Docker Python设置了utf-8语言环境

问题描述 投票:8回答:4

我正在尝试运行我的python文件,该文件首先读取中文字符串并打印出来。

这是我的Dockerfile

FROM python:2.7-onbuild
ENV LANG en_US.UTF-8
ADD . /code
WORKDIR /code
RUN pip install -r requirements.txt
CMD ["python", "app.py"]

这是我的python文件:

    # -*- coding: utf-8 -*-
    import jieba
    s = "我来到北京清华大学"
    s = s.decode('utf-8')
    print type(s), s

然后我跑:

docker build -t python-example .

docker run python-example

我得到的错误:UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-8: ordinal not in range(128)

当我在本地运行它,它工作正常。

python docker utf-8
4个回答
13
投票

我在使用主管和gunicorn部署Django应用程序时遇到了同样的问题。

是什么修复了将以下行添加到我的超级用户配置文件中:

environment=LANG="es_ES.utf8", LC_ALL="es_ES.UTF-8", LC_LANG="es_ES.UTF-8"

对于您的情况,请确保您要打印的中文区域设置可用并安装在docker容器中。这个blog描述了如何做到:示例dockerfile(使用中文语言环境而不是en_CA.UTF-8):

FROM ubuntu:15.10
MAINTAINER Mobify <[email protected]>

RUN apt-get -qq update && \
    apt-get -q -y upgrade && \
    apt-get install -y sudo curl wget locales && \
    rm -rf /var/lib/apt/lists/*

# Ensure that we always use UTF-8 and with Canadian English locale
RUN locale-gen en_CA.UTF-8

COPY ./default_locale /etc/default/locale
RUN chmod 0755 /etc/default/locale

ENV LC_ALL=en_CA.UTF-8
ENV LANG=en_CA.UTF-8
ENV LANGUAGE=en_CA.UTF-8

希望这能引导你走向正确的方向。


12
投票

精简版

把它放在你的Dockerfile

ENV PYTHONIOENCODING=utf-8

或者如上面的评论中提到的那样在命令行上传递它:

docker run -e PYTHONIOENCODING=utf-8 my-python-image some-command

长版:

当您启动Python解释器时,Python必须设置stdout才能将输出发送到您的终端。在您的现代操作系统上,您的终端可能会报告它支持UTF-8或其他一些高级编码。您可以通过运行此命令查看使用的编码:

$ python -c 'import sys; print(sys.stdout.encoding)'
UTF-8

当您运行docker容器时,Python不希望使用更高级编码的环境变量,因此Python将回退到基本字符集以确保兼容性。您可以通过在容器中运行相同的命令来验证这一点:

$ docker run my-python-image python -c 'import sys; print(sys.stdout.encoding)'
ANSI_X3.4-1968

当我们通过PYTHONIOENCODING时,我们看到sys.stdout.encoding设置得恰当:

$ docker run -e PYTHONIOENCODING=UTF-8 my-python-image python -c 'import sys; print(sys.stdout.encoding)'
UTF-8

PYTHONIOENCODING中了解the Python documentationThis answer also goes into great detail about encoding/decoding and stdout


1
投票

我在docker文件中添加以下命令:

RUN locale-gen en_US.UTF-8
ENV LANG='en_US.UTF-8' LANGUAGE='en_US:en' LC_ALL='en_US.UTF-8'

然后构建/重建docker图像,你最好在基本图像中添加它。


0
投票
RUN set -e \
  && locale-gen en_CA en_CA.UTF-8 \
  && update-locale LC_ALL=en_CA.UTF-8 LANG=en_CA.UTF-8
© www.soinside.com 2019 - 2024. All rights reserved.