Python/Учебник Python 2.6: различия между версиями

Содержимое удалено Содержимое добавлено
→‎Строки Unicode: дополнение
Строка 546:
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)</source></big>
 
Для конвертирования Unicode-строки в 8-битовую строку с использованием желаемой кодировки, объекты Unicode предоставляют метод <code>encode()</code>, принимающийимеющей единственныйформат <code>encode([encoding,[,errors]]</code>. Encoding - необязательный аргумент, указывающий названиев кодировкикакую кодировку стоит перевести строку. ПредпочитаютсяПо умолчанию - ASCII. Errors - так же необязательный аргумент - указывает на способ обрабитки ошибок кодировщиком. По умолчанию используется 'strict' - если символ не может быть представлен в данной кодировке, генерируется исключение UnicodeError. Другие возможные значения - 'ignore' (отсутствующие символы удаляются) и 'replace' - (отсутствующие в кодировке символы заменяются, обычно на символ '?'). Для именования кодировок предпочитаются названия записанные в нижнем регистре.
 
<big><source lang="python">>>> u"äöü".encode('utf-8')