Вопросы по теме 'python-unicode'
Как работать со смесью символов UTF-8 и ISO-8859-1 в Python?
У меня есть набор документов, которые содержат символы, закодированные как в UTF-8, так и в ISO-8859-1. Я бы хотел, чтобы они были только в кодировке UTF-8.
Когда я беру документ и декодирую его в UTF-8 с помощью doc.decode('utf-8') , я получаю...
1313 просмотров
schedule
03.05.2022
Django: DatabaseError: рядом с nyny����1: синтаксическая ошибка
Код:
>>> from django.core import serializers
>>> objects = serializers.deserialize('xml', fixturestr.encode('utf8'))
>>> o = next(objects)
>>> o
<DeserializedObject: countries.Country(pk=AF)>
>>>...
897 просмотров
schedule
24.04.2024
Ошибки Python Unicode, синхронизируйте среду разработки и производство
Я только что столкнулся с несколькими ошибками юникода в приложении, которое я запускаю, которое время от времени приходится иметь дело с действительно странными строками, совсем недавно,
Pınar Karsıyaka
в моей среде разработки (Aptana с...
368 просмотров
schedule
25.01.2024
Латинские символы Python и Unicode
У меня есть древовидная структура, в которой ключевые слова могут содержать латинские символы. У меня есть функция, которая перебирает все листья дерева и добавляет каждое ключевое слово в список при определенных условиях.
Вот код, который у меня...
7594 просмотров
schedule
20.01.2023
Загрузка zip-файла непосредственно в AWS S3 с использованием Python urllib2
Я пытаюсь загрузить zip-файл непосредственно на S3 с помощью скрипта Python, но сталкиваюсь с некоторыми ошибками декодирования Unicode.
Что я делаю, так это генерирую предварительно подписанную ссылку S3, а затем загружаю в нее данные. Я знаю,...
2510 просмотров
schedule
27.10.2022
UnicodeEncodeError в python 3 в редакторе eclipse
У меня странная проблема с чтением файла с сохраненным форматом utf-8 (он сохранен на персидском языке). Я использую из eclipse luna и пишу следующий код для чтения из моего файла и отображения его во внутренней консоли eclipse. когда я использую...
21 просмотров
schedule
14.02.2024
Декодирование Python с ошибками = заменить
Используя Python 2.7, я беру некоторый HTML-код с веб-сайта в виде строк и сразу же декодирую его в Unicode. Поскольку позже мне нужно будет знать, где произошли какие-либо ошибки декодирования, я подумал, что лучше всего использовать...
2038 просмотров
schedule
26.01.2024
UnicodeDecodeError: (кодек utf-8) при чтении CSV-файла
то, что я пытаюсь, это прочитать csv, чтобы создать кадр данных --- внести изменения в столбец --- снова обновить/отражать измененное значение в тот же csv (to_csv) - снова попытаться прочитать этот csv, чтобы создать другой кадр данных... там я...
103881 просмотров
schedule
01.10.2022
UnicodeEncodeError: кодек ascii не может кодировать символ u'’' в позиции 6: порядковый номер не в диапазоне (128)
Я пытаюсь получить список из 500 ресторанов Амстердама с TripAdvisor; однако после 308-го ресторана я получаю следующую ошибку:
Traceback (most recent call last):
File "C:/Users/dtrinh/PycharmProjects/TripAdvisorData/LinkPull-HK.py", line 43,...
31159 просмотров
schedule
06.07.2022
UnicodeEncodeError: кодек «ascii» не может кодировать символ «\ xb0» в позиции 23: порядковый номер не в диапазоне (128)
Я пытаюсь загрузить изображение по ссылке, содержащей специальный символ, например: imageUrl = 'https://www.residentadvisor.net/images/labels/3000°records.jpg'
request_=urllib.request.Request(imageUrl,None,headers) #The assembled request...
1044 просмотров
schedule
07.07.2022
Python-3 и \x Vs \u Vs \U в строковой кодировке и почему
Почему в Python 3 используются разные представления строк, ориентированные на байты? Не будет ли достаточно иметь одно представление вместо нескольких?
Для печати номера диапазона ASCII строка показывает последовательность, начинающуюся с \x :...
8267 просмотров
schedule
26.02.2024
Почему бы не использовать патч sys.getfilesystemencoding() для обезьян?
В Python можно прочитать кодировку файловой системы с помощью sys.getfilesystemencoding() .
Но, похоже, нет официального способа установить кодировку файловой системы.
См.: Как изменить кодировку файловой системы с помощью python?
Я...
206 просмотров
schedule
28.09.2023
Правильная длина строки неанглийских символов в Python3
Мне дается строка символов иврита (и некоторых других арабских символов. Я не знаю ни одного из них) в файле
צוֹר
Когда я загружаю эту строку из файла в Python3
fin = open("filename")
x = next(fin).strip()
Длина x кажется равной 5...
1449 просмотров
schedule
08.01.2023
Преобразовать строку в utf-16
У меня есть текстовый файл с японскими иероглифами. Я прочитал из него строку и хочу специально преобразовать ее в utf-16. Как я могу сделать это с помощью Python? Мой код выглядит так -
with open("C:\\Users\\badri\\jap.txt", 'rb') as f:...
4598 просмотров
schedule
13.02.2023
Ошибка UnicodeDecodeError при загрузке word2vec
Полное описание
Я начинаю работать с встраиванием слов и нашел о нем очень много информации. На данный момент я понимаю, что могу тренировать собственные векторы слов или использовать ранее обученные, такие как Google или Wikipedia, которые...
2585 просмотров
schedule
28.12.2023
Ошибка unicode шифрования Python при преобразовании из Python 2 в Python 3
Я нашел код, который хочу включить в свою программу шифрования Python. Он должен шифровать файлы в том же каталоге кода, и я хочу, чтобы он был нацелен на каталог. Но он написан на Python 2, и когда я меняю код, чтобы он соответствовал Python 3, я...
1632 просмотров
schedule
17.09.2023
Как получить правильное значение строки в кодировке UTF-8 (из Unicode) из файла из Python3, который был закодирован с использованием Python2?
Я перемещаю свое приложение с Python2 на Python 3. Приложение сохраняет конфигурацию в файл, и перед сохранением один из атрибутов кодируется в utf-8.
Например: username='ᚠᛇᚻ᛫ᛒᛦᚦ᛫ᚠᚱᚩᚠᚢᚱ' сохраняется как '\xe1\x9a\xa0\xe1\x9b....x9a\xb1'...
29 просмотров
schedule
17.04.2024
Python: как анализировать символы, отличные от ASCII, в строке
В своем сценарии Python я пытаюсь прочитать текстовый файл, содержащий столбцы с именами и фамилиями людей, некоторые из которых содержат символы, отличные от ASCII, например ñ . Но когда я это делаю, я получаю ошибку UnicodeDecodeError: 'utf8'...
224 просмотров
schedule
12.07.2022
Проблемы с отображением символов Unicode в Python (объединение символов, символов кана и т. Д.)
Я пытаюсь составить несколько программ для анализа текста на нескольких языках, включая латынь, древнегреческий и китайский. Среди них один из них предназначен для анализа слова на латыни и разложения его на составляющие его слоги, затем нахождения...
406 просмотров
schedule
16.09.2023
Сценарий Python не может правильно кодировать специальные символы Unicode
Я конвертирую текстовый файл ( words.txt ), который в основном является словарем в этом формате:
good morning, Góðan daginn
в файл json ( converted.json ) в этом формате
{
"wordId": 1,
"word": "good morning",
"translation":...
106 просмотров
schedule
25.02.2023