Вопросы по теме 'utf-16'

Разница между порядком байтов Big Endian и Little Endian
В чем разница между порядком байтов Big Endian и Little Endian? Оба они, похоже, связаны с Unicode и UTF16. Где именно мы это используем?
88944 просмотров
schedule 14.05.2022

Как я могу идентифицировать разные кодировки без использования спецификации?
У меня есть наблюдатель файлов, который захватывает контент из растущего файла, закодированного с помощью utf-16LE. Первый бит записанных в него данных имеет доступную спецификацию - я использовал ее, чтобы идентифицировать кодировку по UTF-8 (в...
1116 просмотров
schedule 10.04.2023

Как я могу декодировать данные UTF-16 в Perl, если я не знаю порядок байтов?
Если я открою файл (и укажу кодировку напрямую): open(my $file,"<:encoding(UTF-16)","some.file") || die "error $!\n"; while(<$file>) { print "$_\n"; } close($file); Я могу хорошо прочитать содержимое файла. Однако, если я...
13035 просмотров
schedule 08.01.2023

utfcpp и широкий API Win32
Хорошо/безопасно/возможно ли использовать крошечную библиотеку utfcpp для преобразования всего, что я получаю из широкой Windows API (FindFirstFileW и т. д.) для действительного представления UTF8 с использованием utf16to8? Я хотел бы...
2554 просмотров
schedule 14.03.2023

SQLite - вставка специальных символов (торговая марка, ) в таблицу
Как я могу вставить специальные символы, такие как товарный знак, в таблицу SQLite? Я пытался использовать кодировку PRAGMA = "UTF-16" безрезультатно :(
2586 просмотров
schedule 15.04.2023

Как я могу использовать инструменты командной строки Mac OS X (и UNIX), такие как grep, с файлами UTF-16?
У меня есть куча текстовых файлов, которые я хочу использовать с grep. Все они взяты из внешнего источника, имеют кодировку UTF-16 и начинаются со знака порядка следования байтов. Инструменты Unix, такие как grep, для меня не работают. Какой...
1292 просмотров
schedule 20.03.2022

Поддержка UTF-16 в приложении GWT/GXT
У меня есть приложение GWT/GXT, работающее в кодировке UTF-8. Мы хотели бы, чтобы оно поддерживало UTF-16. То есть мы хотели бы, чтобы символы в кодировке UTF-16, скопированные из слов/других источников, были безопасно распространены в DB и символы в...
264 просмотров
schedule 28.11.2022

Как в Qt QTextCodec::codecForName(UTF-16) и codecForName(UTF-32) решают, какой порядок байтов использовать?
В документации Qt указано, что (среди прочего) поддерживаются следующие кодировки строк Unicode: UTF-8 UTF-16 УТФ-16ВЕ UTF-16LE UTF-32 УТФ-32ВЕ UTF-32LE Из-за трех разных кодеков, перечисленных для 2- и 4-октетного кодирования...
1612 просмотров
schedule 01.02.2024

Кодировка Firefox и UTF-16
Я создаю сайт с кодировкой UTF-16. Это означает, что все файлы (html, jsp) закодированы в UTF-18, и я установил в заголовке каждой HTML-страницы: <meta http-equiv="content-type" content="text/html; charset=UTF-16"> Моя индексная...
7645 просмотров
schedule 16.08.2022

Как я могу хранить символы UTF-16 в базе данных Postgres?
Я пытаюсь сохранить некоторый текст (например, č ) в базе данных Postgres, однако при получении этого значения оно отображается на экране как ? . Я не уверен, почему он это делает, у меня сложилось впечатление, что это символ, который не...
9095 просмотров

Разработка приложения для использования UTF-8 или UTF-16
Я разрабатываю приложение, которое в основном будет использоваться читателями на английском и испанском языках. Однако в будущем я хотел бы иметь возможность поддерживать более расширенные языки, такие как японский. Размышляя о дизайне программы, я...
905 просмотров
schedule 15.04.2024

Как использовать Boost Spirit для разбора китайского языка (Unicode utf-16)?
Моя программа не распознает китайский язык. Как использовать дух, чтобы распознать китайский язык? Я использую wstring и преобразовал его в utf-16. Вот мой заголовочный файл: #pragma once #define BOOST_SPIRIT_UNICODE #include...
1511 просмотров
schedule 13.10.2022

Можем ли мы изменить кодировку XML с utf-8 на utf-16?
Я написал код для генерации XML с кодировкой UTF-8. Я всегда проверяю XML с помощью файла XSD. В том же коде мне нужна кодировка UTF-16. Потому что один из моих XSD-файлов имеет кодировку UTF-16. Но в моем существующем коде это не принято. выдает...
1602 просмотров
schedule 18.06.2022

Как преобразовать массив ushort utf16 в std :: string utf8?
В настоящее время я пишу плагин, который представляет собой просто оболочку существующей библиотеки. Хост плагина передает мне строку в формате utf-16, определенную следующим образом typedef unsigned short PA_Unichar; И обернутая библиотека...
2597 просмотров
schedule 28.01.2023

Странные символы Юникода при чтении файла в приложении node.js
Я пытаюсь написать приложение node, которое считывает набор файлов, разбивает их на строки и помещает строки в массив. Довольно просто. Он работает с несколькими файлами, за исключением некоторых файлов SQL, с которыми я работаю. По какой-то...
22305 просмотров
schedule 16.03.2024

Использование символов Юникода размером более 2 байтов с .Net
Я использую этот код для создания U+10FFFC var s = Encoding.UTF8.GetString(new byte[] {0xF4,0x8F,0xBF,0xBC}); Я знаю, что это для частного использования и тому подобное, но он отображает один символ, как я и ожидал при его отображении....
5217 просмотров
schedule 06.11.2023

java декодирование строки base64
Я понимаю, что это, вероятно, больше общий вопрос о Java, но, поскольку он работает в среде Notes \ Domino, я подумал, что сначала проверю это сообщество. Сводка: Кажется, я не могу декодировать строку: dABlAHMAdAA=, используя...
4577 просмотров
schedule 12.05.2023

Написание юникода с помощью python — что не так с этим символом
С python 2.7 я читаю как unicode и пишу как utf-16-le. Большинство символов интерпретируются правильно. Но некоторые из них не являются, например, u'脊', также известный как unichr(33034) . Следующий код кода пишется неправильно: import codecs...
642 просмотров
schedule 20.09.2023

Как использовать ICU с UTF-16?
Я рассматриваю возможность использования ICU для обработки строк Unicode в собственном модуле Node.js, потому что мне кажется, что v8::String (согласно v8::String 1String.html" rel="nofollow">эти документы ) не имеет C++ API для этой цели....
1596 просмотров
schedule 04.06.2023

SQL Server: как преобразовать переменную XML в varbinary (max) в кодировке UTF-8?
В SQL Server преобразование по умолчанию из типа xml в varbinary использует кодировку текста XML (начальный и конечный теги с угловыми скобками и т. д.) с использованием кодировки символов UTF-16. Например. declare @xml xml =...
1731 просмотров
schedule 05.02.2024