Вопросы по теме 'multibyte'

Преобразование многобайтовых символов в UTF-8
Мое приложение должно записывать данные в файл XML, который будет прочитан файлом swf. SWF ожидает, что данные в XML будут в кодировке UTF-8. Мне нужно преобразовать некоторые многобайтовые символы в моем приложении (упрощенный китайский, японский,...
8101 просмотров
schedule 08.09.2022

Нажатие ORA-01461 при вставке многобайтовых символов из perl в oracle
У меня есть perl-скрипт, который вставляет записи из текстового файла в нашу базу данных. Всякий раз, когда запись содержит многобайтовый символ, например "RODR_Í_GUEZ". Я получаю сообщение об ошибке ORA-01461, однако мне не хватает 4000 символов,...
1132 просмотров
schedule 04.02.2022

Поиск одной многобайтовой строки в другой многобайтовой строке
Я использую этот код для поиска одной строки utf-8 в другой строке utf-8: if (strlen(mb_stristr($string1, $string2)) > 0) но он всегда возвращает 0! Кто-нибудь знает лучшее решение этой проблемы? Обе строки могут быть комбинацией...
238 просмотров
schedule 30.01.2023

Как обрабатывать многобайтовую строку в Python
В PHP есть многобайтовые строковые функции для обработки многобайтовых строк (например, сценарий CJK). Например, я хочу подсчитать количество букв в многобайтовой строке с помощью функции len в python, но она возвращает неточный результат (т.е....
6873 просмотров

Многобайтовая обрезка в PHP?
По-видимому, в семействе mb_* нет mb_trim , поэтому я пытаюсь реализовать его для себя. . Недавно я нашел это регулярное выражение в комментарии на php.net : /(^\s+)|(\s+$)/u Итак, я бы реализовал это следующим образом: function...
28808 просмотров
schedule 01.07.2022

Помощь в переносе с Multi-Byte на UNICODE в MFC
У меня есть что-то вроде утомительного от 6 месяцев до года впереди меня. Я работаю над программой с более чем миллионом строк кода (большая часть написана в начале/середине 90-х), и было решено, что теперь она должна поддерживать сборку UNICODE. Я...
2484 просмотров
schedule 29.04.2022

Печать строк UTF-8 с помощью printf — широкие и многобайтовые строковые литералы
В подобных утверждениях, когда оба вводятся в исходный код с одинаковой кодировкой (UTF-8) и локаль настроена правильно, есть ли между ними какая-либо практическая разница? printf("ο Δικαιοπολις εν αγρω εστιν\n"); printf("%ls", L"ο Δικαιοπολις εν...
73803 просмотров
schedule 21.09.2023

PHP - заменить все небуквенно-цифровые символы для всех поддерживаемых языков
Привет, я на самом деле пытаюсь заменить все НЕ буквенно-цифровые символы из такой строки: mb_ereg_replace('/[^a-z0-9\s]+/i','-',$string); первая проблема заключается в том, что он не заменяет символы, такие как "." , из строки....
2056 просмотров
schedule 01.01.2023

Regex соответствует многобайтовым числам
Мне нужно сопоставить многобайтовые символы 0123456789 из японского языка, используя регулярное выражение. [0-9] в этом случае не работает. Как я могу сделать это регулярное выражение? Это мой первый опыт сопоставления многобайтовых строк....
1096 просмотров
schedule 16.01.2024

Как заменить многобайтовый символ в java
Я хочу преобразовать многобайтовое пространство. Есть ли способ, с помощью которого я могу преобразовать это в обычные символы. String queryTerm = "DX- zzzz"; queryTerm = queryTerm.replaceAll("\\s", "AND");...
698 просмотров
schedule 15.06.2023

Размеры кодировки символов Unicode C/C++ и форматы по умолчанию
Я только что понял, что (благодаря моему университетскому курсу) многие вещи, которые, как мне казалось, я знал о юникоде, были неверны. Таким образом, я начал читать и закреплять свои знания, и сразу же возникли следующие сомнения, поигравшись с...
1763 просмотров

Удалить специальный символ из строки в C под Linux
Используя C в Linux, как я могу удалить символ € (или любой другой «конкретный» не ASCII-символ, переданный в качестве параметра функции -) из строки? Я пробовал с: void remove_all_chars(char* str, char c) { char *pr = str, *pw = str;...
1570 просмотров
schedule 19.04.2024

Могу ли я использовать PHP preg_replace для данных UTF-8, если соответствующий текст - это ascii?
У меня есть такая строка UTF-8: $string = "<html> some chars in any language so could be double-byte </html>"; Я хочу потерять <html> и </html> Это нормально: $string = preg_replace("/<html>/", "",...
250 просмотров
schedule 02.01.2024

Многобайтовый фред в PHP
У меня есть файл, который слишком велик для размещения в памяти, из которого мне нужно удалить определенные символы (если быть точным, управляющие символы). Моя текущая функция выглядит так: $old = fopen($file, 'r'); $new = fopen($tmpFile, 'w');...
1356 просмотров
schedule 12.04.2024

R-недопустимая многобайтовая строка 1
Я новичок в программном обеспечении R Теперь изучаем интеллектуальный анализ текста с использованием пакета «tm». У меня проблема с преобразованием текста в нижний регистр sms_raw<-read.csv(............)...
13692 просмотров
schedule 07.06.2022

Многобайтовая (китайская) кодировка символов PDO DBLIB — SQL-сервер
На машине с Linux я использую PDO DBLIB для подключения к базе данных MSSQL и вставки данных в таблицу SQL_Latin1_General_CP1_CI_AS . Проблема в том, что когда я пытаюсь вставить китайские символы (многобайтовые), они вставляются как...
4777 просмотров

Символы PHP UTF-16 и str_replace
Я хотел бы перевести дату с русского языка, а затем изменить ее формат. Когда я использую str_replace('Сентября', 'September', $date); , это не работает, потому что, как позже предлагает функция даты, выдавая ошибку, содержащую...
534 просмотров
schedule 19.10.2023

Та же кодировка (UTF-8), но разная длина строки и содержимого (PHP)
У меня есть две строковые переменные - первая переменная задается вручную внутри кода ( $date1="14 июня" ), вторая анализируется с удаленной страницы с помощью cURL и phpQuery. Если мы напечатаем обе переменные, результат будет выглядеть одинаково,...
1028 просмотров
schedule 26.07.2023