Unicode – вопросы и ответы

426
голосов
8
ответов
У меня есть браузер, который отправляет символы utf-8 на мой сервер Python, но когда я извлекаю его из строки запроса, кодировка, возвращаемая Python, является ASCII. Как преобразовать обычную стро...
6 месяцев, 3 недели назад Bin Chen
151
голос
7
ответов
Настройка строки Java не удаляет для меня пробельный символ. String rank = (some method); System.out.println("(" + rank + ")"); Выходной сигнал (1 ) . Обратите внимание на пространство справа от си...
6 месяцев, 3 недели назад Terry Li
81
голос
1
ответ
Привет, у меня возникли проблемы с записью командного файла, где мне нужно указать некоторые пути к файлам, содержащие международные символы (точнее, норвежская буква "ø" ). Например, имя файла axp...
6 месяцев, 3 недели назад Rune Aamodt
58
голосов
1
ответ
У меня есть основное приложение для обработки текстовых сообщений Universal Windows, работающее на настольных устройствах Windows 10. Я хотел бы поддерживать добавление символов и специальных симво...
6 месяцев, 3 недели назад Mark
72
голоса
1
ответ
Как разработчик PHP, я всегда использую код ниже всякий раз, когда я хочу работать с PHP и MySQL в содержимом Unicode: $link = mysql_connect("localhost","root") or die (mysql_error()); if ($link) {...
6 месяцев, 3 недели назад Mohammad Saberi
71
голос
1
ответ
Я хотел бы применить следующую функцию к ряду dataframe: unicodedata.normalize('NFKD', c.lower().decode('utf-8')).encode('ascii','ignore') Я (вроде) понимаю, как я могу делать такие вещи, как db.cn...
6 месяцев, 3 недели назад Dervin Thunk
57
голосов
1
ответ
Я спросил здесь, как поставить %u после каждых четырех цифр, чтобы преобразовать мою длинную строку в правильный текст в Юникоде. Я получил очень хороший ответ с UDF, и он отлично работает... тепер...
6 месяцев, 3 недели назад Husnain Naz
99
голосов
2
ответа
Я ввел "久保充明" как на моем локальном компьютере, так и на сервере, 1) Первый вопрос local - python2.7.10 - Корейский компьютер >>> a = "久保充明" >>> a '\xce\xf9\xdc\xc1\xf5\xf6\xd9\xa...
6 месяцев, 3 недели назад Kenneth Han
71
голос
1
ответ
Многие из вас, возможно, видели "троллей", публикующих странные персонажи, которые испортили всю веб-страницу на сайтах социальных сетей, форумах или сайтах видеопотоков, таких как youtube. Приведе...
6 месяцев, 3 недели назад Dan
101
голос
2
ответа
Я читаю строку данных из базы данных oracle, которая может содержать или не содержать символы Unicode в программе С++. Есть ли способ проверить строку, извлеченную из базы данных, содержать символы...
6 месяцев, 3 недели назад user4910881
121
голос
1
ответ
Попытка разработать текстовый редактор, у меня есть два текстовых поля и кнопка ниже каждого. Когда нажата кнопка ниже текстового поля 1, предполагается преобразовать текст Юникода (предназначенный...
6 месяцев, 3 недели назад Yiu Korochko
82
голоса
1
ответ
У меня есть список, список содержит элементы Unicode, которые я хочу удалить ')' и \n и пустое пространство из списка. По существу создать "чистую" копию списка. Мои попытки ссылаются на это решени...
6 месяцев, 3 недели назад sayth
115
голосов
1
ответ
Я прочитал некоторые данные Unicode из CSV файла, используя стандартную библиотеку Ruby 1.9 csv, например: def read_csv(file_name, value) CSV.foreach(file_name) do |row| if row[0] == value return r...
6 месяцев, 3 недели назад ShockwaveNN
-6
голосов
1
ответ
Обычно символы Unicode могут быть выражены следующим образом: \u0905 => अ Мне интересно, как написать функцию, которая может выводить одно и то же: (unicode "0905") => अ или же (unicode 905) ...
6 месяцев, 3 недели назад zcaudate
115
голосов
2
ответа
я бы понял, почему вывод 3, а не символ char ('5' unicode) char c='5'; c = (char) (c - 2); System.out.println(c); и не могли бы вы объяснить, какая разница между кодом ASCII и символом юникода? зар...
6 месяцев, 3 недели назад Der Mond
92
голоса
1
ответ
Поиск регулярного выражения для соответствия символов Unicode, которые не соответствовали нескольким свойствам за раз. Например, предположим, что я хочу, чтобы все символы в строке поиска были в од...
6 месяцев, 3 недели назад framontb
256
голосов
1
ответ
Я заметил, что на многих веб-сайтах при поиске или просто просмотре будет добавлена ​​переменная get с именем utf и установите ее равной галочке ( ?utf8=✓ ). Два примера: В Dotabuff есть URL-адрес ...
6 месяцев, 3 недели назад Frank
80
голосов
1
ответ
Я получаю gebbrish в своих ошибках ORA sqlplus. Пример: SQL> conn ur@mydb Enter password: ERROR: ORA-01017: ┐┐┐┐┐ ┐┐┐┐┐/┐┐┐┐┐ ┐┐ ┐┐┐┐┐; ┐┐┐┐┐┐┐┐ ┐┐┐┐┐ это мой nls_lang в реестре: AMERICAN_AMERIC...
6 месяцев, 3 недели назад look4regev
58
голосов
7
ответов
У меня проблема с локализацией. Один из моих трудолюбивых коллег заменил все строки в нашем приложении константами, которые содержатся в словаре. Этот словарь получает различные строки, помещенные ...
6 месяцев, 3 недели назад mmr
71
голос
1
ответ
Рассмотрим следующий фрагмент: namespace bl = boost::locale; static bl::generator gen; static auto loc = gen("en_US.UTF-8"); std::string foo8 = u8"Föo"; std::string deco = bl::normalize(foo8,bl::no...
6 месяцев, 3 недели назад Spacemoose
101
голос
2
ответа
Хорошо, у меня есть запрос. Есть ли способ отобразить символ Unicode из его уникального номера. Напр. У меня есть символ Integral (∫) & It Unicode number & HTML code, соответственно, 'U + 2...
6 месяцев, 3 недели назад Jenson M John
101
голос
1
ответ
Знаете ли вы самый быстрый способ кодирования и декодирования UTF8 с дополнительной информацией? Вот интересные случаи, которые происходят со мной: Сериализация Я просто хочу кодировать непрозрачны...
6 месяцев, 3 недели назад Michael Fox
71
голос
1
ответ
Я изучаю некоторые HTML из таких стран, как Китай и Иран. Я обнаружил, что по какой-то причине они используют в своих тегах комментариев, т.е. <!-- comment --> вместо знака ASCII минус, т.е. ...
6 месяцев, 3 недели назад Dingo
91
голос
1
ответ
У меня есть база данных, которая содержит символ Unicode исходного кода C/C++/Java. но я хочу, чтобы моя система была разработана на PHP. например: у меня есть строка unicode \u00c3khk\u201e\u2122r...
6 месяцев, 3 недели назад Kartik it
107
голосов
1
ответ
Я хочу, чтобы мое программное обеспечение было доступно для мировой аудитории, и поэтому меня немного беспокоят шрифты, используемые в моем графическом интерфейсе программы (Winforms,.NET3.5, С#). ...
6 месяцев, 3 недели назад Dan W
99
голосов
1
ответ
Я хочу прочитать.html файл как необработанный текст и заменить экземпляры подстроки, содержащей символы юникода, с другой подстрокой. Предположим, что файл mm03.html содержит только одну строку тек...
6 месяцев, 3 недели назад Bibliophael
71
голос
1
ответ
Это пень. Я обновляю довольно большое приложение (для меня) от Rails 2.3 до Rails 3.0. Я также запускаю это приложение в Ruby 1.9.2, а не 1.8.7 раньше. Кроме того, я также переключился на HTML5. По...
6 месяцев, 3 недели назад allesklar
60
голосов
1
ответ
Я работаю над кроссплатформенной библиотекой, которая будет использоваться для манипулирования файлами (создания, переименования, удаления,...) на оптических носителях. Поэтому у меня есть вопросы,...
6 месяцев, 3 недели назад akmal
59
голосов
2
ответа
У меня есть список путей файла unicode, в котором мне нужно заменить все умляуты английским диакритиком. Например, я бы ü с ue, ä с ae и так далее. Я определил словарь умляутов (ключей) и их диакри...
6 месяцев, 3 недели назад Crazy Otto
91
голос
1
ответ
Я пытаюсь справиться с проблемами, связанными с обменом данными, содержащими символы новой строки и unicode между PHP и Javascript. Мои тесты в Chrome предлагают только одну реальную проблему: Java...
6 месяцев, 3 недели назад DroidOS
57
голосов
1
ответ
Кто-нибудь имеет опыт работы в Юникоде? Я столкнулся с жесткой проблемой с юникодами фарси. У меня есть std::wstring s = (L"\u0634\u0646\u0628\u0647"); который является словом фарси. Когда я его от...
6 месяцев, 3 недели назад Eduard Rostomyan
91
голос
1
ответ
Я пытаюсь прочитать файл из сжатого файла и преобразовать данные в json/dictionary. Но есть проблема с unicode, с которой я некоторое время боролся. Может ли кто-нибудь помочь? exfile_obj = tar.ext...
6 месяцев, 3 недели назад Luffy Cyliu
141
голос
5
ответов
Вот небольшая программа: #!/usr/bin/env python # -*- encoding: utf-8 -*- print('abcd kΩ ☠ °C √Hz µF ü ☃ ♥') print(u'abcd kΩ ☠ °C √Hz µF ü ☃ ♥') В Ubuntu, терминале Gnome, IPython делает то, что я о...
6 месяцев, 3 недели назад endolith
127
голосов
2
ответа
Я ищу большие символы в unicode, например: ∏ ∐ ∑ ∫ ⨀ ⨁ ⨂ ⊕ ⊖ ⊗ ⊘ ⊙ ⎲ ⎳ ⌠ ⌡ Единственное, что я нашел, это объединение двух символов Unicode ⎲ и ⎳. Не уверен, почему это существует, но не большой си...
6 месяцев, 3 недели назад Lance Pollard
107
голосов
1
ответ
При использовании BreakIterator из ICU существует ли способ получить длину байта (или длину блока кода) кластера графем на n-й границе во входной строке? В идеале с наименьшим количеством вызовов API.
6 месяцев, 3 недели назад user3404884
107
голосов
1
ответ
У меня есть таблица на моем MS-SQL-Server 2008R2, которая сама имеет поле nvarchar(50) . Теперь, когда я вставляю значение с помощью Server Management Studio, например INSERT INTO INFORMATIONS(SOME...
6 месяцев, 3 недели назад BigBlackDog
70
голосов
1
ответ
Насколько я знаю, форма UTF-8 "你好" (означает "Как вы?" на английском языке) \xe4\xbd\xa0\xe5\xa5\xbd , а форма UTF-16 u\u4f60\u597d (или вы можете записать ее как \x4f\x60\x59\x7d ). Теперь я испол...
6 месяцев, 3 недели назад Dd Pp
116
голосов
1
ответ
Я создаю систему, в которой все URL-адреса, html, текст, ссылки и т.д. Хранятся в формате Unicode. Для этой цели я извлекаю html с веб-страницы и конвертирую ее в Юникод с помощью кода, вставленног...
6 месяцев, 3 недели назад Pratik Poddar
58
голосов
2
ответа
В старом приложении, запрограммированном под Delphi 6 (платформа, отличная от Unicode), я использовал для фильтрации несимметричных символов просто путем ссылки на номера своих ячеек в таблице симв...
6 месяцев, 3 недели назад Johny
71
голос
1
ответ
Этот код: console.log('😀'); console.log('\uD83D\uDE00'); Из тега HTML-скрипта: 😀 😀 Ran вставлен в консоль браузера (тот же браузер): 😀 😀 Что здесь происходит, что вызывает первый console.log('😀'...
6 месяцев, 3 недели назад JBird
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема