[Comm] использование UTF

Alexej Kryukov =?iso-8859-1?q?akrioukov_=CE=C1_mail=2Eru?=
Пн Окт 4 18:01:44 MSD 2004


On Monday 04 October 2004 15:55, Genix wrote:
> Приветствую!
>
> 1) Подскажите, как узнать код буквы (например "а"-русская) в
> юникодной кодировке?

Если нужен именно Юникод, то можно, например, взять таблицы
в формате pdf с www.unicode.org/charts/. Или посмотреть таблицу
символов в любом юникодовом приложении, где таковая имеется
(хоть тот же OOo). Если же нужно *представление* юникода в
виде UTF-8, то дополнительно нужно знать алгоритм преобразования
(впрочем, он а) несложный и б) известен многим программам, так
что самому разбираться обычно нет необходимости).

> 2) Как можно преобразовать строку вида "D09CD0B0D0BCD0B0" (по
> русски это было Мама) к человеческому виду (желательно средствами
> QT)? В какой кодировке это может быть? Видно, что буква а в этом
> слове имеет "код" D0B0.

Это, конечно, UTF-8, как она должна была бы выглядеть в
шестнадцатеричном редакторе. Если же Вы видите такое в обычном
текстовом файле (не в режиме шестнадцатеричного просмотра), то,
значит, задача сводится к разбиению строки на пары символов (каждая
пара будет представлять собой шестнадцатеричное число с кодом
от 00 до FF) и замене каждой пары на байт с таким кодом.
Полученный текст UTF-8 можно открывать в чем угодно.

Насчет QT ничего не скажу, но скриптик такой на любом языке 
сделать, конечно, ничего не стоит.



Подробная информация о списке рассылки community