[sisyphus] новый libtag: маленькая трагедия

Vasily Tereshko tvv на end.kiev.ua
Чт Ноя 15 18:00:19 MSK 2012


15.11.2012 12:09, Anton V. Boyarshinov пишет:
>> Я думаю да, невозможно. Ибо никакими средствами не отличить windows-1251
>> от  latin-1 с буковками в старшей половине таблицы.
> Сплошной текст в верхней половине latin-1 не бывает ни в одном языке.
Это Вы явно не сталкивались с польским и чешским. ;)
Запросто можно найти название песни с 80-90% "неправильными" символами.
Осталось определить, чем эта ситуация отличается от ситуации, когда в
тексте с windows-1251 в слове "мoлoкo" сделан микс (o - латинская)
Абстрактно предложение на каком-то языке, да, тут тяжело что-то
изобразить. Но мы же про медиаплееры?
>
> По характерным сочетаниям букв хорошо разделяются разные европейские
> языки (но тут нужен текст немного длинне среднего называния песни), а
> уж, допустим, koi8 от windows-1251 -- по одному-двум словам.
Польская фирма выпустила диск украинской группы. И сделала двуязычные
тэги [pl]/[ua], которые потом из .cue перекочевали в mp3.
Вполне обычная ситуация, у меня не далее, как сегодня утром такое
играло. Поведение всех автоопределителей в этом случае вполне прогнозируемо.
UTF-8 везде, вот это нормальный, адекватный выход :)


Подробная информация о списке рассылки Sisyphus