[room] Как найти файл в определённой кодировке?

Денис Черносов denis0.ru на gmail.com
Ср Авг 24 10:04:36 UTC 2011


22 августа 2011 г. 15:53 пользователь Sergey Korobitsin
<undertaker на arta.kz>написал:

> Денис Черносов ☫ → To Культурный офтопик @ Mon, Aug 22, 2011 14:01 +0400
>
> > Добрый день всем!
> >
> >
> > Есть проект, которые разрабатывался в течение долгого времени самыми
> разными
> > людьми. В нём в хаотичном порядке встречаются файлы в кодировке cp1251
> > (остальные в юникоде).
> >
> > 1) Есть ли автоматический способ получить список файлов, в cp1251 для
> > (полу)автоматической конвертации в юникод?
>
> AFAIR, recode при указании перекодировать cp1251->unicode уже
> unicode-ный файл не тронет (у меня был положительный опыт, но лучше
> попробовать).
>
> > 2) Аналогичный вопрос про переносы строк в стиле Windows|Unix...
>
> Аналогично здесь. AFAIK, все преобразователи делают замену \r\n на \n,
> соответственно юниксный файл будет содержать только \n и заменятор
> заменять ничего не будет. Но вначале всё равно стоит
> поэкспериментировать.
>
>
Поэкспериментировал...
1) вроде бы recode действительно не перекодирует лишнего, но
2) преобразование виндовых разделителей в юниксовые он делать не умеет и
вообще не перекодирует такие файлы:

recode: failed: Ambiguous output in step `CR-LF..data'

Зато iconv их нормально отрабатывает. Но iconv точно пытается перекодироват
файлы, которые уже в юникоде и вылетает по ошибке:

iconv: недопустимая входная последовательность в позиции 1099

Так что вижу выход рекурсивного прохода каталога с помощью recode и второго
прохода файлов, на которых он споткнулся с помощью iconv.

Спасибо всем за участие! Особенно тебе, земляк. ;)

--
> Bright regards, Sergey Korobitsin,
> Chief Research Officer
> Arta Software, http://arta.kz/
> xmpp:undertaker на jabber.arta.kz
>
> --
> ...Когда я увидел перед собой перспективу жизни, прожитой так же,
> как живет весь мир, я решил - ни за что, это отвратительно,
> мне будет стыдно самого себя. Если бы я участвовал в поддержке
> этой системы отчужденного, собственнического программирования,
> мне казалось бы, что я делаю мир хуже ради денег.
>  -- Ричард М. Столлман (из интервью)
> _______________________________________________
> smoke-room mailing list
> smoke-room на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/smoke-room
>



-- 
С уважением,
Черносов Денис
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/smoke-room/attachments/20110824/8110915e/attachment.html>


Подробная информация о списке рассылки smoke-room