[room] Как найти файл в определённой кодировке?
Денис Черносов
denis0.ru на gmail.com
Ср Авг 24 10:04:36 UTC 2011
22 августа 2011 г. 15:53 пользователь Sergey Korobitsin
<undertaker на arta.kz>написал:
> Денис Черносов ☫ → To Культурный офтопик @ Mon, Aug 22, 2011 14:01 +0400
>
> > Добрый день всем!
> >
> >
> > Есть проект, которые разрабатывался в течение долгого времени самыми
> разными
> > людьми. В нём в хаотичном порядке встречаются файлы в кодировке cp1251
> > (остальные в юникоде).
> >
> > 1) Есть ли автоматический способ получить список файлов, в cp1251 для
> > (полу)автоматической конвертации в юникод?
>
> AFAIR, recode при указании перекодировать cp1251->unicode уже
> unicode-ный файл не тронет (у меня был положительный опыт, но лучше
> попробовать).
>
> > 2) Аналогичный вопрос про переносы строк в стиле Windows|Unix...
>
> Аналогично здесь. AFAIK, все преобразователи делают замену \r\n на \n,
> соответственно юниксный файл будет содержать только \n и заменятор
> заменять ничего не будет. Но вначале всё равно стоит
> поэкспериментировать.
>
>
Поэкспериментировал...
1) вроде бы recode действительно не перекодирует лишнего, но
2) преобразование виндовых разделителей в юниксовые он делать не умеет и
вообще не перекодирует такие файлы:
recode: failed: Ambiguous output in step `CR-LF..data'
Зато iconv их нормально отрабатывает. Но iconv точно пытается перекодироват
файлы, которые уже в юникоде и вылетает по ошибке:
iconv: недопустимая входная последовательность в позиции 1099
Так что вижу выход рекурсивного прохода каталога с помощью recode и второго
прохода файлов, на которых он споткнулся с помощью iconv.
Спасибо всем за участие! Особенно тебе, земляк. ;)
--
> Bright regards, Sergey Korobitsin,
> Chief Research Officer
> Arta Software, http://arta.kz/
> xmpp:undertaker на jabber.arta.kz
>
> --
> ...Когда я увидел перед собой перспективу жизни, прожитой так же,
> как живет весь мир, я решил - ни за что, это отвратительно,
> мне будет стыдно самого себя. Если бы я участвовал в поддержке
> этой системы отчужденного, собственнического программирования,
> мне казалось бы, что я делаю мир хуже ради денег.
> -- Ричард М. Столлман (из интервью)
> _______________________________________________
> smoke-room mailing list
> smoke-room на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/smoke-room
>
--
С уважением,
Черносов Денис
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/smoke-room/attachments/20110824/8110915e/attachment.html>
Подробная информация о списке рассылки smoke-room