[Comm] wget, кодировки и русские имена файлов

Денис Черносов =?iso-8859-1?q?denis0=2Eru_=CE=C1_gmail=2Ecom?=
Вт Ноя 25 11:43:37 MSK 2008


На planet.altlinux.org нашел ссылки на конкурсные материалы по преподаванию
в школах на базе СПО. Начал качать... сначала руками, потом flashget-ом
(который зовет kget), потом захотелось wget использовать. Наткнулся на
грабли: русские имена файлов сохраняются в безопасном виде:

Автосалон.odb -> �%90в�%82о�%81алон.odb


$ wget
http://freecode.pspo.perm.ru/163//%D0%9A%D0%BE%D0%BD%D0%BA%D1%83%D1%80%D1%81/%d0%9f%d1%80%d0%b8%d0%bc%d0%b5%d1%80%d1%8b%20%d0%91%d0%94/%d0%90%d0%b2%d1%82%d0%be%d1%81%d0%b0%d0%bb%d0%be%d0%bd.odb
--2008-11-25 12:35:44--
http://freecode.pspo.perm.ru/163//%D0%9A%D0%BE%D0%BD%D0%BA%D1%83%D1%80%D1%81/%d0%9f%d1%80%d0%b8%d0%bc%d0%b5%d1%80%d1%8b%20%d0%91%d0%94/%d0%90%d0%b2%d1%82%d0%be%d1%81%d0%b0%d0%bb%d0%be%d0%bd.odb
Распознаётся freecode.pspo.perm.ru... 77.43.139.94
Устанавливается соединение с freecode.pspo.perm.ru|77.43.139.94|:80...
соединение установлено.
Запрос HTTP послан, ожидается ответ... 200 OK
Длина: 50209 (49K) [text/plain]
Сохраняется в каталог: `�%90в�%82о�%81алон.odb'.

100%[==================================================================================>]
50 209      8,26K/s   в 5,9s

2008-11-25 12:35:50 (8,26 KB/s) - `�%90в�%82о�%81алон.odb' сохранён
[50209/50209]



И кодировка сервера выдается iso-8859-1, а не utf-8, как должно быть.
Пробовал такой скрипт для загрузки всего содержимого:

#!/bin/sh
wget -r -np -S \
--header="Accept-Charset: utf-8" \
--header="Content-Language: ru,en" \
http://freecode.pspo.perm.ru/163/Конкурс/<http://freecode.pspo.perm.ru/163/%D0%9A%D0%BE%D0%BD%D0%BA%D1%83%D1%80%D1%81/>

Но не помогает. Поисковики не помогли. Наверное плохо спрашивал... Что я
делаю неправильно?
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/community/attachments/20081125/7bc678f1/attachment.html>


Подробная информация о списке рассылки community