[Comm] wget

Алексей Синицын =?iso-8859-1?q?asinitsinster_=CE=C1_gmail=2Ecom?=
Вс Май 21 11:55:07 MSD 2006


Доброго времени суток.

Выбирая из download'еров не получилось использовать kget (не нашел где
сказать ему про рекурсивность) и D4X (ряд странных проблемы).

Для wget написал следующее:

$ cat bin/wget-up
#!/bin/bash
URL_list=/usr/local/pub/arh/download/url4wget.txt
download_DIR=/usr/local/pub/arh/download
options=" -nc -r -E -k -K"
limits="--limit-rate=2500 --no-parent --reject *.avi,*.mp3,*.rar"
wget $options $limits -i $URL_list -P $download_DIR

 Этот скрипт пускается при подъеме ppp, а при опускании wget
прибивается, что-бы не дублировать (можно проверять запущен-ли уже
wget, но когда-то давно так сделал и так и осталось)
 Некоторую сложность вызывают опции. В мануале сказано следующее:

------------
А если не работает локальный просмотр HTML файлов с расширением,
отличным от .html, например index.cgi, нужно передать команду на
переименование всех таких файлов (content-type = text/html) в
имя.html.

        wget --mirror --convert-links --backup-converted \
              --html-extension -o /home/me/weeklog        \
             http://www.gnu.org/

 С краткими аналогами команд:
        wget -m -k -K -E http://www.gnu.org/ -o /home/me/weeklog
------------

При начатом зеркалировании сайта получаю файлы index.html и затем
index.php.html, file1.php.html, file2.php.html и т.д. (опция E)
которые может смотреть браузер, но ссылки указывают на file1.php,
file2.php и переход со страницы на страницу невозможен Без опции E
внутренние ссылки работают нормально, но браузер спрашивает чем
открывать file.php.

 Правильно-ли я понимаю, что после полного завершения зеркалирования
отработает опция -k и внутренние ссылки исправятся?

 man wget
------------
Только после завершения загрузки Wget знает, какие файлы были
загружены. Следовательно, при параметре -k конвертация произойдет
только по завершении загрузки.
------------
 Здесь имеется в виду не загрузка отдельного файла. но все зеркалирование?

 Спрашиваю здесь, потому-что вся закачка будет идти какое-то время, и
методом тыка проверить долго.


Подробная информация о списке рассылки community