[Comm] wget
Алексей Синицын
=?iso-8859-1?q?asinitsinster_=CE=C1_gmail=2Ecom?=
Вс Май 21 11:55:07 MSD 2006
Доброго времени суток.
Выбирая из download'еров не получилось использовать kget (не нашел где
сказать ему про рекурсивность) и D4X (ряд странных проблемы).
Для wget написал следующее:
$ cat bin/wget-up
#!/bin/bash
URL_list=/usr/local/pub/arh/download/url4wget.txt
download_DIR=/usr/local/pub/arh/download
options=" -nc -r -E -k -K"
limits="--limit-rate=2500 --no-parent --reject *.avi,*.mp3,*.rar"
wget $options $limits -i $URL_list -P $download_DIR
Этот скрипт пускается при подъеме ppp, а при опускании wget
прибивается, что-бы не дублировать (можно проверять запущен-ли уже
wget, но когда-то давно так сделал и так и осталось)
Некоторую сложность вызывают опции. В мануале сказано следующее:
------------
А если не работает локальный просмотр HTML файлов с расширением,
отличным от .html, например index.cgi, нужно передать команду на
переименование всех таких файлов (content-type = text/html) в
имя.html.
wget --mirror --convert-links --backup-converted \
--html-extension -o /home/me/weeklog \
http://www.gnu.org/
С краткими аналогами команд:
wget -m -k -K -E http://www.gnu.org/ -o /home/me/weeklog
------------
При начатом зеркалировании сайта получаю файлы index.html и затем
index.php.html, file1.php.html, file2.php.html и т.д. (опция E)
которые может смотреть браузер, но ссылки указывают на file1.php,
file2.php и переход со страницы на страницу невозможен Без опции E
внутренние ссылки работают нормально, но браузер спрашивает чем
открывать file.php.
Правильно-ли я понимаю, что после полного завершения зеркалирования
отработает опция -k и внутренние ссылки исправятся?
man wget
------------
Только после завершения загрузки Wget знает, какие файлы были
загружены. Следовательно, при параметре -k конвертация произойдет
только по завершении загрузки.
------------
Здесь имеется в виду не загрузка отдельного файла. но все зеркалирование?
Спрашиваю здесь, потому-что вся закачка будет идти какое-то время, и
методом тыка проверить долго.
Подробная информация о списке рассылки community