[mdk-re] wget
S. Budnevitch
=?iso-8859-1?q?budnevitch_=CE=C1_mail=2Emtu=2Eru?=
Ср Фев 28 20:22:12 MSK 2001
On Tue, Feb 27, 2001 at 06:17:34AM +0300, Dmitry V. Levin wrote:
> > Пробелы в URL'ах не допускаются вообще.
> > Они должны быть в urlencoded формате -- '%20'
>
> Это, конечно, так.
>
> Несомненное достоинство wget'а в том, что он выполняет необходимые
> преобразования самостоятельно, что делает ненужным ручную работу по замене
> пробелов и других недопустимых для URL символов в соответствующие им
> hex-последовательности.
>
Только плохо это реализовано. :-( Вчера столкнулся с такой ошибкой:
$ wget -r -np http://home.fnal.gov/~cgw/xemacs/
Loading robots.txt; please ignore errors.
--19:27:19-- http://home.fnal.gov/robots.txt
<skip>
--19:27:21-- http://home.fnal.gov/%7Ecgw/xemacs/
=> `home.fnal.gov/%7Ecgw/xemacs/index.html'
<skip>
FINISHED --19:27:24--
Downloaded: 2,124 bytes in 2 files
Если же написать wget -r -np http://home.fnal.gov/%7Ecgw/xemacs/
то wget начнет скачивать и другие файлы, а не только index.html.
Подробная информация о списке рассылки community