[sisyphus] Какой софт подойдет для скачивания google prc?
Aleksey Birukov
aebirukov на gmail.com
Ср Фев 29 11:10:09 MSK 2012
Понадобилось скачать http://www.google.ru/search?q=ipad+3&hl=ru&tbm=prc
Похоже, что страница формируется динамически (javascript) и поэтому wget не
работает.
Пробовал использовать wkhtmltopdf. И, похоже, что она бы сработала если бы
в ней была возможность изменить User-Agent на Firefox, но к сожалению, этой
возможности в ней нет(?).
Я попробовал в жёстко изменить User-Agent в исходниках, но она у меня не
собралась. Я пока не разбирался почему.
Что можно предпринять? Есть ли ещё программы в Сизифе или не в Сизифе,
которые могли бы мне подойти?
Выходной формат данных должен подходить для парсинга. Лучше если это будет
html.
Можно ли как-то, в моём случае, использовать библиотеку webkit напрямую из
командной строки?
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/sisyphus/attachments/20120229/75382f48/attachment.html>
Подробная информация о списке рассылки Sisyphus