[Comm] Конвертирование html

Андрей Черепанов =?iso-8859-1?q?cas_=CE=C1_altlinux=2Eru?=
Ср Янв 9 13:36:03 MSK 2008


9 января 2008 Алексей Шенцев написал:
> В сообщении от Wednesday 09 January 2008 12:23:47 Андрей Черепанов 
написал(а):
> > 4 января 2008 Александр написал:
> > > Hello all,
> > >
> > > Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
> > > Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
> > > важно).
> >
> > cat'ом слить в один файл и открыть в OpenOffice.org?
>
> Не канает. В таком случае теряется вся целостность документа (ов). Андрей,
> попробуйте слить воедино, как предложили, все html-страницы документации из
> бранча. Интересно какая каша у вас получится? ... :)
> OpenOffice умеет открывать html-страницы. Соотвественно их можно сохранить
> в любом ином формате. Но вот я сейчас попробовал открыть
> страницу /usr/share/doc/HTML/index.html
> Открылась. А вот дальше по ссылкам вызывается вэб-браузер.
Естественно, а что вы хотите? Для нормального получения единым файлом нужно: 
- изначально писать в docbook документацию 
- писать самостоятельно парсер для кучи HTML 
- скачивать wget с конвертацией ссылок
- генерировать chm или war из кучи файлов

-- 
Андрей Черепанов
ALT Linux
cas на altlinux.ru


Подробная информация о списке рассылки community