[Comm] Re: html 2 txt

Vitaly Ostanin =?iso-8859-1?q?vyt_=CE=C1_vzljot=2Eru?=
Вт Авг 26 15:32:10 MSD 2003


On Tue, 26 Aug 2003 16:38:44 +0600
maxim <mnc на mail.esoo.ru> wrote:

> грубо говоря шаблон страницы
> без заполнения, стилей и тому подобных вещей

Вот шаблон страницы. Он будет одинаковым почти для всех
html-страниц.

<html>
  <head>
  </head>
  <body>
  </body>
</html>

Сформулируйте точнее, что Вам нужно - оставить что-то конкретное,
убрать что-то конкретное ?

Можно посмотреть на tidy, есть в sisyphus.

Можно написать обработку на php/perl/python с использованием
готовых библиотек.

Можно натравить на html
xmllint --html file.html
и из полученного вывода формировать что угодно.

<skipped/>

-- 
Regards, Vyt
mailto:  vyt на vzljot.ru
JID:     vyt на vzljot.ru
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url     : <http://lists.altlinux.org/pipermail/community/attachments/20030826/8bc9130f/attachment-0003.bin>


Подробная информация о списке рассылки community