[Comm] фильтр/скрипт для обработки html файлов

Денис Черносов =?iso-8859-1?q?denis0=2Eru_=CE=C1_gmail=2Ecom?=
Вт Авг 5 09:56:00 MSD 2008


5 августа 2008 г. 1:35 пользователь Mikhail Kuligin
<mail4network на gmail.com>написал:

> Здравствуйте,
>
> подскажите есть ли софт или bash скрипты (хочется bash т.к. я перл не
> знаю) для замены избыточных тегов в html документах
> которые создаются после действия пользователя "Сохранить файл как html
> страницу" в небезизвестном редакторе?
> пример того, что хотелось бы заменять на стандартный тег "<p>":
> "<P LANG="ru-RU" CLASS="western" ALIGN=JUSTIFY STYLE="margin-left:
> 0.05cm; margin-right: 0.02cm; text-indent: 0.46cm; margin-bottom: 0cm;
> background: #ffffff; line-height: 0.42cm">"
> причём теги почти все разные и замена в данном случае неэффективна
> да и файлов больше сотни ...


Поковыряй расширение altsearch для OpenOffice.org Там есть реальные
регулярные выражения, а с ними можно организовать любую фильтрацию. Пример
фильтрации html там тоже был. Самый цимус состоит в русской справке,
подробных подсказках и возможности сохранять свои фильтры (там они
называются группы). Полученный опыт составления регулярных выражений будет
полезен при любом языке программирования и для очень широкого круга задач.
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/community/attachments/20080805/e8f0e512/attachment-0002.html>


Подробная информация о списке рассылки community