[Comm] гм... (was: strage script needed)

Michael Shigorin =?iso-8859-1?q?mike_=CE=C1_osdn=2Eorg=2Eua?=
Вс Окт 24 20:17:24 MSD 2004


On Wed, Oct 20, 2004 at 01:09:51PM +0400, Aleksander N. Gorohovski wrote:
> >Имеется список в фомате хтмл, вида
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >необходима программа, которая обработает каждую запись списка
> >следующим образом: пройдя по ссылке найдёт на страничке определённый
> >текст по шаблону (наверное, регулярное выражение) и вставит этот текст
> >в конец строки.
> >Чем бы это сделать ?
> Думаю лучше чем Perl, ничто ни справится!

Ну почему.  Ruby, например. :)

По мотивам 
/usr/share/doc/ruby-doc-extra-0.1/ProgrammingRuby-0.3a/html/tut_io.html:

---
#!/usr/bin/ruby
require 'net/http'

while line = gets
	pattern = Regex.new('http://[a-zA-Z0-9_.]+(:\d+)?(/\S+*)\s+(.*)$')
	host, port, path, rest = line.scan(pattern)
	next unless host
	port = 80 unless port
	path = "/" unless path
	begin
		conn = Net::HTTP.new(host, port)
		resp, data = conn.get(path, nil)
		if resp.message == "OK"
			data.scan(/<img src="(.*?)"/) { |x| puts line + x }
		end
	rescue
		next
	end
end
---

Где-то так (не проверял :) -- должно работать фильтром, в данном
случае выводящим исходную строчку с добавлением пути к картинке
для каждой строчки stdin, соответствующей pattern, для которой
удалось вытащить страничку и найти в ней эти пути.

Но это так, просто пример похожий вспомнился -- писать вообще-то
всегда полезней самому, уж коль странного захотелось :-)

Просто такие вещи на shell пишутся (и особенно модифицируются) уж
больно болезненно, эффективнее получается сразу вложить время в
хороший язык.
  
-- 
 ---- WBR, Michael Shigorin <mike на altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/



Подробная информация о списке рассылки community