[sisyphus] I: recoll-1.10.0

Чернов Евгений =?iso-8859-1?q?chernov-ev_=CE=C1_votgk=2Ecom?=
Сб Дек 1 13:01:45 MSK 2007


Michael Shigorin wrote:
> On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote:
> А что _не_ проиндексировалось?  Я исключаю из пакета хелпер для
> *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> метров несколько многовато для скромной искалки).  Остальное
> вроде входит всё.  Что не входит -- писать надо (дампилки в
> plaintext).
Не индексируется естественно всё что осталось непросмотренное после 
"падения" recollindex.
> 
>> Баги не вешаю потому как весь софт уже не сизифовский может
>> местные баги.
> 
> Тут критична только версия libxapian -- крэш-тест проводился дома
> на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.
> 
Ну это пересобранное из сизифа для себя.
  $ rpm -qa|grep xapian 

libxapian-1.0.4-alt1
xapian-core-1.0.4-alt1
xapian-core-doc-1.0.4-alt1
libxapian-devel-1.0.4-alt1
  $ rpm -qa|grep recoll 

recoll-1.10.0-alt1

>> Вобщем в моем хоуме лежал файлик обозванный по русски с именем
>> примерно 100 символьным на нём индексация падала(если что - на
>> xfs домашний каталог с koi8-r).
> 
> Мгм.  Можете прислать _имя_?  xfs с koi8-r найдётся ;)
Миш помоему ты ссылку кидал на эту статью 
http://samba.org.ua/articles/?section=1&articleid=26 - я её просто в 
firefox сохранил. Сейчас в отдельный каталог её сохранил и на него 
только натравил recollindex.  Вот вывод с максимальным debug.
  $ recollindex 

:4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0
:4:../rcldb/stoplist.cpp:22:StopList::StopList: 
file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string: 
open failed: ю
:4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786
:4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test 
into /home/jin/.recoll/xapiandb
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner: 
[/home/jin/tmp/test] mime [(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning 
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner: 
application/x-fsdirectory [/home/jin/tmp/test]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc 
is text/plain
:4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added 
[/home/jin/tmp/test , ]
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner: 
[/home/jin/tmp/test/Использование службы директорий LDAP для 
представления метаинформации в глобальных вычислительных системах (Using 
LDAP directory service for representation of metainformation in global 
computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime 
[(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning 
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner: 
application/x-fsdirectory [/home/jin/tmp/test/Использование службы 
директорий LDAP для представления метаинформации в глобальных 
вычислительных системах (Using LDAP directory service for representation 
of metainformation in global computing systems) - Samba & LDAP - Статьи 
- samba.org.ua_files]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc 
is text/plain
:2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too 
long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ 
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ 
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ 
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory 
service for representation of metainformation in global computing 
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long 
(> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ 
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ 
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ 
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory 
service for representation of metainformation in global computing 
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../index/indexer.cpp:120:DbIndexer::index: error while indexing 
/home/jin/tmp/test:
:4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1
:4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take 
some time
:4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done.
:4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0
:4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
$
Естественно после этого больше ничего не проиндексируется дальше.

>> Падает с чем-то вроде key_ too long или term too long на
>> каком-то письме.
> 
> Просьба сохранять вывод и по возможности (если это рассылки
> или другая публичная информация) -- именно те данные, на которых
> падает.  Тут хороший автор, можете и сами к нему сходить, но могу
> и я.
Сегодня времени нет на это, слишком долго индексируется. В понедельник 
натравлю занаво и вывод пришлю.
>> Да и ещё ругается на pstotext, которого естественно в сизифе
>> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
>> собрал, чтобы не видеть ругани.
> 
> Ну так закиньте в сизиф?  Если лень связываться -- бросайте
> src.rpm или .spec, соберу, но почти всегда лучше самому
> присматривать за тем, что интересно.  Особенно если его ещё
> не было.
Я просто не знаю надо этот pstotext ему или нет(может он что другое 
использует, а это так забытые куски кода). В консоли ругается а меня это 
немного напрягает. Вот и собрал 1.9. Там уже никаких обновлений с 2004 
года. spec приложил - переделал из чужого как мог.
Если что ещё пересобрать надо, то в понедельник могу продолжить с ним 
играться.
----------- следующая часть -----------
An embedded and charset-unspecified text was scrubbed...
Name: pstotext.spec
URL: <http://lists.altlinux.org/pipermail/sisyphus/attachments/20071201/bebbdbbc/attachment-0002.ksh>


Подробная информация о списке рассылки Sisyphus