[sisyphus] I: recoll-1.10.0
Чернов Евгений
=?iso-8859-1?q?chernov-ev_=CE=C1_votgk=2Ecom?=
Сб Дек 1 13:01:45 MSK 2007
Michael Shigorin wrote:
> On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote:
> А что _не_ проиндексировалось? Я исключаю из пакета хелпер для
> *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> метров несколько многовато для скромной искалки). Остальное
> вроде входит всё. Что не входит -- писать надо (дампилки в
> plaintext).
Не индексируется естественно всё что осталось непросмотренное после
"падения" recollindex.
>
>> Баги не вешаю потому как весь софт уже не сизифовский может
>> местные баги.
>
> Тут критична только версия libxapian -- крэш-тест проводился дома
> на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.
>
Ну это пересобранное из сизифа для себя.
$ rpm -qa|grep xapian
libxapian-1.0.4-alt1
xapian-core-1.0.4-alt1
xapian-core-doc-1.0.4-alt1
libxapian-devel-1.0.4-alt1
$ rpm -qa|grep recoll
recoll-1.10.0-alt1
>> Вобщем в моем хоуме лежал файлик обозванный по русски с именем
>> примерно 100 символьным на нём индексация падала(если что - на
>> xfs домашний каталог с koi8-r).
>
> Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;)
Миш помоему ты ссылку кидал на эту статью
http://samba.org.ua/articles/?section=1&articleid=26 - я её просто в
firefox сохранил. Сейчас в отдельный каталог её сохранил и на него
только натравил recollindex. Вот вывод с максимальным debug.
$ recollindex
:4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0
:4:../rcldb/stoplist.cpp:22:StopList::StopList:
file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string:
open failed: ю
:4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786
:4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test
into /home/jin/.recoll/xapiandb
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner:
[/home/jin/tmp/test] mime [(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner:
application/x-fsdirectory [/home/jin/tmp/test]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc
is text/plain
:4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added
[/home/jin/tmp/test , ]
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner:
[/home/jin/tmp/test/Использование службы директорий LDAP для
представления метаинформации в глобальных вычислительных системах (Using
LDAP directory service for representation of metainformation in global
computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime
[(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner:
application/x-fsdirectory [/home/jin/tmp/test/Использование службы
директорий LDAP для представления метаинформации в глобальных
вычислительных системах (Using LDAP directory service for representation
of metainformation in global computing systems) - Samba & LDAP - Статьи
- samba.org.ua_files]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc
is text/plain
:2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too
long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory
service for representation of metainformation in global computing
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long
(> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory
service for representation of metainformation in global computing
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../index/indexer.cpp:120:DbIndexer::index: error while indexing
/home/jin/tmp/test:
:4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1
:4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take
some time
:4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done.
:4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0
:4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
$
Естественно после этого больше ничего не проиндексируется дальше.
>> Падает с чем-то вроде key_ too long или term too long на
>> каком-то письме.
>
> Просьба сохранять вывод и по возможности (если это рассылки
> или другая публичная информация) -- именно те данные, на которых
> падает. Тут хороший автор, можете и сами к нему сходить, но могу
> и я.
Сегодня времени нет на это, слишком долго индексируется. В понедельник
натравлю занаво и вывод пришлю.
>> Да и ещё ругается на pstotext, которого естественно в сизифе
>> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
>> собрал, чтобы не видеть ругани.
>
> Ну так закиньте в сизиф? Если лень связываться -- бросайте
> src.rpm или .spec, соберу, но почти всегда лучше самому
> присматривать за тем, что интересно. Особенно если его ещё
> не было.
Я просто не знаю надо этот pstotext ему или нет(может он что другое
использует, а это так забытые куски кода). В консоли ругается а меня это
немного напрягает. Вот и собрал 1.9. Там уже никаких обновлений с 2004
года. spec приложил - переделал из чужого как мог.
Если что ещё пересобрать надо, то в понедельник могу продолжить с ним
играться.
----------- следующая часть -----------
An embedded and charset-unspecified text was scrubbed...
Name: pstotext.spec
URL: <http://lists.altlinux.org/pipermail/sisyphus/attachments/20071201/bebbdbbc/attachment-0002.ksh>
Подробная информация о списке рассылки Sisyphus