[sisyphus] Mozilla SIGSEGV

Dmitry Alexeyev =?iso-8859-1?q?dmi=5Fa_=CE=C1_qnx=2Eorg=2Eru?=
Вс Сен 7 15:09:48 MSD 2003


День добрый! 

Оказалось, что я окончательно всех запутал. 
Я очень долго не мог понять, что кодировка изначального файла - utf-16. 
Просто я не поверил в то, что cat понимает utf-16 и корректно его 
отображает. 
Я открыл файл в mcedit и сделал следующее: 
1) убрал первые два лишних символа перед DOCTYPE
2) убрал <!(c)julius 2001> (при этом задев <hTML>)
3) покорёжил кодировку с unicode на unknown (там должно быть utf-16 по 
всем правилам)

После этого Mozilla стала падать при запросе этого файла. Почему? Не 
знаю. Вероятно из-за того, что unknown написано unibyte'ом поверх 
mulitbyte'а, т.е. выход за границы памяти шрифта (это только мои 
подозрения, я ничего не тестировал).

WBR,
Dmitry
> В сообщении от Воскресенье 07 Сентябрь 2003 01:42 Sergey Degtyaryov
>
> написал(a):
> > Mikhail Arkhipov wrote:
> > > В сообщении от Суббота 06 Сентябрь 2003 22:27 Alexey Lubimov 
написал(a):
> > >>>-------------------
> > >>>Т.е. сервер отдаёт это в нормальной кодировке.
> > >>>(Файл я взял оригинальный, на нём ничего не падает. Падать
> > >>> стало, когда я кодировку в unknown изменил и первые два символа
> > >>> удалил)
> > >>>
> > >>>Дальше:
> > >>>------------
> > >>>cat links-orig.htm |more
> > >>>ЪЧ<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
> > >>><!(c) atjulius 2001><HTML><HEAD><TITLE>JB Lab QNX Links</TITLE>
> > >>><META content="text/html; charset=unicode"
> > >>> http-equiv=Content-Type> <META content="Microsoft FrontPage
> > >>> 5.0" name=GENERATOR></HEAD> <BODY>
> > >>>-------------
> > >>
> > >><META content="text/html; charset=utf-8" http-equiv=Content-Type>
> > >
> > > Мозила 1.2.1 из АЛМ 2.2 не упала и выдала текст аналогично
> > > Konq-r. В редакторе последнего просматривается строчка:
> > > <hTML><HEAD><TITLE>JB Lab QNX Links</TITLE>
> > > ^^^^^^^ на лицо нестандартное написание тега. Закрывается
> > > он правильным <HTML>.
> >
> > Element names are written in uppercase letters (e.g., BODY).
> > Attribute names are written in lowercase letters (e.g., lang,
> > onsubmit). Recall that in HTML, element and attribute names are
> > case-insensitive; the convention is meant to encourage readability.
> >
> > http://www.w3.org/TR/html4/about.html#h-1.2.1
>
> С этим непоспоришь, но случаи всякие бывают. Не зря рекомендуют
> не смешивать регистры в написаниях тегов. IMHO, истина конечно
> где-то рядом, и дело не в <hTML>, иначе локальная копия вела бы
> себя аналогично. Просто приведенная ранее строчка
>
> <!(c) atjulius 2001><HTML><HEAD><TITLE>JB Lab QNX Links</TITLE>
>
> несколько отличается от увиденного в редакторе K-r.
> Думаю, что виноват сервер, может связано с идентификацией браузера?
>
> С уважением, Михаил.




Подробная информация о списке рассылки Sisyphus