[mdk-re] Re: Русские PDF - эксперименты

Виктор С. Грищенко (V Grichenko) =?iso-8859-1?q?kikabidze_=CE=C1_mail=2Eru?=
Вс Ноя 11 14:24:11 MSK 2001


	Результаты экспериментов по созданию
	PDF с русскоязычным текстом 
	(Mdk RE Spring / AltLinux Junior 1.1)




Система 1. Mandrake RE Spring 2001
 KOffice последней версии (apt-get)
 AFPL Ghostscript 7.03
 QT: libqt2-2.3.1-alt5

Суть экспериментов:
В KWord создаётся документ из одной строчки некоторым шрифтом 
(Type 1/TrueType) в некоторой кодировке (iso8859-1/koi8-r, локаль
неизменно LANG=ru_RU.KOI8-R).
Документ печатается в PS и PDF (KWord перегоняет PS->PDF ps2pdf'ом)
Полученные PS изучаются на предмет embedded font, полученные
PDF - просматриваются в Acrobat Reader 4.0 для Linux.

Далее - фрагменты полученных PS
----------Type 1 URW Nimbus Roman------------
/FontName /NimbusRomNo9L-Medi def
/PaintType 0 def
/FontMatrix[.001 0 0 .001 0 0]def
/FontBBox[-167 -340 1102 960]def
/FontType 3 def
/Encoding StandardEncoding def
/FontInfo 10 dict dup begin
/FamilyName (Nimbus Roman No9 L) def
/FullName (Nimbus Roman No9 L Medium) def
----------TTF MS Verdana---------------------
Примечание: русские буквы  в тексте отсутствуют,
кодировка шрифта - ISO8859-1
/FontName /Verdana def
/PaintType 0 def
/FontMatrix[.001 0 0 .001 0 0]def
/FontBBox[-49 -206 1447 1000]def
/FontType 3 def
/Encoding StandardEncoding def
/FontInfo 10 dict dup begin
/FamilyName (Verdana) def
/FullName (Verdana) def
----------TTF Monotype Courier----------------
/FontName /CourierNewPSMT def
/PaintType 0 def
/FontMatrix[.001 0 0 .001 0 0]def
/FontBBox[-20 -679 638 1021]def
/FontType 3 def
/Encoding StandardEncoding def
/FontInfo 10 dict dup begin
/FamilyName (Courier New) def
/FullName (Courier New) def
----------------------------------------------
Т.е. за редисок сегодня Trolltech...
Голимый Type 3 от и до.
Кстати, при печати из Kate имеем также Verdana как Type 3 




Система 2. AltLinux Junior 1.1
 Конфигурация: с диска, за исключением ghostscript (обновлён до
 AFPL GS 7.0)

Фрагменты PS:
--------Monotype Courier New ISO8859-1-------
/Monotype-courierNewList [
[ /Monotype-courierNew 1.0 0.0 ]
  [ /Courier 1 0 ]
] d
% No embeddable font for Monotype-courierNew found
--------MT Courier New koi8-r ------------------
/Monotype-courierNewList [
[ /Monotype-courierNew 1.0 0.0 ]
  [ /Courier 1 0 ]
] d
% No embeddable font for Monotype-courierNew found
--------URW Nimbus Roman koi8-r --------------
% Font resource
%!PS-AdobeFont-1.0: NimbusRomNo9L-Regu 1.06
%%Title: NimbusRomNo9L-Regu
%%CreationDate: Tue Sep  4 09:58:33 2001
%%Creator: frob
%%DocumentSuppliedResources: font NimbusRomNo9L-Regu
% Copyright (URW)++,Copyright 1999 by (URW)++ Design & Development; Cyrillic 
glyphs added by Valek Filippov (C) 2001
% Generated by PfaEdit 1.0 (http://pfaedit.sf.net/)
11 dict begin
/FontType 1 def
/FontMatrix [0.001 0 0 0.001 0 0 ]readonly def
/FontName /NimbusRomNo9L-Regu def
/FontBBox [-168 -281 1088 924 ]readonly def
/UniqueID 4217227 def
/PaintType 0 def
/FontInfo 13 dict dup begin
 /version (1.06) readonly def
 /Notice (Copyright \050URW\051++,Copyright 1999 by \050URW\051++ Design & 
Development; Cyrillic glyphs added by Valek Filippov \050C\051 2001) readonly 
def
 /FullName (Nimbus Roman No9 L Regular) readonly def
 /FamilyName (Nimbus Roman No9 L) readonly def
------------------------------------------------

Т.е. для URW Type 1 в документе имеем-таки embedded Type 1 в PS.
Однако, Acrobat Reader 4 для Linux, датированный 24-м января 2000 г,
читать полученный PDF отказывается (unable to extract embedded font)
Acroread свежеинсталлированный сегодня (т.е. поломки исключены).
Стоит, однако, отметить, что на другой машине я делал PDF со шрифтами 
URW (KWord/Junior1.1/gs6.51) - и затем смотрел их Acrobat Reader'ом под
Windows. Буквы были нормальные, векторные. Но шрифт не понравился,
уж извините.

Единственный же нормальный PDF, полученный в ходе этого эксперимента
был сделан под Junior (см. выше) шрифтом MS Courier New, кодировка 
ISO8859-1 и русских букв не содержал (а содержал бы - были бы "??????"
в PDF)
Во всех остальных случаях были получены "пляшущие человечки", т.е. растр,
для Acrobat Reader'a неудобоваримый, т.е. к выкладыванию в Internet
непригодный (то есть абсолютно).

Примечание 1 : 
	для подтверждения результатов по Junior 1.1 был создан новый 
	пользователь, т.е. $HOME чистый. Результат тот же:
	в PS шрифты не включаются, PDF пляшущий.

Примечание 2 :
	в обоих случаях MS TTF устанавливались drakfont'ом.

Примечание 3 :
	использовался KWord по двум причинам:
	а) он мне больше нравится
	б) в Spring только он обновлён по apt до последней версии,
	   а в Junior AbiWord валится сразу при запуске, а у OpenOffice
	   Writer жестокие баги со шрифтами в интерфейсе (неправильно
	   определяет метрики шрифтов - буквы могут наползать друг на 
	   друга, могут вылазить за пределы виджетов - и т.п.)
	   Вправлять мозги всей этой п...братии мне недосуг.

	с наилучшими пожеланиями  -  Виктор С. Грищенко

	P.S. Причитающееся мне пиво прошу передать в фонд борьбы со СПИДом.

	P.P.S. Файлики у меня лежат, если кому интересно.

	-----

	IBM still has no interest in offering its own Linux distribution. 
	As Frye put it, "The Linux business model for IBM is straightforward:
	We sell the hardware underneath it, we sell the software on top of 
	it, and we sell the services all around it. The fact that we don't sell 
	the thin layer Linux operating system is frankly irrelevant." 




Подробная информация о списке рассылки community