[Comm] Re: Еще о локали utf-8 и файле Compose

Денис Смирнов =?iso-8859-1?q?mithraen_=CE=C1_freesource=2Einfo?=
Ср Янв 28 19:57:24 MSK 2004


On Wed, Jan 28, 2004 at 06:45:22PM +0300, Aleksey Avdeev wrote:

 >   Разница в объёме данных, а следовательно в накладных расходах на:
 > 1. хранение (диски не резиновые)

Есть такое, но не так уж и критично.
 
 > 2. резервное копирование (ленты не резиновые + время + 
 > _физический_ объём)


   642947 Ноя 13  1996 Лабиринт_отражений
   205139 Янв 28 19:26 Лабиринт_отражений.bz2
   273723 Янв 28 19:23 Лабиринт_отражений.gz
  1094149 Янв 28 19:23 Лабиринт_отражений.utf
   212953 Янв 28 19:26 Лабиринт_отражений.utf.bz2
   319371 Янв 28 19:23 Лабиринт_отражений.utf.gz

(319371 - 273723) / 273723 * 100 ~= 16% (для gzip -9)
(212953 - 205139) / 205139 * 100 ~= 3%  (для bzip2 -9)

То есть увеличение объёма составит 3% при использование bzip2.

 > 3. скорость обработки (в том числе - полнотекстовый поиск)

А индексы на что?
 
 > 4. поддержка индексов (объёмы + скорость поиска)

Бр-р-р-р-р. Индексирование строк без хэшей?
 
 > 5. ...

?
 
 >   Собственно уменьшение размера поля на 1 _бит_ - уже большой 
 > "+" для крупной БД! А Вы предлагаете 2х кратное _увеличение_ 
 > объёма для кириллической информации...

Увы, при моих (весьма скромных объёмах) для меня простота и прозрачность
кода значение имеет. Производительность значение имеет (но на ней размер
text/varchar/char полей особо не отражается). А вот объём, увы, не имеет.
И не будет иметь до тех пор, пока объёмы баз данных не станут превышать
хотя бы сотню гигабайт (SCSI HDD такого размера, что его стоиомть
становится сколь-либо существенной).
 
-- 
С уважением, Денис

http://freesource.info




Подробная информация о списке рассылки community