[Comm] Архивирование и русские имена файлов

Alexander Bokovoy =?iso-8859-1?q?a=2Ebokovoy_=CE=C1_sam-solutions=2Enet?=
Ср Апр 7 14:54:45 MSD 2004


On Wed, Apr 07, 2004 at 01:43:19PM +0300, Dolgov OV wrote:
> On Wed, 7 Apr 2004 12:10:30 +0300
> Alexander Bokovoy <a.bokovoy на sam-solutions.net> wrote:
> > Проблема в том, что распространенные архиваторы вообще не имеют
> > понятия о кодировках в именах файлов и внутри архива хранят их как
> > есть, в 8-битными. Так что надо искать что-то, что о кодировках знает
> > (сие мне неизвестно). Проблема усугубляется тем, что в POSIX понятие
> > кодировки имени файлы неопределено -- имя файла это просто поток байт,
> > не содержащий определенных символов и заканчивающийся определенным
> > образом.
> > 
> 
> Стоит ли понимать Ваши слова так, что tar _не_распространенный_
> архиватор? :-) Я уже было думал, что tar все нормально проделывает
> только из-за того, что имя архива задается латиницей. Ведь он сначала
> создает как бы обычную копию данных, а уж потом этот _один_ получившийся
> файл сжимает. Ведь как результат просмотра/распаковки tar'овских архивов
> WinRAR'ом наблюдается архив в архиве. Ну тоесть открываем архив *.tgz
> видим в содержимом *.tar и аж потом, в результате просмотра
> предварительно распакованного *.tar видим свои данные.
> 
> Провел эксперимент. В /home/user (! раздел ext3, локаль СР1251) лежит к
> примеру папка Бланки. WinRAR запущен под win4lin + Win98. Пакую:
> 
> $ tar -czf бланки.tgz Бланки
А если у Вас будут файлы с именами в KOI8-R -- проверьте, будет ли WinRAR 
вести себя также толерантно?

В самом tar никакого перекодирования имен не делается.

-- 
/ Alexander Bokovoy
Samba Team                      http://www.samba.org/
ALT Linux Team                  http://www.altlinux.org/
Midgard Project Ry              http://www.midgard-project.org/



Подробная информация о списке рассылки community