[devel] python encodings
Alexey Tourbin
=?iso-8859-1?q?at_=CE=C1_altlinux=2Eru?=
Вс Ноя 18 04:52:03 MSK 2007
On Sun, Nov 18, 2007 at 03:41:13AM +0300, Alexey Tourbin wrote:
> $ hsh-shell
> $$ cd
> $$ echo '# coding: utf8' >test.py
> $$ /usr/lib/rpm/python.req test.py
> python.req: test.py: non-standard encoding: utf8
> python2.4(encodings)
> python.req: ERROR: test.py:
> python.req: maybe you need python-modules-encodings
> Traceback (most recent call last):
> File "/usr/lib/rpm/python.req.py", line 178, in ?
> import encodings
> ImportError: No module named encodings
> $$
>
> Вообще-то MemoryError в данном случае -- это питоновский баг
> http://bugs.python.org/issue979739
Здесь на самом деле нету MemoryError, потому что здесь есть ошибочка
в повторном выбросе исключения. Я только что это починил и заодно
сделал более точное определение модуля кодировки, хотя это вряд ли
реально где-нибудь потребуется. Впрочем, посмотрим.
commit 683c7b2a82e80aeacf1ca1dcc7bc76470f58483a
Author: Alexey Tourbin <at на altlinux>
Date: Sun Nov 18 04:45:01 2007 +0300
python.req.py: implemented search for particular encodings module
$ cat test2.py
# coding: cp1251
$ ./rpm-build-python/python.req.py test2.py
python.req: test2.py: non-standard encoding: cp1251
python.req: test2.py: encoding=cp1251 module=encodings.cp1251
python2.4(encodings.cp1251)
$
diff --git a/rpm-build-python/python.req.py b/rpm-build-python/python.req.py
index 53b3886..52b7e0c 100755
--- a/rpm-build-python/python.req.py
+++ b/rpm-build-python/python.req.py
@@ -150,33 +150,46 @@ else :
return 'iso-8859-1'
return enc
- def need_encoding(line):
+ missing_encodings = None
+ def get_encoding_module(enc) :
+ mod = 'encodings'
+ try :
+ from encodings import search_function
+ except :
+ missing_encodings = True
+ return mod
+ try :
+ mod = search_function(enc)[1].im_class.__module__
+ print >> sys.stderr, "python.req: %s: encoding=%s module=%s" % (src,enc,mod)
+ except :
+ pass
+ return mod
+
+ def need_encoding_module(line):
enc = get_raw_encoding(line)
if enc :
enc = get_enc_normal_name(enc)
if enc not in ['utf-8','iso-8859-1'] :
print >>sys.stderr, "python.req: %s: non-standard encoding: %s" % (src,enc)
- return enc
+ mod = get_encoding_module(enc)
+ return mod
for src in files :
ext = os.path.splitext(basename(src))[1]
if ext not in ['.so','.pyc','.pyo','.pth'] :
lines = [ line.rstrip().replace('\r','') for line in open(src).readlines() ]
- enc = None
+ encmod = None
if len(lines) > 0 :
- enc = need_encoding(lines[0])
- if not enc and len(lines) > 1 :
- enc = need_encoding(lines[1])
- if enc :
- print "%s(%s)" % (prefix,'encodings')
+ encmod = need_encoding_module(lines[0])
+ if not encmod and len(lines) > 1 :
+ encmod = need_encoding_module(lines[1])
+ if encmod :
+ print "%s(%s)" % (prefix,encmod)
try :
lis = parser.suite('\n'.join(lines)+'\n').tolist(line_info=1)
except StandardError,msg :
print >> sys.stderr, 'python.req: ERROR: %s: %s' % (src,msg)
- if enc :
- try :
- import encodings
- except :
+ if encmod and missing_encodings :
print >> sys.stderr, "python.req: maybe you need python-modules-encodings"
raise
for item in match(lis) :
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип : application/pgp-signature
Размер : 189 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url : <http://lists.altlinux.org/pipermail/devel/attachments/20071118/90c96acc/attachment-0002.bin>
Подробная информация о списке рассылки Devel