[devel] java dependencies
Alexey Rusakov
=?iso-8859-1?q?ktirf_=CE=C1_altlinux=2Eorg?=
Сб Июн 9 03:51:41 MSD 2007
On Fri, 8 Jun 2007 19:39:03 +0400
Alexey Tourbin wrote:
> Я переделал rpm-build-java (см. /people/at/packages/rpm-build-java.git).
> Статус экспериментальный и недоделанный (подразумевает новый rpm-build,
> которого пока нет в сизифе), но основные моменты продуманы.
>
> Вкратце, я предлагаю реализовать поиск зависимостей на основе точной
> информации из *.class файлов, и примерно с такой же гранулярностью (на уровне
> *.class файлов, см. ниже насчет вложенных классов). Также можно сохранить
> Provides зависимости на уровне *.jar файлов (для совместимости с JPackage),
> но все Requires зависимости я предлагаю перевести на уровень *.class файлов.
>
> (Для тех, кто совсем не в курсе, поясню, что *.jar файлы -- это zip-архивы,
> которые содержат в себе много-много class-файлов -- байткод. Java умеет
> смотреть в *.jar архивы как в обычные каталоги и отыскивать там class-файлы.
> Но все реальные зависимости имеют место быть между class-файлами, а не
> jar-архивами. Дальше можно не читать.)
>
> Предлагаемый формат зависимостей имеет вид java(java.lang.Object).
>
> Я пока не во всём разобрался, поэтому ищу специалистов по java (особенно по JVM).
>
> Я прочитал спецификацию "VM Spec: The class File Format"
> http://java.sun.com/docs/books/jvms/second_edition/html/ClassFile.doc.html
> и буквально по этой спецификации написал на перле парсер class-файлов, который
> в первом приближении умеет извлекать зависимости. Похожий парсер есть в
> rpm/tools/javadeps.c, но мой парсер получился в несколько раз короче и проще,
> так что написание с нуля я не считаю убитым временем.
>
> Парсер называется jcf-reqprov (java class file, по аналогии с jcf-dump из gcc)
> и умеет полностью парсить константный пул и таблицу классов (см. VM Spec).
> Предыдущий предельно упрощенный парсер из java.req (egrep -hao 'L[a-zA-Z/_]+;')
> делал совсем не то что нужно, хотя и выдавал какие-то зависимости.
>
> Следующий вопрос адресован специалистам по JVM. Хотелось бы не просто парсить
> константный пул и таблицу классов, а дополнить парсер семантикой зависимостей,
> чтобы можно было сказать, в чем именно состоит зависимость на некоторый класc
> (например, суперкласс, суперинтерфейс и т.п.). Поддержка семантики
> зависимостей в первом приближении мной уже продумана, но пока как следует не
> работает. Мне хотелось бы знать, в каких именно случаях JVM ЗАГРУЖАЕТ другой
> class-файл, когда видит на него ссылку. Например, если некоторый метод умеет
> брать аргумент с типом некоторого другого объекта:
> ThisClass.Method(arg=OtherClass)
> означает ли это, что JVM сразу же, в процессе начальной обработки
> (компиляции) ThisClass, будет также (физически) загружать и OtherClass?
> Или же загрузка OtherClass в некотором смысле откладывается, то есть,
> например, происходит по факту вызова ThisClass.Method(arg) откуда-то ещё?
Насколько я ничего не понимаю в JVM, загрузка класса происходит
непосредственно перед использованием его имени в программе (то есть не
при начальной обработке точно). Но есть одно "но": существуют Just-in-Time,
и, хуже того, Ahead-of-Time компиляторы, которые на это поведение могут
существенно повлиять, в частности, поднимая какие-то классы раньше
времени.
Но честно говоря, мне сама идея описания зависимостей в терминах
классов видится неудачной; это не слишком отличается от описания
зависимостей между библиотеками на C в терминах конкретных
предоставляемых/используемых функций. Далеко не все публичные классы на
самом деле рассчитаны на использование снаружи - это мог быть где-то
недогляд программиста, а где-то класс оставили публичным просто "на всякий
случай, вдруг кому пригодится". И перечислять все классы в зависимостях
rpm, имхо, неразумно. Уж лучше изобрести некую концепцию, сходную с
версионированием динамических библиотек.
--
Alexey "Ktirf" Rusakov
GNOME Project
ALT Linux Team
Подробная информация о списке рассылки Devel