"Электронные библиотеки: перспективные методы и технологии, электронные коллекции"

Отчет о 4-й Всероссийской Конференции по Электронным Библиотекам (RCDL’2002)

1. Введение

С 15 по 17 октября 2002 г. в г. Дубне, в Объединенном Институте Ядерных Исследований, была проведена Всероссийская конференция по электронным библиотекам: "Электронные библиотеки: перспективные методы и технологии, электронные коллекции", RCDL’2002.

Электронные библиотеки (ЭБ) - область исследований и разработок, направленных на развитие теории и практики обработки, распространения, хранения, поиска и анализа цифровых данных различной природы. Электронные библиотеки, являющиеся хранилищами знаний, можно рассматривать как сложные информационные системы, при создании и использовании которых требуется решение многих научных, технологических, методологических, экономических, правовых и других вопросов. Технологии электронных библиотек стремительно развиваются. Проблемы семантики, интеграции информации, восприятия и представления разнообразных видов данных ждут более совершенных решений. Развитие технологий электронных библиотек становится всё более существенным для совершенствования стандартов здравоохранения, образования, науки, экономики, равно как и качества жизни вообще. Проекты формирования в цифровой форме информации, накопленной человечеством о Земле, Вселенной, Литературе, Искусстве, Окружающей среде, Человеке, являются примерами областей интенсивного развития глобальных репозиториев представления знаний.

Всероссийская конференция 2002 года (RCDL’2002) является четвертой конференцией по данному направлению (1999 г. - Санкт-Петербург, 2000 г. - Протвино, 2001 г. - Петрозаводск). Основная цель этой серии конференций заключается в том, чтобы способствовать формированию сообщества специалистов России, ведущих исследования и разработки в области электронных библиотек. Для такого сообщества конференция предоставляет возможность обсуждения идей и полученных результатов, установления контактов для более тесного сотрудничества. Конференция также способствует изучению зарубежного опыта, развитию международного сотрудничества в области электронных библиотек. Конференция акцентирует внимание на перспективных исследованиях и технологиях. Наряду с этим, значительное внимание уделяется прототипам приложений и электронным коллекциям, созданным в рамках проектов программы РФФИ по электронным библиотекам и других программ.

На конференцию было представлено 97 расширенных тезисов докладов. В результате проведенного рецензирования программным комитетом конференции было отобрано 59 секционных докладов и 13 стендовых доклада. К открытию конференции был издан сборник трудов конференции. Работа по организации и проведению конференции была поддержана грантами РФФИ и Миннауки.

В работе конференции приняло участие  104 специалиста из  16 городов России (Архангельск-2, Воронеж-2, Долгопрудный-1, Дубна-29, Екатеринбург-1, Казань-2, Москва-40, Нижний Архыз-2, Новосибирск-7, Петрозаводск-3, Пущино-1, Санкт-Петербург-9, Таганрог-1, Томск-2, Троицк-1, Черноголовка-2), а также 15 специалистов из-за рубежа (Венгрия-1, Германия-2, Латвия-1, Молдова-1, США-7, Украина-3).

2. Программа конференции

2.1. Структура конференции

  • Вводная секция
  • Секция   1. Гибридные библиотеки
  • Секция   2. Электронные библиотеки для образования
  • Секция   3. Семантика информационных ресурсов
  • Секция   4. Электронные библиотеки и информационные системы для организации науки
  • Секция   5. На пути к виртуальной обсерватории
  • Секция   6. Технология Data Grid
  • Секция   7. Астрономические фотоархивы
  • Секция   8. Научные коллекции
  • Секция   9. Организация астрономических коллекций
  • Секция 10. Методы представления и поиска документов (1)
  • Секция 11. Интегрированные репозитории научной информации
  • Секция 12. Интеграция разнородных коллекций
  • Секция 13. Методы представления и поиска документов (2)
  • Секция 14. Архивы
  • Секция 15. Индексирование документов
  • Заключительное заседание

2.2. Общая характеристика программы

Электронные библиотеки все более активно врываются в жизнь научных учреждений и университетов. Сейчас трудно представить себе университет Запада, в котором не было бы развитой электронной библиотеки. Электронные библиотеки, создаваемые на основе лицензионных соглашений с издательствами, вытесняют подписку на журналы. Вместе с тем, большей частью электронные библиотеки университетов функционально напоминают традиционные или объединяются с ними в гибридные. В перспективе электронные библиотеки должны стать репозиториями знаний. В программе научно-исследовательской конференции RCDL’2002 отражен этот широкий диапазон различных интерпретаций понятия «электронная библиотека». Проблемы создания гибридных библиотек сочетаются с рассмотрением электронных библиотек и информационных систем для организации науки. Рассматриваемые примеры специализированных научных коллекций показывают, что содержательно, структурно и функционально они выходят далеко за пределы традиционных библиотечных возможностей. Проблемы создания виртуальной астрономической обсерватории рассматриваются детально в контексте международного сотрудничества. Значительное внимание в программе конференции уделено формированию интегрированных репозиториев научной информации - глобальных в определенных областях знания, образуемых при помощи перспективных технологий (посредники) и традиционных подходов. Отдельно рассматриваются вопросы создания электронных архивов. Специальные исследования выделены в секции семантики информационных ресурсов, методов представления, поиска и индексирования документов.

Особо на конференции рассматривались электронные библиотеки в образовании как элементы виртуальной образовательной среды. На них возлагаются особые надежды в связи с происходящей глобальной трансформацией образования под действием информационных технологий. Помимо специальной секции, посвященной этим вопросам, во время конференции было проведено Международное Экспертное Совещание Института Информационных Технологий в Образовании ЮНЕСКО по рассмотрению состояния электронных библиотек в образовании в форме Круглого Стола.

2.3. Некоторые из доложенных и опубликованных результатов (общая характеристика)

В докладах, представленных крупными библиотеками России - РГБ, ГПНТБ, БЕН РАН, ЦНСХБ, рассмотрено состояние, применяемые технологии и перспективы развития цифровой составляющей в их гибридных библиотеках.

На секции 2 (Электронные библиотеки для образования) Mary Marlino (UCAR, USA) представила обзор ориентированных на профессиональное сообщество аспектов создания узко профильных электронных библиотек для образования (на примере DLESES - библиотеки в науках о Земле). Показана роль профессионального сообщества в процессе создания такой предметно-ориентированной библиотеки и взаимное влияние сообщества и библиотеки. Новый подход к организации учебных курсов на основе накопленного в электронных библиотеках материала рассматривался в докладе, представленном А. Ушаковым от имени группы специалистов из Калифорнийского Университета в Санта Барбаре по известному проекту Электронной библиотеки Александрия. В подходе во главу угла поставлена понятийная среда соответствующей предметной области. На примере курса физической географии показано построение обучающей среды на основе этой гипотезы о ведущей роли понятий при обучении и электронных библиотек. Технические аспекты создания электронной библиотеки для аэрокосмического образования рассмотрены в докладе Е.Б. Кудашева.

При обсуждении на секции 3 семантических аспектов информационных ресурсов в докладе Л.А. Калиниченко и Н.А. Скворцова внимание уделено возможности использования проекта стандарта онтологической модели DAML+OIL, разрабатываемого W3C, в предметных посредниках на основе инверсируемого преобразования этой модели в каноническую модель посредника. Дискусионно, хотя и недостаточно мотивированно (нужны примеры, демонстрирующие полезность идеи) выглядели предложения об "образном тезаурусе", "образных" метаданных и индексировании "образных данных" в докладе И.М. Зацмана.

Краткий обзор вопросов создания электронных библиотек для организации науки на секции 4 рассматривался в докладах, представленных ОИЯИ, группой физических институтов РАН, Казанским Госуниверситетом. В докладе Е.Н. Филинова и А.В. Бойченко в очередной раз предпринята попытка рассмотрения стандартов представления ресурсов в электронных библиотеках одновременно и для науки, и для культуры и для образования. Представленный материал не поспевает за фактическим развитием представлений ресурсов в современных электронных библиотеках ввиду очевидного отрыва от мирового сообщества в этой области быстро развивающихся технологий.

На секции 5 (На пути к виртуальной обсерватории) Guenther Eichhorn представил доклад о крупной электронной библиотеке публикаций в области астрономии - The Astrophysics Data System (ADS). Это впечатляющая по масштабам коллекция. О.Б. Длужневская и О.Ю. Малков рассказывали о планах приобщения Российского научного астрономического сообщества к международному движению в направлении Виртуальной Астрономической Обсерватории (ВАО). Для этого развивается проект Российской Виртуальной Обсерватории как компонента для интеграции в Международную ВАО. Доклад В.В. Витковского и др. представил информацию о вкладе Специальной астрофизической обсерватории РАН в ВАО. Доклады по астрономическим коллекциям были представлены также на секциях 7 и 9. Доклады от России и Украины на 7 секции посвящены созданию баз данных на основе архивов фотографических пластинок, накопленных в Пулковской и Крымской обсерваториях. На 9 секции обсуждались вопросы применения различных технологий при создании астрономических коллекций объектные модели для пульсарных данных (доклад А.Е. Авраменко) и XML для различных данных наблюдений (доклад В.В. Витковского и др.). Первый доклад характеризовал использование технологии объектной интероперабельности на основе CORBA/DCOM, второй доклад посвящен использованию Web сервисов и их интероперабельности на основе технологий SOAP, WSDL, UDDI.

Важное место в структуре конференции занимает секция 6, посвященная Data Grid и перспективам использования этой архитектуры в электронных библиотеках. Приглашенный доклад И. Заславского из Суперкомпьютерного центра в Сан Диего содержал краткий обзор развиваемых в этом центре технологий - Storage Resource Broker (SRB), являющийся представителем Data Grid, и MIX - посредник, реализующий подход Global as View к интеграции неоднородных источников данных. Пока эти архитектуры рассматриваются отдельно, хотя в перспективе ожидается их интеграция. Доклад В.В. Коренькова объяснил структуру большого проекта Европейского Союза по Data Grid и участие России в этом проекте. Эти два доклада позволяют сравнивать различные архитектуры Data Grid, развиваемые мировым сообществом.

Секции 10 и 13 были посвящены методам представления и поиска документов. Так, Benjamin M.Gross (UIUC,USA), проанализировав приемы работы с электронной почтой (способы выбора адресов, сортировки писем по категориям и т.п.) предложел свой вариант прототипа системы, имеющей на нижнем уровне память для собщений (писем) в виде реляционной базы данных и набор сервисов на верхнем уровне (например, с сервисом индексирования текстов и метаданных) для улучшения организации хранения сообщений, их выборки, адресации и навигации. Многие из предлагаемых решений могут быть применены и для организации электронных коллекций другого типа. Можно отметить и представленные коллективом авторов из Санкт-Петербургского Государственного Университета (СПбГУ) доклады по работам , поддержанным грантами РФФИ и посвященным исследованию возможности автоматического выявления HTML-документов подобной структуры (т.е.получения информации, облегчающей создание программ-медиаторов) и возможности использования информации о содержимом документов в окрестности рассматриваемых Web-страниц для повышения качества поиска. В докладе Б.В. Доброва и Н.В. Лукашевича основное внимание уделено разработке многоязычных информационных систем, в том числе средствам автоматической обработки, индексирования и поиска документов в "многоязычных" коллекциях документов. Большой объем работ по принципам создания на основе расширенной объектной модели документов (DOM) и наполнению научной информацией (по различным областям науки) Интегрированной Распределенной Информационной Системы (ИРИС) Сибирского Отделения РАН был представлен в докладе Ю.И. Шокина, А.М. Федотова и Ю.В. Леонова. В докладе М.В. Губина приведены результаты исследований, проведенных для выбора метода сжатия индексированных файлов (основной индексной структуры для поиска по тексту).

На секции 11 (Интегрированные репозитории научной информации) профессор Bernd Wegner ( Институт Математики Технического Университета в Берлине) отметил, что в деле создания баз знаний библиотечного типа необходимо формирование глобальных репозитариев, что в свою очередь связано с тремя видами деятельности : запоминанием доступных на данный момент электронных материалов, реализацией проектов для решения проблемы архивирования таких материалов с целью их сохранения в читабельном виде для будущих поколений и переводом напечатанной литературы в электронную форму с обеспечением хорошего доступа и поисковых возможностей для потенциальных читателей.Доклад и был посвящен некоторым деталям этой деятельности , в частности, для проектов с распределенной сетевой архитектурой EMANI (Electronic Mathematics Archives Network Initiative ( международный проект) и ERAM (Electronic Research Archive in Mathematics, Германия). Кроме того, был предложен план развития глобальной Электронной Библиотеки по математике (DML и RusDML).

Два доклада в этой секции (с участием авторов из Института Математики СО РАН, Института Проблем Информатики РАН, Института цитологии и генетики СО РАН и Института Вычислительной математики и математической геофизики СО РАН) были посвящены различным сторонам реализации распределенных систем в области молекулярной генетики и биологии, биотехнологии и медицины, и в частности конкретным реализациям системы Gene Discovery/GeneExpress и средствам использования баз данных TRRD, SWISSPROT (структура и функции белков, их классификация и т.д.), EMBL/GenBank (последовательности ДНК, РНК) и Medline. К сожалению, форма представления материала была слишком ориентирована на знание терминологии и понятий рассматриваемой предметной области.

На секции 12 (Интеграция разнородных коллекций) в докладе Ю.С. Затуливетра подчеркивалась предстоящая проблема превращения Интернет в программируемый метакомпьютер путем активизации функциональных возможностей компьютеров сети для глобальных общесистемных (подавление информационного шума, структуризация и интеграция информационных ресурсов, автоматическое управление вычислительными ресурсами) и пользовательских задач; отмечалось, что Grid-технологии - лишь первый серьезный шаг в этом направлении.

Два доклада на этой секции (В.А. Капустина и О.Л. Жижимова с соавторами) были посвящены возможностям и средствам применения протокола Z39/50 для создания профилированных распределенных информационных систем (стандартизации метаданных, схем данных). Наконец, на этой же секции была представлена Библиотечная Подсистема Интегрированной системы информационных ресурсов РАН (ИСИР РАН) как автоматизированная среда доступа к библиотечным каталогам и данным по степени доступности и использования материалов библиотек Институтов РАН (совместный доклад авторов из ВЦ РАН, БЕН РАН и Центра научных телекоммуникаций и информационных технологий РАН).

В рамках программы секции 14 (Архивы) можно отметить доклад Павла Браславского (Уральское отделение РАН) и Tomas Krichel (USA), посвященный технологии организации архивов данных, доступных через Web: форматам и использованию метаданных в стандарте Dublin Core в соответствие с проектом OAI (Open Archive Initiative) для академических организаций, их документов и коллекций. В докладах коллективов авторов из Института проблем передачи информации РАН и Института систем информатики СО РАН характеризовалась технология создания и использования тексто-графической базы данных по истории Российской фундаментальной науки на основе фондов архива РАН и персональных архивов.

Секция 15 (Индексирование документов). В рамках этой секции было представлено два доклада авторов из СПбГУ. В докладе А. Корявко и И. Некрестьянова рассматривалась проблема построения поисковых систем в Web, когда используются альтернативные подходы к оценке "полезности" Web-страниц для конкретного пользователя, опирающиеся, например, не только на информацию о содержимом документа, но и на метаинформацию как о документе, так и о самом пользователе (о его предыдущих запросах, какие документы и сколько времени он их просматривал после выполнения запроса и т.д., что позволяет более эффективно проводить ранжирование документов). Рассматриваются возможности одного из представителей методов, использующих информацию о связях между Web-страницами : алгоритма Клейнберга для ранжирования страниц Web.

Средства для поиска в среде слабоструктурированных данных отмечены в докладе Б.С. Хвостиченко и Б.А. Новикова.

3. Экспертное Совещание ИИТО ЮНЕСКО "Электронные библиотеки в образовании"

Во время конференции, 15 октября 2002 г., Институт Информационных Технологий в Образовании ЮНЕСКО, в кооперации с конференцией RCDL'2002, ОИЯИ и ИПИ РАН провел Международное Экспертное Совещание "Электронные библиотеки в образовании". В соответствии с планом деятельности ИИТО ЮНЕСКО, развивается проект по применению электронных библиотек в образовании. Целью Экспертного совещания явилось обсуждение Аналитического обзора "Электронные библиотеки в образовании", подготовленного международной группой экспертов. Содержание Аналитического обзора было представлено на совещании проф. Л.А. Калиниченко.

В обзоре рассматриваются технологические аспекты создания электронных библиотек на основе нескольких анализируемых проектов США и Европы. Так, в США разрабатывается Национальная электронная библиотека (NSDL) в области науки, технологий, инженерии, математики, ориентированная в первую очередь на использование в образовании и науке. NSDL (первая версия системы планируется в декабре 2002 г.) разрабатывается как интегрированная распределенная информационная среда. NSDL обеспечивает возможность доступа к разнообразным цифровым объектам - не только текстовым, но и мультимедийным, геопространственным объектам, объектам, представляющим результаты измерений, изучаемые образцы и даже дорогостоящие инструменты для дистанционного доступа. Ввиду такого разнообразия информационных объектов, NSDL поддерживает множественный набор различных стандартов метаданных. Интерфейсы таких систем эволюционируют от традиционных, основанных на ключевых словах, в сторону более семантических интерфейсов (например, использование в качестве запросов реперных отметок Атласа грамотности, созданного в США). Планируется весьма быстрое развитие NSDL, включая рассмотрение этой библиотеки как подструктуры федерального правительства.

Примером части NSDL является CITIDEL - интерактивная электронная библиотека в области компьютерных и информационных технологий, а также сетевая электронная библиотека диссертаций (NDLTD). Это - распределенные инфраструктуры с многоязыковым доступом, поддержкой множественных методов поиска информации и сбора метаданных. NDLTD поддерживается на государственном уровне в ряде стран - в Австралии, Бразилии, Германии, Индии, Корее, США, а также рядом национальных библиотек (включая Британскую Библиотеку).

Интересным примером высококачественной специализированной библиотеки в области конкретной предметной области является DLESE (the Digital Library for Earth System Education).

Важно, что наряду с поддержкой уже ставших традиционными данных, развиваются инфраструктуры, в которых информационными объектами являются потоки данных, измеряемых в реальном времени (например, данных измерений у поверхности Земли, в верхних слоях атмосферы, радиолокационных измерений, измерений посредством сетей мониторизации гроз, спутниковых наблюдений). В США уже развиты сети данных, предоставляющие такие измерения в реальном времени сотням университетов. Имеются проекты, которые такие потоковые данные сделают частью информации в NSDL.

Развиваются принципиально новые "кибер-инфраструктуры" для исследований и образования, позволяющие по-новому подойти к созданию электронных библиотек. В решетках данных термин xGrid, где x обозначает предметную область, обозначает структуру (например, BioGrid), объединяющую специалистов, информацию и инструменты в этой предметной области. Одной из целей таких решеток является открытая публикация научной информации.

Аналитический обзор рассматривает эволюцию этих проектов по крайней мере в пятилетней перспективе. В нем проанализированы также перспективные методы использования таких библиотек в образовательных целях.

Обзор завершается рекомендациями по следующему этапу проекта ЮНЕСКО - разработке образовательного модуля, ориентированного на различные группы слушателей в развивающихся странах (преподавателей; лиц, принимающих решения; преподавателей курсов повышения квалификации преподавателей).

В обсуждении Аналитического обзора приняли участие Dr. Mary Marlino (UCAR, Boulder, CO, USA), Alex Ushakov (UC in Santa Barbara, CA, USA), Prof. Bernd Wegner (TU Berlin, Germany), Dr. Stephan Koernig (TU Darmstadt, Germany), проф. В.П. Шириков (ОИЯИ, Дубна, Россия), д-р. С.А. Христочевский (ИИТО ЮНЕСКО), проф. А.Г. Марчук (ИСИ СО РАН, Новосибирск, Россия), д-р. В.Н. Захаров (ИПИ РАН) и др. Совещание рекомендовало издать и широко распространить текст Аналитического обзора и перейти к следующему этапу проекта ЮНЕСКО.

4. Решения конференции

На заключительной секции конференции участниками конференции были приняты следующие решения:

  • отметить важность и актуальность тематики конференции для развития научной и практической деятельности специалистов России в области создания и развития электронных библиотек,
  • провести в 2003 году Пятую Всероссийскую конференцию по электронным библиотекам (RCDL’2003) в Санкт-Петербурге,
  • рекомендовать программному комитету следующей конференции способствовать отбору большего числа приглашенных докладов и дальнейшему повышению качества принимаемых докладов,
  • для обеспечения планирования конференций RCDL, их устойчивого развития, преемственности традиций и качества организовать Наблюдательный Совет, в состав которого включить специалистов, имеющих опыт проведения подобных конференций RCDL и им подобных,
  • продолжить работу по укреплению связей конференций RCDL с зарубежными учеными, специалистами и профессиональными обществами.

Председатель Организационного комитета Конференции
А.Н. Сисакян
Сопредседатель Организационного комитета Конференции
В.В. Кореньков

Сопредседатели Программного комитета Конференции
Л.А. Калиниченко
О.В. Сюнтюренко
В.П. Шириков


©  Объединенный институт ядерных исследований, 2001 - 2002