РАЗВИТИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ ДОСТУПА К ДОКУМЕНТАМ

В зависимости от характера доступа к документам и источника их возникновения выделяют следующие группы документов и соответствующих им информационных сред:

  • • Документы, хранящиеся в библиотеках. Могут быть в электронном, или ином виде, зависящем от материального носителя (печатная копия, микрофильм и т. д).
  • • Документы, выпущенные издающими центрами (издательства, подписные агентства и т. д.). Существуют и в электронном, и в печатном виде. Документы, размещенные в вычислительных сетях. Существуют только в электронном виде.

Пользователю зачастую требуется доступ к документам, относящимся к различным группам, что обусловило развитие информационных ресурсов и систем работы с ними, объединяющих достижения каждого из направлений развития.

Разработка основных технологий и стандартов доступа к документам

Первым этапом в организации доступа к документам является разработка и внедрение машиночитаемых форматов библиографических описаний, что позволило компоновать описания документов в массивы данных и проводить по ним поиск.

Формат MARC (Machine-Readable Cataloging) был разработан в США в конце 60-х годов для формирования и ведения машиночитаемых каталогов документов. Его внедрение позволило предоставить доступ к сведениям о документах, хранимых в библиотеках [6, 7], что обеспечило значительную экономию времени и средств за счет заимствования записей. Распространение каталожных записей велось посредством магнитной ленты. Первым информационным сервисом стала каталогизация в едином информационном центре. Информация размещалась на центральном компьютере, с которым пользователь связывался с удаленного терминала и производил поиск требуемой информации. Получение печатного документа не предполагалось [8].

Технология распределенной (корпоративной) каталогизации является дальнейшим развитием формата MARC. Сейчас на базе данной технологии построен сервис OCLC (Online Computer Library Center) - некоммерческий членский компьютерный библиотечный сервис и научно-исследовательская организация, общественной целью которой является расширение доступа к мировой информации и сокращение расходов на информацию [9]. Сервис предоставляет доступ к библиографической, аннотационной и полнотекстовой информации. В настоящее время уже более 72000 библиотек 170 стран используют его для поиска, приобретения, каталогизации, заимствования и сохранение материалов [10]. Записи хранятся в формате MARC, что позволяет библиотекам находить и загружать сведения о материалах и добавлять их в местный каталог без длительного процесса каталогизации каждого материала в отдельности. OCLC и её библиотеки-члены создают и поддерживают сводный каталог WorldCat- OCLC Online Union Catalog, крупнейший в мире библиографический каталог (online public access catalog, OPAC). Содержимое каталога доступно через интернет-поисковики, библиографические и книготорговые сайты.

В конце 1970-х годов была начата реализация проекта Linked System Project, одним из результатов которого является протокол Z39.50, позволяющий организовать удаленный доступ к распределенным базам данных. Следует отметить, все 9

технологии доступа к документам, применявшиеся до разработки и внедрения web, включая OCLC, были построены с применением протоколов семейства Z39.50.

Как в США, так и в Европе, центры корпоративной каталогизации обычно развивались на основе библиотечных компьютерных сетей, которые, в свою очередь, зачастую являлись результатом развития академических сетей.

Ярким примером этой концепции является развитие сети JANET в Великобритании. Сеть позволяла получить доступ к документам Британской национальной библиотеки. На базе модернизированной сети JANET (SuperJANET) Британская национальная библиотека создала Центр хранения и обработки материалов Британской Библиотеки (British Library Document Supply Centre - BLDSC), являющийся крупнейшим поставщиком документов на территории Европы.

Для установления межбиблиотечных связей в рамках своих границ, Правительство Королевства Нидерландов в 1996 году начала развитие проекта PICA, целью которого являлось формирование единого библиографического поля, создание, актуализация баз данных информационных материалов, а также - формирование системы передачи заказов на литературу. Основным компонентом проекта является Центральная информационная система, которая состоит из:

  • • распределенной системы каталогизации изданий (GGC);
  • • каталога журнальных статей (OLC);
  • • документальной поисковой системы (ORS);
  • • сводного нидерландского каталога для

обеспечения МБА (NCC/IBL);

• полнотекстовых систем (научные

исследования - AHN, газеты - Newspapers).

В распределенной системе каталогизации изданий основную часть материалов обрабатывает Королевская

10

библиотека. В каталоге в настоящее время хранятся сведения о более чем 12 миллионах изданий на английском, французском, немецком и голландском языках. Сводный нидерландский каталог для обеспечения МБА выполняет роль общего каталога для более чем 350 библиотек Нидерландов. Каталог журнальных статей хранит библиографическую информацию о периодике и содержит сведения о более чем 13,6 тысячах наименований журналов по различным областям знания. Документальная поисковая система позволяет осуществить поиск документов, содержащихся в библиотеках, принимающих участие в проекте PICA. Сервисы, предоставляемые полнотекстовой системой научных исследований, ориентированы, в первую очередь, на запросы научных работников, преподавателей и студентов учебных заведений. Система позволяет получить как библиографические сведения, так и полные тексты научных статей [11].

Во Франции для решения задач каталогизации созданы и успешно функционируют 3 корпоративные сети: сеть Национальной библиотеки, ABES и OCLC, объединяющие 38, 27 и 22 библиотеки соответственно. В состав сети ABES входит пять основных распределенных баз данных (далее - БД):

  • • БД диссертаций (более 326 тысяч записей);
  • • БД электронного межбиблиотечного абонемента (МБА);
  • • БД книг (1,7 млн. записей);
  • • БД периодических изданий (293 тысяч записей);
  • • каталог предметных рубрик.

Создан Сводный каталог библиотек Франции SUDOC, который аккумулирует библиографические описания книг, статей, периодических изданий, аудиовизуальных и других документов, поступающих более чем из 2000 библиотек Франции [11].

Развитие технологий доступа к документам можно условно разделить на ряд этапов. На первом этапе, в практику внедряются машиночитаемые способы описания документов и инструменты работы с ними. Для проектов, разрабатываемых на данном этапе характерно:

  • 1. библиографические описания документов составлялись в формате MARC, которые компоновались в каталоги, отражающие фонд той или иной библиотеки. Для задач обмена записями между библиотеками также применялся формат MARC;
  • 2. формирование заказа на доставку копий документов осуществляется на базе протоколов семейства Z39.50 (по сети) или по телефону, а непосредственная пересылка материалов осуществляется по локальной сети или с помощью факса;
  • 3. почти полное отсутствие полнотекстовых электронных версий документов;
  • 4. на данном этапе развития доступом к документу понимался доступ к метаданным о документе, или, в редких случаях, к аннотации или реферату.

Одной из первых попыток создать электронную библиотеку как систему доступа к документам в кампусе университета был проект Университета Карнеги-Меллона Mercury Electronic Library в 1987-93 гг. [12, 13] и проект CORE в Корнельском университете, в котором предполагалось создать по материалам журналов коллекцию химических структур, доступную в режиме «он-лайн». Оба этих проекта выполнялись в сотрудничестве с издательствами, которые осуществляли сканирование журналов, создавая тем самым коллекции графических образов страниц.

Сходным являлся проект европейско-американский проект Tulip 1991-1995 гг. издательства Elsevier [14], целью которого была организация лицензионного доступа университетских библиотек к научным журналам. В течение трех лет издательство поставляло группе университетов сканированные изображения содержания 43 журналов в области материаловедения. Каждый университет размещал эти материалы на своем сервере и предоставлял локальный доступ.

Следующий шаг развития технологий связан с массовым переводом печатных, графических и иных материалов, имеющихся в библиотеках, в электронный вид и организацией соответствующих хранилищ ресурсов и инструментов работы с ними. В рамках проектов данной стадии развития осуществлялась разработка форматов представления разнородной информации в электронном виде и совершенствование механизмов перевода материалов в электронный вид. Развитие информационных технологий предоставило инструменты, при помощи которых стало возможным оцифровать материалы коллекций многих крупных библиотек.

Значительная часть проектов, начавшихся на данном этапе, развиваются до настоящего времени.

Одним из наиболее ярких примеров проектов данного этапа является библиотека Конгресса США, имеющая большой фонд разнообразных материалов (рукописи, карты, кинопленки, звукозаписи и т.д.), связанных с историей Америки. American Memory - это программа, работавшая в период с 1989 по 1994 гг., в рамках которой были переведены в электронные форматы материалы, наиболее ценные для понимания культуры и истории Америки [15].

Третий этап развития технологий доступа к документам связан с широким распространением сети Internet, развитием технологий world wide web и началом системных исследований в 13

этой области. Характерной чертой проектов данного периода является масштабность исследовательских работ, выход исследований за рамки чисто библиотечных технологий. Большинство исследований проводились в крупных университетах и послужили в последствии дальнейшему развитию технологий сети Internet. К началу 1994 года электронные библиотеки стали рассматриваться как самостоятельные объекты исследования. Начался проект Инициатива «Цифровые библиотеки», выполняемый при поддержке агентств DARPA, NASA и NSF, в рамках которого была начата работа по шести четырехлетним исследовательским проектам в области электронных библиотек, каждый из которых сопровождался исследованиями в смежных областях. Наиболее важными практическими результатами являются:

  • • Университет в Беркли (Калифорния) создал большую коллекцию электронных документов об окружающей среде штата, включая карты, графические изображения и правительственные отчеты.
  • • Университет в Санта-Барбаре (Калифорния) создал цифровую библиотеку Alexandria, содержащую преимущественно карты и географическую информацию. Направления исследований включали обработку метаданных географической информации, разработку пользовательского интерфейса для работы с электронными картами, новые методы анализа и использования библиотечных фондов, методы сжатия и передачи изображений.
  • • Университет Карнеги-Мэллона создал библиотеку видеофрагментов Informedia. Акцент исследований был сделан на мультимодальном поиске, позволяющим выполнять поиск информации из различных источников, распознавании изображений и речи, видеореферировании.
  • • Результатом работы университета в Иллинойсе является создание совместно с издательствами библиотеки научно-технических журналов. Основная часть усилий была направлена на обработку документов в формате SGML и изучение проблем обработки семантической информации в больших коллекциях ресурсов.
  • • Университет Мичигана на базе своих коллекций создает электронную библиотеку. Впервые были широко применены экономические модели и агентный подход для обеспечения интероперабельности.
  • • Стэнфордский университет проводил работы над системой InfoBus. Акцент был сделан на консолидацию сервисов, предоставляемых различными ресурсами в единой набор сервисов на базе электронной библиотеки. Основное внимание уделялось компьютерной литературе, моделировании экономических процессов в электронной библиотеке и разработку пользовательских интерфейсов.

В процессе выполнения работ по проектам, стало ясно, что экономически невыгодно управлять отдельными крупными коллекциями, поэтому оптимальным путем является объединение библиотек в консорциумы для создания и поддержания общих коллекций. В США библиотечные консорциумы организовывались по территориальному признаку и/или отраслям знания. В Европе, где большинство университетов государственные, создавались национальные 15

консорциумы, которые предоставляют услуги электронных библиотек академическому сообществу.

Развитие Web-технологий стало основной причиной развития пользовательских интерфейсов электронных библиотек. Web-браузеры, как неотъемлемая часть новой технологии, становятся повсеместно распространенными, поэтому становится ненужной разработка программного обеспечения для каждого типа операционной системы отдельно. Z-клиенты стали повсеместно заменяться шлюзам Z39.50-HTTP, осуществлявшим доступ к информационным ресурсам библиотек посредством браузера. Этот период развития систем доступа можно охарактеризовать как период электронных публикаций.

До второй половины 1990-х издательства ставили под сомнение целесообразность публикации научных материалов в сети, однако неуклонный рост количества пользователей и библиотек, активно применяющих онлайновые сервисы, заставил их пересмотреть свою точку зрения и начать работы по разработке систем доступа к собственным электронным ресурсам. Одной из крупнейших разработок является является программа Science Direct компании Elsevier. Для формирования информационного наполнения была произведена оцифровка текстов ретроспективных выпусков всех наименований научных журналов, издаваемых когда-либо компанией Elsevier. В процессе работ было оцифровано более 40 млн. страниц.

Работа над важнейшим для современных электронных библиотек проектом «Инициатива открытых архивов» (Open Archive Initiative, OAI) была начата в США в 1999 г. Целью проекта было создание инструментария для обеспечения возможности публикации авторами научных материалов в специализированных репозиториях, а также создание сервисов для сбора и обработки метаданных, описывающих эти материалы. Репозитории построены на базе «модели сбора 16

метаданных», использующей централизованное хранилище метаданных, доступ к которому осуществляют сервис-провайдеры, используя собственный протокол OAI. В основе модели лежат две концепции:

  • • расширяемость метаданных. Это позволяет учесть специфические особенности различных групп пользователей и областей знания;
  • • интероперабельность. Метаданные описываются посредством формата Dublin Core.

Следует отметить, что подобная модель описания хорошо работает для неизменяющихся документов и сталкивается с трудностями при описании метаданных, отражающих движение документа [17].

Развитие систем доступа к документам в Швеции в рамках национальной программы BIB SAM тесно связано с технологией открытых архивов. Концептуальные основы европейской модели открытых архивов определены Берлинской декларацией по открытому доступу к документам точных и гуманитарных наук [18, 19], в соответствии с которой автор (или организация) оплачивают право публикации в журнале, в то время как само издание в электронном виде предоставляется конечным пользователям бесплатно. Зачастую анализ и аргументы в пользу модели открытого доступа концентрируются на проблемах быстро растущих цен на журнальную подписку. Однако в равной степени анализ может опираться и на потенциал перспективного развития научных коммуникаций, и на возможное воздействие на результативность научных исследований, заложенных в идею открытого доступа, и использование научных публикаций через Интернет. В 2003 г. Университет г. Лунд при поддержке Института «Открытое общество» и BIBSAM разработал систему «Директория журналов открытого доступа» (Directory of Open Access Journals - DOAJ), которая предоставила полную информацию о 17

возможностях технологии открытого доступа как для библиотекарей, так и для пользователей. В 2004 г. Швеция присоединилась к Берлинской декларации, и был инициирован проект SVEP, в рамках которого все крупные шведские университеты приступили к «самоархивированию», создав централизованные хранилища - репозитарии научных публикаций своих сотрудников, преподавателей и студентов. В 2006 г. Королевская библиотека Швеции разработала новую программу, стратегической целью которой стало достижение максимальной доступности и наглядности результатов исследований, выполненных учеными, преподавателями и студентами шведских университетов. Значительное внимание в ней уделено увеличению объема и разнообразию материалов в академических репозиториях.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >