Здавалка
Главная | Обратная связь

Развитие новых форм книжных изданий с использованием электронных аналогов. комбинированные издания



КОМБИНИРОВАННОЕ ИЗДАНИЕ — вид издания сложной материальной конструкции, в котором соединены разные носители информации: кодексное печ. издание (см. Кодекс/1/), аудиовизуальное произведение, такие электронные носители информации, как дискета, компакт-диск и др.

Комбинированное электронное представление печатных изданий

1. Введение

В современных электронных библиотеках, как правило, используется либо текстовое, либо графическое представление изданий [1]. В общих словах, комбинированное представление издания строится, как объединение этих двух основных представлений, а также включает информацию для их синхронизации. В результате такой комбинации, пользователь библиотеки имеет возможность использования достоверного графического представления с одной стороны, и все возможности для полнотекстового поиска — с другой.Формирование электронной библиотеки на основе комбинированного представления не является сегодня распространённым. Единственным широко известным проектом данного класса является электронная библиотека компании Google [2]. Вызвано это определённой сложностью технологии подготовки комбинированного представления, нестандартными задачами автоматизированной поддержки форматов.

2. Функциональное описание комбинированного представления

Графическое представление издания (будем также употреблять термин графический слой) — это комплект изображений страниц в каком-либо графическом формате, в нашем случае это JPG. Графическое представление даёт достоверную, но не формализованную информацию об издании, непригодную к использованию в задачах информационного поиска.Требования к комбинированному представлению издания определяются возможностями, которые web-сервер электронной библиотеки предоставляет конечному пользователю библиотеки в отношении данного издания.

 

Основными режимами работы пользователя с изданиями являются два: это режимы просмотра и поиска.

В режиме просмотра пользователь читает текст издания. Как правило, это удобнее всего делать, используя графический слой. Тем не менее, в отдельных случаях пользователю удобно переключиться в просмотр текстового слоя, например для копирования фрагмента текста. Соответственно, требованием к комбинированному представлению является строгое соответствие сегментов текстового слоя страницам издания.В режиме поиска пользователь имеет возможность найти документы по различным характеристикам: атрибутам и полным текстам. Для реализации этой возможности необходимо текстовое представление издания. Чтобы воспользоваться результатами поиска, пользователю требуется войти в специальный режим.В режиме просмотра результатов поиска пользователь видит то же самое издание, что и при обычном просмотре. Но с крайне существенным для нас отличием: найденные в результате полнотекстового поиска слова должны быть выделены визуально, мы будем говорить подсвечены, и по этим подсветкам должна быть реализована навигация (передвижения вперёд/назад). Для этого средствами браузера на изображение страницы накладываются цветные полупрозрачные прямоугольники.

Таким образом, мы приходим к самому существенному требованию к комбинированному представлению: оно должно содержать графические индексы.

Суммируем требования к комбинированному представлению издания. Такое представление должно содержать итекстовый слой; в его разметку, в частности, должно входить разделение на страницы

графический слой

графические индексы страниц

Сформулируем также два существенных свойства графического индекса. Часто слова в изданиях набраны с переносами — соответственно, графический индекс должен поддерживать соответствие одного слова не одному, а вообще говоря нескольким прямоугольникам. При реализации подсветки размеры прямоугольников слегка увеличиваются для удобства восприятия. Соответственно, в графическом индексе высокая точность для координат прямоугольников не требуется. Точность в 2-4 пикселя оказывается достаточной для всех практических задач.

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.