ПРЕДМЕТИЗАЦИЯ ДОКУМЕНТОВ
Под предметизацией понимают интеллектуальный или автоматический анализ содержательных и формальных признаков документа с целью его свертывания и отражения в поисковой системе с помощью языка предметных рубрик (ЯПР). Объектом предметизации является отдельный документ, его составная часть или совокупность документов. Предметы и явления действительности, получившие содержательное отражение в документе с помощью знаков естественного языка, называют предметом документа. Предметизация позволяет выразить предмет и некоторые формальные признаки документа с помощью предметных рубрик. Процесс предметизации Процесс предметизации состоит из нескольких операций: 1. Отбор документов, библиографические записи которых будут включены в предметный каталог. Предметизация документов 2. Анализ содержания и формы документа с целью определения предмета, аспектов его рассмотрения и выявления связи между ними в тексте. 3. Выбор смысловых компонентов (терминов) и формулировка из них рубрик, отражающих выявленные связи. 4. Стандартизация формулировки рубрик с помощью словарей предметных рубрик (или других пособий, например, тезаурусов). 5. Редактирование рубрик, то есть проверка их соответствия правилам предметизации и нормативным документам. 6. Написание рубрик на каталожных карточках или их ввод в базу данных. Качество предметизации зависит от точности отражения содержания документов с помощью языка предметных рубрик (ЯПР). Язык предметных рубрик — это искусственный информационно-поисковый язык, созданный на основе естественного языка, отвечающий требованию однозначности. Структурной единицей ЯПР являются предметные рубрики (простые и сложные), предназначенные для описания содержательных и формальных признаков документов или запросов. Требования к языку предметных рубрик ЯПР должен отвечать следующим требованиям: 1. Быть однозначным. Синонимия, полисемия и омонимия в ЯПР устранены. 2. Фиксировать парадигматические (логические и ассоциативные) отношения. 3. Грамматика ЯПР должна быть простой и подчинена определенным правилам. 4. Полнота словаря должна быть достаточной для предметизации документов и запросов, словарь должен допускать возможность исправлений и дополнений. Предметные рубрики включают в свой состав лексические единицы — слова или словосочетания, выражающие понятия. ВЯПР лексические единицы называются предметными заголовками (или заголовками предметных рубрик) и подзаголовками (или подрубриками), среди которых выделяют тематические, географические, формальные и хронологические подзаголовки. Предметный заголовок — это первый компонент сложной предметной рубрики. Он включает наименование предмета документа. Подзаголовки (подрубрики) отражают тот или иной аспект рассмотрения предмета, например: ©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|