Здавалка
Главная | Обратная связь

Розвиток ідеї автоматичного реферування



 

Проблема автоматичної обробки інформації (АОІ) набуває з кожним роком усе більшого значення, що обумовлено стрімким збільшенням обсягу документів на електронних носіях і темпами розвитку всесвітньої мережі Інтернет. Одне із суттєвих завдань у цій галузі – пошук шляхів і методів автоматичного стиснення тексту, скорочення його обсягу, зберігаючи головний зміст, тобто побудова реферату.

Реферування, як і анотування, виникло в надрах бібліотечно-бібліографічної практики та наукової журналістики. Засоби аналізу документів, вироблені емпіричним шляхом, поступово формували методику бібліографічної роботи, яка мала яскраво виражений прикладний характер. Головним завданням прикладного анотування і реферування було визначення ступеня повноти відображення змісту першоджерела. Основна увага фахівців була сконцентрована на змістовній стороні, а питання про функції і типи рефератів

не розглядалися.

Така картина існувала до 20-х років минулого століття. Необхідно підкреслити, що анотування і реферування ніколи не розглядалися самостійно,

а завжди – в залежності від суті і завдань бібліографічної справи [1].

З виникненням і розвитком інформатики почався якісно новий етап осмислення даної проблеми: ставляться питання про автоматизацію анотування

і реферування, а також про види і функції вторинних документів, що використовуються як вихідні в інтегральних інформаційних системах. Вивчення цих питань виходить за межі бібліографії і книгознавства. Анотування і реферування стають об’єктами досліджень філософів, лінгвістів, фахівців у галузі кібернетики й обчислювальної техніки, а предметом постійних дискусій – теоретичні аспекти: функціональне призначення анотацій і рефератів і засоби розкриття змісту першоджерела у процесі згортання [2].

Проблема функціонального призначення рефератів виникла досить давно, і думки фахівців з цього приводу змінювалися неодноразово. Так, у певні часи вважалося, що реферат здатний повністю замінити читачеві першоджерело. Однак тоді ж існувала й радикально протилежна думка: реферат не може замінити першоджерело, він лише дозволяє робити висновок про необхідність звернення до цього джерела [3].

В основі суперечок, що постійно виникають з цього питання, лежить відносність розподілу в тексті першоджерела власне інформації, носієм якої є реферат, і метаінформації, носієм якої слугує анотація, а також нерозуміння принципової різниці між даними видами вторинних документів.

Різні автори використовують різні визначення поняття «реферат». Наведемо декілька прикладів:

Реферат (від лат. referre – повідомляти, доповідати) – це короткий

виклад змісту наукового документа [4].

Реферат – модель оригіналу, що пропорційно відображає його складові частини [5].

Реферат – це семантично адекватний, обмежений малий обсягом і разом з тим по можливості повний виклад основного змісту первинного документа, що характеризується постійністю структури і призначений для виконання різноманітних інформаційних функцій під час використання його читачами різних категорій [6].

 

Щоб уникнути неоднозначності трактування одного з ключових понять, зазначимо, що у процесі даного дослідження ми оперували останнім із наведених визначень.

Що стосується відмінності реферату від анотації, то, на наш погляд, вона полягає в наступному: реферат передає фактографічну інформацію і відповідає на питання, яку інформацію закладено в первинному документі; анотація ж являє собою стислу описову характеристику першоджерела і відповідає на запитання, про що говориться в первинному документі. Крім того, в анотації основний зміст передається «своїми словами», які припускають високий ступінь абстрагування та узагальнення матеріалу. У рефераті використовуються ключові фрагменти, тобто формулюються узагальнення, запозичені з тексту оригіналу, що робить більш реальним створення автоматичних рефератів.

 

Функціями реферату є [7]:

інформативна (передавання фактографічної інформації);

пошукова (подання пошукового образу первинного документа);

адресна (бібліографічний опис первинного документа);

довідкова (довідковий характер інформації в рефераті);

комунікативна (забезпечення обміну інформацією).

Реферати за функціональним призначенням поділяються на загальні

і спеціалізовані [7], а в залежності від повноти і форми викладу змісту первинного документа – на інформативні (реферат-конспект) та індикативні

(реферат-резюме).

Індикативний реферат містить лише ті положення, які тісно пов’язані

з темою реферованого документа, усе другорядне для даної теми не викладається. Індикативний реферат, окрім основних, може виконувати також індикативну функцію. Саме даний вид реферату викликає інтерес під час документального пошуку, використовується при вирішенні питання про необхідність перегляду першоджерела.

Основні вимоги до якісного автоматичного реферату не відрізняються від вимог до інтелектуального реферату. По-перше, реферат має бути релевантним першоджерелу, тобто встановлювати відповідність змісту документа до змісту запиту користувача. По-друге, реферат має стисло і точно відтворювати факти первинного документа.

 

Реферат в ідеальному вигляді має задовольняти інформаційні потреби споживачів, які володіють різними знаннями, що належать до різних галузей науки, і які цікавляться різними аспектами однієї й тієї ж проблеми і таке інше. Такий реферат умовно може бути названий універсальним [8].

У системі наукової комунікації реферат виступає як основна інформаційно-комунікативна одиниця [9], що зумовлено такими його властивостями [10]:

Від усіх видів вторинних інформаційних документів (анотації, резюме, бібліографічного опису) реферат відрізняється найбільшою інформативністю

в розкритті змісту першоджерела;

Використання рефератів для пошуку поточної або ретроспективної інформації може зекономити до 90% часу [11], необхідного на випадок звернення до первинних документів;

Форма надання інформації у вигляді реферату зручна для зберігання

у фондах довідково-інформаційних служб, у тому числі в автоматизованих інформаційних бібліотечних системах [11], а також в інформаційно-пошукових системах (ІПС).

Актуальність автоматизації процесу реферування була очевидною вже

40 років тому: «…різного виду кількісні підрахунки динаміки зростання первинних документів з екстраполяцією в майбутнє роблять вельми актуальною розробку питань механізації та автоматизації в цій галузі, оскільки підготовка вторинних документів пов’язана з колосальними витратами розумової праці, часу і коштів. Це, у свою чергу, вимагає як теоретичного і методологічного дослідження загалом, так і різних розробок у галузі формалізованих методів згортання» [12, c. 13].

Активні дослідження в галузі автоматичного реферування (АР) за останні два десятиліття ще більше зміцнили позиції реферату в системі АОІ. За всю історію розвитку реферування цей вид вторинного документа не був об’єктом такої пильної уваги дослідників у різних прикладних галузях, як у період автоматизації даного процесу. Внаслідок цього було розроблено чимало методів і систем АР, основні з яких описані в наступному підрозділі.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.