Здавалка
Главная | Обратная связь

ХРАНЕНИЕ ДАННЫХ НА ВНЕШНИХ ЗАПОМИНАЮЩИХ УСТРОЙСТВАХ



2. ОСОБЕННОСТИ ОРГАНИЗАЦИИ ДАННЫХ НА ВЗУ

Большие массивы данных и архивные данные размешаются на устрой­ствах внешней памяти (ВП), где они организуются в файлы. В системах математического обеспечения компьютера обычно имеются средства для работы с файлами — файловые системы.

Основными информационными единицами для наборов данных, хра­нящихся на ВЗУ, являются логическая запись; физическая запись или блок; файл; том.

На уровне ВЗУ логическая запись определяет ту же инфор­мационную единицу, которая используется при рассмотрении методов организации и обработки данных в ОП. Однако для файловой системы запись представляет собой минимальный и неделимый элемент данных, характеризуемый только длиной. Длина логической записи определяется прикладной программой пользователя и выражается в байтах или ма­шинных словах. В системах управления данными различают записи фик­сированной, переменной и неопределенной длин. При любом формате записи могут иметь ключ или не иметь его.

Характеристики записи, удобные для пользователя-программиста (в частности, длина записи), часто оказываются неудобными для органи­зации обмена между ВЗУ и ОП. Обмен логическими записями требует большого количества команд ввода — вывода и ухудшает использование объема памяти устройства ВП. Поэтому при размещении на внешнем носителе записи объединяются в блокиили физические записи и обмен между ВЗУ и ОП осуществляется блоками. Количество логичес­ких записей, объединенных в один блок, называется коэффициентом блокирования.

Блокирование данных не влияет на их логическую обработку. Блок записей передается с ВЗУ в специально выделенную область ОП — буфер.

В буфере физическая запись разблокируется и передается на обработку в другие области ОП. Максимальный размер блока ограничен объемом буфера. Буфер организован как очередь. По мере освобождения буфера в него помещается следующая физическая запись. Логические записи, прошедшие обработку, по одной поступают в буфер. После того как в буфере наберется определенное количество логических записей, равное коэффициенту блокирования, образовавшаяся физическая запись передается в устройство ВП.

Файл - это совокупность логически связанных записей, имеющая имя и описание в системе. Используя имя файла, можно обратиться к данным, объединенным в него. Имя файла и его характеристики содер­жатся в специальной управляющей записи — метке файла. Имена всех файлов, находящихся в системе, вместе с адресами их хранения записы­ваются в специальный каталог, с помощью которого обеспечивается автоматический поиск файла по его имени. Рассмотренное определение файла дает логическую интерпретацию этого термина. Физически файл представляет собой участок поверхности носителя информации, где под общим названием хранятся физические записи. Файл может занимать, например, часть МЛ, целую ленту или несколько лент.

Над записями файлов осуществляют те же операции, что и над запи­сями массивов, хранящихся в ОП: ведение, модификацию, поиск. От­дельную операцию, затрагивающую запись или несколько записей, назы­вают транзакцией. Для выполнения любой транзакции необходимо опре­делить ключ записи, подлежащей обработке, и тип операции. В ряде слу­чаев бывает необходима дополнительная информация.

Файлы в системе могут храниться на различных носителях. Для того чтобы была возможность именовать каждый носитель целиком, незави­симо от размера размещенного на нем файла, введено понятие тома данных. Том— это отдельно адресуемый физический носитель, например сменный пакет дисков, магнитный барабан, бобина магнитной ленты. В пределах одного тома может размещаться один или несколько файлов и тогда том называют соответственно одно- или многофайловым. Один файл может занимать несколько томов, в этом случае имеет место мно­готомный файл. Информация, идентифицирующая том, размещается на специально выделенном участке носителя и образует специальную за­пись — метку тома. По ней операционная система обеспечивает контроль за правильностью установки тома на ВЗУ.

Тома ВЗУ могут накапливаться в системе в больших количествах. Информация о значении и содержании каждого тома записывается на специальных бирках - внешних метках. Они наклеиваются на каждый том снаружи. Структуру внешней метки устанавливает администрация вычислительного центра.

Адресация (идентификация) томов осуществляется в соответствии с внешними метками. Каждый файл имеет абсолютный адрес на ВЗУ. Соответствие между именами файлов и их абсолютными адресами устанавливается файловой системой. Начало файла определяется меткой файла.

Каждый блок и каждая логическая запись также имеют адрес — это адрес их первого байта. Адрес может быть абсолютным или относитель­ным. Абсолютный адрес непосредственно определяет физичес­кое положение записи в томе в терминах конкретного устройства. Прин­цип задания абсолютного адреса рассматривался ранее. Относи­тельный адрес блока - это порядковый номер блока отно­сительно первого блока файла. Относительный адрес записи задается адресом блока, в котором эта запись содержится, и смещением. Смещение равно числу байтов в блоке, предшествующих началу адресуе­мой записи. При обращении к конкретной записи относительный адрес преобразуется в абсолютный.

Для организации структур данных на ВЗУ широко используются указатели, содержащие информацию, отсылающую к другой записи в файле или к записи другого файла. В качестве указателя может исполь­зоваться ключ записи, ее абсолютный или относительный адрес.

При использовании в качестве указателей абсолютных адресов нель­зя записи, на которые устанавливаются указатели, физически переме­щать на носителе, так как в противном случае указатели могут оказаться "висящими", т.е. указывать на пустые места памяти. Также опасным в этом случае является удаление записей. При размещении на освободив­шихся участках памяти новых записей старые "висящие" указатели мо­гут установить ложные логические связи. Для устранения опасности "зависания" указателей при удалении каждой записи надо тщательно отыскивать и корректировать все установленные на нее указатели.

 

 

2.2. ТИПЫ ФАЙЛОВ И РЕЖИМЫ ИХ ОБРАБОТКИ

Существуют следующие типы файловых структур данных: последо­вательный, индексно-последовательный; прямой и библиотечный файлы.

Перечисленные типы файлов отличаются друг от друга способом раз­мещения записей файлов на внешнем носителе: в одном случае при размещении записей может существовать взаимосвязь между ключом записи и ее местоположением (адресом хранения), в другом — этой связи не существует. Ключом записи, как и ранее, будем называть ин­формацию, однозначно определяющую запись и позволяющую ее выде­лить среди других записей.

Наиболее простым подходом к хранению записей файла является их последовательное размещение. Именно так организуются последователь­ные файлы.

Последовательные файлы могут создаваться на всех типах внешних носителей, остальные три типа файлов могут создаваться только на носителях с непосредственным доступом: магнитные диски (МД).

Для всех типов файлов возможны три основных режима их обработ­ки: последовательный, произвольный и режим корректировки.

При последовательном режиме обработки записи файла передаются из ВЗУ в ОП и обрабатываются там в той последовательнос­ти, в которой они размещены на носителе. Последовательность обработ­ки при этом никак не зависит от прикладных программ.

В произвольном режиме записи передаются в ОП и там обра­батываются в том порядке, в котором этого требует прикладная про­грамма. Например, пусть файл содержит сведения о сотрудниках учреж­дения. Требуется получить справки об отдельных сотрудниках. При последовательной обработке в ОП вводятся подряд все записи файла и затем последовательно просматриваются. В результате просмотра всего файла будут найдены нужные записи. При произвольной обработке поря­док просмотра записей может определяться, например, табельным номером этих сотрудников и просмотра всего файла не требуется.

В режиме корректировки в файл добавляются новые записи, удаляются устаревшие и модифицируются уже имеющиеся. Для осуще­ствления корректировки требуется предварительный поиск нужной записи. При поиске, файл может обрабатываться как в последовательном, так и в произвольном режимах. Эффективность каждого из режимов обработки зависит от типа файла.

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.