ХРАНЕНИЕ ДАННЫХ НА ВНЕШНИХ ЗАПОМИНАЮЩИХ УСТРОЙСТВАХ
2. ОСОБЕННОСТИ ОРГАНИЗАЦИИ ДАННЫХ НА ВЗУ Большие массивы данных и архивные данные размешаются на устройствах внешней памяти (ВП), где они организуются в файлы. В системах математического обеспечения компьютера обычно имеются средства для работы с файлами — файловые системы. Основными информационными единицами для наборов данных, хранящихся на ВЗУ, являются логическая запись; физическая запись или блок; файл; том. На уровне ВЗУ логическая запись определяет ту же информационную единицу, которая используется при рассмотрении методов организации и обработки данных в ОП. Однако для файловой системы запись представляет собой минимальный и неделимый элемент данных, характеризуемый только длиной. Длина логической записи определяется прикладной программой пользователя и выражается в байтах или машинных словах. В системах управления данными различают записи фиксированной, переменной и неопределенной длин. При любом формате записи могут иметь ключ или не иметь его. Характеристики записи, удобные для пользователя-программиста (в частности, длина записи), часто оказываются неудобными для организации обмена между ВЗУ и ОП. Обмен логическими записями требует большого количества команд ввода — вывода и ухудшает использование объема памяти устройства ВП. Поэтому при размещении на внешнем носителе записи объединяются в блокиили физические записи и обмен между ВЗУ и ОП осуществляется блоками. Количество логических записей, объединенных в один блок, называется коэффициентом блокирования. Блокирование данных не влияет на их логическую обработку. Блок записей передается с ВЗУ в специально выделенную область ОП — буфер. В буфере физическая запись разблокируется и передается на обработку в другие области ОП. Максимальный размер блока ограничен объемом буфера. Буфер организован как очередь. По мере освобождения буфера в него помещается следующая физическая запись. Логические записи, прошедшие обработку, по одной поступают в буфер. После того как в буфере наберется определенное количество логических записей, равное коэффициенту блокирования, образовавшаяся физическая запись передается в устройство ВП. Файл - это совокупность логически связанных записей, имеющая имя и описание в системе. Используя имя файла, можно обратиться к данным, объединенным в него. Имя файла и его характеристики содержатся в специальной управляющей записи — метке файла. Имена всех файлов, находящихся в системе, вместе с адресами их хранения записываются в специальный каталог, с помощью которого обеспечивается автоматический поиск файла по его имени. Рассмотренное определение файла дает логическую интерпретацию этого термина. Физически файл представляет собой участок поверхности носителя информации, где под общим названием хранятся физические записи. Файл может занимать, например, часть МЛ, целую ленту или несколько лент. Над записями файлов осуществляют те же операции, что и над записями массивов, хранящихся в ОП: ведение, модификацию, поиск. Отдельную операцию, затрагивающую запись или несколько записей, называют транзакцией. Для выполнения любой транзакции необходимо определить ключ записи, подлежащей обработке, и тип операции. В ряде случаев бывает необходима дополнительная информация. Файлы в системе могут храниться на различных носителях. Для того чтобы была возможность именовать каждый носитель целиком, независимо от размера размещенного на нем файла, введено понятие тома данных. Том— это отдельно адресуемый физический носитель, например сменный пакет дисков, магнитный барабан, бобина магнитной ленты. В пределах одного тома может размещаться один или несколько файлов и тогда том называют соответственно одно- или многофайловым. Один файл может занимать несколько томов, в этом случае имеет место многотомный файл. Информация, идентифицирующая том, размещается на специально выделенном участке носителя и образует специальную запись — метку тома. По ней операционная система обеспечивает контроль за правильностью установки тома на ВЗУ. Тома ВЗУ могут накапливаться в системе в больших количествах. Информация о значении и содержании каждого тома записывается на специальных бирках - внешних метках. Они наклеиваются на каждый том снаружи. Структуру внешней метки устанавливает администрация вычислительного центра. Адресация (идентификация) томов осуществляется в соответствии с внешними метками. Каждый файл имеет абсолютный адрес на ВЗУ. Соответствие между именами файлов и их абсолютными адресами устанавливается файловой системой. Начало файла определяется меткой файла. Каждый блок и каждая логическая запись также имеют адрес — это адрес их первого байта. Адрес может быть абсолютным или относительным. Абсолютный адрес непосредственно определяет физическое положение записи в томе в терминах конкретного устройства. Принцип задания абсолютного адреса рассматривался ранее. Относительный адрес блока - это порядковый номер блока относительно первого блока файла. Относительный адрес записи задается адресом блока, в котором эта запись содержится, и смещением. Смещение равно числу байтов в блоке, предшествующих началу адресуемой записи. При обращении к конкретной записи относительный адрес преобразуется в абсолютный. Для организации структур данных на ВЗУ широко используются указатели, содержащие информацию, отсылающую к другой записи в файле или к записи другого файла. В качестве указателя может использоваться ключ записи, ее абсолютный или относительный адрес. При использовании в качестве указателей абсолютных адресов нельзя записи, на которые устанавливаются указатели, физически перемещать на носителе, так как в противном случае указатели могут оказаться "висящими", т.е. указывать на пустые места памяти. Также опасным в этом случае является удаление записей. При размещении на освободившихся участках памяти новых записей старые "висящие" указатели могут установить ложные логические связи. Для устранения опасности "зависания" указателей при удалении каждой записи надо тщательно отыскивать и корректировать все установленные на нее указатели.
2.2. ТИПЫ ФАЙЛОВ И РЕЖИМЫ ИХ ОБРАБОТКИ Существуют следующие типы файловых структур данных: последовательный, индексно-последовательный; прямой и библиотечный файлы. Перечисленные типы файлов отличаются друг от друга способом размещения записей файлов на внешнем носителе: в одном случае при размещении записей может существовать взаимосвязь между ключом записи и ее местоположением (адресом хранения), в другом — этой связи не существует. Ключом записи, как и ранее, будем называть информацию, однозначно определяющую запись и позволяющую ее выделить среди других записей. Наиболее простым подходом к хранению записей файла является их последовательное размещение. Именно так организуются последовательные файлы. Последовательные файлы могут создаваться на всех типах внешних носителей, остальные три типа файлов могут создаваться только на носителях с непосредственным доступом: магнитные диски (МД). Для всех типов файлов возможны три основных режима их обработки: последовательный, произвольный и режим корректировки. При последовательном режиме обработки записи файла передаются из ВЗУ в ОП и обрабатываются там в той последовательности, в которой они размещены на носителе. Последовательность обработки при этом никак не зависит от прикладных программ. В произвольном режиме записи передаются в ОП и там обрабатываются в том порядке, в котором этого требует прикладная программа. Например, пусть файл содержит сведения о сотрудниках учреждения. Требуется получить справки об отдельных сотрудниках. При последовательной обработке в ОП вводятся подряд все записи файла и затем последовательно просматриваются. В результате просмотра всего файла будут найдены нужные записи. При произвольной обработке порядок просмотра записей может определяться, например, табельным номером этих сотрудников и просмотра всего файла не требуется. В режиме корректировки в файл добавляются новые записи, удаляются устаревшие и модифицируются уже имеющиеся. Для осуществления корректировки требуется предварительный поиск нужной записи. При поиске, файл может обрабатываться как в последовательном, так и в произвольном режимах. Эффективность каждого из режимов обработки зависит от типа файла.
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|