Информация на поверхностях накопителя хранится в виде последовательности мест с переменной намагниченностью, обеспечивающих непрерывный поток данных при последовательном их считывании. Вся информация (как и места ее хранения) делится на служебную и пользовательскую. Служебная и пользовательская информация хранятся в областях дорожек называемых секторами. Каждый сектор содержит область пользовательских данных – место, куда можно записать информацию, доступную в дальнейшем для чтения, и зону серво-данных, записываемых один раз при физическом форматировании и однозначно идентифицирующих сектор и его параметры. Вся серво-информация недоступна обычным процедурам чтения/записи и носит абсолютно уникальный характер в зависимости от модели и производителя накопителя.
Диски современных накопителей проходят первичную, или низкоуровневую, разметку (Low Level Formatting) на специальном заводском высокоточном технологическом стенде. В ходе этого процесса на диски записываются служебные метки – серво-информация, а также формируются привычные дорожки и сектора.
В настоящее время используется несколько различных методов кодирования данных на дисках.
Частотная модуляция (Frequency Modulation – FM) – метод, используемый в накопителях на сменных магнитных дисках. Иначе кодирование методом FM можно назвать кодированием с единичной плотностью. Метод предполагает запись данных бита синхронизации на носитель в начале каждого битового элемента. Битовый элемент определяется как минимальный интервал времени между битами данных, получаемый при постоянной скорости вращения диска носителя. Простота кодирования и декодирования по методу FM определяется постоянной частотой следования синхроимпульсов. Однако наличие этих бит синхронизации является одним из недостатков данного метода, т. к. результирующий код малоэффективен с точки зрения компактности данных (половина пространства носителя занимается битами синхронизации). Это один из первых методов, не используемый в настоящее время в накопителях на ЖД.
Модифицированная частотная модуляция (Modified Frequency Modulation – MFM) – улучшенный метод FM. Модификация заключается в сокращении вдвое длительности битового элемента – до 4 мкс и использовании бит синхронизации не после каждого бита данных, а лишь в случаях, когда в предшествующем и текущем битовых элементах нет ни одного бита данных. Такой способ кодирования позволяет удвоить емкость носителя и скорость передачи данных по сравнению с методом FM, т. к. в одном и том же битовом элементе никогда не размещаются бит синхронизации и данных, а на один битовый элемент приходится только одна перемена направления магнитного потока. Также в настоящее время не используется.
Запись с групповым кодированием (Run Limited Length – RLL) – метод, полностью исключающий запись на диск каких-либо синхронизационных бит. Синхронизация достигается за счет использования бит данных. Однако такой подход требует совершенно иной схемы кодирования, т. к. простое исключение бит синхронизации приведет к записи последовательностей из одних нулей или единиц, в которых не будет ни одной перемены полярности магнитного потока. Метод RLL происходит от методов, используемых для кодирования данных при цифровой записи на магнитную ленту. При этом каждый байт данных разделяется на два полубайта, которые кодируются специальным пятиразрядным кодом, суть которого в достижении хотя бы одной перемены направления магнитного потока для каждой пары его разрядов, что означает необходимость наличия в любой комбинации пятиразрядных кодов не более двух стоящих рядом нулевых бит. Из 32 комбинаций пяти бит такому условию отвечают 16. Они и используются для кодирования по методу RLL. При считывании происходит обратный процесс. При- менение метода кодирования RLL позволяет увеличить скорость передачи данных с 250 до 380 Кбит/с. Интересным является тот факт, что метод MFM является частным случаем метода RLL.
Модифицированная запись с групповым кодированием (Advanced Run Limited Length – ARLL) – улучшенный метод RLL, в котором, наряду с логическим уплотнением данных, производится повышение частоты обмена между контроллером и накопителем.
ХРАНЕНИЕ ДАННЫХ
При хранении данных решают две проблемы: сохранения данных в наиболее компактном виде и обеспечения удобного и быстрого доступа к ним.
Различают структурированные данные, в которых отражаются отдельные факты предметной области (это основная форма представления данных в СУБД), и неструктурированные, произвольные по форме, включающие тексты, графику и прочие данные. Эта форма представления данных широко используется, например, в Интернет-технологиях, а сами данные в виде отклика предоставляются пользователю поисковыми системами.
Организация того или иного вида хранения данных (структурированных или неструктурированных) связана с обеспечением доступа к ним. Под доступом понимается возможность выделения по каким-либо признакам элемента данных (или множества элементов) среди других элементов с целью выполнения над ним некоторых действий. При этом под элементом понимается как запись файла (в случае структурированных данных), так и сам файл (в случае неструктурированных данных).
Модели структурированных данных и технологии их обработки основаны на одном из трех способов организации хранения данных: в виде линейного списка (или табличном), иерархическом (или древовидном) и сетевом.
Для данных любого вида доступ осуществляется с помощью ключей. Для структурированных данных такие ключи входят в состав записей файлов в качестве отдельных полей записей. Для неструктурированных данных поисковые слова или выражения входят, как правило, в искомый текст. С помощью ключей выполняется идентификация требуемых элементов в массиве хранения данных.
В качестве единицы хранения данных принят файл.
Файл –это последовательность произвольного числа байтов, обладающих уникальным собственным именем.