FAT (англ. File Allocation Table — «таблица размещения файлов») — классическая архитектура файловой системы, которая всё ещё широко используется для флеш-накопителей, флэш-картах, встроенных устройствах и разнообразных внешних носителях данных .

ИспользованиеПравить

В недавнем прошлом широко использовалась в дискетах, на жёстких дисках и других носителях информации.

FAT так же может быть использована на этапе загрузки в EFI-совместимых компьютерах - EFI System partition форматируется под FAT12, FAT16 или FAT32.

В операционных системах компании Microsoft FAT была основной и единственной файловой системой для M-DOS, MS-DOS, MSX-DOS, MS Windows 9x. Встроенной поддержкой FAT обладают системы MS Windows линии NT, а так же OS/2.

FAT поддерживается практически всеми современными UNIX-подобными системами, включая Linux, FreeBSD, а так же операционными системами Mac OS, BeOS, JNode, AmigaOS и многими другими.

АвторствоПравить

Первая версия FAT разработана Биллом Гейтсом и Марком МакДональдом (и закодирована последним) в 1976—1977 годах.[1][2].

При реализации 86-DOS (позднее переименована в MS DOS) Тимом Паттерсоном, хотя он и основывался на исходниках Microsoft Stand-alone Disk BASIC, структура FAT была переработана в некоторых деталях и совместимость между реализациями MS BASIC/M-DOS и 86-DOS была потеряна [3]. Некоторые более поздние версии MS-BASIC, судя по всему, уже использовали MS-DOS совместимую реализацию FAT, которая стала основой для всех дальнейших версий и расширений этой файловой системы.

FAT использовалась в качестве основной файловой системы в операционных системах компании Microsoft семейств DOS и Windows (до версии Windows 2000), а так же являлась основной файловой системой операционных систем M-DOS и MSX-DOS, выпускавшихся Microsoft для восьмибитных компьютеров.

Многочисленные расширения и доработки этой файловой системы производились разработчиками от Microsoft, лицензированными Microsoft OEM-производителями, а так же сторонними разработчиками.

С последними Microsoft пыталась судиться, утверждая в судах, что воспроизведение FAT нарушает её права на интеллектуальную собственность.

Стандартизация и интеллектуальная собственностьПравить

Структура FAT следует стандарту ECMA-107[4] (он же ISO/IEC 9293)][5] и подробно определяется официальной спецификацией от Microsoft, известной под названием FATGEN[6], однако и стандарт и документ от Microsoft не определяют все возможные версии и расширения этой файловой системы, даже в той их части, которая создавалась самой компанией Microsoft. В частности, эти стандарты описывают версии FAT с именами формата 8.3, но расширение с длинными именами VFAT частично запатентовано[7].

Общая идеологияПравить

Размещение файлов на диске описывается двумя структурами - таблицей размещения файлов (FAT), давшей имя самой файловой системе и иерархией записей о директориях (каталогах). Информация о размещении и параметрах самой FAT и корневой директории либо жестко выводится из логики работы ПО самой системы, либо, в зависимости от реализации, берётся из структур данных загрузочного сектора диска.

Каждый каталог состоит из записей фиксированной длины, содержащих имя файла (с возможным признаком удаления), его точный размер, атрибуты и время создания и номер первого кластера в цепочке FAT. Каталог является специальным видом файла, поэтому каталог может содержать записи и о других каталогах. Цикличность таких ссылок между каталогами подразумеваемо не допускается, но, на практике может быть создана средствами низкого уровня и, до известной степени, не влечёт проблем для ОС в работе с файловой системой[8]. Размер корневого каталога практически во всех реализациях FAT является фиксированным, размеры каталогов более низких уровней могут наращиваться, как и для обычных файлов.

FAT так же состоит из записей фиксированной длины, соответствующих минимальным единицам размещения информации на диске - кластерам, каждая из которых может содержать следующие значения:

  • признак того, что кластер свободен.
  • признак того, что кластер отмечен как сбойный
  • указатель на следующий кластер в цепочке кластеров, соответствующих конкретному файлу. (Цикличность ссылок не допускается, фактическое её появление приведёт к сбою в работе ПО).
  • признак того, что этот кластер - последний в цепочке кластеров, соответствующих конкретному файлу.

В рамках конкретного экземпляра файловой системы существует однозначное соответствие между номером кластера в FAT и его физическим адресом на диске. Алгоритм чтения файла в FAT сводится к получению номера первого кластера файла из записи о файле в каталоге и последовательном получении следующих номеров кластера из цепочки закодированной в FAT. По этим номерам ОС вычисляет физический адрес данных на диске. Контроль достижения конца файла осуществляется с учётом информации о его длине, закодированной в соответствующей записи каталога.

КодировкиПравить

По умолчанию для кодирования имён файлов используется кодировка ASCII.

Это означает, что в различных модификациях и клонах операционных систем, отличных от стандартной, возможно создание таких файлов с именами из символов второй половины кодовой таблицы ASCII, которые будут прочитаны не при любых языковых установках на других компьютерах. Для русскоязычной аудитории первоначальная неприятность использования национальных имён файлов состояла в том, что работавшие в разных кодировках русского языка адаптации MS-DOS показывали имена файлов, созданных в чужой кодировке, в искажённом виде.

Многие программы зарубежного происхождения попросту не понимали имена файлов, состоящие из символов с кодами свыше 127.

Дополнительное, хотя и не очень большое неудобство состояло в том, что для маркировки удалённых записей каталога принято использование кода E5, который соответствовал малой русской букве 'x' в наиболее общепринятой кодировке DOS (CP-866). Впрочем, неустранимых проблем от этого нет, т.к. в FAT принято использование заглавных букв в именах файлов, что при корректной работе ПО минимизирует неудобства. Увы, не любое программное обеспечение работает корректно.

Длинные имена VFAT кодируются с использованием кодировки UTF-16.

Версии системы FATПравить

Версии FAT от Microsoft отличаются разрядностью записей в дисковой структуре, то есть количеством бит, отведённых для хранения номера кластера, а так же особенностями построения внутренних структур данных.

Наименования FAT12, FAT16 и FAT32 в основном обозначаются так по количеству бит, выделенных для адресации кластера, но на практике за этими названиями скрываются несколько различных по структурам данных файловых систем. Другими словами, обозначения FAT12, FAT16 и FAT32 не дают однозначного понимания того, какая конкретно файловая система имеется ввиду.

Оригинальная FATПравить

Оригинальная версия FAT была разработана и закодирована Марком МакДональдом, впервые использована в продукте Microsoft Stand-alone Disk BASIC в версии от 1977 года, выпущенной для основанной на процессоре Intel 8080 системе компании NCR.

Так же поддерживалась операционной системой M-DOS, выпущенной Microsoft в 1979 году и версией MS-BASIC для процессоров Intel 8086, выпущенной тогда же.

Форматы FAT от MS BASIC и от M-DOS различались в следующих аспектах[9]:

  • FAT от BASIC использовал 8 бит. FAT от M-DOS существовал в 8, 10, 12 и 16-битных вариантах.
  • FAT от BASIC использовал 16-битную запись в директориях. FAT от M-DOS - 32-битную.
  • FAT от BASIC использовал 1 экземпляр таблицы FAT на дисковом носителе. FAT от M-DOS - 3 экземпляра этой таблицы.

Для конверсии дискет между BASIC и M-DOS существовали, соответственно, программа на BASIC и специальная команда в M-DOS.

Как было сказано выше, 12- и 16-битные варианты оригинальной реализации FAT были не совместимы с её реализацией в 86-DOS/MS-DOS.

Общепринятая реализация FATПравить

FAT12Править

Первая версия была реализована Тимом Паттерсоном в период между апрелем и августом 1980го года в операционной системе QDOS версии 0.11. По сравнению с оригинальной реализацией были изменен способ кодирования адресации кластеров в FAT, число таблиц FAT было сделано равным двум, корневой каталог был помещён между FAT и областью данных, была изменена структура данных записей корневого каталога, сделанных 32-байтными.

Первоначальная версия FAT16Править

FAT с логическими секторамиПравить

Финальная версия FAT16 и её модификацииПравить

FAT32Править

Расширения FATПравить

Расширения с сохранением основной структурыПравить
FAT+Править
Альтернативные потоки данных и форкиПравить
Расширенные атрибутыПравить
Длинные имена файловПравить
VFATПравить
UMSDOSПравить
posixovlПравить
TFATПравить
TFAT12Править
TFAT16Править
TFAT32Править

FATXПравить

exFAT (FAT64)Править

TexFATПравить

На основе FAT была разработана новая файловая система exFAT (extended FAT), используемая преимущественн о для флеш-накопителей.

Изначально FAT не поддерживала иерархическую систему каталогов. Все файлы располагались в корневом каталоге. Это оказалось неудобно и к тому же малый размер корневого каталога ограничивал количество файлов на диске. Каталоги были введены с выходом MS-DOS 2.0.

NWFSПравить

В различных операционных системах также были внедрены различные расширения FAT. Например, в DR-DOS имеются дополнительные атрибуты доступа к файлам; в Windows 95, Linux — поддержка длинных имён файлов (LFN) в формате Unicode (Virtual FAT — VFAT); в OS/2 — расширенные атрибуты всех файлов.


VFAT — это расширение FAT, появившееся в Windows 95. В FAT имена файлов имеют формат 8.3 и состоят только из символов кодировки ASCII. В VFAT была добавлена поддержка длинных (до 255 символов) имён файлов (англ. Long File Name, LFN) в кодировке UTF-16LE, при этом LFN хранятся одновременно с именами в формате 8.3, ретроспективно называемыми SFN (англ. Short File Name). LFN нечувствительны к регистру при поиске, однако, в отличие от SFN, которые хранятся в верхнем регистре, LFN сохраняют регистр символов, указанный при создании файла.[10][11]

Структура системы FATПравить

В файловой системе FAT смежные секторы диска объединяются в единицы, называемые кластерами. Количество секторов в кластере равно степени двойки (см. далее). Для хранения данных файла отводится целое число кластеров (минимум один), так что, например, если размер файла составляет 40 байт, а размер кластера 4 кбайт, реально занят информацией файла будет лишь 1 % отведенного для него места. Для избежания подобных ситуаций целесообразно уменьшать размер кластеров, а для сокращения объёма адресной информации и повышения скорости файловых операций — наоборот. На практике выбирают некоторый компромисс. Так как емкость диска вполне может и не выражаться целым числом кластеров, обычно в конце тома присутствуют т. н. surplus sectors — «остаток» размером менее кластера, который не может отводиться ОС для хранения информации.

Пространство тома FAT32 логически разделено на три смежные области:

  • Зарезервированная область. Содержит служебные структуры, которые принадлежат загрузочной записи раздела (Partition Boot Record — PBR, для отличия от Master Boot Record — главной загрузочной записи диска; также PBR часто некорректно называется загрузочным сектором) и используются при инициализации тома;
  • Область таблицы FAT, содержащая массив индексных указателей («ячеек»), соответствующих кластерам области данных. Обычно на диске представлено две копии таблицы FAT в целях надежности;
  • Область данных, где записано собственно содержимое файлов — то есть текст текстовых файлов, кодированное изображение для файлов рисунков, оцифрованный звук для аудиофайлов и т. д. — а также т. н. метаданные — информация относительно имен файлов и папок, их атрибутов, времени создания и изменения, размеров и размещения на диске.

В FAT12 и FAT16 также специально выделяется область корневого каталога. Она имеет фиксированное положение (непосредственно после последнего элемента таблицы FAT) и фиксированный размер в секторах.

Если кластер принадлежит файлу, то соответствующая ему ячейка содержит номер следующего кластера этого же файла. Если ячейка соответствует последнему кластеру файла, то она содержит специальное значение (FFFF16 для FAT16). Таким образом выстраивается цепочка кластеров файла. Неиспользуемым кластерам в таблице соответствуют нули. «Плохим» кластерам (которые исключаются из обработки, например, по причине нечитаемости соответствующей области устройства) также соответствует специальный код.

При удалении файла первый знак имени заменяется специальным кодом E516 и цепочка кластеров файла в таблице размещения обнуляется. Поскольку информация о размере файла (которая располагается в каталоге рядом с именем файла) при этом остаётся нетронутой, в случае, если кластеры файла располагались на диске последовательно и они не были перезаписаны новой информацией, возможно восстановление удалённого файла.

Загрузочная записьПравить

Первая важная структура тома FAT называется BPB (англ. BIOS parameter block) и расположена в зарезервированной области, в нулевом секторе. В контексте BPB слово BIOS не имеет отношения к загрузочной программе, расположенной в чипе CMOS, а означает Basic Input-Output System в смысле «нижней» части MS-DOS 2.0, которая отвечала за драйвера устройств, в дополнение «верхней» части — BDOS (Basic Disc Operating System).

BIOS Parameter BlockПравить

  Достоверность этой статьи поставлена под сомнение одним из участников Традиции.
Необходимо проверить точность фактов, изложенных в ней.
На странице обcуждения могут быть пояснения.

BPB в принципе отсутствовал в FAT, обслуживавшей MS-DOS 1.x, так как в то время предполагалось лишь два различных типа тома — одно- и двусторонние пятидюймовые дискеты на 360 кб, причём формат тома определялся по первому байту области FAT. BPB был введен в MS-DOS 2.x в начале 1983 года как обязательная структура загрузочного сектора, по которой впредь следовало определять формат тома; старая схема определения по первому байту FAT лишилась поддержки. Также в MS-DOS 2.0 была введена иерархия файлов и папок (до этого все файлы хранились в корневом каталоге).

Структура BPB в MS-DOS 2.x содержала 16-битное поле «общего количества секторов», что означало принципиальную неприменимость этой версии FAT для томов объёмом более 216 = 65 536 секторов, то есть более 32 Мб при стандартном размере сектора 512 байт. В MS-DOS 4.0 (1988) вышеназванное поле BPB было расширено до 32 бит, что означало увеличение теоретического размера тома до 232 = 4 294 967 296 секторов, то есть до 2 ТБ при 512-байтном секторе.

Следующая модификация BPB появилась вместе с Windows 95 OSR2, в которой была введена FAT32 (в августе 1996 года). Было снято двухгигабайтное ограничение на размер тома, том FAT32 теоретически может иметь размер до 8 Тб. Впрочем, размер каждого отдельного файла при этом не может превышать 4 Гб. BIOS Parameter Block FAT32 в целях совместимости с ранними версиями FAT повторяет BPB FAT16 вплоть до поля BPB_TotSec32 включительно, далее следуют различия.

«Загрузочный сектор» FAT32 в действительности представляет собой три 512-байтных сектора — сектора 0, 1 и 2. Каждый из них содержит сигнатуру 0xAA55 по адресу 0x1FE, то есть в последних двух байтах, в случае если размер сектора равен 512 байт. Если же размер сектора более, чем 512 байт, то сигнатура содержится как по адресу 0x1FE, так и в последних двух байтах нулевого сектора, то есть дублируется.

FSInfoПравить

Загрузочная запись раздела FAT32 содержит структуру под названием FSInfo, используемую для хранения значения числа свободных кластеров тома. FSInfo, как правило, занимает сектор 1 (см. поле BPB_FSInfo) и имеет следующую структуру (адреса относительно начала сектора):

  • FSI_LeadSig. 4-байтовая подпись 0x41615252, свидетельствует, что сектор используется для структуры FSInfo.
  • FSI_Reserved1. Промежуток с 4-го по 483-й байт сектора включительно, обнуляется.
  • FSI_StrucSig. Ещё одна подпись, расположена по адресу 0x1E4 и содержит значение 0x61417272.
  • FSI_Free_Count. Четырёхбайтовое поле по адресу 0x1E8, содержит последнее известное системе значение числа свободных кластеров тома. Значение 0xFFFFFFFF означает, что число свободных кластеров неизвестно и должно вычисляться.
  • FSI_Nxt_Free. Четырёхбайтовое поле по адресу 0x1EC, содержит номер кластера, от которого должен начинаться поиск свободных кластеров по таблице индексных указателей. Обычно это поле содержит номер последнего кластера FAT, отведенного для хранения файла. Значение 0xFFFFFFFF означает, что поиск свободного кластера должен проводиться с самого начала таблицы FAT, то есть со второго кластера.
  • FSI_Reserved2. Зарезервированное 12-байтное поле по адресу 0x1F0.
  • FSI_TrailSig. Подпись 0xAA550000 — последние 4 байта сектора FSInfo.

Смысл введения FSInfo в оптимизации работы системы, так как в FAT32 таблица индексных указателей может иметь значительные размеры и её побайтовый просмотр может занять значительное время. Однако значения полей FSI_Free_Count и FSI_Nxt_Free могут не соответствовать действительности и должны проверяться на адекватность. Кроме того, они даже не обновляются в резервной копии FSInfo, расположенной, как правило, в секторе 7.

Определение типа FAT томаПравить

Определение типа FAT тома (то есть выбор между FAT12, FAT16 и FAT32) производится ОС по количеству кластеров в томе, которое в свою очередь определяется из полей BPB. Прежде всего вычисляется количество секторов корневого каталога:

RootDirSectors = (BPB_RootEntCnt * 32) / BPB_BytsPerSec

Далее определяется, какие из полей BPB_FATSz16/32 и BPB_TotSec16/32 не равны нулю, и они используются при определении количества секторов области данных тома:

DataSec = TotSec — (BPB_ResvdSecCnt + (BPB_NumFATs * FATSz) + RootDirSectors)

Наконец, определяется количество кластеров области данных:

CountofClusters = DataSec / BPB_SecPerClus

По количеству кластеров проводится однозначное соответствие с файловой системой:

  • CountofClusters < 4085 — FAT12
  • CountofClusters = 4085 ÷ 65524 — FAT16
  • CountofClusters > 65524 — FAT32

Согласно официальной спецификации, это единственный допустимый способ определения типа FAT. Искусственное создание тома, нарушающего указанные правила соответствия, приведет к его некорректной обработке Windows. Тем не менее, рекомендуется избегать значений CountofClusters, близких к критическим (4085 и 65525), для верного определения типа файловой системы любыми, часто некорректно написанными драйверами.

На дискете при форматировании всегда создается FAT12. Что касается жестких-дисков и флеш-накопителей, то при размере накопителя до 512 Мб (при 512-байтном секторе) по умолчанию создается FAT16, свыше 512 Мб — FAT32. Размер кластера определяется при форматировании исходя из файловой системы и размера тома.

Серийный номер томаПравить

Серийный номер тома (поле BS_VolID) в Windows 98 создается из даты и времени форматирования таким образом, что восстановить их невозможно без дополнительной информации.

Таблица FATПравить

Следующая важная структура тома FAT — это сама таблица FAT, занимающая отдельную логическую область. Она определяет список (цепочку) кластеров, в которых размещаются файлы и папки тома. Между кластерами и индексными указателями таблицы имеется взаимно однозначное соответствие — N-й указатель соответствует кластеру с тем же номером. Первому кластеру области данных присваивается номер 2. Значение индексного указателя соответствует состоянию соответствующего кластера. Возможны следующие состояния:

  • кластер свободен — указатель обнулен;
  • кластер занят файлом и не является последним кластером файла — значение указателя — это номер следующего кластера файла;
  • кластер является последним кластером файла — указатель содержит метку EOC (End Of Clusterchain), значение которой зависит от версии FAT: для FAT12 меткой EOC считается любое значение, большее или равное 0x0FF8 (по умолчанию 0x0FFF); для FAT16 — большее или равное 0xFFF8 (по умолчанию 0xFFFF); для FAT32 — любое значение, большее или равное 0x0FFFFFF8 (по умолчанию 0x0FFFFFFF);
  • кластер поврежден — указатель содержит специальную метку, значение которой для FAT12 0x0FF7, для FAT16 0xFFF7 и для FAT32 0x0FFFFFF7. Поврежденный кластер не может использоваться файловой системой для хранения данных; соответствующие указатели не затрагиваются при форматировании тома, когда все остальные указатели обнуляются;
  • кластер зарезервирован «для будущей стандартизации» — указатель содержит значение, превышающее CountofClusters, но меньшее метки поврежденного кластера (то есть до 0xFFF6 включительно для FAT16). В этом случае кластер, не соответствуя никаким реальным данным, считается занятым и пропускается при поиске свободного, но никакой другой информации о нём не предоставляется.

Кластеры 0 и 1 отражаются FAT особо. Индексный указатель, соответствующий нулевому кластеру (самый первый указатель таблицы FAT), содержит значение BPB_Media в нижних 8 битах; остальные биты устанавливаются в 1. Например, если BPB_Media = 0xF8 (жесткий диск), FAT[0] = 0x0FFFFFF8 для FAT32. Таким образом, формально FAT[0] = EOC, что используется при обработке файлов нулевого размера (см. далее).

Второй зарезервированный указатель, FAT[1], при форматировании устанавливается в значение метки EOC. В FAT12 он не используется больше никак, а в FAT16 и FAT32 верхние два бита этого указателя могут содержать отметку о необходимости проверки тома (т. н. «грязный бит»), при чём все остальные биты выставлены в 1. Наличие грязного бита проверяется в процессе загрузки Windows программой autochk.exe. Грязный бит формируется при некорректном отключении тома или при аппаратной ошибке носителя и соответственно принимает два возможных значения.

Индексный указатель FAT32 по определению является 32-битным, однако верхние 4 бита в действительности игнорируются, так что значение указателя по сути является 28-битным. Единственной операцией, оперирующей с верхними 4 битами указателя, является форматирование тома, когда обнуляется весь указатель. Это означает, что, например, значения указателя 0x10000000, 0xF0000000 и 0x00000000 все соответствуют свободному кластеру, так как они отличаются лишь в верхних 4 битах.

Значение размера таблицы FAT по BPB, то есть BPB_FATSz16/32, может превышать реальное, так что в конце каждой таблицы FAT могут находиться сектора, не соответствующие никаким реальным кластерам данных. При форматировании эти сектора обнуляются, а в процессе функционирования тома никак не используются. Поэтому действительный адрес последнего сектора таблицы FAT, содержащего указатели на реальные кластеры тома, всегда должен рассчитываться из общего количества кластеров области данных, а не из поля BPB_FATSz16/32. Кроме того, последний сектор, занятый таблицей FAT, вовсе не обязательно весь занят ею — в этом случае избыточное пространство сектора так же не используется и забивается нулями при форматировании тома.

Файловые записиПравить

Непосредственно после окончания последней таблицы FAT следует область данных, содержащая файлы и папки. Каталог FAT (папка, директория) является обычным файлом, помеченным специальным атрибутом. Данными (содержимым) такого файла в любой версии FAT является цепочка 32-байтных файловых записей (записей каталога). Каталог не может штатно содержать два файла с одинаковым именем. Если программа проверки диска обнаруживает искусственно созданную пару файлов с идентичным именем в одном каталоге, один из них переименовывается.

Корневой каталогПравить

Единственным обязательно присутствующим каталогом является корневой каталог. В FAT12/FAT16 корневой каталог имеет фиксированный размер в секторах, который вычисляется из значения BPB_RootEntCnt, и следует на диске непосредственно после таблицы FAT.

В FAT32 корневой каталог, как и любой другой, имеет переменный размер и является цепочкой кластеров. Номер первого кластера корневого каталога отражается BPB_RootClus. Корневой каталог имеет следующие отличия от других каталогов тома FAT:

  • у него нет меток даты и времени;
  • нет собственного имени (кроме «\»);
  • он не содержит файлов с именами «.» и «..» (см. далее);
  • является единственным каталогом, в котором может штатно располагаться файл метки тома (см. далее).

Структура файловой записиПравить

Файловая запись FAT32 состоит из следующих структур:

  • DIR_Name. 11-байтное поле по относительному адресу 0, содержит короткое имя файла (в рамках стандарта 8.3). По поводу имен файлов см. далее.
  • DIR_Attr. Байт по адресу 0x0B, отвечающий за атрибуты файла.
  • DIR_NTRes. Байт по адресу 0x0C, используется в Windows NT.
  • DIR_CrtTimeTenth. Байт по адресу 0x0D. Счетчик десятков миллисекунд времени создания файла, допустимы значения 0-199. Поле часто неоправданно игнорируется.
  • DIR_CrtTime. 2 байта по адресу 0x0E. Время создания файла с точностью до 2 секунд.
  • DIR_CrtDate. 2 байта по адресу 0x10. Дата создания файла.
  • DIR_LstAccDate. 2 байта по адресу 0x12. Дата последнего доступа к файлу (то есть последнего чтения или записи — в последнем случае приравнивается DIR_WrtDate). Аналогичное поле для времени не предусмотрено.
  • DIR_FstClusHI. 2 байта по адресу 0x14. Номер первого кластера файла (старшее слово, на томе FAT12/FAT16 равен нулю).
  • DIR_WrtTime. 2 байта по адресу 0x16. Время последней записи (модификации) файла, например его создания.
  • DIR_WrtDate. 2 байта по адресу 0x18. Дата последней записи (модификации) файла, в том числе создания.
  • DIR_FstClusLO. 2 байта по адресу 0x1A. Номер первого кластера файла (младшее слово).
  • DIR_FileSize. DWORD, содержащий значение размера файла в байтах. Фундаментальное ограничение FAT32 — максимально допустимое значение размера файла составляет 0xFFFFFFFF (то есть 4 Гб минус 1 байт).

Если первый байт записи FAT (то есть DIR_Name[0]) содержит 0xE5 или 0x05, это значит, что запись свободна (соответствующий файл был удалён). 0 в DIR_Name[0] означает, что свободна не только эта запись, но и все следующие записи каталога; Windows не анализирует остаток каталога после обнулённой записи.

Имя файла в FATПравить

Поле DIR_Name логически разбивается на первые 8 символов, образующие имя файла, и последние 3, образующие расширение. Точка-разделитель добавляется на уровне операционной системы и не хранится в поле имени. Если имя и расширение файла не заполняют отведённое для них место, остальные байты поля DIR_Name заполняются пробелами (0x20). Имя и расширение файла могут содержать любую комбинацию букв, цифр или символов с ASCII-кодами свыше 127; специальные символы распределяются на три группы:

  • Разрешённые: ! # $ % & ( ) - @ ^ _ ` { } ~ '
  • Запрещённые: + , . ; = [ ]
  • Служебные: * ? < : > / \ | "

Служебные символы имеют особое значение в DOS и Windows и не могут входить в состав имени файла (знаки * ? являются метасимволами, а знаки : / \ используются как разделители в путях к файлам, остальные служебные и запрещённые знаки являются управляющими в интерпретаторах командной строки COMMAND.COM и cmd.exe), в то время как символы из числа запрещённых всё же можно включить в имя файла ценой возникновения LFN-записи (см. ниже). Например, каталог с именем, начинающимся точкой или содержащем несколько точек, можно создать в режиме командной строки (mkdir .directory) или в оболочках вроде FAR Manager, Total Commander, WinRAR. Имя файла не может начинаться или заканчиваться пробелом; ни в каком байте поля имени недопустимы управляющие символы ASCII (то есть 0х00-0х1F), за исключением оговорённого выше случая кода 5. Информация о текущей (на момент создания файла) кодовой странице DOS не сохраняется, поэтому доступ к файлам, в именах которых есть национальные коды из Extended ASCII (например, знаки кириллицы из кодовой страницы 866), при другой кодовой странице может быть проблематичным или невозможным (поскольку перед поиском файла в каталоге его имя переводится в верхний регистр в соответствии с таблицей, заложенной в кодовой странице). Полный путь к файлу не может превышать 80 байтов (3 — буква диска; 64 — путь; 12 — имя файла, включая точку-разделитель; 1 — терминальный нулевой знак).

Все буквенные символы 8.3 имени всегда переводятся и сохраняются в поле DIR_Name в верхнем регистре. Для сохранения исходного регистра имени Windows NT используется байт DIR_NTRes: 1 в бите 3 говорит, что имя следует отображать в нижнем регистре; за расширение отвечает бит 4. Если имя или расширение содержат символы обоих регистров, для такого файла создается LFN-запись (см. ниже). Windows 9x для сохранения нетривиального регистра имени всегда создает LFN-запись и игнорирует поле DIR_NTRes. Как следствие, имя одного и того же файла, лишённого ассоциированной LFN-записи, может отображаться Windows 9x целиком в верхнем регистре, а Windows NT — (частично) в нижнем.

Файловые атрибутыПравить

В байте атрибутов верхние два бита являются резервными и всегда должны быть обнулены. Остальные биты распределяются таким образом, что значение 0x01 соответствует атрибуту «только для чтения», 0x02 — «скрытый», 0x04 — «системный», 0x20 — «архивный». Набор нескольких атрибутов составляется суммированием основных значений. Кроме этих стандартных атрибутов, используются ещё следующие: 0x10 — свидетельствует, что файл является каталогом (контейнером для других файлов); 0x08 — ATTR_VOLUME_ID, специальный атрибут уникального файла нулевого размера в корневом каталоге, имя которого считается меткой тома. Ограничение длины метки тома FAT в 11 символов связано с размером поля DIR_Name. Если файл имеет набор атрибутов READ_ONLY | HIDDEN | SYSTEM | VOLUME_ID (значение 0х0F), это свидетельствует, что запись не соответствует отдельному файлу, а содержит часть длинного имени другого файла, не вписывающегося в рамки 8.3 (см. далее).

Искусственное присвоение ненулевого значения верхним двум битам DIR_Attr используется для формирования файлов, которые невозможно удалить или переименовать штатными средствами файловой системы без форматирования. Это полезно, например, при борьбе с вирусами Autorun.inf (программа Panda USB and AutoRun Vaccine). С другой стороны, это же средство могут использовать сами вирусы. Значение DIR_Attr = 0x40 резервировано для внутреннего использования (устройство).

Что происходит при создании каталогаПравить

При создании каталога для него «пожизненно» выставляется DIR_FileSize = 0. Размер содержимого каталога определяется простым следованием по цепочкам кластеров до метки End Of Chain. Размер самого каталога лимитируется файловой системой в 65 535 32-байтных записей (то есть записи каталога в таблице FAT не могут занимать более 2Мб). Это ограничение призвано ускорить операции с файлами и позволить различным служебным программам использовать 16 битное целое (WORD) для подсчета количества записей в каталоге. (Как следствие, возникает теоретическое ограничение на количество файлов в каталоге — 65 535 при условии, что все имена файлов следуют стандарту 8.3). Каталогу отводится один кластер области данных (за исключением случая, если это корневой каталог FAT12/FAT16) и полям DIR_FstClusHI / DIR_FstClusLO присваивается значение номера этого кластера. В таблицу FAT для записи, соответствующей этому кластеру, помещается метка EOC, а сам кластер забивается нулями. Далее создаются два специальных файла, без которых каталог FAT считается повреждённым (первые две 32-байтных записи в области данных кластера) — файлы нулевого размера с именами «.» (одна точка, идентификатор каталога) и «..» (две точки, указатель на родительский каталог). Отметки даты и времени этих файлов приравниваются значениям для самого каталога на момент создания и не обновляются при изменениях каталога. Поля DIR_FstClusHI / DIR_FstClusLO файла «.» содержат значение номера содержащего его кластера, а файла «..» — номера первого кластера каталога, содержащего данный. Таким образом, файл «.» отсылает к самому каталогу, а файл «..» — к начальному кластеру родительского каталога; если родительский каталог — корневой, начальным кластером считается нулевой.

Время и датаПравить

Двухбайтовая отметка даты имеет следующий формат:

  • биты 0-4 — день месяца, допускаются значения 1-31;
  • биты 5-8 — месяц года, допускаются значения 1-12;
  • биты 9-15 — год, считая от 1980 года («эпоха MS-DOS»), возможны значения от 0 до 127 включительно, то есть 1980—2107 годы.

Два байта, отвечающие отметке времени, распределяются так:

  • биты 0-4 — счетчик секунд (по две), допустимы значения 0-29, то есть 0-58 секунд;
  • биты 5-10 — минуты, допустимы значения 0-59;
  • биты 11-15 — часы, допустимы значения 0-23.

Из отметок даты и времени критическим является лишь время последней модификации (то есть DIR_WrtTime и DIR_WrtDate), остальные могут не поддерживаться многими системами; при операциях с файлом в такой системе (например, DOS или Windows 3.1) эти поля игнорируются. FAT сохраняет отметки даты и времени по местному часовому поясу, при его смене отметки не меняются.

Временные отметки каталогов задаются при создании и не изменяются при записи новых файлов в каталог, переименовании или выделении ему нового кластера.

Дата последнего доступа к файлу обновляется при каждом обращении, например при просмотре свойств файла, при перемещении на другой том (но не в пределах тома). При копировании файла в Windows 98 дата последнего доступа исходного файла обновляется, в Windows XP — нет.

Дата-время модификации файла изменяется при каждой записи нового содержимого в области данных (не в файловой записи). Другими словами, дата-время модификации не изменяется при смене атрибутов или переименовании файла. Перемещение или копирование файла сохраняет исходную отметку модификации.

Дата и время создания задается при выделении файловой записи для нового, не существовавшего до этого файла. Иначе говоря, при переименовании или перемещении файла дата и время создания не изменяется, а при копировании новый файл получает новую отметку. Таким образом, при копировании файла в Windows файл может получить более позднюю дату создания, чем дату модификации.

LFN-записиПравить

Файлы и каталоги с длинным именем (свыше 8.3) обрабатываются файловой системой FAT особым образом. Структура 32-битной записи для файла с LFN (Long File Name) отличается от обычной (SFN-записи):

  • LDIR_Ord. Первый байт записи, служит для нумерации записей в наборе.
  • LDIR_Name1. Десятибайтовое поле по адресу 0х01, содержит первые пять символов имени файла (вернее, той части его имени, которая отражена в данной LFN-записи).
  • LDIR_Attr. Байт атрибута по адресу 0х0B, равен 0х0F (ATTR_LONG_NAME).
  • LDIR_Type. Байт по адресу 0х0C, обнулен и дополнительно свидетельствует, что данная запись таблицы FAT относится к файлу с длинным именем.
  • LDIR_Chksum. Байт по адресу 0х0D, содержит контрольную сумму SFN псевдонима файла, соответствующего набору LFN-записей.
  • LDIR_Name2. 12-байтовое поле по адресу 0х0E, содержащее шестой-одиннадцатый символы имени файла.
  • LDIR_FstClusLO. 2-байтовое поле по адресу 0х1A, в контексте LFN-записи лишено смысла и обнуляется.
  • LDIR_Name3. 4-байтовое поле по адресу 0х1C, содержащее 12-й и 13-й символы имени файла.

Набор LFN-записей каталога FAT всегда должен быть связан с обычной SFN-записью, которой физически предшествует на диске. Набор LFN-записей, обнаруженный без соответствующей обычной записи, называется орфаном и запись считается поврежденной; подобный файл является совершенно невидимым в старых версиях MS-DOS/Windows.

В последовательности LFN-записей каждая из них имеет собственный порядковый номер, определяемый первым байтом (LDIR_Ord). Маска 0х40 свидетельствует, что данная запись является крайней в ряду следующих за ней LFN-записей (то есть, например, для третьей в ряду LFN-записи значение байта LDIR_Ord будет 0x43, для 17-й — 0x51). В последующих записях этот байт изменяется от N для N-й «длинной» записи по счету от соответствующей обычной, до 1 для ближайшей к обычной записи.

Длинные имена файлов хранятся в кодировке UNICODE (UTF-16), при этом сохраняется вводимый регистр буквенных символов. Если некоторый символ имени в кодировке OEM или UNICODE не может быть превращен в символ кодовой страницы, он всегда отображается в виде символа подчеркивания «_», при чём сохраненный на диске действительный символ не изменяется.

Байт контрольной суммы вычисляется по определенному алгоритму на основе 8.3 имени обычной записи (для файла с длинным именем «имя» из обычной записи называется псевдонимом — alias) и копируется во все соответствующие ей «длинные» записи. Если какое-либо из значений не согласуется с именем файла (например, если файл был переименован под ранней версией MS-DOS/Windows), возникает орфан.

SFN-псевдоним файла с длинным именем состоит из основной части и, при необходимости, цифрового «хвоста». Если файл имеет расширение, его первые 3 символа сохраняются в псевдониме. Соответствующее имя образуется переводом в кодировку OEM символов длинного имени файла, причем все пробелы длинного имени игнорируются, а символы, непереводимые в OEM либо запрещенные в контексте короткого имени, заменяются подчеркиванием «_». Цифровой хвост «~n», где n = 1 ÷ 999999, добавляется к псевдониму, если первоначально полученный псевдоним конфликтовал с именем какого-либо файла в том же каталоге, либо превышал стандарт 8.3, или если какой-либо символ при смене кодировки не нашёл OEM-аналога и был заменён подчеркиванием. Таким образом образуются псевдонимы типа NEWFIL~1.DJV (LFN = New file for me.djvu). Схема образования псевдонима файла оптимизирована для скорости операций и поэтому малопредсказуема в подробностях.

Имя файла длиной, некратной 13 символам, не заполняет поля имени LFN-записей таблицы FAT полностью. В таком случае имя файла искусственно оканчивается символом NUL (0x00), а избыточные байты забиваются единицами (то есть символами 0xFF).

Для длинных имен длина имени ограничена 255 символами, не считая разделителя NUL, а полный путь — 260 символами, включая NUL. В длинном имени также допускается использование шести специальных символов, запрещенных в коротких именах: + , ; = [ ]

При попытке создания в томе FAT32 файла или каталога с именем, содержащим такой символ, автоматически генерируется LFN-запись независимо от длины имени файла. Аналогичный процесс происходит при создании файла/папки с именем, содержащим не-ASCII символы.

Возможна ситуация, когда файл метки тома физически не предшествует всем записям тома с длинными именами (когда том не имеет метки или метка была назначена после записи какого-либо файла с длинным именем). Тогда метка тома в FAT12/FAT16 будет отображаться неправильно, так как будет взята из ближайшей LFN-записи (поскольку она также имеет атрибут VOLUME_ID), и при попытке изменения метки тома в действительности будет происходить нарушение имени соответствующего файла. При удалении файла, имеющего ассоциированные LFN-записи, последние не затрагиваются и становятся орфаном. При дальнейшем создании нового файла упомянутый орфан может быть ошибочно ассоциирован с ним в случае совпадения контрольных сумм имен старого и нового файлов, однако используемый алгоритм вычисления контрольной суммы (ASCII-код первого символа псевдонима файла циклически сдвигается на бит вправо и прибавляется код следующего символа и т. д.) делает такую вероятность ничтожно малой.

Смысл файловых операций в FATПравить

Форматирование тома — таблица индексных указателей обнуляется, за исключением первых трех (FAT[0] и FAT[1] зарезервированы, а FAT[2] содержит запись, соответствующую файлу метки тома, либо, при отсутствии её — метку EOC) и записей поврежденных кластеров; записи корневого каталога обнуляются (за исключением файла метки тома, если она есть), в остальном область данных не затрагивается.

Удаление файла — первый символ файловой записи и всех ассоциированных LFN-записей заменяется кодом 0xE5; занимаемые файлом кластеры помечаются в таблице FAT как свободные, а в области данных не затрагиваются.

Создание файла или каталога командой «Создать» контекстного меню — создается файловая запись для нового «пустого» файла с именем по умолчанию (например, «Новая папка») и размером, определяемым типом файла; сам файл, если имеет ненулевой размер (что верно для практически всех «пустых» файлов, кроме каталогов и текстовых документов) записывается в области данных в выделенные ему кластеры; в таблице FAT создается соответствующая кластерная цепочка. После присвоения файлу действительного имени (не по умолчанию) первоначально созданная файловая запись помечается как удаленная и создается новая.

Переименование файла — создается новая запись с обновленным именем; старая запись помечается как удаленная.

Сохранение файла из приложения (не из командной строки) — создается запись, содержащая все поля, кроме размера и начального кластера файла; после завершения сохранения файла создается новая запись, содержащая все поля, а прежняя удаляется.

Копирование файла — в новом местоположении создается идентичная файловая запись (возможно, за исключением некоторых временных отметок, см. выше), файлу выделяется первый свободный кластер и содержимое файла копируется в новое место, при чём происходит копирование текущего кластера, поиск следующего свободного и заполнение таблицы FAT.

Перемещение файла (между разными томами) — копирование с последующим удалением файла из исходного местоположения.

Перемещение файла (в пределах тома) — кластерная цепочка не затрагивается, файловая запись копируется без изменения в новый каталог, после чего удаляется из прежнего.

Поиск свободного кластера по таблице индексных указателей для выделения новому файлу начинается в общем случае не с начала области данных (то есть с кластера 2), а с последнего выделенного какому-либо файлу кластера, номер которого сохраняется в структуре FSInfo. Другими словами, если файлу 1 был отведен кластер 30, а файлу 2 — кластер 31, после чего файл 1 был удален, то при создании нового файла 3 он, скорее всего, будет физически размещен начиная с кластера 32.

Отказоустойчивость системыПравить

Поскольку система FAT хранит данные о файлах и данные о свободном месте на диске в одной таблице, то операция записи файла, традиционно состоящая из двух этапов (добавление занимаемого блока в перечень занятых и исключение этого же блока из списка свободных) происходит в FAT в одно действие. Благодаря этому система FAT обладает врождённой устойчивостью к сбоям, то есть сбой (например, питания) в момент выполнения операции чтения или записи в большинстве случаев не приведёт к разрушению файловой системы. Однако в данном случае речь идёт именно о целостности файловой системы, а не самих файлов.

Характеристики[6]Править

FAT12 FAT16 FAT32
Разработчик Microsoft
Полное название File Allocation Table (Таблица размещения файлов)
(12-битная версия) (16-битная версия) (32-битная версия)
Представлена 1980 (Microsoft Disk BASIC) Ноябрь 1987 (MS-DOS 3.31) Август 1996 (Windows 95 OSR 2)
Идентификатор тома 0x01 (MBR) 0x04, 0x06, 0x0E (MBR) 0x0B, 0x0C (MBR)
EBD0A0A2-B9E5-4433-87C0-68B6B72699C7 (GPT)
Структуры
Содержимое каталога Таблица
Размещение файлов Линейный список
Сбойные блоки Тегирование кластера
Ограничения
Размер файла 32 MiB 2 GiB 4 GiB
Количество кластеров 4084 65 524 268 435 445 (228−12)
Длина имени файла 8.3 или 255 символов при использовании LFN
Размер тома 32 MiB 2 GiB
4 GiB (64 Кб на кластер, поддерживается не везде)
2 TiB
8 TiB (2 Кб на сектор)
Возможности
Сохраняемые даты Создания, модификации, доступа
Диапазон дат 1 января 198031 декабря 2107
Дополнительные данные Изначально не поддерживаются
Атрибуты файлов Только для чтения, скрытый, системный, метка тома, подкаталог, архивный
Разграничение прав доступа Нет
Прозрачное сжатие Отдельные утилиты (Stacker, DoubleSpace, DriveSpace)
Прозрачное шифрование Сторонние утилиты или клоны DOS

ЛицензированиеПравить

Майкрософт запатентовала некоторые алгоритмы работы с FAT и VFAT.

В США при повторном рассмотрении[когда?] было принято решение аннулировать некоторые из патентов, но потом его отменили.

В октябре 2006 года в Германии был аннулирован за очевидность патент на VFAT, выданный Европейским патентным бюро.[12]

Со временем FAT стали широко использовать в различных устройствах для совместимости между DOS, Windows, OS/2, Linux. Майкрософт не выказывала намерений принуждать к их лицензированию[уточнить].[13]

В феврале 2009 года Майкрософт подала в суд на компанию TomTom, производителя автомобильных навигационных систем на основе Linux, обвиняя её в нарушении патентов.[14]

По мнению Джереми Эллисона[уточнить], цель Майкрософт — поставить различные компании перед выбором: заключить с Майкрософт договор о патентной защите (такой, который с ней заключила Novell в ноябре 2006 года), нарушив тем самым лицензию GNU GPL, и сделав невозможным для себя использование Linux, или не заключать такого договора, и быть обвинённой в нарушении патентов, защита по которым предоставляется при его заключении при условии неразглашения.[15][16]

В марте 2009 года TomTom подала встречный иск о нарушении патентов.[17]

ПримечанияПравить

  1. http://cd.textfiles.com/megademo2/INFO/OS2_HPFS.TXT
  2. www.microsoft.com/mscorp/ip/tech/fathist.asp в archive.org
  3. Обсуждение вопроса на странице Марка МакДонадльда в английской Википедии
  4. Volume and File Structure of Disk Cartridges for Information Interchange, первая версия, стандартизирующая только FAT12 принята в 1985, вторая - в 1995 году.
  5. Существует в версиях от 1987 и 1994 года.
  6. а б "Microsoft Extensible Firmware Initiative FAT32 File System Specification 1.03". Microsoft. 6 декабря 2000. Archived from the original on 2011-08-22. Retrieved 5 апреля 2010.  Unknown parameter |description= ignored (help); Check date values in: |date=, |accessdate= (help)
  7. Aaron R. Reynolds, Dennis R. Adler, Ralph A. Lipe, Ray D. Pedrizetti, Jeffrey T. Parsons, Rasipuram V. Arun (1998-05-26). "Common name space for long and short filenames". US Patent 5758352. Retrieved 2012-01-19.
  8. Проблемы начинаются тогда, когда какое-то ПО начинает строить свою работу с использованием этого умолчания, например делать последовательный обход всех каталогов.
  9. Обсуждение вопроса на странице Марка МакДонадльда в английской Википедии
  10. "What About VFAT?". TechNet Archive. Microsoft. 15 октября 1999. Archived from the original on 2011-08-22. Retrieved 5 апреля 2010.  Check date values in: |date=, |accessdate= (help)
  11. Не следует путать расширение файловой системы VFAT с одноимённым драйвером файловой системы, который появился в Windows for Workgroups 3.11 и предназначен для обработки вызовов функций MS-DOS (INT 21h) в защищённом режиме (см.: "KB126746: Windows for Workgroups Version History". VERSION 3.11 → Non-Network Features. Microsoft. 14 ноября 2003. Archived from the original on 2011-08-22. Retrieved 5 апреля 2010.  Check date values in: |date=, |accessdate= (help))
  12. "Federal Patent Court declares FAT patent of Microsoft null and void". heise online. Heise Zeitschriften Verlag. 2 марта 2007. Archived from the original on 2011-08-22. Retrieved 10 марта 2009.  Unknown parameter |lang= ignored (help); Check date values in: |date=, |accessdate= (help)
  13. Brian Kahin. (10 марта 2009). "Microsoft Roils the World with FAT Patents". The Huffington Post. Archived from the original on 2011-08-22. Retrieved 10 марта 2009.  Unknown parameter |lang= ignored (help); Check date values in: |date=, |accessdate= (help)
  14. Ryan Paul. (25 февраля 2009). "Microsoft suit over FAT patents could open OSS Pandora's Box". Ars Technica. Condé Nast Publications. Archived from the original on 2011-08-22. Retrieved 9 марта 2009.  Unknown parameter |lang= ignored (help); Check date values in: |date=, |accessdate= (help)
  15. Glyn Moody. (5 марта 2009). "The Real Reason for Microsoft’s TomTom Lawsuit". ComputerworldUK. IDG. Archived from the original on 2011-08-22. Retrieved 9 марта 2009.  Unknown parameter |lang= ignored (help); Check date values in: |date=, |accessdate= (help)
  16. Steven J. Vaughan-Nichols. (5 марта 2009). "Linux companies sign Microsoft patent protection pacts". Блоги Computerworld. IDG. Archived from the original on 2011-08-22. Retrieved 9 марта 2009.  Unknown parameter |lang= ignored (help); Check date values in: |date=, |accessdate= (help)
  17. Erica Ogg. (19 марта 2009). "TomTom countersues Microsoft in patent dispute". CNet. Archived from the original on 2011-08-22. Retrieved 20 марта 2009.  Unknown parameter |lang= ignored (help); Check date values in: |date=, |accessdate= (help)

СсылкиПравить

  • ECMA-107(англ.) стандарт FAT