Единицы количества информации
Единицы количества информации служат для измерения объёма информации — величины, исчисляемой логарифмически.[1] Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации — складывается. Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.
Чаще всего измерение информации касается объёма компьютерной памяти и объёма данных, передаваемых по цифровым каналам связи.
Первичные единицыПравить
Объёмы информации можно представлять как логарифм[2] количества состояний.
Наименьшее целое число, логарифм которого положителен — 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.
Единица, соответствующая числу 3 (трит) равна
Такая единица как нат (nat, е-бит), соответствующая натуральному логарифму применяется в вычислительной технике в инженерных и научных расчётах. Основание натуральных логарифмов не является целым числом.[3]
Единицы, производные от битаПравить
Целые количества бит отвечают количеству состояний, равному степеням двойки.
Особое название имеет 4 бита — ниббл (полубайт, тетрада, четыре двоичных разряда), которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.
БайтПравить
Измерения в байтах | ||||||||
---|---|---|---|---|---|---|---|---|
ГОСТ 8.417-2002 | Приставки СИ | приставки МЭК | ||||||
Название | Символ | Степень | Название | Степень | Название | Символ | Степень | |
байт | Б | 20 | - | 100 | байт | B | Б | 20 |
килобайт | KБ | 210 | кило- | 103 | кибибайт | KiB | КиБ | 210 |
мегабайт | МБ | 220 | мега- | 106 | мебибайт | MiB | МиБ | 220 |
гигабайт | ГБ | 230 | гига- | 109 | гибибайт | GiB | ГиБ | 230 |
терабайт | ТБ | 240 | тера- | 1012 | тебибайт | TiB | ТиБ | 240 |
петабайт | ПБ | 250 | пета- | 1015 | пебибайт | PiB | ПиБ | 250 |
эксабайт | ЭБ | 260 | экса- | 1018 | эксбибайт | EiB | ЭиБ | 260 |
зеттабайт | ЗБ | 270 | зетта- | 1021 | зебибайт | ZiB | ЗиБ | 270 |
йоттабайт | ЙБ | 280 | йотта- | 1024 | йобибайт | YiB | ЙиБ | 280 |
Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях написано ниже). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.
Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.
КилобайтПравить
Для измерения больших количеств байтов служат единицы «килобайт» = 1000 байт и «Кбайт»[4] (кибибайт, kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов см. ниже). Такой порядок величин имеют, например:
- Сектор диска обычно равен 512 байтам то есть половине Кбайт, хотя для некоторых устройств может быть равен одному или двум Кбайт.
- Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).
- «Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.
Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.
МегабайтПравить
Единицы «мегабайт» = 1000 килобайт = 1000000 байт и «Мбайт»[4] (мебибайт, mebibyte) = 1024 Кбайт = 1048576 байт применяются для измерения объёмов носителей информации.
Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.
Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.
Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.
ГигабайтПравить
Единицы «гигабайт» = 1000 мегабайт = 1000000000 байт и «Гбайт»[4] (гибибайт, gibibyte) = 1024 Мбайт =
Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 гигабайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.
Для исчисления ещё больших объёмов информации имеются единицы терабайт—тебибайт (
Терминологические тонкостиПравить
Что такое «байт»?Править
В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти, который на старых машинах не обязательно был или равен 8 битам (а память не обязательно состоит из битов — см., например: троичный компьютер). В современной традиции, байт часто считают равным восьми битам.
В таких обозначениях как Кбайт (русское) или KB (английское) под байт (B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории.
Во французском языке используются обозначения o, Ko, Mo и т. д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.
Чему равно «кило»?Править
Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:
- двоичными кратными единицами, обозначаемыми согласно ГОСТу как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти);
- единицами килобайт, мегабайт, гигабайт и т. д., понимаемыми как научные термины (десять в степенях кратных трём).
Последние по определению равны соответственно
В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.
В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц. В английском языке для «киби»=1024 иногда используют прописную букву K, дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило. Однако, такое обозначение не опираются на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».
См. такжеПравить
СсылкиПравить
- ↑ С точки зрения физики, величина информации (как и близкая к ней по смыслу энтропия) безразмерна. На практике, как и при измерении безразмерных же углов, пользуются различными практически удобными единицами.
- ↑ «логарифм» на answers.com (англ.) Не важно, какой именно логарифм выбрать, поскольку численные величины логарифмов по разным основаниям пропорциональны. Таким образом, вопрос выбора единицы измерения информации фактически равнозначен выбору основания для логарифма количества состояний. Следует также заметить, что информация случайной величины точно равна логарифму количества состояний лишь при равномерном распределении. Во всех прочих случаях количество информации будет меньше.
- ↑ http://books.ifmo.ru/book/pdf/35.pdf
- ↑ а б в ГОСТ 8.417-2002 «Единицы величин»