Единицы измерения ёмкости носителей и объёма информации

Измерения в байтах
Измерения в байтах
ГОСТ 8.417—2002

Единицы количества информации^[1]^[2] используются в технике^[1] для измерения ёмкости компьютерной памяти и объёма данных, передаваемых по каналам связи. В теории информации^[2] также используются для определения количества информации как меры изменения энтропии.

Единицы измерения информации

Большой по размеру объём данных может содержать в себе очень малое количество информации. То есть объём данных и количество информации являются разными характеристиками, применяемыми в разных областях, связанных с информацией, но исторически название «количество информации» использовали в значении «объём данных», а для измерения количества информации применяли названия «информационная энтропия» и «ценность информации».

Единицы измерения ёмкости носителей и объёма данных

Применяются для измерения ёмкости носителей информации — запоминающих устройств и для измерения объёмов данных.

Единицы измерения количества информации

Применяются для измерения количества информации в объёме данных. Информационная энтропия

Первичная единица

Первичной характеристикой объёма данных является количество возможных состояний.

Первичной единицей измерения объёма данных является 1 возможное состояние (значение, код).

Вторичные единицы

Вторичной характеристикой объёма данных является разряд.

Ёмкость (объём) одного разряда может быть разной и зависит от основания применённой системы кодирования.

Ёмкости одного разряда в двоичной, троичной и десятичной системах кодирования:

Один двоичный разряд (бит) имеет 2 взаимоисключающих возможных состояния (значения, кода).

Один троичный разряд (трит) имеет 3 взаимоисключающих возможных состояния (значения, кода).

…

Один десятичный разряд (децит) имеет 10 взаимоисключающих возможных состояний (значений, кодов).

…

Третичные единицы

Третичными характеристиками объёма данных являются различные множества разрядов.

Ёмкость множества разрядов равна количеству возможных состояний этого множества разрядов, которое определяется в комбинаторике, равно количеству размещений с повторениями и вычисляется по формуле:

{\bar {A}}(c,n)={\bar {A}}_{c}^{n}=c^{n}

возможных состояний (кодов, значений)

где

c

— количество возможных состояний одного разряда (основание выбранной системы кодирования),

n

— количество разрядов в множестве разрядов.

То есть ёмкость множества разрядов представляет собой показательную функцию от количества разрядов с основанием, равным количеству возможных состояний одного разряда.

Пример:

1 байт состоит из 8-ми ( $n=8$ ) двоичных разрядов ( $c=2$ ) и может принимать:

${\bar {A}}_{c}^{n}=c^{n}=2^{8}=256$ возможных состояний (значений, кодов).

Логарифмические единицы

Единицы измерения информации бит, нат, трит и бан (децит)

Когда некоторые величины, в том числе и объём данных, представляют собой показательные функции, то, во многих случаях, удобнее пользоваться не самими величинами, а логарифмами этих величин.

Объём данных тоже можно представлять логарифмически, как логарифм количества возможных состояний^[3].

Объём информации (объём данных) — может измеряться логарифмически.^[4] Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации — складывается. Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.

Для объёмов двоичных данных удобнее пользоваться двоичными логарифмами.

2^{1}

возможных состояния,

\log _{2}2^{1}=1

двоичный разряд = 1 бит

2^{8}

возможных состояний,

\log _{2}2^{8}=8=2^{3}

двоичных разрядов = 1 Байт (Октет)

2^{8*2^{10}}

возможных состояния,

\log _{2}2^{8*2^{10}}=8*2^{10}=2^{13}

двоичных разрядов = 1 КилоБайт (КилоОктет)

2^{8*2^{20}}

возможных состояний,

\log _{2}2^{8*2^{20}}=8*2^{20}=2^{23}

двоичных разрядов = 1 МегаБайт (МегаОктет)

2^{8*2^{30}}

возможных состояния,

\log _{2}2^{8*2^{30}}=8*2^{30}=2^{33}

двоичных разрядов = 1 ГигаБайт (ГигаОктет)

2^{8*2^{40}}

возможных состояний,

\log _{2}2^{8*2^{40}}=8*2^{40}=2^{43}

двоичных разрядов = 1 ТераБайт (ТераОктет)

Наименьшее целое число, двоичный логарифм которого целое положительное — это 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.

Для объёмов троичных данных удобнее пользоваться троичными логарифмами.

3^{1}=3

возможных состояния,

\log _{3}3^{1}=1

троичный разряд (трит)

3^{6}=729

возможных состояний,

\log _{3}3^{6}=6

троичных разрядов (тритов) = 1 Трайт.

Единица, соответствующая числу 3, трит равна log₂3≈1,585 бита.

Такая единица как нат (nat), соответствующая натуральному логарифму применяется в инженерных и научных расчётах. В вычислительной технике она практически не применяется, так как основание натуральных логарифмов не является целым числом.

Для объёмов десятичных данных удобнее пользоваться десятичными логарифмами.

10^{1}=10

возможных состояний,

\log _{10}10^{1}=1

десятичный разряд = 1 децит

10^{10^{3}}

возможных состояний,

\log _{10}10^{10^{3}}=10^{3}

десятичных разряда = 1 килодецит.

10^{10^{6}}

возможных состояний,

\log _{10}10^{10^{6}}=10^{6}

десятичных разрядов = 1 мегадецит.

10^{10^{9}}

возможных состояний,

\log _{10}10^{10^{9}}=10^{9}

десятичных разрядов = 1 гигадецит.

Единица, соответствующая числу 10, децит равна log₂10≈3.322 бита.

В проводной технике связи (телеграф и телефон) и радио исторически впервые единица информации получила обозначение бод.

Единицы, производные от бита

В целых количествах двоичных разрядов (битов) количество возможных состояний равно степеням двойки.

Тетрада, полубайт, ниббл

Особое название имеют четыре двоичных разряда (4 бита) — тетрада, полубайт, ниббл, которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Байт

Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях написано ниже). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.

Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.

Килобайт

Для измерения больших ёмкостей запоминающих устройств и больших объёмов информации, имеющих большое количество байтов, служат единицы «килобайт» = [1000] байт и «Кбайт»^[5] (кибибайт, kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов см. ниже). Такой порядок величин имеют, например:

Сектор диска обычно равен 512 байтам то есть половине Кбайта, хотя для некоторых устройств может быть равен одному или двум кибибайт.
Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).
«Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Мегабайт

Единицы «мегабайт» = 1000 килобайт = [1 000 000] байт и «мебибайт»^[5] (mebibyte) = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.

Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.

Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Гигабайт

Единицы «гигабайт» = 1000 мегабайт = [1 000 000] килобайт = [1 000 000 000] байт и «Гбайт»^[5] (гибибайт, gibibyte) = 1024 Мбайт = 2³⁰ байт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Для исчисления ещё больших объёмов информации имеются единицы терабайт и тебибайт (10¹² и 2⁴⁰ байт соответственно), петабайт и пебибайт (10¹⁵ и 2⁵⁰ байт соответственно) и т. д.

Что такое «байт»?

В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти, который на старых машинах не обязательно был равен 8 битам (а память не обязательно состоит из битов — см., например: троичный компьютер). В современной традиции, байт часто считают равным восьми битам.

В таких обозначениях как байт (русское) или B (английское) под байтом (B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории.

Во французском языке используются обозначения o, Ko, Mo и т. д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.

Чему равно «кило»?

Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:

двоичными кратными единицами, обозначаемыми согласно ГОСТ 8.417-2002 как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти);
единицами килобайт, мегабайт, гигабайт и т. д., понимаемыми как научные термины (десять в степенях, кратных трём),

эти единицы по определению равны, соответственно, 10³, 10⁶, 10⁹ байтам и т. д.

В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.

В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.

В английском языке для «киби»=1024=2¹⁰ иногда используют прописную букву K, дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило. Однако, такое обозначение не опирается на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».

Вариации

Примечания

↑ ¹ ² Единицы количества информации // ГОСТ 8.417—2024 Государственная система обеспечения единства измерений. Единицы величин (рус.). — Москва: Российский институт стнадартизации, 2024. — С. 20. — 24 с.
↑ ¹ ² Еременко Владимир Тарасович, Минаев Владимир Александрович и др. 2.5. Количественная оценка информации // Теория информации (рус.). — Орёл: ОрёлГТУ, 2010. — С. 74. — 443 с. — ISBN 978-5-93932-311-6.
↑ «логарифм» на answers.com Архивная копия от 22 сентября 2008 на Wayback Machine (англ.)
↑ С точки зрения физики, величина информации (как и близкая к ней по смыслу энтропия) безразмерна. На практике, как и при измерении безразмерных углов, пользуются различными практически удобными единицами.
↑ ¹ ² ³ ГОСТ 8.417-2002 «Единицы величин`» (неопр.). Дата обращения: 11 июня 2008. Архивировано 2 февраля 2012 года.

См. также

[:0-1] ¹ ² Единицы количества информации // ГОСТ 8.417—2024 Государственная система обеспечения единства измерений. Единицы величин (рус.). — Москва: Российский институт стнадартизации, 2024. — С. 20. — 24 с.

[:1-2] ¹ ² Еременко Владимир Тарасович, Минаев Владимир Александрович и др. 2.5. Количественная оценка информации // Теория информации (рус.). — Орёл: ОрёлГТУ, 2010. — С. 74. — 443 с. — ISBN 978-5-93932-311-6.

[3] «логарифм» на answers.com Архивная копия от 22 сентября 2008 на Wayback Machine (англ.)

[4] С точки зрения физики, величина информации (как и близкая к ней по смыслу энтропия) безразмерна. На практике, как и при измерении безразмерных углов, пользуются различными практически удобными единицами.

[gost-5] ¹ ² ³ ГОСТ 8.417-2002 «Единицы величин`» (неопр.). Дата обращения: 11 июня 2008. Архивировано 2 февраля 2012 года.

[1]

[2]

[3]

[4]

[5]

Измерения в байтах
ГОСТ 8.417—2002			Приставки СИ		Приставки МЭК
Название	Обозначение	Степень	Название	Степень	Название	Обозначение		Степень
байт	Б	10⁰	—	10⁰	байт	B	Б	2⁰
килобайт	Кбайт	10³	кило-	10³	кибибайт	KiB	КиБ	2¹⁰
мегабайт	Мбайт	10⁶	мега-	10⁶	мебибайт	MiB	МиБ	2²⁰
гигабайт	Гбайт	10⁹	гига-	10⁹	гибибайт	GiB	ГиБ	2³⁰
терабайт	Тбайт	10¹²	тера-	10¹²	тебибайт	TiB	ТиБ	2⁴⁰
петабайт	Пбайт	10¹⁵	пета-	10¹⁵	пебибайт	PiB	ПиБ	2⁵⁰
эксабайт	Эбайт	10¹⁸	экса-	10¹⁸	эксбибайт	EiB	ЭиБ	2⁶⁰
зеттабайт	Збайт	10²¹	зетта-	10²¹	зебибайт	ZiB	ЗиБ	2⁷⁰
йоттабайт	Ибайт	10²⁴	йотта-	10²⁴	йобибайт	YiB	ЙиБ	2⁸⁰
роннабайт	-	10²⁷	ронна-	10²⁷	-	-	-	-
кветтабайт	-	10³⁰	кветта-	10³⁰	-	-	-	-

Единицы измерения ёмкости носителей и объёма информации
Базовые единицы	Бит Кубит Трит Кутрит
Связанные единицы	Байт Трайт Ниббл Слово Октет
Традиционные битовые единицы	Килобит Мегабит Гигабит Терабит Петабит Эксабит Зеттабит Йоттабит Роннабит Кветтабит
Традиционные байтовые единицы	Килобайт Мегабайт Гигабайт Терабайт Петабайт Эксабайт Зеттабайт Йоттабайт Роннабайт Кветтабайт
Битовые единицы МЭК (IEC)	Кибибит Мебибит Гибибит Тебибит Пебибит Эксбибит Зебибит Йобибит Робибит Квебибит
Байтовые единицы МЭК (IEC)	Кибибайт Мебибайт Гибибайт Тебибайт Пебибайт Эксбибайт Зебибайт Йобибайт Робибайт Квебибайт

Единицы измерения ёмкости носителей и объёма информации

Содержание

Единицы измерения информации

Единицы измерения ёмкости носителей и объёма данных

Единицы измерения количества информации

Первичная единица

Вторичные единицы

Третичные единицы

Логарифмические единицы

Единицы, производные от бита

Тетрада, полубайт, ниббл

Байт

Килобайт

Мегабайт

Гигабайт

Что такое «байт»?

Чему равно «кило»?

Вариации

Примечания

См. также

Навигация

Единицы измерения ёмкости носителей и объёма информации

Единицы измерения информации

Единицы измерения ёмкости носителей и объёма данных

Единицы измерения количества информации

Первичная единица

Вторичные единицы

Третичные единицы

Логарифмические единицы

Единицы, производные от бита

Тетрада, полубайт, ниббл

Байт

Килобайт

Мегабайт

Гигабайт

Что такое «байт»?

Чему равно «кило»?

Вариации

Примечания

См. также

Навигация

Поиск