ИНФОРМОХРАНИЛИЩА

Кандидат физико-математических наук В. ХОРТ.

Главное богатство человечества — информация, накопленная за его многотысячелетнюю историю. Статья посвящена тому, как люди научились хранить информацию, чтобы передавать её следующим поколениям, как они делали это раньше и как теперь. Подробно рассмотрены такие носители данных, как лазерные диски и флэш-карты.

Наука и жизнь // Иллюстрации
Наскальные рисунки, скорее всего, помогали древним людям передавать потомкам навыки охоты.
В шумерском письме, уходящем в IV тысячелетие до н. э., применялись иероглифы (условные знаки), позволявшие довольно легко понять смысл написанного.
С помощью таких перфокарт и перфоленты загружали данные и программы в первые ЭВМ.
Первые магнитные диски — прообразы современных «винчестеров».
На поверхности компакт-дисков расположены углубления — питы. Сфокусированный луч воспринимается как ноль, расфокусированный — как единица.
Отражающая поверхность у компакт-дисков СD-R (в центре) темнее, чем у CD-A (слева). Самая тёмная отражающая поверхность у CD-RW (справа).
В архитектуре NOR доступ можно получить к каждой ячейке памяти.
В архитектуре NAND данные записывают страницами и блоками, в результате чего часть блока может оказаться неиспользованной.

Когда заносите что-либо в память, не забудьте, куда вы это занесли.
Компьютерная аксиома Бейзера (из Полного собрания законов Мэрфи)

ИЕРОГЛИФЫ И БУКВЫ

Информацию об окружающем мире люди и животные получают с помощью органов чувств. Сигналы от них поступают в мозг и хранятся там зачастую до тех пор, пока жив его обладатель. Большая часть этой информации никогда не используется, хотя о ней можно вспомнить, раздражая отдельные участки мозга. Обрабатывая и систематизируя её, люди и животные совершают все свои поступки. Набор информации у каждой особи индивидуален, но есть и много общего. Малыш, уколовшись иголкой и поплакав, впоследствии будет вести себя с острыми предметами осторожно.

Совсем не обязательно узнавать об опасностях только через личный опыт. В животном мире о них предупреждают тревожным звуком. И это один из способов обмена информацией, который позволяет эффективно выживать в дикой природе. Человечество пошло значительно дальше и создало развитую систему речи. Чем больше слов появлялось в обиходе древнего человека, тем больше опыта он мог передавать своим потомкам, обеспечивая их выживание.

Поначалу, скорее всего, каждое слово соответствовало конкретному объекту, а позже словами стали обозначать и абстрактные понятия. Для наглядности древние люди использовали также жесты и примитивные рисунки на песке, а порою на скалах. Постепенно изображения стали схематичными — так появились иероглифы, каждый из которых соответствовал слову.

Были и другие способы передачи информации. В Южной Америке за 1500 лет до н. э. существовало узелковое письмо: на палку или толстую шерстяную нить подвешивались разноцветные тонкие шнурки с простыми или сложными узелками. Такие послания назывались кипу, и для их расшифровки в наши дни приходится использовать компьютеры.

Иероглифами писали древние египтяне и шумеры с IV тысячелетия до н. э. Сейчас подобная письменность распространена в странах Дальнего Востока. Число иероглифов, например, в китайском языке составляет несколько десятков тысяч.

В античных странах Средиземноморья письменность развивалась по-другому — там письменные знаки (буквы) соответствовали не словам, а звукам. Из нескольких букв составлялось слово. При таком подходе число букв, в отличие от множества иероглифов, не превышало нескольких десятков.

Передача информации письменным способом долгое время оставалась уделом избранных. Изобретение бумаги и, главное, книгопечатания не только расширило круг лиц, допущенных к знаниям, но и увеличило словарный запас людей. Информацию, которой владело человечество, держать в головах было уже невозможно. Отныне её можно было хранить в книгах, и люди учились пользоваться ими для поиска ответов на свои вопросы. К слову, не всякая информация является знанием: в различных сказаниях и легендах содержится информация, а вот знания, скорее, можно почерпнуть из учебников.

НАЧАЛО КОМПЬЮТЕРНОЙ ЭПОХИ: ОТ ПЕРФОКАРТ ДО ДИСКЕТ

В компьютерных технологиях для букв, цифр, знаков препинания и других печатных символов используют последовательность из восьми нолей и единичек — байт. На одной странице книги размещается около 3500 символов, образующих примерно 400 слов. Таким образом, книга объёмом 300 страниц содержит приблизительно миллион знаков, то есть чуть меньше мегабайта (1 048 576 байт). В Российской государственной библиотеке, где хранится около 20 млн томов, содержится приблизительно 20 терабайт данных (один терабайт равен 1024 гигабайтам, или 240 байт). (Реальный объём информации, конечно, намного больше — ведь в книгах есть множество иллюстраций, которые требуют гораздо большего объёма памяти, нежели буквы.)

В первых электронно-вычислительных машинах (ЭВМ) для обмена данными тоже использовались бумажные носители — перфокарты и перфоленты. На перфокарте можно было «набить» не более 80 символов, плотность записи на перфоленте тоже не была высокой.

Более перспективным оказался другой способ общения с ЭВМ, основанный на магнитной записи, давно уже применявшейся для хранения звуков. На ленту, покрытую ферромагнитным материалом, записывали последовательности импульсов. Наличие импульса считалось единицей, а его отсутствие — нулём.

Позже ферромагнитный слой стали наносить на алюминиевые диски — прообразы современных жёстких дисков. С уменьшением размеров компьютеров начали применять дискеты — круглые пластмассовые пластинки, «упакованные» для сохранности в плоский корпус. Их размеры постепенно уменьшались, а объём записываемой информации, напротив, увеличивался: На 8-дюймовой дискете можно было записать до 256 килобайт информации, на дискетах 5,25 дюйма — до 1,2 мегабайта, а на самых маленьких 3,5-дюймовых — 1,44 мегабайта.

ЛАЗЕРНЫЙ ЛУЧ В РОЛИ ГРАММОФОННОЙ ИГЛЫ

В середине 60-х годов ХХ века американский изобретатель Джеймс Расселл, большой любитель классической музыки, недовольный тем, что звуковая дорожка на виниловых пластинках со временем разрушается и качество воспроизведения ухудшается, придумал способ записывать и считывать звуковой сигнал с помощью луча лазера. В 1970 году он запатентовал прообраз современных компакт-дисков.

В 1971 году Дж. Расселл оказался в корпорации «Optical Recording», где начал работать над проблемой записи на диски телевизионных программ, чтобы потом распространять их по почте. В 1974 году эта компания представила первое устройство для записи и воспроизведения таких дисков, но оно не привлекло внимания. Впрочем, в 1975 году с устройством познакомились представители концерна «Philips». И хотя они невысоко оценили увиденное, вскоре в корпорации были созданы диски, очень похожие на то, что было у Дж. Расселла.

В 1980 году компании «Phillips» и «SONY» приступили к массовому изготовлению лазерных дисков для записи звука. Они совместно разработали стандарт CD-DA (Compact Disk Digital Audio, то есть «компакт-диск с цифровым звуком»). Позже, в 1992 году, обеим компаниям пришлось заплатить около 30 млн долларов за выкуп лицензии, так как решением суда исключительные права на технологию CD были закреплены за «Optical Recording». Сам Рассел ничего не получил, ведь он создавал своё изобретение, будучи сотрудником компании, а значит, всеми правами на интеллектуальную собственность владела «Optical Recording».

На первых лазерных дисках диаметром 115 мм можно было записать программу продолжительностью 68 минут. Позже, по слухам, Норио Ога, вице-президент «SONY», предложил увеличить диаметр диска до 120 мм, чтобы на нём разместить запись длиной в 74 минуты 33 секунды — именно столько времени исполняет 9-ю симфонию Бетховена, одно из самых продолжительных классических произведений, оркестр под управлением Сейджи Озава.

Чтобы оцифровать звуковой сигнал, в соответствии с теоремой Котельникова — Найквиста необходимо периодически производить измерения его амплитуды, причём число отсчётов в единицу времени должно по крайней мере в два раза превышать частоту верхней гармоники сигнала (см. «Наука и жизнь № 5, 2004 г.).

Максимальная частота, воспринимаемая среднестатистическим человеком, равна 20 кГц, а потому частоту дискретизации, или, как её ещё называют, частоту сэмплирования, устанавливают с некоторым запасом: 44,1 кГц.

Для характеристики скорости потока записываемой информации используют величину, называемую битрейтом (от англ. Bit Rate). Музыкальные произведения записываются на CD с постоянным битрейтом 1407 килобит в секунду. Несложный расчёт показывает, что ёмкость диска составляет около 700 Мбайт.

Лазерный диск сделан из алюминия, тонкий слой которого защищён покрытием из прозрачного поликарбонатного пластика. Алюминиевая поверхность покрыта огромным количеством микроскопических углублений вдоль дорожки шириной 0,5 мкм и шагом 1,6 мкм. Сфокусированный луч лазера падает на поверхность вращающегося диска и отражается от неё. Отражение от поверхности углубления (pit) и от основной поверхности (land) происходит по-разному, что и фиксируется фотоэлементом.

Компакт-диски получают штамповкой по матрице, изготовленной на высокоточном оборудовании.

Дорожка диска движется относительно считывающей головки с постоянной скоростью примерно 1,15 м/с. Чтобы обеспечить её, система стабилизации регулирует частоту вращения диска от 500 об/мин при чтении внутренних дорожек до 200 об/мин при чтении внешних.

ЗАПИШИ САМ

В 1988 году были выпущены первые CD-R (CD-Recordable, то есть компакт-диск записываемый), на которых можно было сделать запись в одном экземпляре. В таких заготовках, или «болванках», отражающий слой изготовлен из тонкой золотой либо серебряной плёнки, а между ней и поликарбонатной основой находится слой органического материала, теряющего первоначальную прозрачность при нагревании. При записи лазерный луч разогревает отдельные участки этого слоя и они перестают пропускать свет, и когда при воспроизведении лазерный луч попадает на них, то до приёмника он уже не доходит.

Из-за этого дополнительного слоя коэффициент отражения у записываемых дисков чуть ниже, чем у штампованных, поэтому некоторые проигрыватели лазерных дисков могут не воспроизвести сигнал, записанный на «болванке».

Следующим шагом в эволюции компакт-дисков стали появившиеся в 1997 году диски CD-RW (CD-ReWritable, то есть CD-перезаписываемые), поначалу названные CD-E (CD-Erasable, то есть стираемые). На них можно удалять записанную информацию и заменять её новой. Их дополнительный органический слой слой может иметь два состояния — аморфное и кристаллическое. В зависимости от этого меняется его прозрачность. При нагреве от комнатной температуры до температуры выше критической слой переходит в аморфное состояние и остается таким после остывания. При нагреве же до температуры ниже критической он весь переходит в кристаллическое состояние. Современные диски CD-RW выдерживают до десятков тысяч циклов перезаписи. К сожалению, отражающая способность этих дисков хуже, чем одноразовых. И хотя иногда бытовые проигрыватели «справляются» с ними, гарантированно считывают сигнал только специальные дисководы с автоматической регулировкой усиления фотоприёмника.

Если записать музыку с использованием специальных алгоритмов сжатия, то на обычном 700-мегабайтном лазерном диске можно разместить звуковой материал длительностью 600 мин. Многим известен формат MP3. При записи в этом формате звуковой сигнал делится на фрагменты длительностью по 50 мс. Каждый фрагмент раскладывается на гармоники с помощью преобразования Фурье. Затем часть гармоник удаляется с учётом физиологии слуха. Например, человеческое ухо не воспринимает тихие гармоники на фоне более громких; кроме того, из-за инерции слуха после громкого звука некоторое время тихие звуки не слышны, валяют и другую «лишнюю» информацию. В результате несколько снижается динамический диапазон сигнала, то есть соотношение самого высокого и самого низкого уровней, и плохо воспроизводятся крутые фронты. Тем не менее заметить ухудшение может только человек с тренированным слухом. Звук в формате MP3 можно кодировать с постоянным или переменным битрейтом (от 32 до 320 кбит/с) и таким образом экономить объём примерно в 5 раз.

КОРОЧЕ ВОЛНА — ВЫШЕ ЁМКОСТЬ

Для считывания информации с компакт-диска используются так называемые красные лазеры с длиной волны 780 нм. При использовании лазеров с длиной волны 650 или 635 нм размер информационного пита можно сделать меньше. В результате информацию на диске можно уплотнить, уменьшив как шаг между дорожками, так и расстояния между питами. Такие диски стали называть DVD (Digital Versatile Disk, то есть цифровой универсальный диск). На нём размещается до 4,7 Гбайт информации. Этого достаточно, чтобы вместить полнометражный фильм со звуковым сопровождением на нескольких языках по выбору и ещё вспомогательные данные, облегчающие управление изображением.

У DVD-дисков поликарбонатный защитный слой можно сделать вдвое тоньше, чем у компакт-дисков. В результате появились двухслойные DVD-диски, у которых один из отражающих слоёв полупрозрачный. На них можно расположить данные объёмом до 8,5 Гбайт. Удвоить объём информации до 9,4 Гбайт не удаётся, поскольку, чтобы избежать сбоев при считывании информации со второго слоя, используются алгоритмы с повышенной избыточностью данных.

В 1995 году фирма «Pioneer» начала разработку, а уже в 1997 году выпустила первый привод для записи дисков DVD-R лазером с длиной волны 635 нм. Ёмкость дисков составляла 3,95 Гбайта. Привод на первых порах стоил 17 тыс. долларов, а «болванка» — 50 долларов.

В 1999 году в компании «Pioneer» выпустили очередную версию пишущего привода. Он стоил уже «всего» 5400 долларов и позволял записать на один диск до 4,7 Гбайта данных, как на обычных DVD. Спустя ещё немного времени компания разработала стандарт записи, защищённой от копирования: часть информации записывалась в служебную область диска. Начиная с этого момента компания «Pioneer» продвигает два формата DVD-R: один — DVD-R (А) (Authoring, то есть профессиональный), другой — DVD-R(G) (General, то есть для общего пользования). Для записи DVD-R(A) использовался лазер с длиной волны 635 нм, и на таких приводах можно записывать «болванки», выпущенные для прежних дисководов. Для записи DVD-R(G) длина волны составляла 650 нм. Оба типа приводов могут считывать данные с дисков обоих форматов. А вот записывать данные на диск другого формата из-за разницы в длине волны не могут.

Вслед за однократно записываемыми дисками там же, в «Pioneer», наладили выпуск и перезаписываемых дисков, получивших вначале наименование DVD-R/W, а позже переименованных в DVD-RW. И хотя делалось всё возможное, чтобы перезаписываемые DVD-диски можно было читать на всех приводах, добиться этого в полной мере не удалось. Отражающая способность материала, который применяется в дисках DVD-RW, ниже, чем у материала дисков DVD-R, из-за чего многие старые приводы не справляются с перезаписываемыми DVD-дисками.

Стандарты записи на DVD разрабатывали и другие компании. Так, «Matsushita», больше известная как «Panasonic», создала стандарт, получивший название DVD-RAM. Записываемые диски DVD-RAM помещались в специальный картридж — прямоугольную коробку размером 135,5(124,6(8 мм. Появившиеся в 1998 году приводы для DVD-RAM стоили не больше 800 долларов, что выгодно отличало их от продукции «Pioneer». И хотя на этих устройствах нельзя было читать обычные DVD-диски, их покупали из-за меньшей цены.

Следовало ожидать, что, как и в случае с CD-RW, форматы перезаписываемых DVD-дисков будут согласованы с уже существующими стандартами. Несмотря на то что они подтверждены на специальном форуме, некоторые его члены всё же разработали другой формат, который получил название DVD + RW. На этих дисках новые данные можно записывать поверх старых, и, кроме того, запись может осуществляться в несколько приёмов. Любопытно, что формат DVD + R появился после формата DVD + RW. Используемый в нём отражающий слой обладает чуть большей отражающей способностью, поэтому такие диски зачастую успешно читаются приводами, рассчитанными на работу с DVD-дисками, изготовленными в промышленных условиях.

Всё же из-за несогласованности стандартов режимы лазера, предусмотренные для записи на DVD + R, отличаются от тех, которые предусмотрены для записи на DVD + RW-дисках. Вот почему выпущенные прежде дисководы для DVD + RW не всегда могут записывать диски DVD + R.

Уменьшение длины волны до 405 нм позволяет за счёт уменьшения расстояния между дорожками и питами разместить на диске 15 Гбайт информации. Именно такое количество данных содержится на дисках формата HD DVD. Их появление вызвано распространением телевидения и видео высокой чёткости, с разрешением 1920(1080 пикселей. Впрочем, этот формат тоже не единственный, и сейчас на рынке появились диски Blu-ray (BD). Своё название они получили от английского выражения «Blue Ray», что буквально означает «голубой луч» и объясняется тем, что для их записи и воспроизведения применяется коротковолновый сине-фиолетовый лазер. Из первого слова удалили одну букву, чтобы зарегистрировать новую торговую марку. На одном слое подобных дисков можно хранить до 33 Гбайт информации.

КАРТЫ ВМЕСТО ДИСКОВ

Компакт-диски получили широкое распространение в компьютерной индустрии, но развитие цифровой фотографии привело к распространению новых устройств хранения данных — флэш-карт. Их принцип действия основан на свойствах транзисторов с плавающим затвором, которые называют ячейками (см. «Наука и жизнь № 3, 2008 г.).

Наибольшее распространение получили флэш-карты с микросхемами NOR (по аналогии с названиями логических ячеек NO-OR, то есть ИЛИ-НЕ) и NAND (NO-AND, то есть И-НЕ).

В архитектуре NOR ячейки памяти располагаются параллельно, что позволяет получить доступ к каждой из них. Память используется эффективно, но за это приходится платить увеличением времени для записи или удаления данных.

В архитектуре NAND ячейки последовательно объединены в группы, из которых составлены страницы, в свою очередь объединённые в блоки. При такой организации обратиться к отдельной ячейке памяти невозможно. Запись данных осуществляется постранично, а стирание — поблочно. Такая архитектура позволяет быстрее работать с блочными типами данных. Подобным образом, кстати, организовано хранение данных на жёстких дисках, а потому NAND-карточки часто используются в МР3-плеерах и цифровых камерах или вместо HD-дисков.

Неудивительно, что флэш-карты очень быстро вытеснили дискеты. Объём современных флэш-карт приближается к сотне гигабайт, а это составляет серьёзную конкуренцию жёстким дискам. Так, «Samsung» уже выпускает ультрамобильный портативный компьютер Q1-SSD с 32-гигабайтным «флэш-диском».

К сожалению, число циклов перезаписи у флэш-карт ограничено. Транзисторы с плавающим затвором при частой перезаписи данных выходят из строя. Ситуация усугубляется тем, что часть информации, например таблица оглавления файлов, располагается в первых секторах носителей данных. Приходится идти на различные ухищрения. На одних «флэшках» используется специальная файловая система. На других, например на Compact Flash (CF) или Security Digital (SD), используется специальный контроллер, который старается равномерно распределять данные по объёму памяти и тем самым повысить её ресурс.

В последние годы размеры носителей информации становятся меньше, но при этом информации на них хранится больше. Скорее всего, такая тенденция сохранится в ближайшем будущем, ведь появляются новые открытия, которые поступают в «сокровищницу» человеческих знаний. Их надо не только хранить, но и эффективно использовать.

Другие статьи из рубрики «Человек и компьютер»

Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее