Экономика резервирования данных

PDF Печать E-mail

Необходимость резервирования данных обычно осознается лишь при их полной или частичной потере. Лихорадочные попытки восстановления крупиц информации (и внушительные суммы, выплаченные специалистам по восстановлению) «открывают глаза» и способствуют принятию целого комплекса мер, направленных на защиту данных, но, увы… Резервирование - намного более сложная штука, чем это кажется на первый взгляд. Начнем с того, что ручное резервирование требует времени (которое, как известно, — деньги), а автоматическое — приобретения дополнительных программно-аппаратных средств и, естественно, носителей информации. Дешевым носителям свойственно «умирать» сразу же после записи данных. Дорогие носители окупают себя только при выборочном резервировании, когда сохраняются лишь самые ценные данные, но даже в этом случае требуются солидные вложения, и нет никакой гарантии, что восстановление данных пройдет, как и планировалось.

Основные причины потери данных

Различные компании приводят свою статистику причин потери данных, но, в целом, отказы жестких дисков занимают порядка 13%, и порядка 50% приходится на отказы операционной системы. Доля вины вирусов колеблется от 2% до 22% процентов. Ничего себе «разрывчик» в оценках, больше чем на порядок! Просто потрясающая точность, рождающая вопрос — а можно ли вообще доверять такой статистике?!

Ответ отрицательный. Даже если статистика взята не с потолка, и отсутствует какая бы то ни было подтасовка фактов или фальсификация данных, результат замыкается сам на себя и в общем случае не имеет никакого смысла.

Рассмотрим фирму, занимающуюся восстановлением данных и обсуживающую крупные компании, администраторы которых с мелкими разрушениями файловой системы справляются самостоятельно и обращаются за помощью только в случае серьезных аппаратных отказов. Естественно, в статистике, собранной данной фирмой, аппаратные отказы будут доминировать над всеми остальными видами потери данных. А вот если фирма обслуживает SOHO-сектор, не способный даже поднять упавшую систему, аппаратные отказы отойдут на самый последний план, занимая доли процента, вытесненные количеством ошибок оператора.

Хорошо, пойдем другим путем — путем сбора опросов. Как часто вы теряете данные и от чего? Кажется, железной объективности тут не избежать, но… весь фокус в том, что при смене технологии производства жестких дисков (переход на гидродинамические подшипники или перпендикулярную запись), процент отказов резко возрастает, и, зачастую, все винчестеры, выпущенные фирмой, умирают в течение нескольких лет. Подобных «проколов» в техпроцессе не сумел избежать ни один производитель - ни IBM, ни Maxtor, ни Quantum. Следовательно, статистика сбоев HDD очень сильно зависит от времени, в течение которого она собиралась.

RAID или не RAID

Тех, кто верит в магическую силу аббревиатуры RAID, спешу разочаровать: для резервирования данных RAID'ы не предназначены. RAID уровня 0 увеличивает производительность дискового ввода/вывода, а RAID'ы более высоких уровней страхуют от выхода жесткого диска из строя, в большинстве случаев позволяя менять его на лету без остановки сервера, что очень удобно.

Жесткие диски — довольно надежные устройства, и если только нам не попадется дефектная модель с грубыми конструктивными недоработками или технологическими нарушениями, риск потери данных из-за выхода винчестера из строя достаточно мал и составляет приблизительно 13% от всех остальных причин разрушений данных. Кстати, существует множество фирм, занимающихся аппаратным восстановлением жестких дисков, и в подавляющем большинстве случаев данные все-таки удается спасти.

Хранилища: централизованные и распределенные

Некоторые администраторы предпочитают хранить все данные на серверах, чтобы их было удобнее резервировать. Однако поговорка гласит: не клади все яйца в одну корзину, и это справедливо не только для яиц (кстати, китайцы говорили: прежде, чем класть яйца в корзину, убедись в том, что ты сделал действительно надежную корзину), но и для серверов.

Данные, сосредоточенные в одном месте, легко резервировать, но легко и… атаковать. Сумеете ли вы обеспечить надежную защиту сервера? А как на счет выхода из строя процессора, материнской платы или другого компонента? Сколько времени уйдет на ремонт (особенно, если смена оборудования потребует переустановки операционной системы)? И не забывайте, что пока вы будете спасать сервер, все сотрудники фирмы будут вынуждены курить или раскладывать пасьянс, поскольку необходимые им данные останутся недоступными. Также следует учесть пропускную способность локальных сетей и мощность самого сервера, которые далеко не безграничны, и при одновременном обращении ко многим файлам все начнет жутко тормозить. Одно дело, когда пользователи лениво работают в Word/Excel, периодически сохраняясь, и совсем другое, если несколько человек запустят поиск документов по содержимому, вынуждая сервер открывать все файлы один за другим…

Централизованное хранение данных на сервере требует:

  • Достаточно мощного сервера, рассчитанного на пиковую загрузку
  • Наличия резервного «зеркального» сервера на случай выхода из строя основного
  • Надежной защиты, способной предотвратить вторжение хакеров как извне, так и изнутри.

Другими словами, централизованное хранение экономически выгодно только в крупных организациях, имеющих несколько сотен компьютеров. В противном случае лучше резервироваться на местах.

Но с резервированием на местах также имеются большие проблемы. Причем не технические, а организационные. Пользователи – они же такие непослушные, можно даже сказать, невменяемые. Хранение документов в «Корзине» — обычное дело, и только наивный может надеяться, что путем инструктажа ситуацию можно исправить. Намного проще предоставить это дело автоматическими средствами. Подойдет любая программа резервирования, даже Microsoft Backup, входящая в штатный комплект поставки Windows NT/2000/XP и оснащенная встроенным планировщиком. Остается только выбрать перспективный (как в техническом, так и в экономическом смысле) носитель информации.

Носители данных XXI века

Вот основные (можно даже сказать, фундаментальные) свойства носителей, определяющие их отбор:

  • Удельная стоимость одного гигабайта информации
  • Надежность (число циклов чтения/записи, устойчивость к физическим воздействиям)
  • Производительность (скорость чтения/записи, возможность произвольного доступа)
  • Объем одного носителя.

Если с удельной стоимостью, надежностью и производительностью никаких вопросов не возникает, то последний пункт встречает резкое непонимание, граничащее с критикой. Но вот попробуйте зарезервировать 750–гигабайтный жесткий диск на 700-мегабайтные CD-R/RW диски, и вам все сразу станет понятно. Вопрос даже не в том «сколько это будет стоить», а в том, «где разместить такое количество дисков» и «как не запутаться в этом хозяйстве»! Причем, чем больше носителей мы используем, тем выше вероятность того, что один из них окажется бракованным. А значит, все оставшиеся окажутся бесполезным, особенно если резервирование осуществляется не на файловом, а на секторном уровне, и в дефектный носитель попали секторы, хранящие критические структуры файловой системы.

У DVD-R/RW дисков надежность та же самая (вопреки распространенным слухам), а вот с удельной стоимостью и объемом дела обстоят намного лучше. Но, к сожалению, зарезервировать данные в автоматическом режиме не удастся, и нам потребуется оператор, вынимающий из привода одни диски и вставляющий другие. А также «библиотекарь», отвечающий за сохранность архива и прилагающий максимум усилий, чтобы не возникало путаницы между копиями разной степени свежести.

Стримеры обладают сопоставимой с жесткими дисками емкостью и высочайшей надежностью, но при этом безнадежно отстают в скорости, и резервирование занимает слишком много времени и, так же, как и в случае с CD/DVD-R/RW, не поддается полной автоматизации, требуя человека, меняющего ленты. Другой существенный недостаток стримеров — проблемы с произвольным доступом.

Внешние жесткие диски с Ethernet-портом (фактически, представляющие собой файловые серверы в миниатюре) — самые перспективные кандидаты на роль носителей для резервирования. Просто устанавливаем их в стойку, подключаем к хабу и заставляем программу с заданной периодичностью резервировать данные по сети, складывая их в кольцевой буфер и при этом не отрывая сотрудников от производства.

Зачем нужен кольцевой буфер?! А вот зачем — дело в том, что факт разрушения данных часто обнаруживается не сразу, а лишь спустя некоторое время. Если у нас будет только одна резервная копия, то в ней окажутся разрушенные данные, что не есть хорошо (можно даже сказать, что это катастрофа!).

Другой немаловажный момент. Резервируясь на секторном уровне, мы теряем возможность вытащить из архива какой-то конкретный файл (ошибочно удаленный с рабочего компьютера оператором или погрызенный вирусом). Внешние жесткие диски представляют собой великолепное хранилище данных, снижающее накладные расходы на резервирование в несколько раз и позволяющее полностью автоматизировать процесс.

Правда, здесь есть одно «но». Коль скоро резервные данные доступны по сети, они могут быть уничтожены хакером, вирусом или злобным работником. Следовательно, от стримеров (CD/DVD-R/RW) никуда не уйти, и хотя бы раз в месяц (а лучше еженедельно) придется выполнять полное ручное резервирование всех данных.

Кстати, вы уже обратили внимание, что в статистике причин потери данных фигурируют стихийные бедствия? А еще существуют такие неприятные явления как прорывы труб отопления, пожары и так далее. Резервная копия, хранящаяся рядом с основным компьютером во всех этих случаях абсолютно бесполезна, и действительно ценные данные рекомендуется сохранять на стримере и раз в месяц (год, неделю) сдавать ленту на хранение в банк. Более дорогой (но и значительно более надежный вариант) — завести себе аккаунт где-нибудь на другом конце земного шара (желательно, в сейсмически неактивном районе), и передавать данные по интернету.

Заключение

Обсудив возможные методы резервирования (и сопутствующие им проблемы), остается только сопоставить стоимость резервирования со стоимостью данных помноженную на вероятность их потери (обычно обозначаемую латинскими буквами rf — risk factor). Вот о последнем коэффициенте большинство из нас почему-то забывает и вкладывает в резервирование гораздо большие суммы, чем оно того требует.

Источник

 
Белоруссия: спецслужбы получили право на онлайн-слежку
11.03.2010
КГБ Беларуси и Оперативно-аналитический центр при президенте (ОАЦ) получили полный доступ в режиме онлайн к абонентским базам белорусских операторов связи. При этом проникновение в жизнь абонентов...
Microsoft предупреждает о атаках на незакрытую брешь в Internet Explorer
11.03.2010
Вчера вечером компания Microsoft предупредила пользователей о том, что киберпреступники начали широкомасштабное использование непропатченной уязвимости в ранних версиях браузера Internet Explorer,...
Опасность использования приложений для удаленного доступа
На сегодняшний день существует два основных пользовательских интерфейса для подключения к удаленному компьютеру.Принцип работы первого заключается в следующем: пользователь программы-клиента вводит имя удаленного ПК, логин и пароль (примерами могут служить такие...