Базовые технологии в системах хранения данных

Реферат

Анализ проблемы управления информационными данными

Информация становится одним из самых ценных активов для предприятия и определяет его конкурентоспособность. Менеджеры по информационным технологиям часто сталкиваются с проблемами, связанными с большим объемом распределенных данных, которые циркулируют в информационной системе. Неэффективное управление этими данными может негативно сказаться на прибыльности и способности предприятия к росту. Постоянный рост объема данных и усложнение их структуры стали основными вызовами для бизнеса в сфере передачи, хранения, защиты и управления данными.

Значение системы хранения данных

Для многих представление об системе хранения данных сопряжено с устройствами хранения, особенно с дисковыми массивами. Действительно, в настоящее время дисковые массивы являются основными устройствами хранения. Однако стоит помнить, что обработка информации и форматирование ее логической структуры (например, дисковых томов и файловых систем) осуществляются на сервере. В процедуры доступа к данным на сервере вовлечены адаптеры, работающие по определенному протоколу, драйверы, обеспечивающие взаимодействие этих адаптеров с операционной системой, а также менеджеры дисковых томов, файловые системы и менеджеры памяти операционной системы и другие компоненты.

Система хранения данных обычно включает в себя следующие подсистемы и компоненты: устройства хранения (дисковые массивы, ленточные библиотеки), инфраструктуру доступа к устройствам хранения, систему резервного копирования и архивирования данных, программное обеспечение для управления хранением, а также систему управления и мониторинга.

Альтернативы системам хранения данных

В традиционном подходе серверы подключены непосредственно к системе хранения данных DAS (Direct Attached Storage).

Однако наряду с DAS существуют также устройства хранения, подключаемые к сети, такие как NAS (Network Attached Storage), а также компоненты хранения данных в сети, представленные SAN (Storage Area Networks).

NAS- и SAN-системы возникли как альтернатива архитектуре DAS, чтобы удовлетворить растущие требования к системам хранения данных, используя доступные на тот момент технологии. Для лучшего понимания преимуществ сетевых моделей давайте начнем с рассмотрения традиционного подхода.

Системы хранения прямого подключения

Устройства хранения DAS, также известные как SAS (Server Attached Storage), т. е. системы, подключаемые непосредственно к серверу, были разработаны много лет назад для расширения емкости хранения существующих серверов. В те времена при необходимости увеличения числа томов, связанных с приложениями, к серверу добавлялись новые диски либо приобретался новый сервер. Принимая во внимание технологические ограничения того времени (узкая полоса пропускания, медленные сети, дорогостоящие микропроцессоры) и относительно низкие требования к емкости и времени доступа, системы DAS были вполне адекватным решением.

14 стр., 6820 слов

Задачи и средства резервного копирования и хранения данных

... того, для эффективного восстановления работоспособности системы носители должны обрабатываться в правильном порядке. 3.2 Технологии хранения резервных копий и данных В процессе выполнения резервного копирования данных появляется проблема выбора технологии хранения резервных копий и данных. В настоящее время ...

Один из недостатков технологии DAS в сегодняшней ИТ-инфраструктуре — доступность дисковой системы, ассоциированной с данным сервером, только через это устройство, что приводит к созданию отдельных «островов» данных. Кроме того, файлы не могут совместно использоваться несколькими серверами, а для добавления дисковых накопителей к сети серверы должны быть переведены в автономный режим. Чтобы разрешить эти проблемы и обеспечить избыточность и высокую готовность данных, компаниям приходилось копировать данные на несколько серверов и использовать различные RAID-конфигурации. В настоящее время, невзирая на значительные изменения в объемах хранения и характере информационных систем, решения DAS остаются в основе своей неизменными. Поскольку с течением времени росли требования к системам хранения, компании просто добавляли диски к своим серверам и серверы к своим сетям. То, что когда-то было практичным решением, теперь привело к тому, что у компаний образовалась сложная инфраструктура систем хранения данных и огромные серверные фермы, которыми все труднее управлять.

Сетевое хранение данных

Архитектуры сетевых систем хранения были разработаны в 1990-х гг., и их задачей было устранение основных недостатков систем DAS. В общем случае сетевые решения в области систем хранения должны были реализовать три задачи: снизить затраты и сложность управления данными, уменьшить трафик локальных сетей, повысить степень готовности данных и общую производительность. При этом архитектуры NAS и SAN решают различные аспекты общей проблемы. Результатом стало одновременное сосуществование двух сетевых архитектур, каждая из которых имеет свои преимущества и функциональные возможности.

Устройства хранения данных, подключаемые к сети NAS

Основная задача систем NAS — упростить совместное использование файлов. На базовом уровне устройства NAS — это оборудование, которое подключается непосредственно к локальной сети. В этом состоит их основное отличие от систем с индивидуальными серверами с прямым подключением изолированных накопителей. Устройства NAS, часто называемые файлерами, состоят из единого головного устройства, выполняющего обработку данных и осуществляющего сетевое соединение цепочки дисков. Устройства NAS позволяют использовать системы хранения в сетях Ethernet, в них для организации совместного доступа к файлам применяется протокол TCP/IP. Эти устройства позволяют клиентам совместно использовать файлы, даже если клиентские системы работают под управлением различных ОС. В отличие от архитектуры DAS, в системах NAS не требуется переводить серверы в автономный режим для увеличения общей емкости; диски можно добавлять в структуру NAS простым подключением устройства в сеть.

NAS-устройства не могут совместно использовать носители других NAS-устройств в сети, при этом каждое добавляемое в сеть устройство хранения должно управляться как отдельный том. То, что NAS-устройства оперируют только в файловом формате и не способны разделять свою емкость хранения между несколькими узлами, — еще один ограничивающий фактор их применения.

7 стр., 3287 слов

Базы данных и системы управления базами данных

... данных (БнД) База данных (БД) Система управления базами данных (СУБД) Глава1. Базы данных 1. 1 Основные понятия баз данных В современных базах данных хранятся не только данные, но и информация. База данных (БД)– организованная структура, предназначенная для хранения ... последующая выдача на устройство вывода или передача по каналам связи. Существует много систем управления базами данных. Они могут по ...

Сети хранения данных (SAN)

Решения SAN (Storage Area Network) были разработаны для решения проблем хранения данных в НИС (сетях информационного хранения), таких как перегрузка каналов связи, задержки в локальных IP-сетях (10/100-Мбит/c) и проблемы доступа к данным большим количеством компьютеров. В отличие от систем DAS (Direct Attached Storage) и NAS (Network Attached Storage), SAN позволяет перемещать данные по выделенной сети, не вызывая избыточного трафика в локальной сети.

Концепция SAN была впервые предложена в 1998 году и заимствована из мэйнфреймового мира, где она применялась в центрах обработки данных для подключения компьютеров к системам хранения и распределенным сетям. Основное различие между SAN и NAS заключается в способе организации обмена данными между устройствами хранения и серверами. Архитектура SAN направлена на решение проблем, вызванных интенсивными процедурами резервного копирования и обмена данными путем перенесения всей системы в выделенную подсеть.

Системы, основанные на протоколе Fibre Channel, позволяют в широких пределах изменять емкость системы хранения данных и гарантировать более высокую пропускную способность в пределах выделенной подсети. Так, дисковые массивы и ленточные библиотеки, не оборудованные интерфейсами Fibre Channel, можно подключить к SAN, используя маршрутизаторы Fibre Channel-SCSI.

Оптимизация архитектуры SAN для протокола передачи данных на уровне блоков сделала ее применение естественным для работы с большими базами данных. Система стала рассматриваться как надежное решение, особенно для динамичного структурированного контента. Однако использование блочных команд ввода-вывода означает, что совместное использование файлов различными пользователями в общем случае невозможно, что вместе с высокой стоимостью и необходимостью привлечения значительных ресурсов для управления этими сложными решениями может ограничивать сферы применения данной технологии.

Управление жизненным циклом информации (Information Life-cycle Management, ILM) является одним из решений проблемы управления системами хранения данных, которые постепенно увеличиваются по объему. Старые методы управления такими системами становятся все сложнее и дорогими. Однако, с использованием концепции ILM, можно достичь высокой доступности, адекватной производительности и надежности хранения информации, соответствующей требованиям бизнеса и государственных регулирующих органов.

Согласно концепции ILM, данные могут быть разделены по критерию их ценности для бизнеса, а затем управляться с учетом изменения их ценности во времени. Наиболее важная информация автоматически перемещается на самую быструю, надежную и защищенную систему хранения данных, в то время как менее важная информация может быть перемещена на более дешевую и менее скоростную систему.

Например, архивные данные могут быть записаны на магнитные ленты и удалены с рабочей системы, чтобы не замедлять доступ к более критичной информации. Уже ненужная информация автоматически удаляется из системы. Весь процесс управления жизненным циклом информации должен быть цикличным, чтобы обеспечить эффективное использование ресурсов хранения данных и соответствовать требованиям бизнеса.

16 стр., 7666 слов

Администрирование базы данных

... как используются соответствующие данные. Проблеме администрирования баз данных внимание уделяется сравнительно недавно – с появлением и развитием современных баз данных. Однако в связи с тем, что совершенствование баз данных и систем управления данных – явление постоянное и ...

Таким образом, ILM предоставляет возможность более эффективно управлять системами хранения данных, обеспечивая оптимальное использование ресурсов, высокую доступность, надежность и соответствие требованиям бизнеса и регулирующих органов.

Один из методов, который используется для разрешения противоречия между объемами хранимых данных и временем доступа к ним, называется управление иерархическим хранением HSM (Hierarchical Storage Management).

HSM реализует политику архивирования редко используемых данных путем переноса их с дисков на компрессированные ленты. Однако концепция управления жизненным циклом информации (ILM) представляет собой шаг вперед по сравнению с HSM, поскольку она не только оперирует блоками данных, но и управляет содержанием данных на протяжении всего их жизненного цикла. В этом новом подходе ILM, стратегия активного управления информацией направлена на принятие самостоятельных решений о данных, а не просто на их обработку. Ключевой особенностью ILM является способность пользователей задавать политики передвижения данных, которые применяются к объемам данных с использованием следующих технологий: различные методы миграции данных с одного типа систем хранения на другой, удаленное и локальное зеркалирование данных, резервное копирование и архивирование и так далее.

Эффективное внедрение ILM позволяет компаниям достичь значительной экономии за счет сокращения затрат на оборудование и программное обеспечение. Автоматизация управления жизненным циклом информации обеспечивает интеграцию приложений, информационных ресурсов и сервисов управления хранением, таким образом, достаточно задать приоритет приложений или группы информации, чтобы применялся соответствующий уровень обслуживания. Такая интеграция и автоматизация решает проблему эффективности управления объемами данных.

Первые шаги внедрения ILM заключаются в оценке и классификации доступной информации и ресурсов, в их оценке с точки зрения их значения для бизнеса. Это должны сделать организации, которые решили управлять своей информацией с позиции жизненного цикла.

Резервное копирование

Система резервного копирования является неотъемлемой частью системы хранения данных. Ее основная цель — создание резервных копий и восстановление данных, обеспечивая высокую доступность системы. Кроме того, система резервного копирования является важным методом обеспечения непрерывности бизнеса. Централизованная система резервного копирования позволяет сократить совокупную стоимость владения ИТ-инфраструктурой за счет оптимального использования устройств резервного копирования и сокращения расходов на администрирование по сравнению с децентрализованной системой.

Централизованная система резервного копирования имеет многоуровневую архитектуру, включающую:

  • сервер управления резервным копированием, который также может выполнять функцию сервера копирования данных;
  • один или несколько серверов копирования данных, к которым подключены устройства резервного копирования;
  • компьютеры-клиенты с программами-агентами резервного копирования;
  • консоль администратора системы резервного копирования.

Администратор системы ведет список компьютеров-клиентов, устройств записи и носителей хранения резервных данных, а также составляет расписание резервного копирования. Вся эта информация хранится в специальной базе данных, находящейся на сервере управления резервным копированием.

6 стр., 2668 слов

Хранилища данных

... Подход построения хранилища данных для интеграции неоднородных источников данных принципиально отличается от подхода динамической интеграции разнородных БД. Строится новое крупное хранилище, управление данными в ... свои схема и регламенты хранения, резервного копирования и восстановления. В результате часть данных может оказаться на флэш-накопителях системы хранения старшего уровня с возможностью ...

В соответствии с расписанием или по команде оператора, сервер управления отправляет команду программе-агенту, установленному на компьютере-клиенте, для начала процесса резервного копирования данных в соответствии с выбранными настройками. Программа-агент собирает и передает данные, подлежащие резервированию, на сервер копирования, указанный сервером управления.

Сервер копирования сохраняет полученные данные на подключенном устройстве хранения данных. Информация о процессе, включающая информацию о копируемых файлах и использованных носителях, сохраняется в базе данных сервера управления. Эта информация помогает найти местоположение сохраненных данных при необходимости их восстановления на компьютере-клиенте.

Резервное копирование данных является важной задачей для обеспечения сохранности информации и возможности ее восстановления в случае сбоев или аварий. Однако, чтобы система резервного копирования была эффективной, необходимо учитывать несколько ключевых аспектов.

Во-первых, чтобы сохранить непротиворечивые данные компьютера-клиента, необходимо предотвратить их изменение в процессе копирования. Для этого приложения компьютера-клиента должны завершить все транзакции, сохранить содержимое кэш-памяти на диск и приостановить свою работу. Этот процесс инициируется по команде программы-агента, которая передается приложениям компьютера-клиента.

Во-вторых, созданные резервные копии необходимо проверять на предмет целостности и работоспособности. Ведь основная цель резервного копирования — восстановление данных после сбоя или аварии. Поэтому, при построении системы резервного копирования необходимо уделить внимание этому аспекту.

Кроме того, при построении системы резервного копирования необходимо учитывать сокращенное «окно» резервного копирования. В ситуации, когда информационные системы работают круглосуточно, доступный временной интервал остановки приложений для проведения операции резервного копирования может быть очень ограничен.

Еще одним важным аспектом является уменьшение трафика данных резервного копирования в локальной сети. Поскольку данные передаются с компьютеров-клиентов на серверы копирования через локальную сеть, большой объем данных может привести к повышенной нагрузке и сделать сеть недоступной для других приложений.

Для сокращения трафика резервного копирования в основной сети ранее использовались выделенные сети резервного копирования и многоуровневая структура с несколькими серверами копирования. Такой подход позволял выделить сервер копирования и локализовать трафик резервного копирования между этим сервером и основными серверами, что способствовало снижению нагрузки на общую локальную сеть.

Резервное копирование с использованием SAN

Применение сетей хранения данных (SAN) позволяет полностью перенести трафик резервного копирования с локальной сети на сеть хранения. Существуют два варианта реализации: без загрузки локальной сети, или внесетевое копирование (LAN-free backup), и без участия сервера, или внесерверное копирование (Server-free backup).

17 стр., 8048 слов

Защита баз данных

... доступа к данным. В данной работе будут рассмотрены основные аспекты защиты баз данных, их реализация ... над объектами базы данных. Эти привилегии позволяют управлять доступом пользователей к данным и обеспечивают ... ресурсов, используемых для ввода, хранения, обработки и передачи данных [1]. Система считается ... которой определен минимальный набор прав. По умолчанию каждый новый пользователь относится ...

Внесетевое копирование — это процесс передачи данных с диска на ленту и обратно, который осуществляется внутри SAN (Storage Area Network).

Одной из основных преимуществ такого подхода является исключение сетевого сегмента из пути резервного копирования данных. Это позволяет избежать задержек, связанных с передачей трафика через сеть IP и платы ввода-вывода. Кроме того, такой подход снижает нагрузку на локальную сеть, что позволяет проводить резервное копирование практически в любое время суток.

Однако стоит отметить, что при внесетевом копировании пересылку данных выполняет сервер, подключенный к SAN. Это может привести к увеличению нагрузки на данный сервер. Для организации передачи данных по протоколу Fibre Channel может использоваться один оптический кабель, через который могут быть организованы несколько каналов передачи данных. Таким образом, весь объем резервируемых данных с backup-серверов направляется на ленточное устройство, минуя локальную сеть. Локальная сеть при этом необходима лишь для контроля работы backup-серверов со стороны главных серверов. Поэтому по локальной сети передается только небольшой объем метаданных, содержащих информацию о резервируемых данных.

В данном методе резервного копирования главные серверы отвечают за политику резервного копирования данных в своем сегменте или зоне ответственности. Backup-серверы, в свою очередь, являются клиентами по отношению к главному серверу. Этот метод резервного копирования считается эффективным и максимально задействует пиковую полосу пропускания Fibre Channel.

В качестве протокола, используемого для передачи данных между серверами и библиотеками, могут использоваться как SCSI поверх Fibre Channel, так и IP поверх Fibre Channel. Большинство FC-адаптеров и FC-концентраторов поддерживают оба протокола одновременно на одном Fibre Channel-канале.

Внесерверное копирование, также известное как копирование с участием третьей стороны (Third-Party Copy, 3PC), является развитием метода внесетевого копирования (LAN-free).

Оно позволяет снизить количество процессоров, памяти и устройств ввода-вывода, задействованных в процессе резервного копирования.

Этот тип резервного копирования осуществляет полную архивацию разделов и позволяет восстанавливать отдельные файлы. Оно осуществляется без непосредственного участия сервера, с данными, копируемыми с диска на ленту и обратно. Для этого процесса требуется наличие дополнительного третьего узла, который полностью отвечает за процесс копирования.

Маршрутизатор хранилищ данных может выступать в качестве такого узла и выполнять функции, которые ранее выполнял сервер. Преимущество архитектуры SAN заключается в отсутствии жесткой привязки его компонентов к устройствам хранения данных. Благодаря этому свойству возможно реализовать резервное копирование без участия сервера.

Для резервного копирования блоков данных, относящихся к определенному файлу, предварительно создается индекс или список номеров принадлежащих блоков. Это позволяет в дальнейшем привлекать внешние устройства для резервного копирования.

Внесерверное копирование позволяет перемещать данные между дисковыми массивами и библиотеками, подключенными к сети SAN, напрямую. При этом данные перемещаются по сети SAN и не загружают локальную сеть или серверы. Этот метод резервного копирования идеально подходит для корпоративных сетей, которые должны работать непрерывно. Особенно в случаях, когда временной период для выполнения резервного копирования без существенного влияния на работу пользователей и приложений является критично малым.

18 стр., 8617 слов

Защита баз данных

... данных или «объектом данных», для которых должна быть создана система безопасности, может быть как вся база данных целиком, так и любой объект внутри базы данных. ... несанкционированного их чтения. В данной работе я затрагиваю основные аспекты защиты баз данных, их реализацию на примерах ... и ресурсов, используемых для ввода, хранения, обра­ботки и передачи данных) [1]. Система называется безопасной, ...

Репликация данных представляет собой процесс создания копий данных для обеспечения их сохранности и доступности. Современные дисковые массивы обладают средствами, позволяющими создавать Point-In-Time (PIT)-копии данных, то есть копии, фиксирующие состояние данных на определенный момент времени. Для создания PIT-копий существуют два основных метода: клонирование и «моментальный снимок» (snapshot).

Клонирование подразумевает полное копирование данных. При этом требуется достаточное дисковое пространство, такое же как и для исходных данных, и определенное время. Однако, при использовании клонирования нет нагрузки на дисковые тома, содержащие исходные данные. Это означает, что дисковая подсистема продуктивного сервера не испытывает дополнительной нагрузки. Клонирование является эффективным методом создания копий данных, особенно в случаях, когда требуется полная сохранность данных.

В отличие от клонирования, «моментальный снимок» может быть реализован как программно на продуктивном сервере, так и аппаратно внутри дискового массива. Процесс создания «моментального снимка» начинается с завершения всех транзакций и сохранения кэш-памяти на диск. Затем создается виртуальная структура, называемая snapshot, которая представляет собой карту расположения блоков данных. ОС и другое программное обеспечение воспринимают snapshot как логический том. Приложение на короткое время прерывает свою работу для сохранения данных. После этого приложение возобновляет работу в стандартном режиме и изменяет блоки данных. При изменении блоков данных, старые данные копируются в область кэш-памяти snapshot с помощью драйвера snapshot, а в карте расположения блоков данных указывается ссылка на новое местоположение блока. Карта snapshot всегда указывает на блоки данных, полученные на момент завершения транзакций приложением. Блоки данных, которые не были изменены, хранятся на прежнем месте, а старые данные измененных блоков хранятся в области кэш-памяти snapshot. Для создания копий данных с помощью «моментальных снимков» требуется меньше дискового пространства, но это создает дополнительную нагрузку на дисковую подсистему продуктивного сервера.

Выбор метода создания PIT-копий зависит от бизнес-требований, предъявляемых к системе резервного копирования. Клонирование является предпочтительным методом, если требуется полная сохранность данных и нет возможности дополнительной нагрузки на дисковую подсистему. Однако, если требуется экономия дискового пространства, то создание копий с помощью «моментальных снимков» может быть более подходящим вариантом, несмотря на дополнительную нагрузку на дисковую подсистему.

Виртуализация ресурсов хранения

Виртуализацию трудно отнести к совершенно новым технологиям — идеи виртуализации различных вычислительных ресурсов тем или иным образом реализовывались и ранее. А вот необходимость в виртуализации ресурсов хранения объясняется рядом причин. Прежде всего это, конечно, резкий рост объемов данных. Обострились проблемы хранения и управления большими объемами информации. Это связано и с широким распространением «островов» данных (напомним, что под ними понимаются данные, находящиеся на различных носителях в гетерогенных системах хранения, нередко территориально удаленных друг от друга и работающих под управлением разных ОС).

11 стр., 5258 слов

Мультимедийные базы данных

... теории баз данных; исследовать понятия Мультимедийных баз данных; рассмотреть аппаратное обеспечение мультимедиа; исследовать программное обеспечение мультимедиа. Объектом исследования являются мультимедийные базы данных. Предметом исследования являются характеристики, разработка и аппаратное обеспечение мультимедийных баз данных. Структура курсовой работы состоит ...

Для обслуживания таких «островов», отличающихся сложностью конфигураций аппаратных и программных средств, а также разнообразием используемых технологий, необходимы дополнительные материальные и человеческие ресурсы. Ухудшилась оперативность доступа к данным, находящимся в гетерогенных системах хранения, что приводит к значительным финансовым потерям для компаний, бизнес которых связан с оперативной обработкой актуальной и особо важной информации. В той или иной степени перечисленные выше проблемы решаются с помощью технологий виртуализации ресурсов хранения.

Под виртуализацией ресурсов хранения обычно понимается отображение любого количества разнородных носителей, устройств и систем хранения (JBOD, RAID, RAIT и т. д.) в виде единого хранилища данных (так называемого виртуального пула), управление которым осуществляется централизованно. Можно сказать, что при применении технологий виртуализации «разрываются» физические связи между серверами и устройствами хранения разных типов, а физическая память преобразуется в единый логический пул, состоящий из отдельных гетерогенных устройств хранения, прозрачный доступ к которым обеспечивается независимо от их технических особенностей и территориального расположения. Технологии виртуализации ресурсов хранения позволяют:

Уровни виртуализации – одна из ключевых концепций, которые позволяют эффективно управлять и использовать разнообразные ресурсы хранения данных. Виртуализация представляет собой процесс отделения логического представления устройств хранения от их физического размещения, что дает возможность преодолеть физические ограничения традиционных систем хранения.

Существуют три основных уровня виртуализации в сетевых средах хранения данных: уровень серверов, уровень сетей SAN и системный уровень. Каждый из этих уровней может использоваться независимо друг от друга или совместно для достижения максимальной эффективности.

На уровне серверов виртуализация осуществляется путем использования специального программного обеспечения, которое установлено на сервере и независимо от типа накопителей. Это программное обеспечение позволяет операционной системе воспринимать сервер как связанный с конкретным типом устройства хранения, хотя на самом деле она взаимодействует с виртуальным диском. Виртуализация на уровне серверов может быть применена как в гомогенной среде сетей SAN, так и в других сетевых средах. Однако этот уровень виртуализации имеет ограниченные возможности взаимодействия с аппаратными и программными компонентами, поэтому рекомендуется для систем начального уровня.

Наиболее широко известна виртуализация на уровне сетевой структуры. Этот уровень виртуализации часто используется в открытых средах сетей SAN как со стандартными, так и с виртуализованными системами хранения данных. Он включает в себя всю архитектуру сетей SAN и может использоваться в качестве основной реализации асимметричного объединения накопителей в общий пул в рамках сети SAN.

Целью виртуализации является оптимизация использования доступных ресурсов хранения и управление большими пулами внешней памяти. Это позволяет упростить управление гетерогенными системами хранения, сократить время резервного копирования и восстановления данных, а также повысить отказоустойчивость корпоративной информационной системы. Кроме того, виртуализация способствует снижению общей стоимости владения корпоративной системой хранения, позволяя избежать «островов» данных и эффективнее использовать имеющиеся устройства и системы хранения.

8 стр., 3604 слов

Распределенные технологии обработки и хранения данных

... разработка, настолько выросла, что вновь возникшие задачи потребовали децентрализации хранения и обработки данных и, соответственно, развития информационной системы. Здесь и совершается ошибка. ... этой области необходимо преодолеть инерцию мышления и принять современные технологии, соответствующие требованиям распределенных систем.Поведение и мотивация разработчиков вполне понятны и оправданы. ...

На системном уровне виртуализация осуществляется на основе контроллеров дисковых массивов, работа которых независима от активности узла. Контроллеры дисковых массивов создают виртуальные диски, выполняют мгновенные копии состояний системы и клонирование данных при взаимодействии с управляющим ПО. Виртуализация на уровне индивидуального контроллера системы хранения — это значительный шаг за пределы классической технологии RAID. Виртуализация на этом уровне особенно хорошо подходит для среды, требующей высокой производительности, готовности данных, отказоустойчивости, эффективности управления системой хранения, репликации данных и поддержки кластеров.

Упрощенное управление накопителями — еще одно значительное преимущество виртуализации на системном уровне, позволяющее администраторам оперировать атрибутами системы хранения, а не составляющими ее физическими объектами. Виртуализация позволяет пользователям создавать для своих систем хранения данных единую модель управления, не принимая во внимание тип носителей, тем самым позволяя избежать работы по физическому размещению данных. Такой подход снижает сложность развертывания системы хранения, позволяет администраторам управлять всеми накопителями как единым консолидированным пулом и переносит задачи управления с уровня индивидуальных накопителей на уровень всего пула.

Способность динамического расширения емкости виртуальных дисков без нарушения работы выполняющихся приложений значительно улучшает эффективность на системном уровне. Виртуализация позволяет следить за эффективностью использования емкости томов или всего пула накопителей и по мере необходимости выделять дополнительные ресурсы в динамическом режиме.

Возможность по желанию пользователя увеличивать (но не уменьшать) размер виртуального диска (в зависимости от наличия свободного дискового пространства в пуле) позволяет достичь высоких результатов в эффективности использования емкости носителей. Эта особенность виртуализации повышает эффективность использования накопителей как благодаря устранению ограничений на доступный размер емкости хранения, так и благодаря перераспределению данных по мере роста пула.

Виртуальные библиотеки

В последнее время все большую популярность приобретает идея ускорения резервного копирования с помощью специальных массивов из относительно дешевых жестких дисков с интерфейсом Serial ATA (SATA), которые служат для промежуточной записи копируемых данных. Реализуется эта идея, как правило, с помощью так называемых виртуальных библиотек VTL (Virtual Таре Library), которые «подставляют» серверу резервного копирования недорогой дисковый массив как обычную ленточную библиотеку. При этом, разумеется, нет необходимости в новом ПО для резервного копирования или модернизации старого.

Предпосылками этой тенденции, с одной стороны, было появление быстрых и недорогих жестких дисков SATA очень большой емкости, а с другой — потребность в проведении процедуры сохранения необходимого объема данных за ограниченное время, называемое «окном» резервного копирования.

«Окно» копирования определяется несколькими критериями. Поскольку создание резервной копии требует абсолютного доступа к данным, обычно этот процесс проводится в нерабочие часы, когда он оказывает минимальное влияние на работу персонала, загруженность серверов и локальной сети. Если объем переносимых во время одной сессии данных превышает размер картриджа магнитной ленты, возникает необходимость ручной замены носителя по требованию программы резервного копирования. Итак, помимо отличной скорости, система хранения на жестких дисках может помочь и в таком случае, предоставляя для записи резервной копии свободное пространство, превышающее возможности одного картриджа.

Сохранение резервных копий данных является основополагающим моментом в обеспечении безопасности информации. Существует несколько подходов к резервному копированию, каждый из которых имеет свои преимущества и недостатки. Но в решениях Disk-to-Disk-to-Tape (D2D2T) успешно объединяются достоинства сохранения на жестких дисках и магнитных лентах, что делает этот подход эффективным и надежным.

Основные достоинства сохранения резервных копий на жестких дисках включают высокую скорость сохранения и восстановления данных. Жесткие диски обеспечивают быстрый доступ к информации и позволяют проводить операции резервного копирования мгновенно. Это особенно важно для организаций, где важно минимизировать простои системы.

С другой стороны, магнитные ленты обладают низкой стоимостью хранения и позволяют сохранить большие объемы данных. Ленточные накопители могут быть использованы для долгосрочного хранения информации, а также для архивации данных. Низкая стоимость ленточного хранения делает его привлекательным выбором для многих компаний с ограниченными бюджетами.

Именно поэтому решения D2D2T становятся все более популярными. Они включают использование дисковой кэш-памяти в качестве промежуточного этапа при резервном копировании данных, а затем передачу копий данных на магнитные ленты. Такой подход позволяет объединить скорость и эффективность хранения данных с низкой стоимостью и безопасностью ленточного хранения.

Для этого часто используется виртуальная ленточная библиотека (Virtual Tape Library, VTL), которая предоставляет 100%-ную аппаратную эмуляцию ленточных накопителей определенного типа. VTL подключается к адаптеру SCSI вместо реального ленточного накопителя, а магнитные ленты подключаются к VTL. Это позволяет программам резервного копирования работать с VTL так же, как с обычными ленточными накопителями, не замечая подмены и совместимости нового оборудования с операционными системами и программами резервного копирования.

Таким образом, решения D2D2T с использованием VTL объединяют высокую скорость сохранения и восстановления данных на жестких дисках с низкой стоимостью и безопасностью хранения на магнитных лентах. Это делает их эффективным инструментом для обеспечения безопасности информации и минимизации рисков потери данных.

Список литературы

  1. Электронный ресурс
  2. Журнал Upgrade4_08_05