На сегодняшний день можно выделить 4 основных модели хранения данных. Это Direct attached storage - локальное подключение к серверам, Network Attached Storage (NAS) - сетевые устройства хранения, Centralized storage - централизованный сервер хранения и Storage Area Network (SAN) - выделенная сеть хранения данных.
Самой распространенной из них является архитектура локального подключения, где к сети подключены серверы, а к каждому серверу подсоединен свой дисковый массив и своя ленточная библиотека данных. В этом случае для каждого сервера могут использоваться и различные средства управления. Основной недостаток данного метода заключается в отсутствии единого пространства хранения данных. Из-за этого data sharing - совместное использование данных с помощью стандартных средств попросту невозможно.
Вторая модель - NAS. Здесь и серверы, дисковые массивы и ленточные библиотеки имеют равнозначное подключение к сети. Возможным становится совместное использование данных без каких-либо дополнительных средств. Тонкий сервер реализует модель файловой системы. NAS вполне может претендовать на то, чтобы считаться идеальной системой, однако этому мешает один существенный момент: обращение ко всем устройствам обеспечивает один и тот же сетевой интерфейс, что способствует увеличению трафика. Это узкое место данной модели и потенциальная точка отказа. Кроме того, данная организация хранения данных, в силу своей архитектурной особенности не в состоянии обеспечить достаточную их безопасность.
Третья модель - Centralized storage подразумевает подключение к сети серверов, и организация доступа каждого сервера к единому серверу хранения данных (Storage Server). А тот, в свою очередь, имеет соединение с ленточной библиотекой данных и удаленной системой резервного копирования. Дисковые массивы к серверу подключаются по внутренней или внешней SCSI-шине. Такой способ создает определенные трудности при расширении дисковой системы, не позволяет создать централизованное управление всеми накопителями организации, а также не позволяет эффективно перераспределять свободные дисковые ресурсы между различными серверами и приложениями. Данная модель хранения обуславливает и высокую стоимость хранения данных ($0,5 за Кб). Сильные стороны - возможность использования разных интерфейсов (SCSI, Faber Channel), и организация удаленного хранения данных, доступ к которым может быть как синхронный, так и асинхронный. Однако организация синхронного канала подразумевает какое-то время задержки доставки данных, а при асинхронном способе возникает проблема рассогласования копий между собой.
Четвертая модель - Storage Area Network (SAN) - выделенная сеть хранения данных практически не имеет недостатков, и обладает такими достоинствами, как высокая пропускная способность (1-2 Гб/с), высокий уровень доступности данных, управляемость и масштабируемость как конкретных устройств, так и самой системы. Эту модель хранения и обеспечения доступа к данным мы и рассмотрим более подробно.
Как видно из названия, Storage Area Network представляет собой выделенную сеть, предназначенную для высокоскоростного соединения серверов и устройств хранения данных, к которым относятся дисковые массивы, ленточные и оптические библиотеки и другие. В отличие от третьей модели - Centralized storage, данные здесь хранятся на нескольких различных устройствах, объединенных в отдельную сеть, благодаря чему между ними возможен обмен данными. При этом технология SAN позволяет каждому серверу получить доступ к любому накопителю, не загружая другие серверы. В данной технологии используются единые средства резервирования, совместное использование данных можно осуществлять с помощью интеллектуальных устройств.
Особенность технологии SAN позволяет все виды устройств хранения данных рассматривать как единый управляемый ресурс, легко перераспределяемый между различными серверами и приложениями. Это позволяет, в случае надобности, без проблем наращивать систему хранения данных организации. Естественно, что большое число небольших накопителей можно заменить несколькими крупными дисковыми массивами и ленточными библиотеками. Это не только упрощает администрирование, но и зачастую оказывается более дешевым решением.
Все устройства сети SAN подключаются по протоколу Fibre Channel (FC), поддерживающему сегодня максимальную скорость передачи данных - 200 Мб/сек (Full Duplex). В 2000 году пропускная способность Fibre Channel будет доведена до 200 Мб/сек (Half Doplex), а в ближайшем будущем - до 800 Мб/сек (Half Doplex). Кроме того, применение коммутаторов позволяет наращивать производительность практически неограниченно. Для сравнения: SCSI поддерживает сегодня максимальную скорость 160 Мб/сек, разделяемую между всеми устройствами, подключенными к SCSI-шине.
Fibre Channel допускает применение в зависимости от конкретной задачи, как оптических кабелей, так и медных. Максимальное расстояние для передачи данных с помощью протокола Fibre Channel по медному кабелю - 10-30 м, по одномодовому оптическому кабелю (1300 nm) - 10 км.
Подключение устройств по протоколу Fibre Channel помимо высокой производительности обладает еще одним свойством, связанным с унаследованными чертами протокола SCSI. Благодаря этому свойству, серверы и приложения "видят" накопители, подключенные к выделенной сети хранения данных, как локально подключенные по SCSI-шине.
Применение протокола Fibre Channel в сети SAN
позволяет повысить скорость резервного
копирования. Американская компания Legato,
специализирующаяся на разработке
программного обеспечения, управляющего
резервным копированием, предлагает, в
частности, два вида такого ПО - LAN-free backup и
Server-less backup.
Так реализация LAN-free backup происходит без
излишней нагрузки на ЛВС. Но при этом
сохраняется нагрузка на серверы, так как
копирование данных с дисковой подсистемы
на ленточную библиотеку осуществляется как
раз посредством серверов. Копирование
данных напрямую, без участия серверов,
возможно путем реализации Server-less backup.
Однако для этого требуются специальные
аппаратно-программные решения, такие как
Legato Celestra, использующие протокол NDMP (Network Data
Management Protocol) и набор команд SCSI Extended Copy.
Сети SAN позволяют эффективно реализовать кластеры серверов и дублирование данных. Помимо кластеризации, выделенные сети хранения данных, благодаря высоким скоростям и поддержке больших расстояний, позволяют создавать зеркальные копии данных в реальном масштабе времени. При этом зеркальная копия может быть расположена за сотню километров от оригинала и для ее создания достаточно одного накопителя, тогда зеркальный сервер не нужен.
Архитектура сетей SAN отчасти похожа на архитектуру сетей LAN. Упрощенно локальная сеть состоит из коммутатора, сервера и пользовательских компьютеров. Сеть SAN, как говорилось выше, состоит из коммутатора, сервера и различных накопителей. Конечно, это не полный набор, потому что, как и любая другая сеть, SAN строится с помощью оптоволоконных или медных кабелей, мостов и удлинителей, адаптеров, управляющего программного обеспечения. В принципе, с помощью небольшой модернизации локальная сеть может быть преобразована в сеть SAN. В архитектуру SAN могут быть интегрированы, существующие у организации, накопительные устройства путем преобразования SCSI интерфейса в интерфейс Fibre Channel. Серверы также дополняются адаптерами Fibre Channel. Путь встраивания технологии SAN в существующую инфраструктуру предприятия позволяет сэкономить средства заказчика, потраченные ранее на создание информационной системы. Тем более, что возможно поэтапное внедрение SAN с постепенным наращиванием мощности.
Модель SAN предполагает возможность 4 типов подключения устройств. Первое - точка-точка, при котором скорость обмена данными составляет 100 Мб/сек, или 200 Мб/сек в режиме Full Duplex. Второй тип - подключение накопителей и серверов к FC-хабу. В этом случае полоса пропускания 100 Мб/сек будет разделяться между всеми, подключенными к хабу устройствами (до 127 устройств). Третий тип - коммутируемое подключение - подключение накопителей и серверов к FC-коммутатору. Здесь полоса пропускания 100 Мб/сек (200 Мб/сек в режиме Full Duplex) будет доступна для каждого подключенного к коммутатору устройства (к коммутаторам можно подключить до 16 миллионов устройств). И четвертый тип - смешанное подключение, когда используются и коммутаторы и хабы. При этом каждый FC-хаб может иметь только один порт, подключенный к порту коммутатора, и может быть назначен или частным (private), или общедоступным (public). Устройства, подключенные к частным FC-хабам, могут взаимодействовать только с устройствами, подключенными к тому же хабу. А устройства, подключенные к общедоступному FC-хабу, могут взаимодействовать с устройствами, подключенными к другим FC-хабам и коммутаторам.
Мосты применяются для подключения SCSI-устройств к сетям SAN. Удлинители позволяют осуществлять соединения Fibre Channel на расстояниях порядка 100 км.
Помимо несомненных достоинств технологии SAN, она имеет ряд недостатков. Основной, пожалуй, это незавершенная система стандартов. Из-за этого решение SAN системные интеграторы сегодня рекомендуют реализовывать на технике какого-либо одного производителя. Аппаратно-программные средства для этого предлагают сегодня многие крупные компании, среди которых Hewlett-Packard, Sun Microsystems, IBM, Dell, Compaq, Siemens. Принятие стандартов, ожидаемое в ближайший год, должно изменить ситуацию, что облегчит внедрение технологии SAN. Это тем более важно, так как одна из основных идей технологии SAN заключается именно в возможности использования стандартных компонентов для увеличения емкости и мощности корпоративных хранилищ данных. Здесь могут быть использованы стандартные серверы и устройства, удовлетворяющие обязательному требованию по поддержке протокола Fibre Channel.
Второй недостаток - дороговизна решения. Как известно, на стоимость влияют такие критерии, как себестоимость продукции, уровень цен у конкурентов и ожидание рынка. Конкуренции в России в области построения сетей хранения данных нет, поэтому ценовой уровень решений SAN сегодня примерно одинаков у всех производителей. Единственно, чем могут различаться между собой решения SAN, это тем, какой используется коммутатор. Коммутаторы разных фирм различаются по архитектуре и быстродействию, а также по цене. Но это мало сказывается на общей стоимости решения. Сейчас ценовой фактор заметно ограничивает круг потенциальных заказчиков. Это лишь крупные корпорации, где число пользователей превышает одну тысячу, или компании, для которых критичны сроки обработки информации и жизненно важна ее сохранность. В дальнейшем, с падением цены, сети SAN станут стандартным решением, включенным в автоматизированную информационную структуру любого предприятия.
Что касается существующих сегодня на рынке аппаратных средств, на основе которых может быть реализована технология SAN, компания Hewlett-Packard еще в 1997 году выпустила первые продуты на основе Fibre Channel, в частности дисковый массив, полностью использующий преимущества данного протокола в скорости. HP AutoRAID Model 12H имеет наименьшее планируемое время простоя в отрасли. Hewlett-Packard также разработала и реализовала чип (Tachyon Fiber Channel Protocol Chip), являющийся фактическим стандартом при работе с Fibre Channel. Сегодня НР представляет довольно широкий спектр оборудование для Fibre Channel - систем.
Для организации работы с данным протоколом в сети SAN можно использовать оборудование фирмы Compaq: дисковые массивы FC Array, хабы FC Storage Hab 7, 12, а также FC адаптер - FC Host Controller. Дисковые массивы и серверы Netfinity для организации сетей SAN предлагает компания IBM. Полностью законченное решение сегодня поставляет Dell. Основу этого решения составляют серверы PowerEdge различных форматов, система хранения данных PowerVault 650/651 с модулями расширения PowerVault 630F, необходимое сетевое оборудование. Мост Fibre Channel/SCSI, производства Dell, позволяет подключать ленточные накопители SCSI-формата.
Компании Sun Microsystems уже год предлагает целый спектр программно-аппаратных средств для построения решений по технологии SAN. Эти решения фактически стали мировым стандартом в этой области. В частности, компания предлагает технологию построения интеллектуальных сетей хранения данных - Sun Intelligent Storage Network. Для управления такими сетями, в том числе организованными на базе техники других производителей, используется ПО - Sun Manager.
Что касается широкого применения выделенных сетей хранения данных в России, то это дело ближайшего будущего. В какой-то мере здесь препятствует чисто российская черта: не достаточно серьезное отношение к накопленным данным. О создании SAN задумываются либо когда уже создана определенная инфраструктура хранения, либо если уже однажды компания понесла убытки из-за потери данных. Однако изменению сознания весьма поспособствовала так называемая "проблема 2000", о которой столько говорилось в прошлом году. Отчасти реальная, отчасти мнимая угроза потери данных из-за сбоев в компьютерных системах побудила многих по-другому взглянуть на проблему сохранности информации. Поэтому волна решений SAN уже потихоньку докатывается и до России.
Пока же в нашей стране нет ни одного
полномасштабного внедрения данной
технологии. К слову, действительный эффект
от внедрения SAN можно получить лишь при
наличии достаточно большого объема данных.
Существующие сегодня технологи хранения
данных, поддерживающие протокол Fibre Channel,
позволяют создать систему хранения на 4,5 Tb,
что большинству предприятий и организаций
вполне достаточно. На отечественных
предприятиях уже используются в этой
области небольшие кластерные решения,
являющиеся первым шагом на пути к
технологии SAN. В скором времени
целесообразность концентрации и
консолидации данных предприятия станет
более очевидной, тогда технология SAN
придется весьма кстати.