Система хранения данных EMC Data Domain: DD990 (Data-Domain-DD990)

Система хранения данных ЕМС  Data Domain DD990 — это гибкая, безопасная и надежная система, которая позволяет обеспечить масштабируемую и эффективную защиту данных для приложений резервного копирования, архивирования и аварийного восстановления, благодаря высокоскоростной дедупликации  «на лету».

ОСНОВНЫЕ СВЕДЕНИЯ

Высокоскоростная масштабируемая дедупликация

  • Производительность до 31 ТБ/ч
  • Сокращает требования к хранилищу резервных копий в 10–30 раз, а к архивной системе хранения — в 5 раз
  • Масштабируемость, ориентированная на использование ЦП

Архитектура неуязвимости данных Data Invulnerability Architecture

  • Проверка записи и чтения «на лету», непрерывное обнаружение и исправление ошибок
  • Массив RAID 6 с двойными данными четности дисков

Прозрачная интеграция

  • Поддержка ведущих корпоративных приложений резервного копирования и архивирования

Консолидация резервного копирования и архивирования

  • Эффективная защита данных резервного копирования и/или архивирования
  • Соответствие политикам стратегического управления и требованиям регуляторов в отношении архивирования данных

Поддержка облака

  • Безопасная многопользовательская среда обеспечивает логическую изоляцию пользовательских данных

Быстрое, эффективное и масштабируемое аварийное восстановление

  • Снижение требований к полосе пропускания до 99%
  • Репликация с 270 удаленных площадок в единую систему

Простота эксплуатации

  • Сокращение административных расходов
  • Автоматическая обратная связь для передачи отчетов
  • Компактность

ВЫСОКОСКОРОСТНАЯ МАСШТАБИРУЕМАЯ ДЕДУПЛИКАЦИЯ

Система ЕМС  Data Domain DD990 демонстрируют лучшие в отрасли показатели скорости и эффективности, обеспечивая пропускную способность до 31 ТБ/ч. Это позволяет делать больше резервных копий за меньшее время, что снижает требования к длительности окон резервного копирования. Система хранения данных EMC Data Domain DD990 использует дедупликацию данных переменной длины, что сокращает требования к дисковому пространству и гарантирует сохранение на диск уже дедуплицированных данных. Это сокращает требования к хранилищу резервных копий и архивов в среднем в 10–30 раз, что позволяет использовать диск в качестве экономичной альтернативы ленте. Данные на диске доступны в сети и на основной площадке в течение более длительных периодов хранения, а быстрота и надежность восстановления и извлечения данных значительно повышается. Таким образом система хранения данных Data Domain DD990 может защищать до 28,4 ПБ данных резервного копирования и архивирования в единой системе. Тот объем ресурсов, которого раньше хватало лишь на пару дней временного хранения переносимых данных, благодаря дедупликации обеспечивает долгие месяцы длительного хранения на дисках.

Система хранения данных EMC Data Domain DD990 с функцией дедупликации может осуществлять дедупликацию данных в процессе резервного копирования или архивирования, что позволяет максимально повысить производительность и значительно снизить требования к емкости дисковой системы хранения. Дедуплицированные данные можно хранить на основной площадке для немедленного восстановления или для более длительного хранения на диске. Также можно реплицировать дедуплицированные данные для выполнения аварийного восстановления на удаленную площадку по глобальной сети или на площадку поставщика услуг в облаке, что устраняет необходимость резервного копирования на ленту, либо для консолидации операций резервного копирования на ленту в центральном местоположении. Системы Data Domain способны объединять данные резервного копирования и архивные данные в одной инфраструктуре, что обеспечивает более высокую степень консолидации и позволяет отказаться от изолированных систем хранения резервных копий и архивов и связанных с этим издержек.

 

Самая высокая в отрасли производительность при минимальных требованиях к дисковому пространству обеспечивается в первую очередь за счет масштабируемой архитектуры EMC Data Domain Stream-Informed Segment Layout (SISLTM). Точнее говоря, архитектура SISL позволяет использовать постоянно увеличивающуюся производительность ЦП для непрерывного наращивания производительности систем Data Domain за счет уменьшения числа обращений к дискам при дедупликации данных. Архитектура SISL определяет повторяющиеся сегменты в памяти и дедуплицирует данные, снижая тем самым использование дисков. Это приводит к тому, что пропускная способность систем Data Domain ориентирована на использование ЦП, а не увеличение количества дисков.

АРХИТЕКТУРА НЕУЯЗВИМОСТИ ДАННЫХ DATA INVULNERABILITY ARCHITECTURE

Система хранения данных EMC Data Domain DD990  разработана как «системы хранения последнего уровня», обеспечивающая надежное восстановление данных. Архитектура EMC Data Domain Data Invulnerability Architecture, которая интегрирована в DD OS, обеспечивает лучшую в отрасли защиту от проблем, связанных с целостностью данных. Проверка записи и чтения «на лету» защищает от таких нарушений и автоматически исправляет их во время добавления и извлечения данных. Выявление и исправление ошибок ввода-вывода «на лету» в процессе резервного копирования избавляет от необходимости в повторении заданий, гарантирует их своевременное выполнение, а также обеспечивает соблюдение соглашений об уровне обслуживания. Кроме того, в отличие от других массивов или файловых систем корпоративного класса здесь предусмотрена функциональность непрерывного обнаружения ошибок и самовосстановления, которая обеспечивает возможность восстановления данных в течение их жизненного цикла в системе Data Domain DD990.

Комплексная проверка обеспечивает чтение данных после их записи и сравнение с информацией, которая была отправлена на диск. При этом проверяется доступность данных на диске в файловой системе и отсутствие повреждений. В частности, когда операционная система Data Domain DD990 получает запрос на запись от ПО резервного копирования, она вычисляет контрольную сумму данных. После анализа данных на наличие избыточности новые сегменты данных и все контрольные суммы сохраняются. После записи всех данных на диск операционная система Data Domain DD990 проверяет возможность чтения всего файла с диска в файловой системе Data Domain DD990, а также совпадение контрольных сумм считанных и записанных данных. Это подтверждение правильности данных и возможности их восстановления на каждом уровне системы.

ПРОСТАЯ ИНТЕГРАЦИЯ

Система хранения данных EMC Data Domain DD990 с легкостью интегрируются в существующие инфраструктуры и может без дополнительной настройки работать с ведущими приложениями для резервного копирования и архивирования. Интеграция системы Data Domain DD990 в вашу среду не требует никаких изменений в процессе или инфраструктуре, что позволяет быстро и эффективно использовать преимущества дедупликации. Кроме того, системы Data Domain DD990 могут интегрироваться непосредственно в ведущие корпоративные приложения, такие как Oracle RMAN, или записывать данные через файловую систему CIFS или сетевую файловую систему NFS для поддержки различных рабочих нагрузок.

Поскольку системы Data Domain DD990 одновременно поддерживают несколько методов доступа, включая NFS, CIFS, VTL, NDMP и EMC Data Domain BoostTM, все приложения и утилиты могут одновременно поддерживаться в одной и той же системе Data Domain DD990, что обеспечивает более высокую степень консолидации системы хранения для защиты данных. Система может представлять себя как файловый сервер, предлагающий доступ по протоколу NFS или CIFS по сети Ethernet, в качестве виртуальной ленточной библиотеки (VTL), доступной по сети Fibre Channel, ленточного сервера NDMP по сети Ethernet или дисковой системы назначения, использующей собственные интерфейсы приложений, например, EMC Data Domain Boost.

КОНСОЛИДАЦИЯ РЕЗЕРВНОГО КОПИРОВАНИЯ И АРХИВИРОВАНИЯ

Благодаря такой гибкости DD OS система хранения данных EMC Data Domain DD990  стали единственной платформой защиты данных, которая поддерживает одновременную работу с данными резервного копирования и архивирования. Это позволяет снизить совокупную стоимость владения (TCO) систем Data Domain DD990 за счет совместного использования ресурсов для хранения данных резервного копирования и архивных данных. Например, одна система Data Domain DD990 может использоваться для резервного копирования и восстановления в масштабах предприятия (включая среды Oracle, SAP, Microsoft и VMware, среды IBM i и мейнфреймов), а также для защиты архивных данных (включая файлы, электронную почту, управление корпоративным содержанием, базы данных и архивирование виртуальных машин). Системы Data Domain DD990 обеспечивают защиту архивных данных с минимальными затратами за счет интеграции с ведущими приложениями для архивирования, включая EMC SourceOne и Symantec Enterprise Vault. Консолидация системы Data Domain DD990 с обычной платформой защиты данных позволяет отказаться от использования изолированных хранилищ данных и исключить связанные с ними издержки на управление, занимаемое пространство, электроэнергию и охлаждение. Помимо этого, благодаря использованию ПО EMC Data Domain Retention Lock системы Data Domain DD990 могут обеспечить соответствие политикам в области стратегического управления и требованиям регуляторов в отношении архивирования данных, включая стандарт SEC 17a-4(f).

ПОДДЕРЖКА ОБЛАКА

EMC Data Domain DD990  включает безопасную многопользовательскую среду, которая позволяет крупным предприятиям и поставщикам услуг, которые стремятся предлагать услуги на основе  EMC Data Domain DD990  в частном или общем облаке, предоставлять защиту данных как услугу. Безопасная многопользовательская среда системы EMC Data Domain DD990  логически изолирует данные, предоставляя к ним доступ только для отдельных пользователей. Средства управления и мониторинга в многопользовательском режиме позволяют отслеживать тенденции по распределению расходов между подразделениями и создавать отчеты по уровням пользователей. Безопасная многопользовательская среда также предоставляет пользователям возможности самообслуживания, разрешая им доступ только к допустимым ресурсам и удовлетворяя их потребности в мониторинге таких ресурсов.

БЫСТРОЕ, ЭФФЕКТИВНОЕ И МАСШТАБИРУЕМОЕ АВАРИЙНОЕ ВОССТАНОВЛЕНИЕ

Как только данные попадают в систему EMC Data Domain DD990, она может немедленно реплицировать их на площадку аварийного восстановления. Чтобы соответствовать строгим требованиям аварийного восстановления, ПО EMC Data Domain Replicator может обеспечить скорость репликации 52 ТБ/ч через сетевое подключение 10 Гбит/с. EMC Data Domain DD990 реплицирует по сети только сжатые данные, что обеспечивает значительное сокращение требуемого времени, полосы пропускания и издержек по сравнению с традиционными методами репликации. Благодаря дедупликации между площадками по любым сегментам глобальной сети передаются только уникальные данные. Это позволяет снизить требования к полосе пропускания глобальной сети на величину до 99% и обеспечивает быструю, надежную и экономичную репликацию по сети. Чтобы обеспечить самый высокий уровень безопасности, данные, которые реплицируются между системами Data Domain, могут шифроваться с использованием стандартного протокола Secure Socket Layer (SSL). Системы EMC Data Domain DD990 обеспечивают гибкие топологии репликации, включая полное зеркалирование системы, двунаправленную и каскадную репликацию, а также репликацию по схеме «многие к одному» и «один ко многим».

ПРОСТОТА ЭКСПЛУАТАЦИИ

Системы хранения данных  EMC Data Domain DD990 очень просты в установке и управлении, благодаря чему сокращаются административные и операционные издержки. Администраторы могут получить доступ к операционной системе Data Domain при помощи командной строки по протоколу SSH или приложения EMC Data Domain Enterprise Manager — графического интерфейса пользователя на основе браузера. Можно легко выполнить начальную настройку и обновить конфигурацию нескольких систем, одновременно осуществляя мониторинг состояния системы и выполняемых операций. Возможность простого использования скриптов наряду с мониторингом по протоколу SNMP обеспечивает дополнительную гибкость управления.

Кроме того, все системы Data Domain оснащены функцией автоматической обратной связи для передачи отчетов, так называемой автоматической поддержкой, которая отправляет уведомления по электронной почте с полными сведениями о состоянии системы в службу технической поддержки EMC, а также выбранным администраторам. Такая не требующая вмешательства функциональность оповещения и сбора данных обеспечивает упреждающую поддержку и обслуживание без привлечения администратора, что еще больше упрощает ежедневное управление.

Характеристики

  • Максимальная пропускная способность (другие):15,0 ТБ/ч
  • Максимальная пропускная способность (DD Boost):31,0 TБ/ч
  • Логическая емкость:5,7—28,5 ПБ
  • Логическая емкость с DD Extended Retention:До 100 ПБ
  • Максимальная полезная емкость:До 570 ТБ
  • Максимальная полезная емкость с Extended Retention:До 2,0 ПБ
  • Поддерживаются полки ES30:1 ТБ, 2 ТБ, 3 ТБ
  • Тип диска:SATA
  • Встроенные функции для работы в сети:1 порт управления; 4 порта 1 Гбит/с
  • Опциональные возможности работы в сети с картами ввода-вывода:До 16 портов 1 Гбит/с; До 6 портов 10 Гбит/с; До 6 портов FC 8 Гбит/с
  • :49,9 кг
  • Габариты:48,3 x 70, 4 x 17,3 Высота стоек — 4U по стандарту EIA
  • Питание Сеть переменного тока 100—120/200— 240 В, 50/60 Гц:1400 ВА
  • Тепловая мощность (ватт):1400 Вт
  • Тепловая мощность (кДж/ч):7300 кДж/ч
  • Рабочая температура и высота над уровнем моря:+5°C…+35°C, +35°C на высоте 2286 м
  • Нерабочая температура (при транспортировке):-40℃…+65℃
  • Рабочая влажность:20—80% (без образования конденсата)
  • Акустический шум при эксплуатации (акустическая мощность):Уровень акустической мощности: 7,2 бела
  • Акустический шум при эксплуатации (звуковое давление):LpAm: 56,4 дБ
  • Безопасность:UL 60950-1, CSA 60950-1, EN 60950-1, IEC 60950-1, GS, SABS, ГОСТ, IRAM
  • Электромагнитные излучения:FCC класс A, EN 55022, CISPR 22, VCCI, BSMI, MIC, ICES-003
  • Помехоустойчивость:EN 55024, CISPR 24
  • Гармоники в линии электропитания:EN 61000-3-2

Решения с этой моделью

Вычислительные комплексы высокой доступности

Модернизация предприятий в современном мире является необходимой реальностью для эффективного и продуктивного функционирования компаний. Одним из важнейших направлений структурной модернизации организаций является ее развитие на основе кластеризации. Главной отличительной чертой кластера является его инновационная составляющая. Это единый комплекс произвольных устройств (серверы, дисковые накопители, системы хранения и пр.), работающих совместно для выполнения общих задач.

Обычно различают следующие основные виды кластеров:

  1. Кластеры высокой доступности (отказоустойчивые кластеры). Отказоустойчивая компьютерная система, которая гарантирует, в случае отказа, автоматическое возобновление работоспособности на протяжении незначительного промежутка времени (от долей секунды до нескольких минут).
  2. Вычислительные кластеры. Набор серверов, объединенных некоторой коммуникационной сетью. Каждый вычислительный узел имеет свою оперативную память и работает под управлением своей операционной системы.

Кластер высокой доступности.

Кластер высокой доступности состоит из нескольких устройств, которые работают как выделенная система для обеспечения высокой доступности приложений и сервисов для клиентов. Доступность осуществляется за счет перемещения служб или приложений между узлами. Для клиента, кластер выглядит как единое целое, и его неполадки могут выразиться в кратковременном снижении производительности или недоступности какого-либо ресурса на время от нескольких секунд до нескольких минут в зависимости от конфигурации. Кластеризации сервера осуществляется на основе кворум диска — к одному кворум диску подключаются два и более сервера. Типовая конфигурация серверного кластера высокой доступности, включает два сервера (основной и резервной) и общую внешнюю систему хранения данных:

В обычном режиме приложение работает на основном сервере, а в случае выхода из строя этого сервера перезапускается на дополнительном. Надежность системы хранения достигается за счет дублирования всех компонентов с возможностью горячей замены.

Но, тем не менее, при таком подключении система хранения используется одна и является «точкой отказа». Системы хранения также объединяют в отказоустойчивый кластер, используя специальные аппаратные решения для виртуализации, например IBM SVC или ЕМС VPLEX:

Решения по виртуализации систем хранения позволяют объединить логические диски (LUN) двух и более СХД в один виртуальный, который и презентуется физическому или виртуальному серверу. Объединяя кластерные технологии, можно строить решения с высокой степенью доступности и полным дублированием всех узлов и компонентов:

Основные характеристики данного решения являются высокая надежность, производительность, простота масштабирования, а также легкость в управлении. Увеличив количество узлов и разнеся их по разным дата-центрам, можно построить катастрофоустойчивое решение:

Кластеры высокой доступности разворачиваются в том случае, когда доступ к службам и приложениям со стороны клиентов должен быть непрерывен, а также когда не допускается простой из-за отказа компонентов информационных систем. В большинстве случаев, они применяются для таких сервисов, как базы данных, серверы почты, ERP и CRM приложения, серверы web-приложений, и других.

Пример на базе реализованного решения (DataGroup)

Постановка задачи

Необходимо создать отказоустойчивое решение для IT инфраструктуры управляющей компании. Все сервисы должны быть доступны в режиме 24/7. Решение должно масштабироваться при росте компании.

Реализация

Решение было реализовано на базе системы виртуализации VMware. В качестве вычислительных нод кластера были использованы два сервера Lenovo. Для хранения виртуальных машин была использована система хранения данных EMC VNXe. Сетевая коммутация была построена с использованием коммутаторов Cisco. Также для целей резервного копирования была использован NAS LenovoEMC.

Физические сервера Lenovo1 и Lenovo2 объединены в отказоустойчивый кластер (HA Cluster) средствами VMWare vSphere. Гипервизор ESXi установлен на локальных дисках серверов. В качестве хранилища для виртуальных машин используется СХД VNXe. Datastore построен на дисках в составе массива RAID5. СХД подключена к серверам используя протокол iSCSI.

Физически подключение выглядит следующим образом:

  • На каждом из SP СХД (SPA и SPB) организована группа Port Channel LACP из двух портов
  • Каждый порт подключен к соответствующему коммутатору SW-Core согласно схеме
  • На каждом из серверов выделены два порта, которые подключены к обоим коммутаторам

В итоге каждый сервер имеет два логических подключения к СХД (по одному на каждый процессор) и четыре физических. Данная схема обладает отказоустойчивостью при неисправности любого физического линка, коммутатора, процессора СХД и порта сетевой карты.

Для управления гипервизором, обмена служебными сообщениями между серверами, а также связи с виртуальными машинами используются два сетевых порта на каждом из серверов. При этом каждый сервер имеет подключение к обоим коммутаторам. Что также обеспечивает отказоустойчивость при неисправности любого физического линка, коммутатора и порта сетевой карты.

Для целей резервного копирования используется NAS LenovoEMC, диски которого объединены в RAID5. На базе образованного пространства создан NFS экспорт и презентован серверам. Оба  сетевых интерфейса NAS объединены в группу Port Channel LACP, при этом обеспечивается одновременная связь с двумя коммутаторами для целей отказоустойчивости.

На СХД VNXe на базе дисков NL-SAS создан массив RAID6, на котором организован сетевой доступ через протокол CIFS. Доступ к сетевым папкам осуществляется через те же физические интерфейсы, что и iSCSI, но в рамках другого VLAN.

Реализованное решение помимо отказоустойчивости также соответствует требованиям по масштабируемости. В случае необходимости можно легко добавить физические сервера в HA кластер и диски в СХД.

Сервисная поддержка на все установленное оборудование включает в себя гарантию производителя на 3 года с обслуживанием в рабочие часы на месте установки. В случае необходимости могут быть приобретены дополнительные гарантийные опции с разным сроком поддержки (до 5-ти лет), режимом обслуживания (24×7 или 9×5) и временем реакции (4 или 8 часов).

Виртуализация серверов

Три способа построения частного облака

  1. Первый, традиционный способ серверной виртуализации заключается в самостоятельном построении виртуализированных инфраструктур из различных аппаратно-программных компонентов. Это решение, которое позволяет заказчикам самим выбрать компоненты для построения своей инфраструктуры. DataGroup в своей практике для этого использует компоненты ведущих мировых производителей, таких как Qsan, Gigabyte, HP, Lenovo,EMC, Cisco.
  2. Второй способ заключается в приобретении полностью интегрированной (встроенной) платформы для построения эффективной динамичной системы для ЦОД, которая позволит объединить мощности серверов и технологии хранения данных. Этот способ реализуется решением Vblock от компании VCE. Vblock представляет собой оборудование, уже собранное в стойки и укомплектованное необходимыми кабельными соединениями и элементами питания. Проще говоря, поставляется уже готовым к развертыванию и использованию. Платформа предварительно настроена и оптимизирована под решение конкретных задач. Кроме того, системы проходят предварительное тестирование на работу различных приложений. И все же, этот способ имеет такие недостатки, как высокая стоимость платформы Vblock (от 500 000 USD) и ограниченный выбор компонентов и технологий: Cisco, EMC и VMware.
  3. Третий способ — это приобретение проверенного решения корпорации ЕМС и компании Data Group – VSPEX, которое обладает всеми преимуществами выше изложенных способов.

Пример на базе реализованного решения

Постановка задачи

Для модернизации IT инфраструктуры энергосбытовой компании требовалось построение виртуального датацентра с использованием продуктов VMware. Для этого требовались сервера и система хранения данных, которые полностью совместимы с программными решениями от VMware.

Реализация

В качестве решения была предложена платформа VSPEX от EMC и Datagroup, состоящая из полностью совместимых между собой компонентов. Причем, совместимость гарантируется самим вендором.

Помимо СХД EMC VNX в решении были применены блейд системы и модули интерконнекта Cisco UCS.

Решение обладает полной отказоустойчивостью за счет исключения единой точки отказа. Все компоненты задублированы. Более того, контроллеры и модули ввода/вывода работают параллельно для увеличения общей производительности.

В решении используется подход полной виртуализации. Помимо традиционной виртуализации приложений на базе VMware vSphere применена виртуализация аппаратной составляющей самих лезвий (серверов) и системы коммутации при помощи архитектуры Cisco Unified Computing System. В результате системный администратор может с легкостью перемещать не только виртуальные машины между нодами, но и перемещать гипервизоры между лезвиями. В случае расширения системы будет достаточно добавить новые лезвия и сопоставить их с профилями использования. Все остальное система сделает автоматически!

Резервное копирование с дедупликацией данных

По мере того как требования к ресурсам хранения данных возрастают, а бюджеты урезаются, предприятия изыскивают дополнительные возможности для оптимизации своей инфраструктуры хранения и администрирования данных. Важную роль в этом деле играют такие технологии, как дедупликация и сжатие данных, которая позволяет сократить их объем за счет удаления повторных копий и сохранения только уникальной информации.

Сжатие данных — это один из способов сокращения размера файлов. Сжатие данных осуществляется на уровне отдельных файлов и заключается в поиске и удалении не несущих информации и повторяющихся фрагментов. Эта форма дедупликации осуществляется на уровне отдельных файлов и не учитывает наличие повторяющихся сегментов в разных файлах. Технологии сжатия данных появились много лет назад, но поскольку они работают в пределах одного файла, их достоинства во многом теряются в сравнении с другими формами дедупликации. Например, с помощью сжатия данных нельзя найти и удалить повторяющиеся файлы. Вместо этого каждый файл будет сжат по отдельности.  Надо отметить, что технология сжатия данных менее эффективна, так как не способна распознавать одинаковую информацию. Дедупликация заменяет копии многократно встречающихся данных ссылками (они же — указатели, или Pointer) на первичный источник и используется в масштабе всей файловой системы или ресурсов хранения. Резервное копирование данных — это одна из основных областей применения дедупликации.

Эффективные системы дедупликации данных помогают предприятиям справиться с резервным копированием информации в своих хранилищах. Дедупликация позволяет избавиться от лишних экземпляров информации и, как следствие, сократить общий объем хранимой информации и упростить обеспечение возможности ее восстановления после сбоя. Также, позволяет предприятиям значительно сократить объем данных в хранилищах и операционные затраты на инфраструктуру резервного копирования и восстановления.

Капиталовложения в дедупликацию данных несут в себе существенные преимущества для бизнеса. В частности, дедупликация данных дает следующие преимущества:

  • Сокращение затрат на инфраструктуру. Исключение повторяющихся данных из резервных копий позволяет сократить размер резервных копий. В результате дедупликации на хранение резервных копий требуется меньше места в хранилище. Уменьшение емкости хранилища позволяет сократить его стоимость и расходы на электропитание и охлаждение.
  • Увеличение периодов хранения. Поскольку дедупликация данных приводит к сокращению размера ежедневных резервных копий, появляется возможность увеличить период их хранения. Это обстоятельство очень важно для пользователей, заинтересованных в продлении срока хранения резервных копий, но не имеющих такой возможности в текущих условиях.
  • Повышение надежности защиты данных. Дедупликация данных позволяет многим предприятиям перейти на ежедневное полное резервное копирование. Многие предприятия вынуждены осуществлять ежедневное инкрементное и еженедельное полное резервное копирование из-за ограничений на длительность окон резервного копирования. Поскольку дедупликация приводит к уменьшению размера резервных копий, появляется возможность реализовать более агрессивные политики резервного копирования, позволяющие ускорить восстановление данных в случае сбоя.
  • Сокращение объемов и повышение производительности. Сокращение общего размера образов с резервными копиями упрощает переход с ленточных на дисковые хранилища с финансовой точки зрения. Переход на дисковые хранилища позволяет ускорить резервное копирование и повысить его надежность, а также способствует дальнейшему сокращению окон резервного копирования и ускорению восстановления.
  • Значительное снижение нагрузки на сеть. Поскольку дедупликация сокращает размер резервных копий, она удешевляет их репликацию в удаленных хранилищах, а значит, делает удаленную репликацию более доступной. Кроме того, дедупликация на стороне клиента (то есть, в источнике данных для резервного копирования) позволяет избавиться от избыточной информации до любых манипуляций с резервными копиями. Это значит, что при резервном копировании можно сохранять только те фрагменты файлов, которых еще нет в базе данных. В средах с дедупликацией резервное копирование создает лишь малую толику нагрузки на сеть по сравнению с традиционными средами.
  • Повышение уровня безопасности и упрощение управления. Хранение резервных копий на дисках позволяет повысить уровень информационной безопасности за счет устранения рисков, задержек и затрат на физические манипуляции с магнитными лентами и их хранение. Вместо того чтобы физически перемещать магнитные ленты между центрами обработки данных, появляется возможность пересылать данные по сети.

Важно помнить о том, что не существует универсального решения для дедупликации. Существует множество способов организации и осуществления дедупликации. Они по-разному влияют на производительность и эффективность, и поэтому выбор стратегии дедупликации должен осуществляться с учетом множества факторов.

На сегодняшний день на рынки систем резервного копирования представлены более двух десятков программных и аппаратных решений от различных производителей. Но лишь часть из них представляет действительный интерес для применения в масштабах корпоративных систем.

Программные решения для резервного копирования данных с дедупликацией данных.

Корпорация ЕМС предлагает два программных решения для резервного копирования данных с дедупликацией данных:  Avamar и NetWorker.

Система резервного копирования Avamar использует дедупликацию на клиенте таким образом, что данные резервного копирования уменьшаются до прохода по перегруженной локальной сети (LAN). Avamar идентифицирует дубликаты сегментов данных, после чего приложение резервного копирования отправляет только новые уникальные сегменты по сети на устройство хранения данных. Таким образом обеспечивается сокращение окон резервного копирования, уменьшение потребляемого пространства для хранения данных и максимально эффективное использование доступной полосы пропускания.  ЕМС Avamar предназначен для защиты виртуальных сред VMware и Microsoft, удаленных офисов, а также настольных и портативных компьютеров. Для более сложных задач рекомендуется использовать ПО ЕМС NetWorker.

EMC NetWorker – это унифицированное  решение для резервного копирования и восстановления за счет объединения различных возможностей защиты данных — от резервного копирования, репликации и до ленточного накопителя — все компоненты работают в общем интерфейсе управления для снижения затрат и сложности. Обладает простой интеграцией с Avamar и Data Domain для полной оптимизации преимуществ дедупликации в среде. Обеспечивает  полную защиту среды — от критически важных для бизнеса приложений, например Microsoft, Oracle, SAP и т.д., и до небольших бизнес-сред, в том числе виртуальных топологий VMware и Microsoft HyperV.

Корпорация Symantec предлагает решения Backup Exec и NetBackup.

Symantec Backup Exec предназначен для защиты виртуальных и физических сред компаний малого и среднего бизнеса. Благодаря использованию новейших технологий, Backup Exec позволяет сохранять резервные копии локальных или удаленных данных практически на любом устройстве, в том числе на магнитных лентах, дисках или в облаке. Последняя версия  Backup Exec 2014, поддерживает  Windows Server 2012 и 2012 R2, выборочное восстановление для Exchange 2013, SharePoint 2013 и SQL 2014.

Symantec NetBackup 7 обеспечивает высокий уровень производительности, автоматизации, управляемости и масштабируемости для защиты виртуальных и физических сред корпоративных заказчиков, которые уже сегодня содержат тысячи виртуальных машин и петабайты данных и ориентированы на ЦОД на основе ПО и «ИТ как услугу» в будущем.

Аппаратные решения для резервного копирования данных с дедупликацией данных.

С точки зрения момента дедупликации,  различают два вида систем: Системы с дедупликацией на «лету»  и системы с пост-дедупликацией, также известной как асинхронная дедупликация. Дедупликация на «лету»  осуществляется во время поступления новых данных в дисковую систему, и система дедупликации сначала распознает и удаляет повторяющиеся фрагменты, и только после этого записывает данные на диски. Системы с пост-дедупликацией сначала сохраняют данные на диски, а затем осуществляют дедупликацию. Основное достоинство систем с пост-дедупликацией заключается в отсутствии дополнительных задержек на пути передачи данных, что позволяет передавать информацию с максимальной скоростью. Дедупликация «на лету» является наиболее эффективным и экономически выгодным методом дедупликации. Она в значительной мере уменьшает требования к объему дисковой системы резервного копирования. Например, дисковая система резервного копирования для виртуальной среды общей емкости 10ТБ, с технологией пост-дедупликацией нам потребуется минимум  на 12ТБ т.к. она сначала записывает весь объем на диски, а потом производит дедупликацию данных. А системы с  дедупликацией на «лету» достаточно будет 3ТБ (меньшей емкостью системы не производятся), т.к. дедупликация производится до того как данные попадут на диски, а емкость дедуплицированных данных на обоих системах будет идентичная. Дедупликация «на лету» также снижает время подготовки к аварийному восстановлению (DR), так как отсутствует период ожидания, пока система примет полную совокупность данных и затем выполнит ее дедупликацию, чтобы начать перемещение на удаленную площадку. Дисковые системы резервного копирования (D2D) с дедупликаций «на лету» производят компании ЕМС, Symantec, HP, Dell, IBM и другие. СХД ЕМС Data Domain обеспечивают тесную интеграцию с существующими инфраструктурами, включая средства резервного копирования, архивирования и корпоративные приложения. Система Data Domain может защитить данные всего предприятия, включая резервные копии для сред Oracle, Microsoft, VMware, открытых систем и мейнфреймов, а также архивирование файлов, электронной почты, баз данных, управления корпоративным содержанием и виртуальных машин. Поддерживаю протоколы VTL, CIFS, NFS, NDMP, DD Boost, технологии репликации (EMC Data Domain Replicator), шифрования (EMC Data Domain Encryption). Программное обеспечение EMC Data Domain Boost обеспечивает более тесную интеграцию с приложениями резервного копирования Symantec  NetBackup и Backup SAP ExeSAP

BR*Tools и HANA Studio, Oracle RMAN и другими.

При использовании Data Domain Boost процесс дедупликации частично распределяется на сервер резервного копирования или клиенты приложений, что позволяет отправлять в систему Data Domain только уникальные сегменты данных

В семействе СХД ЕМС Data Domain  есть решения для любых заказчиков: от небольших устройств для удаленных филиалов до высокомасштабируемых систем для резервного копирования и архивирования в больших корпоративных центрах обработки данных.

Дедупликация данных позволяет существенно  сократить  требования к дисковой системе резервных копий и архива (10—50 раз), и может использоваться  как  экономичная альтернатива ленточной системе резервного копирования.

Система хранения ЕМС DD620 с ПО резервного копирования Symantec Backup Exec и агентами ЕМС DD Boost, используется  одним  из наших заказчиков  для резервного копирования IT инфраструктуры компании. Благодаря использовании дедупликации удалось сократить объем резервных копий в 38 раз:

 

 

Подробнее на сайте EMC