Cистемы хранения данных: понятие, значение и рекомендации по выбору

Бизнес – это движение денег, товара, наем/увольнение персонала. И большой объем документов, оформляемых бухгалтерией, отделом кадров, складом, менеджерами по продажам и т.д. Изрядная часть из них подпадает под федеральный закон №125-ФЗ, обязывающем хранить бумаги исходя из их категории от 1 года до 75 лет. Поэтому при массовом переходе на электронный документооборот становятся актуальными цифровые системы хранения данных (СХД).

Системы хранения данных

Выбор у бизнеса небольшой – или содержать целый архивный отдел, или выбрать систему хранения больших данных, подходящую его специфике. В первом случае неизбежны затраты на аренду помещения, оснащение его стеллажами и прочей мебелью, на наем персонала, который будет заниматься только архивацией, т.е. проверкой, систематизацией, подшивкой документов. Во втором же случае можно настроить автоматическое сохранение из баз данных, например, при закрытии периода.

Что такое системы хранения данных

Теперь подробнее о техническом оснащении систем хранения данных. Они представляют собой физический или виртуальный сервер, настроенный на выполнение ограниченного перечня задач. В начале 2000-х резервные копии бухгалтерских баз делали на компакт-дисках, потом постепенно перешли на внешние жесткие диски. Но такие решения имели низкую надежность, слабые возможности масштабирования, небольшой набор функций.

Возможности современных СХД:

  1. Оперативный доступ и хранение информации. При внедрении создается огромный хаб, куда сотрудники предприятия «сливают» рабочую документацию. Доступ к ней есть у всех, кто имеет соответствующие полномочия, утечка файлов третьим лицам исключена.
  2. Расширение и масштабирование. Система позволяет в любой момент увеличить объем накопителей, доступный пользователям. Причем практически без остановки на техническое обслуживание. То же относится к процессорным мощностям, объему оперативной памяти.
  3. Функции безопасности. Сервер СХД допускает к записи и чтению только авторизованных пользователей, с возможностью настройки прав исходя из должности и прочих критериев. Защита работает и относительно возможных хакерских, вирусных атак.
  4. Репликация. Речь идет об автоматическом создании резервных копий абсолютно всех или только указанных данных. При системной ошибке «центрального» СХД программа сможет исправить повреждения за счет бэкапа.

Еще возможно выполнение дедупликации или контроля дублей, сжатие данных, кластеризация на «холодный» и «горячий» доступ, интеллектуальное управление трафиком. Точный набор функций зависит от того, какие бизнес-процессы нужно оптимизировать. Задача внедрения упрощается за счет того, что СХД представляет собой аппаратно-программный комплекс – какой софт поставишь, такой функционал фактически и получишь.

Схема доступа к СХД мало отличается от серверов других типов. Внутри системы стоят накопители (жесткие диски или скоростные SSD). Запрос пользователя сначала поступает на сетевой адаптер, затем подается на исполнение контроллеру СХД, который через дисковый контроллер записывает или считывает данные. Программное обеспечение, установленное на сервер, контролирует процесс «от и до», исходя из заданных при настройке параметров.

Виды СХД. Обзор различных типов

Существует несколько классификаций СХД, что несколько путает представителей бизнеса, когда поднимается вопрос выбора системы хранения данных. Например, их делят на файловые, блочные и объектные. Первые предполагают резервирование информации в том виде, как она располагается на компьютере пользователя. На сервере создаются каталоги, в них подкаталоги и т.д., куда «летят» файлы из одноименных каталогов «источника».

Блочные разбивают поступающие файлы на блоки или чанки. Такой подход ускоряет сохранение изменений, упрощает управление производительностью. Система никогда не зависнет на огромном видеофайле, т.к. весь входящий трафик дробится на чанки одного размера. Сборка осуществляется уже на компьютере пользователя. Объектные работают по схожему принципу: к каждому объекту добавляются идентификаторы и метаданные, ускоряющие поиск.

NAS

Еще популярна классификация по виду сетевого доступа – NAS, DAS, SAN. Первый представляет собой типовой сетевое хранилище (Network Attached Storage) с обработкой поступающих данных на уровне файлов. Сервер обычно оснащен RAID-массивом, программной/аппаратной поддержкой целого ряда протоколов – FTP, SFTP, HTTP, NFS, SMB, DC. Его можно развернуть как на базе своей серверной, так и на мощностях какого-либо ЦОД, в том числе в режиме коллокации.

Преимущества NAS:

  1. Простота подключения и управления.
  2. Высокая гибкость в плане наращивания объема.
  3. Относительно низкая цена внедрения и владения.

Сервера NAS универсальны, к ним можно подключаться с устройств на любой платформе. Такие системы популярны даже для домашних сетей, например, для хранения коллекции музыки, видео, фотографий. Но практическое значение СХД имеет все-таки для бизнеса. И чаще в облачном виде, когда файлы хранятся на удаленном сервере, а доступ к файловому хранилищу организуется через интернет. Реализация по большому счету зависит от программного обеспечения.

Из недостатков NAS отмечают медленный доступ к информации по сравнению с локальной сетью. Встречается софт, несовместимый с технологией. В таком случае придется купить другой сервер или переходить на подходящее программное обеспечение. Зато сетевые хранилища NAS продаются в виде компактных аппаратно-программных комплексов, оснащенных всем необходимым «под ключ». Нужно лишь выбрать место для установки и подключить оборудование к локальной сети.

DAS

Второй вариант, DAS или Direct Attach Storage предполагает прямое подключение к рабочему ПК. В упрощенном виде любой внешний жесткий диск или флешку, подключаемые через интерфейс USB, можно назвать такой системой хранения данных. Корпоративные системы конструктивно чуть сложнее. Например, внутри них установлен RAID-контроллер, объединяющий несколько дисков в единое пространство, обеспечивающий зеркалирование информации внутри самого СХД.

Накопители могут быть и внешними, и внутренними. Благо существует достаточно универсальных скоростных протоколов передачи данных, например, SCSI/iSCSI, Fibre Channel (FC), SATA/eSATA. Они отличаются пропускной способностью, нюансами вроде наличия ограничений по длине кабеля и т.д. Основное отличие от NAS – отсутствие сетевого интерфейса, обычно играющего роль «узкого места» при передаче информации.

Преимущества DAS:

  1. Низкая цена оборудования.
  2. Простота внедрения и администрирования.
  3. Высокая скорость передачи данных.

Системы DAS хорошо подходят для хранения потокового видео, например, поступающего с камер видеонаблюдения. Ограничивает популярность технологии ряд недостатков. Так, СХД требует для развертывания отдельный сервер, допускает одновременное подключение всего 2 серверов к одной дисковой полке. При выходе из строя аппаратной части оборудования хранилище недоступно для чтения/записи. Есть нюансы разграничения прав доступа, применения антивирусов.

SAN

Есть еще один перспективный вариант – SAN (Storage Area Network). Технически он представляет собой сеть хранения данных, часто включающую несколько блочных устройств, подключенных в единую систему по протоколу FC или iSCSI. Особенность этой технологии заключается в прямом доступе к устройству хранения: логическому, физическому диску или RAID-массиву. Несмотря на относительно высокую цену решения крупные предприятия склоняются к внедрению SAN-сети.

Преимущества:

  1. Высокая скорость работы, низкая задержка.
  2. Простая масштабируемость и гибкость настройки.
  3. Высокая надежность хранения информации.
  4. Разгрузка подсети от служебного трафика.

Система работает с блоками, это объясняет перечисленные плюсы. Да, комплекс довольно сложно проектировать и разворачивать, но при участии квалифицированного IT-персонала задача выглядит как рядовая. Бизнес может несколько смутить относительно высокая стоимость решения, которое окупается функционалом. Например, здесь используется топология, обеспечивающая взаимосвязь по схеме «каждый с каждым», с возможностью обрабатывать несколько соединений одновременно.

Как выбрать систему хранения данных

Теперь подробнее о выборе СХД. Начинать можно с вендора и технических характеристик. Такие критерии действительно важны. Только рациональнее сначала ответить вопрос, зачем эта система нужна. От того, какую информацию планируется хранить, в каком объеме, насколько часто будут поступать запросы на запись/чтение и зависит выбор оборудования. Технические характеристики должны выполнять бизнес-задачи (задачу лучше решать со специалистом).

Есть еще популярные вопросы:

  1. Как будет подключено оборудование?
  2. Понадобится ли расширение и насколько быстро?
  3. Где физически будет стоять сервер СХД?
  4. Кто будет пользоваться, обслуживать технику?
  5. Кто заказчик?

Последнее может накладывать определенные ограничения. Например, госзаказчик может быть «под санкциями» у конкретного вендора. Тогда его продуктовая линейка окажется недоступной. Иногда от оборудования ожидают «особые» свойства вроде противоударных свойств корпуса. Или же нужно сохранять архивы на «отчуждаемых носителях», которые можно хранить на специальном складе без доступа к информации через интернет.

При оценке целесообразности покупки конкретной модели сервера СХД стоит учитывать и цену оборудования/внедрения, и стоимость услуг по настройке/сопровождению. Важно, чтобы бизнес-задачи были решены полностью и без «переплаты».

Перспективы развития систем хранения данных

По оценкам IDC к 2025 году общий объем хранимых данных вырастет до 175 зеттабайт. Вывод из подобных исследований один – потребность в решениях с высокой пропускной способностью или с большой емкостью будет расти. В бизнесе этот процесс отчасти стимулируют надзорные органы. Так, ИФНС РФ в 2020 году представила концепцию развития ЭДО, запланированную на внедрение к 2024 году. Предприятия фактически вынуждены переходить на новые стандарты.

Тенденции развития:

  1. Наблюдается массовый переход на объектные хранилища.
  2. Сервера начинают «по умолчанию» комплектоваться SSD-накопителями.
  3. Появляются и развиваются удобные интерфейсы управления данными.
  4. Программное обеспечение оснащается системами искусственного интеллекта.
  5. Повышается скорость подключения и передачи информации.

Постепенно технологии СХД перетекают из крупных отраслей в средний бизнес. Цифровые данные становятся все более важным ресурсом, поэтому российские провайдеры дата-центров (ЦОД) наращивают свои мощности (минимум на 4-5 тыс. стойко-мест в год). Речь идет только об облачных ресурсах, доступных без крупных вложений даже небольшому стартапу. Параллельно развивается и выпуск автономных комплексов, подходящих для эксплуатации «внутри предприятия».

Есть возможность использовать одновременно локальные ресурсы и ряд публичных «облаков». Это делает систему хранения данных более гибкой, упрощает миграцию с устаревшего оборудования на более скоростное, надежное.

Заключение

Рынок СХД стабильно растет. Его «подогревает» повышающийся спрос со стороны крупного и уже среднего бизнеса. «Старые» технологии применяются фактически наравне с современными. Такой подход упрощает выбор системы «под бюджет», с перспективой развития.