СХД: основа для работы с «новой нефтью»
Тезис «данные – это новая нефть» точен, но с данными, как показывает практика, индустрия работает явно хуже, чем с нефтью и ее производными. Познакомимся поближе с этой проблемой и сделаем практические выводы, актуальные для большинства компаний.
Содержание |
Современный мир получил цифровизацию большинства областей, что привело к возможности получения огромного количества данных, например, о работе машин и механизмов, погодных условиях, о трафике на улицах городов, состоянии различных рынков, динамике валютных курсов, о заболеваниях и вариантах лечения. Ценность данных состоит в том, что их анализ может дать бизнес-значимую информацию, которая актуальна для оперативного управления и для принятия решений разного уровня: от тактических до стратегических.
Данные для ретроспективы, ИИ, соответствия закону
Данные имеют высокую ценность как «в моменте», так и в плане доступности для ретроспективного анализа. А сочетание этих двух направлений обеспечивают высочайшую синергию, позволяя получать из данных информацию быстро и точно. Например, обучаем искусственный интеллект на примере накопленных данных, а обученная нейросеть, которая получается в итоге проведенной работы, решает текущие задачи легко и быстро. Другой пример: проводим ретроспективный анализ и экстраполируя его результаты получаем прогноз на будущее, которым можно руководствоваться в выстраивании стратегий.
Данные для обучения ИИ, для ретроспективного анализа и прочих операций «дэйта майнинга» должны быть предварительно получены и где-то сохранены. Именно с этим, как показывает практика, при современном состоянии индустрии, есть очень серьезные проблемы.
Заметим, что иногда необходимость в хранении данных определяет требование не бизнеса, а закона. В ряде случаев компании обязуют хранить данные за определенный период и предъявлять по требованию госструктур.
Емкость накопителей vs количество производимых данных
Человечество производит и постоянно увеличивает количество информации, однако, при любых оценках, доля сохраняемых данных оказывается незначительной. Эксперты расходятся во мнениях, оценивая количество данных, которые оказываются сохраненными на накопителях из расширяющегося потока, формируемого «интернетом вещей», системами видеонаблюдения, данными геологоразведки, наблюдениями за климатом. Но никто из них не озвучивает значений, превышающих 10%, которые сохраняли бы для дальнейшего использования.
Получается, что 90% и более «новой нефти» можно использовать только «в моменте», а потом эти данные оказываются безвозвратно утеряны. Не очень высокая эффективность для «экономики данных»!
От теории – к практике
Сказанное выше справедливо и для отдельных компаний, и для индустрий, и для цивилизации в целом. Абстрагируясь от глобальной ситуации, поговорим о том, что можно сделать на практике в одной, отдельно взятой компании.
Бутфорс проблему не решит. Покупка все большего количества емкостей на on premise накопителях, для локальных СХД или в облаках, в стремлении угнаться за растущим объемом данных – действие необходимое, но недостаточное. Придется прибегать к интеллектуальным подходам для организации хранения данных.Метавселенная ВДНХ
Интеллектуальный подход многогранен и во многом зависит от типов данных и от особенностей бизнеса конкретной компании. В одном случае дупликация будет вредна и от нее придется отказаться, в другом, наоборот – резервное копирование станет необходимостью.
Для интеллектуального подхода данные компании придется, как минимум, структурировать, что потребует разделения на категории: от «горячих» до «ледяных». Такое разделение условно и весьма индивидуально для каждой компании. «Температура» данных зависит от частоты и интенсивности обращений к ним. Список клиентов, информация про активные счета и история взаимодействия с контрагентами за пару-тройку предыдущих лет, например, должны быть доступны оперативно, их лучше хранить на быстрых накопителях. Более «холодные» данные можно разместить на медленных системах хранения, а «ледяные» иногда размещают даже на ленточных накопителях.
В реальных условиях значительную часть данных компаниям лучше хранить on premise. Идеальная модель хранения в «облаке» далеко не всегда оказывается оптимальной, а зачастую случаются проблемы, например, когда система используется для размещения персональных данных. Поэтому необходимо понимать особенности современных накопителей.
Дорогу современным системам!
Для хранения данных следует применять современные решения. Объективных причин для этого несколько. Новейшие накопители получают ряд технологий, способных снизить стоимость владения, в том числе, за счет оптимизированных режимов работы, улучшенной управляемости и оперативной диагностики. Это обеспечивает стабильную работу и снижает риски потери данных.
Пример современного решения – представленная в середине лета компанией Seagate Technology система Exos Corvault, предназначенная для хранения больших объемов данных с заявленной доступностью 99,999%. Новинка представляет собой шасси высотой 4U для установки в стойку, вмещает 106 жестких дисков Seagate Exos с интерфейсом SAS. В Corvault применены фирменные контроллеры Seagate VelosCT шестого поколения.
К особенностям Exos Corvault, использующей фирменные контроллеры Seagate VelosCT шестого поколения, следует отнести высокую плотность хранения, производительность и защищенность. Это обеспечивает ряд фирменных решений, как аппаратных, так и программных.
Система Seagate защищена от вибрационных и акустических помех, а также от перегрева. Для энергопитания устройства предусмотрены две линии, которые резервируют друг друга. Corvault сохранит работоспособность при обесточивании любой из линий, перейдя на питание только от другой.
Актуальной «фишкой», реализованной Seagate в данной новинке, является Advanced Distributed Autonomic Protection Technology (ADAPT), которая обеспечивает высокую скорость работы, за счет распределения хранимой информации по разным накопителям. В результате производительность Corvault находится на уровне решений SAN, которые дороже в приобретении и сложнее в обслуживании.
Если в процессе работы произошел сбой, то другая фирменная технология – Autonomous Drive Regeneration (ADR) способна быстро решить проблему и восстановить работоспособность решения и данные. Конечно, автоматику не стоит считать всемогущей, но в большинстве случаев она срабатывает, устраняя необходимость ручного вмешательства персонала. ADR является для Corvault одной из ключевых особенностей, которая при этом оказывается конкурентным преимуществом. Вряд ли в ближайшее время кто-нибудь из других производителей сможет создать нечто подобное ADR, ведь Seagate смог реализовать технологию потому, что является вертикально интегрированный вендором, то есть сам производит и жесткие диски, и системы хранения.
Итоги
К выбору систем хранения, которые размещены на стороне заказчика, нужно подходить очень аккуратно, находя современные решения, простые в установке и в использовании, а также обладающие малой удельной стоимостью хранимого терабайта. Важно, что новейшие решения зачастую оказываются универсальными, то есть актуальными для хранения «горячих данных» и для размещения более «прохладных», например, резервных копий.
Новые решения, например, рассмотренный Corvault, по цене за терабайт при основных характеристиках корпоративного уровня, оказывается, как и у обычных винчестеров для ПК, что делает приобретение продукции Seagate очень выгодным. Аналоги, присутствующие на рынке, могут предложить такое же сочетание плотности, производительности и надежности лишь за существенно большую удельную цену. Фирменные технологии Seagate, в частности, ADAPT и ADR обеспечивают увеличение скорости работы и повышение надежности в условиях реальной эксплуатации.
Подобрать решение