SAP HANA - SAP HANA

SAP HANA
Логотип SAP SE
Разработчики) SAP SE
Первый выпуск 2010 г. ( 2010 )
Стабильный выпуск 2.0 SPS05 (26 июня 2020 г . ; 12 месяцев назад ) [±] ( 2020-06-26 )
Написано в C , C ++
Операционная система Linux
Доступно в английский
Тип Многомодельная база данных
Лицензия Проприетарное коммерческое программное обеспечение
Веб-сайт www .sap .com / products / hana .html

SAP HANA (высокопроизводительное аналитическое устройство) - это система управления реляционными базами данных в оперативной памяти , ориентированная на столбцы , разработанная и проданная SAP SE . Его основная функция в качестве программного обеспечения, запускающего сервер базы данных, заключается в хранении и извлечении данных по запросу приложений. Кроме того, он выполняет расширенную аналитику ( прогнозная аналитика , обработка пространственных данных , текстовая аналитика, текстовый поиск, потоковая аналитика , обработка графических данных ) и включает возможности извлечения, преобразования, загрузки (ETL), а также сервер приложений .

История

На начальном этапе разработки SAP HANA ряд технологий был разработан или приобретен SAP SE . Они включали поиск TREX двигателя ( в памяти колонки-ориентированной поисковой системы ), P * TIME (в памяти оперативной обработки транзакций (OLTP) Платформа приобретена SAP в 2005 году), и MaxDB с LiveCache двигателя в памяти.

Первая крупная демонстрация платформы состоялась в 2008 году: команды из SAP SE , Института Хассо Платтнера и Стэнфордского университета продемонстрировали архитектуру приложения для анализа и агрегации в реальном времени под названием HYRISE. Бывший руководитель SAP SE Вишал Сикка назвал эту архитектуру «новой архитектурой Hasso». До того, как название «HANA» стабилизировалось, люди называли этот продукт «Новой базой данных». Программное обеспечение ранее называлось «SAP High-Performance Analytic Appliance».

Первая исследовательская работа по HYRISE была опубликована в ноябре 2010 года. В 2013 году исследовательская система была выпущена с открытым исходным кодом, а в 2016 году была переработана и в 2017 году преобразована в HYRISE2.

Первый продукт был выпущен в конце ноября 2010 года. К середине 2011 года технология вызвала интерес, но более опытные бизнес-клиенты считали, что она «зародилась». В сентябре 2011 года было объявлено о поддержке HANA для SAP NetWeaver Business Warehouse, которая станет доступной к ноябрю.

В 2012 году SAP продвигала аспекты облачных вычислений . В октябре 2012 года SAP анонсировала платформу как предложение услуг под названием SAP HANA Cloud Platform и вариант под названием SAP HANA One, который использует меньший объем памяти.

В мае 2013 года было объявлено о предложении управляемого частного облака под названием HANA Enterprise Cloud service.

В мае 2013 года стал доступен Business Suite на HANA, позволяющий клиентам запускать функции SAP Enterprise Resource Planning на платформе HANA.

S / 4HANA , выпущенная в 2015 году, написанная специально для платформы HANA, объединяет функциональность для ERP , CRM , SRM и других в единую систему HANA. S / 4HANA представляет собой упрощенный бизнес-пакет, заменяющий ERP- системы предыдущего поколения . Хотя вполне вероятно, что SAP сосредоточит свои инновации на S / 4HANA, некоторые клиенты, использующие системы, отличные от HANA, выразили обеспокоенность по поводу привязанности к продуктам SAP. Поскольку для работы S / 4HANA требуется система SAP HANA, клиентам, использующим приложения бизнес-пакета SAP на оборудовании, не сертифицированном SAP, необходимо будет перейти на сертифицированную SAP базу данных HANA, если они выберут функции, предлагаемые S / 4HANA.

Вместо управления версиями в программном обеспечении для обновлений используются пакеты обновлений , называемые стеками пакетов поддержки (SPS). Стеки пакетов поддержки выпускаются каждые 6 месяцев.

В ноябре 2016 года SAP анонсировала SAP HANA 2, которая предлагает усовершенствования в нескольких областях, таких как управление базами данных и управление приложениями, и включает две новые облачные службы: анализ текста и анализ наблюдения Земли. Клиенты HANA могут перейти на HANA 2 с SPS10 и выше. Клиенты, использующие SPS9 и ниже, должны сначала выполнить обновление до SPS12 перед обновлением до HANA 2 SPS01.

Архитектура

Обзор

Основные различия между HANA и системами предыдущего поколения SAP является то, что она является колонки-ориентированной , в оперативной памяти базы данных , который сочетает в себе OLAP и OLTP операции в единую систему; таким образом, в целом SAP HANA - это система OLTAP. Хранение данных в основной памяти, а не на диске, обеспечивает более быстрый доступ к данным и, соответственно, более быстрые запросы и обработку. Хотя хранение данных в памяти дает преимущества в производительности, это более дорогостоящая форма хранения данных. Наблюдая за схемами доступа к данным, до 85% данных в корпоративной системе могут быть доступны нечасто, поэтому может быть экономически выгодно хранить часто используемые или «горячие» данные в памяти, в то время как менее часто используемые «теплые» данные являются Хранение на диске, подход SAP назвал «Динамическое многоуровневое хранение».

Системы, ориентированные на столбцы, хранят все данные для одного столбца в одном месте, а не хранят все данные для одной строки в одном месте (системы, ориентированные на строки). Это может повысить производительность запросов OLAP для больших наборов данных и обеспечить большее вертикальное сжатие схожих типов данных в одном столбце. Если время чтения для данных, хранящихся в столбцах, достаточно велико, консолидированные представления данных могут выполняться на лету , устраняя необходимость в поддержании агрегированных представлений и связанной с ними избыточности данных .

Хотя для OLTP традиционно отдается предпочтение строковым системам, хранение в памяти открывает методы для разработки гибридных систем, подходящих как для возможностей OLAP, так и для OLTP , устраняя необходимость поддерживать отдельные системы для операций OLTP и OLAP.

Компоненты индексатора

Сервер индексирования выполняет управление сеансом, авторизацию, управление транзакциями и обработку команд. База данных имеет как хранилище строк, так и хранилище по столбцам. Пользователи могут создавать таблицы, используя любое хранилище, но столбчатое хранилище имеет больше возможностей и используется чаще всего. Сервер индексирования также управляет сохранением между образами кэшированной памяти объектов базы данных, файлами журнала и файлами постоянного хранилища. Механизм XS позволяет создавать веб-приложения.

Информационное моделирование SAP HANA (также известное как моделирование данных SAP HANA) является частью разработки приложений HANA. Моделирование - это методология предоставления эксплуатационных данных конечному пользователю. В процессе моделирования используются виртуальные объекты многократного использования (именованные представления расчетов).

MVCC

SAP HANA управляет параллелизмом за счет использования мультиверсионного управления параллелизмом (MVCC), который дает каждой транзакции моментальный снимок базы данных в определенный момент времени. Когда базе данных MVCC необходимо обновить элемент данных, она не будет перезаписывать старые данные новыми, а вместо этого пометит старые данные как устаревшие и добавит новую версию.

Большое количество данных

В горизонтально масштабируемой среде HANA может хранить в памяти тома данных размером до петабайта, возвращая результаты запроса менее чем за секунду. Однако ОЗУ по-прежнему намного дороже, чем дисковое пространство, поэтому подход горизонтального масштабирования возможен только для определенных критических по времени сценариев использования.

Аналитика

SAP HANA включает ряд аналитических механизмов для различных видов обработки данных. Библиотека бизнес-функций включает ряд алгоритмов, доступных для решения общих алгоритмов обработки бизнес-данных, таких как амортизация активов , скользящий прогноз и скользящее среднее . Библиотека прогнозной аналитики включает собственные алгоритмы для вычисления общих статистических показателей в таких областях, как кластеризация , классификация и анализ временных рядов .

HANA включает в себя язык статистического программирования с открытым исходным кодом R в качестве поддерживаемого языка в хранимых процедурах .

База данных колоночного хранилища предлагает возможности графической базы данных. Графический движок обрабатывает язык запросов Cypher, а также имеет возможность визуального манипулирования графом с помощью инструмента под названием Graph Viewer. Структуры данных графиков хранятся непосредственно в реляционных таблицах в хранилище столбцов HANA. Предварительно созданные алгоритмы в графическом движке включают сопоставление с образцом, поиск окрестности, единственный кратчайший путь и компоненты с сильной связью. Типичные ситуации использования Graph Engine включают такие примеры, как отслеживание цепочки поставок, обнаружение мошенничества, а также планирование логистики и маршрутов.

HANA также включает механизм пространственной базы данных, который реализует типы пространственных данных и расширения SQL для операций CRUD с пространственными данными. HANA сертифицирована Open Geospatial Consortium и интегрируется с географической информационной системой ESRI ArcGIS .

Помимо числовых и статистических алгоритмов, HANA может выполнять текстовую аналитику и поиск по тексту предприятия. Возможности поиска HANA основаны на «нечетком» отказоустойчивом поиске, во многом похожем на современные поисковые системы на базе Интернета. Результаты включают статистическую меру релевантности результатов поиска, а критерии поиска могут включать порог точности результатов. Доступные анализы включают идентификацию таких сущностей, как люди, даты, места, организации, запросы, проблемы и т. Д. Такое извлечение сущностей может быть выполнено для конкретных случаев использования, таких как Голос клиента (предпочтения и ожидания клиента), Предприятие (например, слияния и поглощения, продукты, организации) и Государственный сектор (публичные лица, события, организации). Также могут быть реализованы пользовательские извлечения и словари.

Разработка приложения

Помимо возможностей базы данных и аналитики данных, SAP HANA представляет собой сервер веб-приложений , на котором размещаются пользовательские приложения, тесно интегрированные с базой данных и аналитическими механизмами HANA. XS Advanced Engine (XSA) изначально работает с языками и средами выполнения Node.js и JavaEE . XSA основан на архитектуре Cloud Foundry и, таким образом, поддерживает понятие «принесите свой собственный язык», позволяя разработчикам разрабатывать и развертывать приложения, написанные на языках и в средах выполнения, отличных от тех, которые XSA реализует изначально, а также развертывать приложения как микросервисы . XSA также поддерживает серверный JavaScript (XSJS).

Поддержка сервера приложений - это набор инструментов управления жизненным циклом приложений, позволяющий развертывать разработку и отслеживать приложения, ориентированные на пользователя.

Развертывание

HANA можно развернуть локально или в облаке у ряда поставщиков облачных услуг .

HANA можно развернуть локально как новое устройство от сертифицированного поставщика оборудования. В качестве альтернативы, существующие аппаратные компоненты, такие как хранилище и сеть, могут быть использованы как часть реализации, подход, который SAP называет «Tailored Data Center Integration (TDI)». HANA сертифицирована для работы в нескольких операционных системах, включая SUSE Linux Enterprise Server и Red Hat Enterprise Linux . Поддерживаемые аппаратные платформы для локального развертывания включают Intel 64 и POWER Systems . Система поддерживает как горизонтальное, так и вертикальное масштабирование .

Несколько поставщиков облачных услуг предлагают SAP HANA на основе инфраструктуры как услуги , в том числе:

SAP также предлагает собственные облачные сервисы в виде:

Редакции

Лицензирование SAP HANA в основном делится на две категории.

Лицензия на выполнение:

Используется для запуска приложений SAP, таких как SAP Business Warehouse на базе SAP HANA и SAP S / 4HANA .

Лицензия на полное использование:

Используется для запуска приложений SAP и сторонних разработчиков. Это лицензирование можно использовать для создания пользовательских приложений.

В рамках лицензии на полное использование функции сгруппированы в выпуски, предназначенные для различных вариантов использования.

  • Базовая версия: предоставляет основные функции базы данных и инструменты разработки, но не поддерживает приложения SAP.
  • Platform Edition: базовая версия плюс пространственная, прогнозная, интеграция с R-сервером, поиск, текст, аналитика, графические движки и дополнительные упакованные бизнес-библиотеки.
  • Enterprise Edition: Platform edition плюс дополнительные связанные компоненты для некоторых возможностей загрузки данных и структуры правил.

Кроме того, такие возможности, как потоковая передача и ETL, лицензируются в качестве дополнительных опций.

С 9 марта 2017 г. SAP HANA доступна в экспресс-выпуске ; оптимизированная версия, которая может работать на ноутбуках и в других средах с ограниченными ресурсами. Лицензия на SAP HANA, экспресс-выпуск предоставляется бесплатно даже для продуктивного использования до 32 ГБ ОЗУ. Можно приобрести дополнительное увеличение мощности.

Смотрите также

Рекомендации

Внешние ссылки