KNIME - KNIME

KNIME
KNIMELogoTM.svg
Разработчики) KNIME
Стабильный выпуск
4.4.1 / 30 июня 2021 г.
Репозиторий
Операционная система Linux , OS X , Windows
Доступно в английский
Тип Ведомый аналитика / Корпоративная отчетность / Business Intelligence / Data Mining / Deep Learning / Анализ данных / Text Mining / Big Data
Лицензия Стандартная общественная лицензия GNU
Веб-сайт www .knime .com

KNIME ( / n m / ), Konstanz Information Miner , представляет собой бесплатную платформу для анализа данных, отчетности и интеграции с открытым исходным кодом . KNIME объединяет различные компоненты для машинного обучения и интеллектуального анализа данных посредством своей концепции модульной конвейерной обработки данных «Building Blocks of Analytics». Графический пользовательский интерфейс и использование JDBC позволяет сборка узлов смешивания различных источников данных, в том числе предварительной обработки ( ETL: извлечение, преобразование, загрузка ), для моделирования, анализа и визуализации данных без, или только с минимальным, программирования.

С 2006 года KNIME использовался в фармацевтических исследованиях, а также в других областях, таких как анализ данных клиентов CRM , бизнес-аналитика , интеллектуальный анализ текста и анализ финансовых данных. Недавно были попытки использовать KNIME в качестве инструмента для автоматизации процессов (RPA).

Штаб-квартира KNIME находится в Цюрихе, с дополнительными офисами в Констанце, Берлине и Остине (США).

История

Разработка KNIME была начата в январе 2004 года группой инженеров-программистов из Университета Констанца в качестве проприетарного продукта. Первоначальная команда разработчиков, возглавляемая Майклом Бертольдом, происходила из компании из Кремниевой долины, поставляющей программное обеспечение для фармацевтической промышленности. Первоначальной целью было создание модульной, хорошо масштабируемой и открытой платформы обработки данных, которая позволила бы легко интегрировать различные модули загрузки, обработки, преобразования, анализа и визуального исследования данных без акцента на какой-либо конкретной области приложения. Платформа была задумана как платформа для сотрудничества и исследований, а также должна служить платформой интеграции для различных других проектов анализа данных.

В 2006 году была выпущена первая версия KNIME, и несколько фармацевтических компаний начали использовать KNIME, а ряд поставщиков программного обеспечения для медико-биологических наук начали интегрировать свои инструменты в KNIME. Позже в том же году, после статьи в немецком журнале c't , к ним присоединились пользователи из ряда других регионов. По состоянию на 2012 год KNIME используется более чем 15 000 реальных пользователей (т.е. не считая загрузок, но пользователей, регулярно получающих обновления, когда они становятся доступными) не только в медико-биологических науках, а также в банках, издательствах, производителях автомобилей, телекоммуникационных компаниях, консалтинговых фирмах и т. Д. в различных других отраслях промышленности, а также в большом количестве исследовательских групп по всему миру. Последние обновления KNIME Server и KNIME Big Data Extensions обеспечивают поддержку Apache Spark 2.3, Parquet и хранилища типа HDFS.

Шестой год подряд KNIME занимает лидирующие позиции в области платформ обработки и анализа данных и машинного обучения в Magic Quadrant компании Gartner .

Скриншот KNIME

Внутренности

KNIME позволяет пользователям визуально создавать потоки данных (или конвейеры), выборочно выполнять некоторые или все этапы анализа, а затем проверять результаты, модели, используя интерактивные виджеты и представления. KNIME написан на Java и основан на Eclipse . Он использует механизм расширения для добавления плагинов, обеспечивающих дополнительную функциональность. Базовая версия уже включает сотни модулей для интеграции данных (файловый ввод-вывод, узлы базы данных, поддерживающие все распространенные системы управления базами данных через JDBC или собственные коннекторы: SQLite, MS-Access, SQL Server, MySQL, Oracle, PostgreSQL, Vertica и H2) преобразование данных (фильтр, преобразователь, разделитель, объединитель, объединитель), а также широко используемые методы статистики, интеллектуального анализа данных, анализа и текстовой аналитики. Визуализация поддерживается с помощью бесплатного расширения Report Designer. Рабочие процессы KNIME можно использовать в качестве наборов данных для создания шаблонов отчетов, которые можно экспортировать в такие форматы документов, как doc, ppt, xls, pdf и другие. Другие возможности KNIME:

  • Ядро-архитектура KNIME позволяет обрабатывать большие объемы данных, которые ограничены только доступным пространством на жестком диске (не ограниченным доступной оперативной памятью). Например, KNIME позволяет анализировать 300 миллионов адресов клиентов, 20 миллионов изображений клеток и 10 миллионов молекулярных структур.
  • Дополнительные плагины позволяют интегрировать методы интеллектуального анализа текста, интеллектуального анализа изображений, а также анализа временных рядов и сетевого анализа.
  • KNIME интегрирует различные другие проекты с открытым исходным кодом, например , алгоритмы машинного обучения из Weka , H2O.ai , Keras , Спарк , в проекте R и LIBSVM ; а также plotly , JFreeChart , ImageJ и Kit развития химии .

KNIME реализован на Java, тем не менее, он позволяет оберткам вызывать другой код в дополнение к предоставлению узлов, которые позволяют запускать Java , Python , R , Ruby и другие фрагменты кода.

Лицензия

Начиная с версии 2.1, KNIME выпущен под GPLv3 с исключением, которое позволяет другим использовать четко определенный API узла для добавления проприетарных расширений. Это позволяет также коммерческим поставщикам ПО добавлять оболочки, вызывающие их инструменты из KNIME.

Курсы KNIME

KNIME предлагает две линии онлайн-курсов, основанных на направлениях Data Wrangling и Data Science.

Смотрите также

  • Weka - алгоритмы машинного обучения, которые можно интегрировать в KNIME
  • ELKI - фреймворк интеллектуального анализа данных со множеством алгоритмов кластеризации
  • Keras - библиотека нейронных сетей
  • Orange - набор инструментов для визуализации данных, машинного обучения и интеллектуального анализа данных с открытым исходным кодом с аналогичным интерфейсом визуального программирования.
  • Список бесплатных программных пакетов и пакетов с открытым исходным кодом

использованная литература

  1. ^ «Что нового в KNIME Analytics Platform 4.0 и KNIME Server 4.9» . knime.com .
  2. ^ Бертольд, Майкл Р .; Себрон, Николас; Укроп, Фабиан; Габриэль, Томас Р .; Кёттер, Тобиас; Майнл, Торстен; Ол, Питер; Тиль, Килиан; Висведель, Бернд (16 ноября 2009 г.). "KNIME - поиск информации Konstanz" (PDF) . Информационный бюллетень ACM SIGKDD Explorations . 11 (1): 26. DOI : 10,1145 / 1656274,1656280 . S2CID  408188 .
  3. ^ Тивари, Абхишек; Сехар, Арвинд К.Т. (октябрь 2007 г.). «Основа рабочего процесса для информатики наук о жизни». Вычислительная биология и химия . 31 (5–6): 305–319. DOI : 10.1016 / j.compbiolchem.2007.08.009 . PMID  17931570 .
  4. ^ "Бот платформы KNIME Analytics" .,
  5. ^ «Открыт для инноваций» . KNIME.com .
  6. ^ Трипос, Inc. архивации 2011-07-17 в Wayback Machine
  7. ^ Шредингер архивации 2009-09-25 в Wayback Machine
  8. ^ ChemAxon архивации 2011-07-17 в Wayback Machine
  9. ^ NovaMechanics Ltd.
  10. ^ Консультанты Treweren
  11. ^ Datenbank-Mosaik Data Mining oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c't 20/2006, S. 164ff, Heise Verlag.
  12. ^ Forum auf der KNIME Webseite
  13. ^ "Всепроникающий" . Архивировано из оригинала на 2010-08-29 . Проверено 7 декабря 2010 .
  14. ^ Beisken, S .; Meinl, T .; Wiswedel, B .; Де Фигейредо, LF; Бертольд, М .; Стейнбек, К. (2013). "KNIME-CDK: химинформатика, управляемая рабочими процессами" . BMC Bioinformatics . 14 : 257. DOI : 10,1186 / 1471-2105-14-257 . PMC  3765822 . PMID  24103053 .
  15. ^ Выпущено KNIME 2.1.0. Архивировано 17 апреля 2010 г. на Wayback Machine.
  16. ^ новый путь обучения

внешние ссылки

  • KNIME Домашняя страница
  • KNIME Hub - официальная платформа сообщества для поиска узлов, компонентов, рабочих процессов и совместной работы над новыми решениями
  • Nodepit - коллекция узлов KNIME, поддерживающая управление версиями и установку узлов