Orange (программное обеспечение) - Orange (software)

апельсин
Orange-software-logo.png
Разработчики) Люблянский университет
Первый выпуск 10 октября 1996 г . ; 24 года назад  ( 1996-10-10 )
Стабильный выпуск
3.27.1 / 3 ноября 2020 г . ; 6 месяцев назад  ( 3 ноября 2020 г. )
Репозиторий Оранжевый репозиторий
Написано в Python , Cython , C ++ , C
Операционная система Кроссплатформенность
Тип Машинное обучение , интеллектуальный анализ данных , визуализации данных , анализ данных
Лицензия GPLv3 или новее
Веб-сайт оранжевый .biolab .si

Orange - это набор инструментов для визуализации данных , машинного обучения и интеллектуального анализа данных с открытым исходным кодом. Он имеет интерфейс визуального программирования для быстрого качественного анализа данных и интерактивной визуализации данных .

Типичный рабочий процесс в Orange 3.

Описание

Orange - это компонентный программный пакет визуального программирования для визуализации данных , машинного обучения , интеллектуального анализа данных и анализа данных .

Компоненты Orange называются виджетами, и они варьируются от простой визуализации данных, выбора подмножества и предварительной обработки до эмпирической оценки алгоритмов обучения и прогнозного моделирования .

Визуальное программирование реализуется через интерфейс, в котором рабочие процессы создаются путем связывания предопределенных или созданных пользователем виджетов , в то время как опытные пользователи могут использовать Orange в качестве библиотеки Python для манипулирования данными и изменения виджетов.

Программное обеспечение

Orange - это программный пакет с открытым исходным кодом, выпущенный под лицензией GPL . Версии до 3.0, включающие основные компоненты на C ++ с оболочками на Python, доступны на GitHub . Начиная с версии 3.0, Orange использует общие библиотеки Python с открытым исходным кодом для научных вычислений, такие как numpy , scipy и scikit-learn , а его графический пользовательский интерфейс работает в кроссплатформенной структуре Qt .

Установка по умолчанию включает ряд алгоритмов машинного обучения, предварительной обработки и визуализации данных в 6 наборах виджетов (данные, визуализация, классификация, регрессия, оценка и неконтролируемый). Дополнительные функции доступны в виде надстроек (биоинформатика, слияние данных и анализ текста).

Orange поддерживается в macOS , Windows и Linux, а также может быть установлен из репозитория Python Package Index ( pip install Orange3 ).

По состоянию на май 2018 года стабильная версия - 3.13 и работает с Python 3, тогда как устаревшая версия 2.7, работающая с Python 2.7, все еще доступна.

Текущая загружаемая версия (протестированная) по состоянию на май 2021 года, размещенная на веб-сайте, - это версия 3.28.

Функции

Orange состоит из холста- интерфейса, на котором пользователь размещает виджеты и создает рабочий процесс анализа данных. Виджеты предлагают базовые функции, такие как чтение данных, отображение таблицы данных, выбор функций, обучение предикторов, сравнение алгоритмов обучения, визуализация элементов данных и т. Д. Пользователь может интерактивно исследовать визуализации или загружать выбранное подмножество в другие виджеты.

Виджет "Дерево классификации" в Orange 3.0
Виджет Paint Data в сочетании с иерархической кластеризацией и k-средними.

Цели

Программа предоставляет платформу для выбора экспериментов, систем рекомендаций и прогнозного моделирования и используется в биомедицине , биоинформатике , геномных исследованиях и обучении. В науке он используется как платформа для тестирования новых алгоритмов машинного обучения и внедрения новых методов в генетике и биоинформатике. В образовании он использовался для обучения методам машинного обучения и интеллектуального анализа данных студентов, изучающих биологию, биомедицину и информатику.

Расширения

Различные проекты основаны на Orange либо путем расширения основных компонентов с помощью надстроек, либо с использованием только Orange Canvas для использования реализованных функций визуального программирования и графического интерфейса.

  • OASYS ORange SYnchrotron Suite
  • scOrange для биостатистики отдельных клеток
  • Квазар для анализа данных в естественных науках

История

  • В 1996 году Университет Любляны и Институт Йожефа Стефана начали разработку ML *, фреймворка машинного обучения на C ++ .
  • В 1997 году были разработаны привязки Python для ML *, которые вместе с появляющимися модулями Python сформировали совместный фреймворк под названием Orange.
  • В последующие годы большинство основных алгоритмов интеллектуального анализа данных и машинного обучения были разработаны либо на C ++ (ядро Orange), либо в модулях Python.
  • В 2002 году были разработаны первые прототипы для создания гибкого графического пользовательского интерфейса с использованием мегафиджетов Pmw Python .
  • В 2003 году графический интерфейс пользователя был переработан и переработан для среды Qt с использованием привязок PyQt Python. Был определен фреймворк визуального программирования, и началась разработка виджетов (графических компонентов конвейера анализа данных).
  • В 2005 году были созданы расширения для анализа данных в биоинформатике .
  • В 2008 году были разработаны установочные пакеты Mac OS X DMG и Fink .
  • В 2009 году было создано и поддержано более 100 виджетов.
  • С 2009 года Orange находится в стадии бета-версии 2.0, и на веб-сайте предлагаются установочные пакеты на основе ежедневного цикла компиляции.
  • В 2012 году была введена новая иерархия объектов, заменившая старую модульную структуру.
  • В 2013 году произошел серьезный редизайн графического интерфейса.
  • В 2015 году выпущен Orange 3.0.
  • В 2016 году Orange находится в версии 3.3. В разработке используется ежемесячный стабильный цикл выпуска.

Рекомендации

дальнейшее чтение

Внешние ссылки