DeepMind - DeepMind

DeepMind Technologies Limited
Тип бизнеса	Дочернее предприятие
Основан	23 сентября 2010 г . ; 11 лет назад
Штаб-квартира
Учредитель (и)
Исполнительный директор	Демис Хассабис
Главный управляющий	Лила Ибрагим
Промышленность	Искусственный интеллект
Продукты	AlphaGo , AlphaStar , AlphaFold , AlphaZero
Сотрудники	> 1000 (июнь 2020 г.)
Родитель	Независимый (2010–2014 гг.) ; Google Inc. (2014–2015 гг.) ; Alphabet Inc. (2015– настоящее время)
URL	www.deepmind.com

DeepMind Technologies является британский искусственный интеллект дочерней алфавитом Inc. и научно - исследовательская лаборатория , основанная в сентябре 2010 года DeepMind был приобретен на Google в 2014 г. Компания базируется в Лондоне, с научно - исследовательскими центрами в Канаде, Франции и Соединенных Штатах. В 2015 году она стала дочерней компанией Alphabet Inc. , материнской компании Google.

DeepMind создала нейронную сеть, которая учится играть в видеоигры способом, аналогичным человеческому, а также нейронную машину Тьюринга или нейронную сеть, которая может иметь доступ к внешней памяти, как обычная машина Тьюринга , в результате чего в компьютере, который имитирует кратковременную память человеческого мозга.

DeepMind сделал заголовки в 2016 году после того, как его AlphaGo программы бить человек профессиональным Go игрок Ли SEDOL , чемпион мира, в матче пяти игр , которая была предметом документального фильма. Более общая программа AlphaZero превзошла самые мощные программы игры го , шахматы и сёги (японские шахматы) после нескольких дней игры против самой себя, используя обучение с подкреплением . В 2020 году DeepMind значительно продвинулся в решении проблемы сворачивания белков .

История

Вход в здание, где расположены Google и DeepMind, по адресу 6 Pancras Square, Лондон, Великобритания.

Запуск был основан Демис Хассабис , Шейн Легг и Мустафы Сулеймана в 2010 году Hassabis и Легг впервые встретились в University College London «s Гэтсби Computational Neuroscience Unit .

Во время одного из интервью Демис Хассабис сказал, что стартап начал работать над технологией искусственного интеллекта, обучая его играть в старые игры семидесятых и восьмидесятых годов, которые относительно примитивны по сравнению с теми, которые доступны сегодня. Некоторые из этих игр включали Breakout , Pong и Space Invaders . ИИ вводился в одну игру за раз, без какого-либо предварительного знания ее правил. Потратив некоторое время на изучение игры, ИИ в конечном итоге стал в ней экспертом. «Считается, что когнитивные процессы, через которые проходит ИИ, очень похожи на те, которые использует человек, который никогда не видел игру, чтобы понять ее и попытаться овладеть ею». Цель основателей - создать ИИ общего назначения, который может быть полезным и эффективным практически для чего угодно.

В компанию инвестировали крупные венчурные компании Horizons Ventures и Founders Fund , а также предприниматели Скотт Банистер, Питер Тиль и Илон Маск . Яан Таллинн был одним из первых инвесторов и советником компании. 26 января 2014 года Google объявил, что компания приобрела DeepMind за 500 миллионов долларов и согласилась приобрести DeepMind Technologies. Продажа Google произошла после того, как Facebook, как сообщается, завершил переговоры с DeepMind Technologies в 2013 году. Впоследствии компания была переименована в Google DeepMind и сохраняла это имя около двух лет.

В 2014 году DeepMind получила награду «Компания года» от Кембриджской компьютерной лаборатории .

В сентябре 2015 года DeepMind и Royal Free NHS Trust подписали свое первоначальное соглашение об обмене информацией (ISA) для совместной разработки приложения для управления клиническими задачами Streams.

После приобретения Google компания создала совет по этике искусственного интеллекта . Совет по этике для исследований ИИ остается загадкой, поскольку и Google, и DeepMind отказываются раскрывать, кто входит в состав совета. DeepMind вместе с Amazon, Google, Facebook, IBM и Microsoft является одним из основателей Partnership on AI , организации, занимающейся интерфейсом общества и ИИ. DeepMind открыла новое подразделение под названием DeepMind Ethics and Society, в котором основное внимание уделяется этическим и социальным вопросам, поднимаемым искусственным интеллектом, с участием выдающегося философа Ника Бострома в качестве советника. В октябре 2017 года DeepMind запустила новую исследовательскую группу для изучения этики ИИ.

В декабре 2019 года соучредитель Сулейман объявил, что покидает DeepMind и присоединяется к Google, работая на политическом посту. В 2021 году Wall Street Journal сообщил, что Сулеймана отправили в отпуск в DeepMind в 2019 году после расследования утверждений сотрудников о том, что он над ними издевался. Компания наняла внешнего юриста для расследования утверждений о том, что Сулейман издевался над сотрудниками, и его отправили в отпуск перед тем, как уйти в Google. В электронном письме, которое было отправлено сотрудникам после обнародования этой истории и опубликовано Business Insider , говорилось, что «стиль управления Сулеймана не соответствовал ожидаемым стандартам».

Business Insider также опубликовал дополнительные подробности исторических обвинений в издевательствах над Сулейманом, включая утверждения о том, что он хвастался «сокрушением людей», «имел привычку улетать из ниоткуда» и требовал от сотрудников выполнения задач, не связанных с их работой.

Продукты и технологии

Согласно веб-сайту компании, цель DeepMind Technologies - объединить «лучшие методы машинного обучения и системной нейробиологии для создания мощных универсальных алгоритмов обучения ».

В 2016 году Google Research выпустила документ о безопасности ИИ и предотвращении нежелательного поведения в процессе обучения ИИ. Deepmind также выпустила несколько публикаций через свой веб-сайт. В 2017 году DeepMind выпустила GridWorld, тестовую площадку с открытым исходным кодом для оценки того, учится ли алгоритм отключать аварийный выключатель или иным образом проявляет нежелательное поведение.

В июле 2018 года исследователи DeepMind обучили одну из своих систем игре в Quake III Arena .

По состоянию на 2020 год DeepMind опубликовал более тысячи статей, в том числе тринадцать статей, одобренных природой или наукой . DeepMind привлекала внимание СМИ в период AlphaGo; Согласно поиску LexisNexis , в 2016 году 1842 опубликованных новостных сообщения с упоминанием DeepMind снизились до 1363 в 2019 году.

Глубокое обучение с подкреплением

В отличие от других AIs, таких , как IBM «ы Deep Blue или Уотсон , которые были разработаны для заранее определенной цели , и только функции в пределах его объема, DeepMind утверждает , что его система предварительно не запрограммирован: он узнает из опыта, используя только необработанные пиксели в качестве входных данных. Технически он использует глубокое обучение в сверточной нейронной сети с новой формой Q-обучения , формой обучения с подкреплением без использования моделей . Они тестируют систему в видеоиграх, особенно в ранних аркадных играх , таких как Space Invaders или Breakout . Не изменяя код, ИИ начинает понимать, как играть в игру, и через некоторое время играет в несколько игр (в первую очередь Breakout ) более эффективную игру, чем когда-либо мог бы любой человек.

В 2013 году DeepMind опубликовал исследование системы искусственного интеллекта, которая может превзойти человеческие способности в таких играх, как Pong , Breakout и Enduro , а также превзойти современные характеристики Seaquest , Beamrider и Q * bert . Сообщается, что эта работа привела к приобретению компании Google. Искусственный интеллект DeepMind применялся в видеоиграх 1970-х и 1980- х годов ; продолжалась работа над более сложными 3D-играми, такими как Quake , впервые появившимся в 1990-х годах.

В 2020 году DeepMind опубликовала Agent57, AI Agent, который превосходит человеческий уровень производительности во всех 57 играх пакета Atari2600.

AlphaGo и преемники

В 2014 году компания опубликовала исследование компьютерных систем, способных играть в го .

В октябре 2015 года компьютерная программа игры по го под названием AlphaGo, разработанная DeepMind, победила чемпиона Европы по го Фан Хуэй , профессионала на 2 дан (из возможных 9) , со счетом 5: 0. Это был первый случай, когда искусственный интеллект (ИИ) победил профессионального игрока в го. Раньше было известно, что компьютеры играли в го только на «любительском» уровне. Считается, что для компьютеров в го гораздо сложнее выиграть по сравнению с другими играми, такими как шахматы , из-за гораздо большего количества возможностей, что делает его непомерно трудным для традиционных методов ИИ, таких как грубая сила .

В марте 2016 года он победил Ли Седола - игрока с 9 даном Го и одного из лучших игроков в мире - со счетом 4–1 в матче из пяти игр .

На саммите Future of Go в 2017 году AlphaGo выиграла матч из трех игр с Кэ Джи , который в то время непрерывно занимал первое место в мире в течение двух лет. Он использовал протокол контролируемого обучения , изучая большое количество игр, в которые люди играли друг против друга.

В 2017 году улучшенная версия AlphaGo Zero обошла игры AlphaGo 100 до 0. Стратегии AlphaGo Zero были самоучками. AlphaGo Zero смог превзойти своего предшественника всего за три дня с меньшей вычислительной мощностью, чем AlphaGo; для сравнения, оригинальной AlphaGo потребовались месяцы, чтобы научиться играть.

Позже в том же году AlphaZero, модифицированная версия AlphaGo Zero, но для обработки любой игры с идеальной информацией для двух игроков, приобрела сверхчеловеческие способности в шахматах и сёги. Как и AlphaGo Zero, AlphaZero училась исключительно через самостоятельную игру.

Технология

Технология AlphaGo была разработана на основе подхода глубокого обучения с подкреплением . Это отличает AlphaGo от остальных технологий искусственного интеллекта, представленных на рынке. С учетом сказанного, «мозг» AlphaGo был представлен для различных ходов на основе исторических данных турниров. Количество ходов постепенно увеличивалось, пока в итоге не было обработано более 30 миллионов из них. Цель заключалась в том, чтобы система имитировала человека-игрока и в конечном итоге стала лучше. Он играл против самого себя и учился не только на собственных поражениях, но и на победах; таким образом, со временем он научился совершенствоваться и в результате увеличил свой выигрыш.

AlphaGo использовала две глубокие нейронные сети: сеть политик для оценки вероятностей перемещения и сеть создания ценности для оценки позиций. Сеть политики обучалась посредством обучения с учителем, а затем была усовершенствована путем обучения с подкреплением градиента политики . Сеть создания ценности научилась предсказывать победителей в играх, в которых политическая сеть играет против самой себя. После обучения эти сети использовали опережающий поиск по дереву Монте-Карло (MCTS), используя сеть политик для определения возможных ходов с высокой вероятностью, в то время как сеть создания ценности (в сочетании с развертыванием Монте-Карло с использованием политики быстрого развертывания) оценивала позиции в дереве.

Zero обучался с использованием обучения с подкреплением, в котором система сыграла против себя миллионы игр. Единственным ориентиром для него было увеличение винрейта. Он сделал это, не извлекая уроков из игр, в которые играли люди. Его единственные входные характеристики - это черные и белые камни с доски. Он использует одну нейронную сеть, а не отдельные сети политик и значений. Упрощенный поиск по дереву использует эту нейронную сеть для оценки позиций и выборочных перемещений без развертывания Монте-Карло. Новый алгоритм обучения с подкреплением включает опережающий поиск внутри цикла обучения. В AlphaGo Zero работало около 15 человек и миллионы вычислительных ресурсов. В конечном счете, ему требовалось гораздо меньше вычислительной мощности, чем AlphaGo, работающему на четырех специализированных ИИ-процессорах (Google TPU ) вместо 48 AlphaGo.

AlphaFold

В 2016 году DeepMind обратила свой искусственный интеллект к сворачиванию белков - одной из самых сложных проблем в науке. В декабре 2018 года DeepMind AlphaFold победил в 13-й критической оценке методов прогнозирования структуры белка (CASP), успешно предсказав наиболее точную структуру для 25 из 43 белков. «Это проект-маяк, наша первая крупная инвестиция с точки зрения людей и ресурсов в фундаментальную, очень важную, реальную научную проблему», - сказал Хассабис The Guardian . В 2020 году на 14-м мероприятии CASP прогнозы AlphaFold достигли показателя точности, сопоставимого с лабораторными методами. Доктор Андрей Крыштафович, один из научных судей, назвал это достижение «поистине замечательным» и сказал, что проблема предсказания того, как складываются белки, «в значительной степени решена».

WaveNet и WaveRNN

В 2016 году DeepMind представила WaveNet, систему преобразования текста в речь . Первоначально он был слишком ресурсоемким для использования в потребительских товарах, но в конце 2017 года он стал готов к использованию в потребительских приложениях, таких как Google Assistant . В 2018 году Google запустил коммерческий продукт преобразования текста в речь Cloud Text-to-Speech на основе WaveNet.

В 2018 году DeepMind представила более эффективную модель под названием WaveRNN, разработанную совместно с Google AI . В 2019 году Google начал внедрять его для пользователей Google Duo .

AlphaStar

В 2016 году Хассабис назвал игру StarCraft вызовом будущего, поскольку она требует стратегического мышления и обработки несовершенной информации.

В январе 2019 года DeepMind представила AlphaStar, программу для игры в стратегию в реальном времени StarCraft II . AlphaStar использовала обучение с подкреплением, основанное на повторах человеческих игроков, а затем играла против себя, чтобы улучшить свои навыки. На момент презентации AlphaStar обладал знаниями, эквивалентными 200 годам игрового времени. Он выиграл 10 матчей подряд против двух профессиональных игроков, хотя у него было несправедливое преимущество - он мог видеть все поле, в отличие от игрока-человека, которому приходится перемещать камеру вручную. Предварительная версия, в которой это преимущество фиксировалось, проиграла в последующем матче.

В июле 2019 года AlphaStar начала играть против случайных людей в публичной европейской многопользовательской рейтинговой системе 1 на 1. В отличие от первой итерации AlphaStar, в которой играли только протоссов против протоссов, в этой игре играли за все расы игры, и в ней ранее были исправлены несправедливые преимущества. К октябрю 2019 года AlphaStar достиг уровня гроссмейстера в рейтинге StarCraft II во всех трех гонках StarCraft , став первым ИИ, достигшим высшей лиги широко популярного киберспорта без каких-либо игровых ограничений.

Разные вклады в Google

Google заявил, что алгоритмы DeepMind значительно повысили эффективность охлаждения его центров обработки данных. Кроме того, DeepMind (вместе с другими исследователями Alphabet AI) помогает персонализированным рекомендациям приложений Google Play . DeepMind также сотрудничал с командой Android в Google для создания двух новых функций, которые стали доступны людям с устройствами под управлением Android Pie, девятой версии мобильной операционной системы Google. Эти функции, Adaptive Battery и Adaptive Brightness, используют машинное обучение для экономии энергии и упрощения использования устройств с операционной системой. DeepMind впервые использует эти методы в таком небольшом масштабе, когда типичные приложения машинного обучения требуют на порядок большей вычислительной мощности.

DeepMind Здоровье

В июле 2016 года было объявлено о сотрудничестве между DeepMind и офтальмологической клиникой Мурфилдс для разработки приложений искусственного интеллекта для здравоохранения . DeepMind будет применяться для анализа анонимных сканирований глаз для поиска ранних признаков заболеваний, ведущих к слепоте .

В августе 2016 года было объявлено о программе исследований с госпиталем Университетского колледжа Лондона с целью разработки алгоритма, который может автоматически различать здоровые и раковые ткани в области головы и шеи.

Совместно с Фондом Royal Free London NHS Foundation Trust и Imperial College Healthcare NHS Trust также осуществляются проекты по разработке новых клинических мобильных приложений, связанных с электронными картами пациентов . Сообщается, что в декабре 2017 года сотрудники Royal Free Hospital заявили, что доступ к данным пациентов через приложение сэкономил «огромное количество времени» и внес «феноменальные» изменения в ведение пациентов с острым повреждением почек. Данные результатов теста отправляются на мобильные телефоны персонала и предупреждают их об изменении состояния пациента. Это также позволяет персоналу видеть, ответил ли кто-то еще, и показывать пациентам их результаты в наглядной форме.

В ноябре 2017 года DeepMind объявила о партнерстве в области исследований с Британским центром онкологических исследований в Имперском колледже Лондона с целью улучшения выявления рака груди за счет применения машинного обучения к маммографии. Кроме того, в феврале 2018 года DeepMind объявила, что работает с Министерством по делам ветеранов США, пытаясь использовать машинное обучение для прогнозирования начала острого повреждения почек у пациентов, а также в более широком смысле общего ухудшения состояния пациентов во время пребывания в больнице, поэтому что врачи и медсестры могут быстрее лечить нуждающихся пациентов.

DeepMind разработала приложение под названием Streams, которое отправляет врачам уведомления о пациентах, которым грозит серьезная травма. 13 ноября 2018 года DeepMind объявила, что ее подразделение здравоохранения и приложение Streams будут включены в Google Health . Защитники конфиденциальности заявили, что это объявление предало доверие пациентов и, по всей видимости, противоречит предыдущим заявлениям DeepMind о том, что данные пациентов не будут связаны с учетными записями или службами Google. Представитель DeepMind сказал, что данные пациентов по-прежнему будут храниться отдельно от сервисов или проектов Google.

Споры по обмену данными NHS

В апреле 2016 года New Scientist получил копию соглашения о совместном использовании данных между DeepMind и Royal Free London NHS Foundation Trust . Последний управляет тремя лондонскими больницами, в которых ежегодно проходят лечение около 1,6 миллиона пациентов. Соглашение показывает, что DeepMind Health имела доступ к данным о госпитализации, выписке и передаче, несчастным случаям и неотложной помощи, патологии и радиологии, а также к интенсивной терапии в этих больницах. Сюда входили личные данные, например, был ли у пациентов диагностирован ВИЧ , страдали ли они от депрессии или когда-либо делали аборт , чтобы провести исследования с целью поиска лучших результатов при различных состояниях здоровья.

В Управление комиссара по информации (ICO) была подана жалоба , в которой утверждалось, что данные должны быть псевдонимами и зашифрованы. В мае 2016 года New Scientist опубликовал еще одну статью, в которой утверждалось, что проект не получил одобрения Консультативной группы по конфиденциальности Управления по регулированию лекарственных средств и товаров медицинского назначения .

В мае 2017 года Sky News опубликовала просочившееся письмо от Национального хранителя данных Фионы Калдикотт , в котором говорилось , что, по ее «взвешенному мнению», соглашение о совместном использовании данных между DeepMind и Royal Free было заключено на «ненадлежащей правовой основе». В июле 2017 года Управление комиссара по информации постановило, что больница Royal Free не соблюла Закон о защите данных, когда передала DeepMind личные данные 1,6 миллиона пациентов.

Этика и общество DeepMind

В октябре 2017 года DeepMind анонсировала новое исследовательское подразделение DeepMind Ethics & Society. Их цель - финансирование внешних исследований по следующим темам: конфиденциальность, прозрачность и справедливость; экономические последствия; управление и подотчетность; управление рисками ИИ; Мораль и ценности ИИ; и как ИИ может решать мировые проблемы. В результате команда надеется глубже понять этические последствия ИИ и помочь обществу увидеть, как ИИ может быть полезным.

Это новое подразделение DeepMind является полностью отдельным от партнерства ведущих компаний, использующих ИИ, академических кругов, организаций гражданского общества и некоммерческих организаций под названием « Партнерство по искусственному интеллекту на благо людей и общества», частью которого также является DeepMind. Совет по этике и обществу DeepMind также отличается от обсуждаемого Совета по этике ИИ, который Google изначально согласился сформировать при приобретении DeepMind.

DeepMind профессора машинного обучения

DeepMind спонсирует три кафедры машинного обучения:

один в Кембриджском университете , проводимый Нилом Лоуренсом на факультете компьютерных наук и технологий
другой в Оксфордском университете , проведенный Филом Блансом . на кафедре компьютерных наук
другой - в Университетском колледже Лондона , проведенном Марком Дайзенротом . на кафедре информатики факультета инженерных наук

Смотрите также

Глоссарий искусственного интеллекта

Languages

In other projects