«Современная борьба за лидерство в области разработки и развития искусственного интеллекта разворачивается вокруг владения данными» — Алексей Мяков, директор подразделения компьютерного зрения Intel.
Искусственный интеллект сейчас применяется практически во всех сферах деятельности. Крупные компании внедряют нейронные сети для анализа данных и формирования прогнозов. О том, какие тренды наиболее актуальны в индустрии и чего можно ожидать в будущем, рассказывает директор подразделения компьютерного зрения Intel Алексей Мяков.
Сейчас искусственный интеллект, в том или ином виде, используется в различных индустриях. Расскажите, какие технологии получили наибольшее распространение и применение?
— В 2012 году в рамках соревнования по распознаванию изображений ImageNet Large Scale Visual Recognition Challenge (ILSVRC) состоялось рождение или ренессанс такой технологии, как Deep Learning, «Глубокое обучение». Показав свою состоятельность в компьютерном зрении, данная технология семимильными шагами пошла проникать в различные индустрии и предметные области знаний (голос, текст, данные и т.д.) и помогать решать проблемы, которые либо ранее не решались, либо решения не обладали достаточной точностью.
Искусственный интеллект, на мой взгляд, понятие слишком избитое, и рождает у людей неправильные ассоциации — все сразу думают о роботах и летающих машинах, как в кино.
Глубокое обучение — более понятный термин, как технология решения задач с новым уровнем качества. Неправильно думать, что технология глубокого обучения похожа на процесс мышления человека. Для мышления человека при распознавании предмета первична его функция. Нейронные сети же анализируют форму предмета. К тому же, хоть мы можем и не отдавать себе в этом отчета, люди мыслят определенными эвристиками, автоматически смотрят на соотношение объектов. Нейронная же сеть при распознавании учитывает только форму и градиент цвета — она «видит» только сам объект.
Глубокое обучение является частью гораздо более «взрослого» направления, а именно, машинного обучения. И если в машинном обучении неотъемлемой частью создания алгоритма был человек, то в глубоком обучении нейронные сети учатся на данных. Влияние человека становится меньше, а важность данных — больше. Существуют десятки разновидностей структур нейронных сетей и многие сотни их реализаций или топологий для решения широкого спектра задач. Следует отметить, что в подавляющем большинстве случаев структура нейронных сетей является публичной информацией. Когда исследователи разрабатывают новую нейронную сетку, то они публикуют ее в открытом доступе, и так разработка становится общечеловеческой интеллектуальной собственностью. Разработанную структуру обычно не патентуют. Все самое ценное IP сосредоточено именно в данных. Поэтому, по сути, современная борьба за лидерство в области разработки и развития искусственного интеллекта разворачивается вокруг владения данными.
Какие наиболее интересные тренды и разработки в этой сфере, по вашему мнению, стоит выделить?
— Среди наиболее интересных трендов в области исследований стоит выделить экспоненциальный рост размеров сетей и данных. Например, новейшая сеть в области анализа текстов GPT 3 от компании OpenAI имеет фантастическое количество параметров — 175 миллиардов, а по некоторым оценкам для того, чтобы ее полностью натренировать «с нуля» необходимо потратить около $5 млн. Сеть обучают огромному количеству текстов, что позволяет ей отвечать на вопросы, делать выводы и заключения. В отличие от простейших чат-ботов, к которым мы начинаем привыкать, диалог с GPT 3 вполне осмысленный и логичный.
Благодаря глубокому обучению, в декабре 2020 года был совершен прорыв в решении фундаментальной проблемы биологии, а именно в расшифровке 3D-структуры протеинов, над которой ученые бились последние 50 лет. Это, несомненно, поможет в создании новых лекарственных препаратов или поиске решения проблемы разложения промышленных отходов.
Из более повседневных применений глубокого обучения следует отметить анализ медицинских МРТ, КТ или УЗИ изображений. Например, анализ параметров плода в утробе матери при ультразвуковом исследовании. Другим примером из области потребительской электроники являются умные часы с функцией ЭКГ. Эта функция в фоновом режиме периодически проверяет сердечный ритм и в случае обнаружения отклонений от нормы — признаков мерцательной аритмии — присылает уведомление.
У нас в Нижнем Новгороде специалистами из Приволжского Исследовательского Медицинского Университета создано мобильное приложение, которое способно по фотографии распознавать вероятность наличия меланомы или рака кожи — достойный пример применения возможностей искусственного интеллекта в медицине.
А если говорить о тенденциях на будущее? Можно ли сделать прогнозы о том, какие технологии получат большее развитие?
— Если же говорить о тенденциях, то, на мой взгляд, сейчас мы наблюдаем кризис перепроизводства по части исследований. Да, большое количество исследований и данных — это показатель прогресса, но сейчас основной вопрос в том, как это применить для положительного влияния на жизнь человечества и повышения ее качества.
На мой взгляд, продолжится взрывной рост глубокого обучения в медицине и робототехнике, который был еще дополнительно усилен COVID-19. Со временем появятся беспилотные автомобили. Смелые прогнозы говорили об их повсеместном внедрении уже в ближайшие пару лет, однако, на мой взгляд, стоит подождать широкого распространения таких автомобилей хотя бы 10 лет.