Наука и технологии России

Вход Регистрация
23.03.17 | Наука и техника: Информационные системы Артемов А.А., Сергеев А.С., Хасеневич И.А.

В ожидании чудес, обыкновенных чудес

Компьютерные программы наступают на пятки представителям не только простых, но даже и таких творческих профессий как переводчик и журналист, грозя в недалеком будущем вытеснить их с рынка. Согласно докладу ООН, вскоре роботы займут 2/3 имеющихся рабочих мест в развивающихся странах. Попытаемся разобраться, насколько оправданы фантастические фильмы и роботоцентричные прогнозы и можно ли уже сейчас говорить о полноценном развитии искусственного интеллекта.

Главными функции ИИ сейчас считаются аналитическая, коммуникативная и творческая. Подраздел науки об искусственном интеллекте, задачей которого является «обучить» компьютер «мыслить» (а значит, анализировать данные, выявлять скрытые закономерности и решать на основе них сложные задачи) называется машинным обучением (machine learning). Без преувеличения, эти исследования находятся на «переднем крае» науки, работы в данном направлении ведут крупнейшие и наиболее технологически развитые корпорации мира (включая Google, Microsoft и IBM). Разрабатываемые ими сервисы, такие как Google Predictions API, Microsoft Azure и IBM Watson позволяют создавать модели знаний на основе больших структурированных данных.

t

Эволюция информации в интернете.

Алгоритмы обработки данных в подобных сервисах не запрограммированы жестко, они могут самостоятельно выявлять закономерности и делать определенные выводы. Авторитетный журнал Массачусетского технологического института MIT Technology Review включил машинное обучение на основе полученных результатов (reinforcement learning), когда программа проводит эксперименты и «учится» на своих ошибках, в топ-10 самых прогрессивных, прорывных технологий 2017 года[1]. Как отмечает профессор Московской школы управления Сколково П. Лукша, уже сейчас IBM Watson диагностирует рак с точностью в несколько раз превышающей опытных врачей-диагностов. Экспоненциальный рост вычислительной техники (представлен на графике) демонстрирует ускоренное развитие возможностей подобных систем. Также следует отметить, что несмотря на свою технологическую сложность, эти программы имеют простой и дружелюбный интерфейс, что позволяет использовать их любому пользователю.

t

Экспоненциальный рост вычислительных возможностей (по Реймонду Курцвейлу)

Подобные системы развиваются и в России. Так, руководитель роботехнического центра Сколково Альберт Ефимов сообщил о разработке системы «Соцмедика», которая, по замыслу создателей, должна стать «реальным конкурентом» вышеупомянутому проекту Watson. Другая российская разработка - платформа Brain2 компании “Когнитивные системы” – концентрируется на быстрой обработке bigdata в нейромодели знаний для систем ИИ. В частности, всего после 20 минут обучения по 79 параметрам 1461 объектов недвижимости, нейромодель для оценки стоимости недвижимости (House Prices) способна предсказать стоимость объекта с незначительной ошибкой (RMSE, среднеквадратичное отклонение, равно 0,42) Это равнозначно оценке опытного эксперта по недвижимости. У опытного программиста-математика на решение подобной задачи с применением лучшей бесплатной библиотеки для машинного обучения Keras (TensorFlow) уйдет не менее 30 часов, а результат будет лучше незначительно (RMSE ? 0,32).

При существенной разнице в финансировании проектов, отечественные разработки не намного уступают зарубежным аналогам, а в ряде случаев превосходят их. Так модель созданная в сервисе Google Prediction, для решения уже упомянутой задачи House Prices от Kaggle (сервиса для проведения конкурсов среди специалистов по машинному обучению) показывает RMSE = 7000, что в десятки тысяч раз хуже чем в Brain2.

Развитие аналитической функции машин – не новость, но насколько современный ИИ способен коммуницировать с человеком? Когда они наконец по-настоящему пройдут тест Тьюринга, когда их невозможно будет отличить от человека? Пока самый известный пример такой коммуникации - помощники Siri и Google Assistant, установленные на устройствах Apple и Android соответственно. Обе эти программы значительно продвинулись в распознавании естественной речи и выполнении мелких поручений (написать сообщение, сделать заметку), но при этом не научились синтезировать собственные ответы на вопросы, поскольку и Siri, и Google Assistant могут отвечать – «зачитывая» найденные предложения. Выпущенная компанией Amazon в 2014 году Alexa работает чуть сложнее - синтезирует ответ на базе готовых шаблонов. Наконец, наиболее продвинутой технологией на данный момент обладает китайский робот Сяо Нань, известный тем, что написал статью на 300 иероглифов за 1 секунду. Вот пример текста, синтезированного этой программой:

"В первом квартале прогноз доходов от Apple над Уолл-стрит"; "Индекс потребительских цен августе выросли на 2% рекордно высокого уровня 12 месяцев"; "Анжу Мяньян 4,3 землетрясение произошло", "Олимпийские игры, настольный теннис женщин в одиночном четвертьфинале Дин Нин (Китай) 4: 0 легко вырезать круглый".

Безусловно, Сяо Нань пока не сможет заменить человека – журналиста: налицо проблемы со связностью текста, кроме того, Сяо Нань не умеет брать интервью и задавать дополнительные вопросы. Тем не менее, данный проект – один из немногих, где робот находит и синтезирует произвольный текст без явного шаблона.

А что в России? Сравнение рейтинга на основе оценок десятков тысяч пользователей Google Play показывает, что созданный отечественными разработчиками голосовой помощник «Дуся» не уступает тому же Google Assistant. Ограничение «Дуси» такое же, как и у других голосовых помощников – программа выдает только готовые ответы на заданные вопросы (хотя, система Дуси позволяет создавать собственные функции с помощью написания скриптов, что принципиально не меняет функционал программы, но несколько расширяет область применения).

Синтезировать собственные ответы на вопросы умеет уже вышеупомянутый Brain2. Например, разработанная на основе текста стратегии «Сбербанка» нейромодель (а точнее 7 многослойных нейробайесовых моделей со структурой FuzzyArt) способна осуществлять поиск релевантных запросу лексем и синтезировать из них ответ в виде предложения. Такая модель может быть использована в качестве «умного» чат-бота-помощника, причем точность подбора слов для ответов системы составляет 0,86, а правильность синтезирования ответа из выбранных слов достигает 0,91.

В последние годы активно развиваются не только аналитическая и коммуникативная, но и творческая функция машинного разума. Самая сложная из них – это осмысленная поэзия. Из достижений можно выделить совместный проект Google и Университетов Стэнфорда и Массачусетса по обучению ИИ написанию стихотворений. Один из полученных результатов выглядит следующим образом:

there is no one else in the world.
there is no one else in sight.
they were the only ones who mattered.
they were the only ones left.
he had to be with me. she had to be with him.
i had to do this. i wanted to kill him.
i started to cry. i turned to him.

Не отстают и отечественные разработчики. Так, сотрудники «Яндекса» Алексей Тихонов и Иван Ямщиков выпустили альбом «Нейронная оборона», состоящий из песен и стихотворений, написанных роботом. Созданный ими алгоритм написал тексты в стиле Егора Летова, основателя группы «Гражданская оборона», а Тихонов и Ямщиков исполнили их. Альбом начинается со слов: «В ожидании чудес, невозможных чудес».

Другой российский проект «Пушкин» компании «Когнитивные системы» ставит своей целью научить ИИ сочинять стихотворения в стиле солнца русской поэзии (катрены 4-х стопным ямбом). Для этого разработаны модели по определению и подбору рифм, ударения в слове, ведутся работы над моделью смысловых ассоциаций по группе слов и комбинациям текста.

t

Проект «Пушкин»

Возможно, уже наши дети будут жить в новом мире. В мире, где программы будут решать сложные задачи – водить машины, строить дома, проводить диагностику и хирургические операции – и все это под нашим контролем и при поддержании живого диалога человека и машины. Сможет ли человек занять достойное место в этом новом мире? Уже сейчас можно спрогнозировать существенное высвобождение рабочей силы, а вот прогноз о том, чем займутся люди нетворческих профессий, менее определенный. Одно можно сказать точно: возможные проблемы все равно не заставят никого отказаться от развития самой технологии. Потому отрадно, что у России стартовые позиции в «марафоне искусственного интеллекта» неплохие. И хотя в ключевые рынки Национальной технологической инициативы – государственной программы мер по поддержке развития в России перспективных отраслей, которые в течение следующих 20 лет могут стать основой мировой экономики – ИИ не входит в явном виде, его элементы неминуемо потребуются для решения задач этих рынков. Для Aeronet, Autonet, Marinet эти задачи включают в себя создание беспилотных летательных аппаратов, беспилотных автомобилей и интеллектуальных транспортных систем, для Neuronet – это человеко-машинное взаимодействие, создание сети, объединяюшей нейроинтерфейсы, для EnergyNet – умные сети, для Healthnet – математическое моделирование заболеваний… Не удивляйтесь, если для ваших детей Пушкин будет не поэтом позапрошлого века, а лучшим говорящим «другом» из папиного автомобиля.

РЕЙТИНГ

4.56
голосов: 9

Обсуждение