Наука и технологии России

Вход Регистрация

Искусственный интеллект авторобота наделён функцией гиппокампа

Компания Cognitive Technologies разработала технологию компьютерного зрения, благодаря которой авторобот будет способен с высокой точностью интерпретировать сложные ситуации, возникающие, как правило, в критических ситуациях – внезапном появлении на дороге других участников движения, пешеходов, посторонних предметов.

Новая технология, как считают в компании, позволит избежать ошибок, которые допускали известные зарубежные системы при распознавании объектов дорожной сцены. «Фактически мы в чём-то научились моделировать функцию гиппокампа человека, который выделяет и удерживает в потоке внешних сигналов наиболее важную информацию по текущей ситуации, выполняя функцию хранилища кратковременной памяти, как ОЗУ компьютера», – комментирует  руководитель департамента разработки беспилотных транспортных средств Юрий Минкин. Известно, что гиппокамп также определяет степень важности запоминаемой информации и принимает решение, что нужно сохранить, а что забыть.

Система компьютерного зрения Cognitive Technologies научилась, как и гиппокамп человека, обогащать информацию о текущей дорожной ситуации данными, которые она запомнила несколькими мгновениями ранее.

При этом система хранит в памяти не всю картинку, полученную с видеокамеры, а лишь наиболее важные её элементы, непосредственно влияющие на дорожную обстановку и безопасность. Это даёт возможность не хранить все изображение целиком, а лишь 5–10% его объёма и не требует какого-либо значительного повышения ресурсов вычислительного устройства. Также это позволяет использовать видеокамеры не с самой высокой разрешающей способностью или относительно узкоугольные объективы.

Использование технологии, по мнению разработчиков, даст серьёзное преимущество над аналогами, поскольку она позволяет решить одну из главных проблем для любой системы компьютерного зрения – распознавания объектов, находящихся на самой границе картинки (см. рис. 1). Как показывает практика, именно в этих случаях возникает наибольшее количество ошибок детекции объектов. При использовании модели Cognitive Technologies для их распознавания мы получаем отступ (padding – зона, выделенная цветом на рисунке 1 между прямоугольниками A’B’C’D’ и ABCD), который необходим для работы нейронных сетей глубокого обучения и других сверточных нейронных сетей.

авторобот Рисунок 1. Источник: пресс-служба Cognitive Technologies

Когда объект попадает на границу картинки (поля зрения видеокамер) ABCD, распознать его очень сложно (часть автомобиля, обведённого кругом, попавшего в поле зрения камер – прямоугольник ABCD). Эта проблема успешно решается, когда искусственный интеллект авторобота дополняет знание о текущей дорожной ситуации данными из ближайшего прошлого – из своей оперативной памяти (моделирование функции гиппокампа человека). Картинка, попавшая в поле зрения видеокамер мгновением ранее A’B’C’D’, содержит информацию об объекте (автомобиль, обведённый кругом), достаточную для его распознавания.

Использование подобной технологии позволило бы системе компьютерного зрения, установленной на автомобиле Tesla, избежать аварии, произошедшей в мае этого года (см. рис. 2). «Наша система смогла бы детектировать транспортное средство, приближавшееся сбоку, – утверждает Юрий Минкин. – Программная эмуляция большего угла охвата видеокамер позволила бы «увидеть» колеса, подвеску, а также другие элементы грузовика и в итоге идентифицировать приближающийся объект как автомобиль. И, кроме того, выиграть доли секунды, крайне необходимые для принятия правильного решения в критической ситуации».

авторобот Рисунок 2. Источник: пресс-служба Cognitive Technologies

Моделирование функции гиппокампа в аналогичных ситуациях позволяет использовать максимально полные данные о дорожной ситуации. На картинке ABCD, попадающей в поле зрения камер авторобота, сложно распознать светлое изображение на светлом фоне, однако, воспроизведённые «из памяти» данные (картинка A’B’C’D’), включающие колеса и другие элементы грузовика позволяют точно детектировать объект как транспортное средство.

«Разработанная нами технология моделирования функций гиппокампа человека в совокупности с созданной ранее моделью фовеального зрения, дающей возможность выделять важные элементы дорожной сцены, позволяет существенно увеличить безопасность работы беспилотного автомобиля», – утверждает президент Cognitive Technologies Ольга Ускова.

Обсуждение