Глубокие сверточные нейронные сети (DCNN) не видят объекты так, как это делают люди — используя конфигурационное восприятие формы — и это может быть опасно в реальных приложениях ИИ, говорит профессор Джеймс Элдер, соавтор исследования Йоркского университета, опубликованного сегодня.
Опубликованное в журнале Cell Press iScience , «Модели глубокого обучения не в состоянии уловить конфигурационную природу восприятия человеческой формы» — это совместное исследование Элдера, заведующего кафедрой исследований человеческого и компьютерного зрения в Йорке и содиректора Йоркского центра искусственного интеллекта и искусственного интеллекта. общества» и доцент кафедры психологии Николас Бейкер из колледжа Лойола в Чикаго, бывший постдокторант VISTA в Йорке.
В исследовании использовались новые визуальные стимулы, называемые «Франкенштейны», для изучения того, как человеческий мозг и DCNN обрабатывают целостные, конфигурационные свойства объектов.
Life Extension, MacuGuard, препарат с шафраном для укрепления зрения, 60 мягких таблеток
«Франкенштейны — это просто объекты, которые были разобраны и снова собраны неправильным образом», — говорит Элдер. «В результате у них есть все нужные местные черты, но не в тех местах».
Исследователи обнаружили, что, хотя Франкенштейны путают зрительную систему человека, DCNN — нет, что свидетельствует о нечувствительности к конфигурационным свойствам объекта.
«Наши результаты объясняют, почему модели глубокого ИИ терпят неудачу при определенных условиях, и указывают на необходимость рассмотрения задач, выходящих за рамки распознавания объектов, чтобы понять визуальную обработку в мозгу», — говорит Элдер. «Эти глубокие модели, как правило, используют «сокращения» при решении сложных задач распознавания. Хотя эти сокращения могут работать во многих случаях, они могут быть опасны в некоторых реальных приложениях ИИ, над которыми мы в настоящее время работаем с нашими отраслевыми и государственными партнерами. — отмечает Старейшина.
Одним из таких приложений являются системы видеобезопасности дорожного движения: «Объекты оживленного дорожного движения — транспортные средства, велосипеды и пешеходы — мешают друг другу и попадают в поле зрения водителя в виде мешанины разрозненных фрагментов», — объясняет Элдер. «Мозг должен правильно сгруппировать эти фрагменты, чтобы определить правильные категории и расположение объектов. Система ИИ для мониторинга безопасности дорожного движения, которая способна воспринимать фрагменты только по отдельности, не справится с этой задачей, потенциально неправильно понимая риски для уязвимых участников дорожного движения. «
По словам исследователей, изменения в обучении и архитектуре, направленные на то, чтобы сделать сети более похожими на мозг, не привели к настройке обработки, и ни одна из сетей не смогла точно предсказать суждения человека об объекте в каждом испытании. «Мы предполагаем, что для того, чтобы соответствовать чувствительности конфигурации человека, сети должны быть обучены решать более широкий спектр объектных задач, помимо распознавания категорий», — отмечает Элдер.
Leave a Comment
Your email address will not be published. Required fields are marked with *