Ученые из Института математических проблем биологии РАН создали нейросеть, которая управляет своим «взглядом» и ищет объекты на воспринимаемой картинке почти так же, как это делают органы зрения и мозг человека, говорится в статье, опубликованной в журнале Neural Networks.
«Разработанная модель предлагает простое и неожиданное объяснение для весьма сложного когнитивного процесса поиска и распознавания объектов на картинке, воспринимаемой нашими глазами», — рассказывает Яков Казанович из Института математических проблем биологии РАН в Пущино.
По его словам, созданная его командой нейросеть должна помочь нейрофизиологам разобраться в том, как работает реальное человеческое зрение.
За последние десять лет сотни программистов и десятки крупных IT-компаний создали бесчисленное множество систем машинного зрения, способных распознавать различные объекты на воспринимаемой картинке и классифицировать их. Эти данные современные роботы, поисковые машины и дроны могут использовать для самых разных целей — к примеру, для обхождения препятствий или поиска клиента при доставке посылки.
Несмотря на огромные успехи в этой области, ученые до сих пор фактически ничего не знают о том, как работает зрение человека и животных и как нам удается автоматически классифицировать и распознавать даже те объекты, которые мы никогда раньше не видели.
Поэтому, как рассказывает Казанович, многие особенности человеческого сознания, восприятия реальности и зрения до сих пор остаются загадкой для нейрофизиологов и психологов. К примеру, ученые достаточно давно спорят о том, почему человек очень легко находит «контрастирующие» объекты в огромном множестве непохожих на него других структур, но при этом испытывает сложности при поиске нескольких фигур, запрятанных в небольшом числе похожих на них объектов.
Казанович и его коллега Роман Борисюк сделали большой шаг к решению этой проблемы, создав систему искусственного интеллекта, которая при решении этих задач ведет себя абсолютно таким же образом, что и человек.
Главной ее особенностью, как рассказывают ученые, является то, что она состоит из множества относительно независимых друг от друга структур, так называемых «ансамблей», нейроны в которых вырабатывают особые колебания. Одна из этих структур становится своеобразным «дирижером», который управляет работой остальных «ансамблей» и раздает им задания, а другие ансамбли по сути являются объектами, которые «видит» нейросеть на картинке.
«Ансамбли» постоянно конкурируют друг с другом за влияние на «дирижера» и на работу всей нейросети в целом. То, как протекает эта конкуренция, как показали опыты и расчеты Казановича, почти идеально отражает принцип работы зрения человека и похоже на «скольжение» нашего взгляда по картинке при поиске объектов разной степени «контрастности».
Эта модель, как надеются ученые, поможет нейрофизиологам не только найти аналогичные структуры в мозге человека и обезьян, но и понять, как они работают, что приблизит нас к созданию «естественных» систем машинного зрения.