Увидеть больше: новейшие технологии компьютерного зрения

1
1
13 ноября 2017

22-27 октября в Италии прошла международная конференция ICCV 2017, посвященная новейшим разработкам в сфере машинного обучения и компьютерного зрения, распознавания и анализа информации. В этой статье мы расскажем о самых свежих и интересных проектах, заявивших о себе на ICCV – и как они повлияют на Digital Signage.

Появилось очень много действительно классных технологий по работе с изображениями. Теперь, к примеру, можно за несколько секунд превратить фотографию со смартфона в профессиональный снимок. Уникальное решение, которое при помощи специального алгоритма качественно улучшает фотографию, самостоятельно меняя параметры детализации, цвета, контрастности. Конечно, на конечный результат влияет и первоначальное качество изображения, однако решение способно преобразить практически любой снимок. Также системы обучились создавать фотореалистичные изображения с чистого листа – просто по заданным параметрам.

Еще одна интересная технология позволяет менять стилистику фотографии в режиме реального времени, используя не только заранее заданные стили, но и загружая новые. Не подходит стилистка «Звездной ночи» Ван Гога? Используйте в качестве шаблона то, что душе угодно, «Крик» Эдварда Мунка, к примеру.

Следующий большой блок решений связан с техниками распознавания – событий на видео, изображений, необычных комбинаций объектов или действий. Так, например, системы научились распознавать сложные сцены внутри видео и находить их по текстовому описанию. Скоро можно будет просто ввести в поиск на YouTube «часть, где появляется Горилла» и быстро получить то, что нужно. Более того, системы стали еще лучше понимать и даже самостоятельно составлять описания к изображениям и видео на естественном языке. Например, не просто «ребенок идет к машине», а «маленькая девочка идет в сторону бежевого минивэна».

Очень интересная технология, которая позволяет искусственному интеллекту понимать необычные комбинации объектов и действий. Так, даже если система никогда не видела «свинью, которая жарит блинчики», она будет в состоянии распознать происходящее, когда встретит подобное изображение, просто сопоставив отдельно заложенную информацию об объектах и действиях.

Появился еще целый пласт технологий, которые расширяют возможности искусственного интеллекта, позволяя системам понимать и отвечать на сложные вопросы, заданные на естественном языке, определять объекты, находящиеся за углом, если они излучают свет, точно считать количество человек на фотографии или определять схему расположения дорог по изображениям с воздуха.

Все эти технологии в самое ближайшее время будут использованы в разных сферах бизнеса – ритейл, автомобилестроение, услуги, рекламный рынок, ИТ. А в сочетании с Digital Signage они дадут мощный толчок к усилению понимания покупательского поведения и персонализации предложений.