Приложение Apple Photos может узнавать людей по лицам и языку тела в будущем

Приложение Apple Photos может улучшить функцию идентификации объекта Faces, не только используя распознавание лиц, но и работая над определением индивидуального языка тела, типичных поз и торса людей.

Более десяти лет с тех пор, как Apple представила функцию распознавания лиц в iPhoto ’09, Apple изучает, как улучшить свою способность определять людей на изображениях. Какой бы умной и полезной ни была функция Faces, ее легко перепутать, и Apple хочет использовать дополнительные детали, такие как язык тела, чтобы отсортировать людей.

«Распознавание людей путем сочетания сигналов лица и тела» — это недавно опубликованная патентная заявка, в которой описываются несколько способов, которыми это можно сделать, и почему это необходимо.

«С распространением мобильных устройств с камерой, пользователи могут делать множество фотографий любого количества людей и объектов в самых разных условиях и географических точках», — говорит Apple. «Однако категоризация и систематизация этих изображений может оказаться сложной задачей».

«Часто распознавание лица используется для идентификации человека по изображениям, но распознавание лица может не работать», — продолжает он, — «например, в случае плохого качества изображения и / или позы человека, например, если человек смотрит в сторону от камеры «.

Так что это наша вина, что наши фотографии затрудняют распознавание лиц. Предлагаемое Apple решение — создать то, что она называет «кластером» характеристик человека, а не только его лица.

«Изображения, снятые в течение определенного периода времени, можно сгруппировать в« моменты », при этом каждый момент представляет собой набор пространственно-временных согласованных изображений», — говорит Apple. «Другими словами,« момент »состоит из изображений, сделанных в одном и том же месте (например, дома, на работе, в ресторане или другом значимом месте) и в одном и том же временном интервале заданной продолжительности».

Например, фотографии, которые вы делаете однажды утром дома, затем анализируются, и данные о каждом человеке на изображении хранятся в том, что Apple называет «многомерным абстрактным пространством встраивания». Это база данных, собранная об этом человеке из этих фотографий.

Деталь из патента, описывающая один рабочий процесс для дополнения распознавания лиц другими характеристиками

«[This is] не только на основе характеристик лица, но и на дополнительных характеристиках тела (например, туловища) людей, изображенных на изображениях, — говорит Apple. — Эти характеристики могут включать, например, форму, текстуру, позу и подобно.»

Однако не все эти характеристики рассматриваются одинаково. «[For instance] Характеристики туловища вряд ли будут одинаковыми в разные моменты … потому что люди меняют одежду в течение нескольких дней, недель, месяцев и т. д., — продолжает Apple.

Таким образом, это лицо остается центральным в обнаружении и каталогизации этого «кластера» информации. Apple говорит о создании кластеров только за один, два или три «момента» снимка, но похоже, что точность тем выше, чем больше изображений нужно использовать.

В этой патентной заявке указаны три изобретателя. В него входит Винай Шарма, чья предыдущая работа включает выданный патент на обучающие системы для улучшения распознавания лиц.