Skip to main content

Приложение Apple Photos может улучшить функцию идентификации объекта Faces, не только используя распознавание лиц, но и работая над определением индивидуального языка тела, типичных поз и торса людей.

Более десяти лет с тех пор, как Apple представила функцию распознавания лиц в iPhoto ’09, Apple изучает, как улучшить свою способность определять людей на изображениях. Какой бы умной и полезной ни была функция Faces, ее легко перепутать, и Apple хочет использовать дополнительные детали, такие как язык тела, чтобы отсортировать людей.

«Распознавание людей путем сочетания сигналов лица и тела» — это недавно опубликованная патентная заявка, в которой описываются несколько способов, которыми это можно сделать, и почему это необходимо.

«С распространением мобильных устройств с камерой, пользователи могут делать множество фотографий любого количества людей и объектов в самых разных условиях и географических точках», — говорит Apple. «Однако категоризация и систематизация этих изображений может оказаться сложной задачей».

«Часто распознавание лица используется для идентификации человека по изображениям, но распознавание лица может не работать», — продолжает он, — «например, в случае плохого качества изображения и / или позы человека, например, если человек смотрит в сторону от камеры «.

Так что это наша вина, что наши фотографии затрудняют распознавание лиц. Предлагаемое Apple решение — создать то, что она называет «кластером» характеристик человека, а не только его лица.

«Изображения, снятые в течение определенного периода времени, можно сгруппировать в« моменты », при этом каждый момент представляет собой набор пространственно-временных согласованных изображений», — говорит Apple. «Другими словами,« момент »состоит из изображений, сделанных в одном и том же месте (например, дома, на работе, в ресторане или другом значимом месте) и в одном и том же временном интервале заданной продолжительности».

Например, фотографии, которые вы делаете однажды утром дома, затем анализируются, и данные о каждом человеке на изображении хранятся в том, что Apple называет «многомерным абстрактным пространством встраивания». Это база данных, собранная об этом человеке из этих фотографий.

Деталь из патента, описывающая один рабочий процесс для дополнения распознавания лиц другими характеристиками

Деталь из патента, описывающая один рабочий процесс для дополнения распознавания лиц другими характеристиками

«[This is] не только на основе характеристик лица, но и на дополнительных характеристиках тела (например, туловища) людей, изображенных на изображениях, — говорит Apple. — Эти характеристики могут включать, например, форму, текстуру, позу и подобно.»

Однако не все эти характеристики рассматриваются одинаково. «[For instance] Характеристики туловища вряд ли будут одинаковыми в разные моменты … потому что люди меняют одежду в течение нескольких дней, недель, месяцев и т. д., — продолжает Apple.

Таким образом, это лицо остается центральным в обнаружении и каталогизации этого «кластера» информации. Apple говорит о создании кластеров только за один, два или три «момента» снимка, но похоже, что точность тем выше, чем больше изображений нужно использовать.

В этой патентной заявке указаны три изобретателя. В него входит Винай Шарма, чья предыдущая работа включает выданный патент на обучающие системы для улучшения распознавания лиц.