Skip to main content

Дублинский конференц-центр (Источник: официальный сайт)

Apple является главным спонсором 24-й конференции Interspeech, посвященной вычислениям на разговорном языке, и представит предложения по активации Siri без голосовой команды, а также по улучшению распознавания людей с серьезными нарушениями речи.

Несмотря на то, что Apple отказывается от требования сказать «Привет» перед устным вызовом Siri, ее исследователи в области машинного обучения уже стремятся пойти дальше. На официальной конференции Interspeech в Дублине с 20 по 24 августа 2023 года сотрудники Apple примут участие в дискуссиях, в том числе:

Голосовые помощники без триггеров Spatial Audio Learning Голосовые помощники для людей с дизартричной речью

Голосовые помощники без триггеров звучат как идея, лежащая в основе некоторых патентов Apple о том, что Siri отвечает, когда на нее смотрят. Но Apple утверждает в своем предложении для конференции, что у нас уже есть Siri, способная отвечать без голосовых команд «Siri» или «Привет, Siri».

«[For example, smartwatches] теперь включают в себя методы вызова виртуальных машин без триггеров, такие как Raise To Speak (RTS), когда пользователь поднимает часы и говорит с виртуальными машинами без явного триггера», — говорит Apple. «Современные современные системы RTS полагаться на эвристику и инженерные конечные автоматы для объединения жестов и звуковых данных для мультимодального принятия решений».

«Однако эти методы имеют ограничения, в том числе ограниченную адаптируемость, масштабируемость и вызванные человеческим фактором предубеждения, — продолжает Apple. — В этой работе мы предлагаем мультимодальную систему слияния аудио-жестов на основе нейронной сети, которая… данные жестов».

Дизартричная речь

Дизартрия — это состояние, при котором мышцы, используемые для речи, ослаблены из-за множества различных состояний, и говорить становится значительно труднее.

«Мы предлагаем персонализированную систему распознавания фраз на основе запросов по примерам, которая обучается с использованием небольших объемов речи, не зависит от языка, не использует традиционный лексикон произношения и хорошо обобщает серьезность различий речи», — говорится в предложении Apple. которые будут представлены на конференции.

«На внутреннем наборе данных, собранном у 32 человек с дизартрией, этот подход работает независимо от степени тяжести, — продолжает Apple, — и показывает улучшение припоминания на 60% по сравнению с коммерческой системой распознавания речи».

Перед конференцией

Apple также является одной из многих компаний, спонсирующих Семинар молодых женщин-исследователей речи, который проводится за день до конференции в субботу, 19 августа 2023 года.

«Семинар направлен на повышение интереса к исследованиям в нашей области среди женщин, которые еще не решили получить докторскую степень в области речевых наук или технологий, — говорится на официальном сайте, — но которые уже получили исследовательский опыт в своих университетах в индивидуальном или групповом порядке». проекты».

Этот семинар будет проходить в престижном Дублинском Тринити-колледже. 24-я конференция Interspeech проходит в конференц-центре Дублина.