Дублинский конференц-центр (Источник: официальный сайт)
Apple является главным спонсором 24-й конференции Interspeech, посвященной вычислениям на разговорном языке, и представит предложения по активации Siri без голосовой команды, а также по улучшению распознавания людей с серьезными нарушениями речи.
Несмотря на то, что Apple отказывается от требования сказать «Привет» перед устным вызовом Siri, ее исследователи в области машинного обучения уже стремятся пойти дальше. На официальной конференции Interspeech в Дублине с 20 по 24 августа 2023 года сотрудники Apple примут участие в дискуссиях, в том числе:
Голосовые помощники без триггеров Spatial Audio Learning Голосовые помощники для людей с дизартричной речью
Голосовые помощники без триггеров звучат как идея, лежащая в основе некоторых патентов Apple о том, что Siri отвечает, когда на нее смотрят. Но Apple утверждает в своем предложении для конференции, что у нас уже есть Siri, способная отвечать без голосовых команд «Siri» или «Привет, Siri».
«[For example, smartwatches] теперь включают в себя методы вызова виртуальных машин без триггеров, такие как Raise To Speak (RTS), когда пользователь поднимает часы и говорит с виртуальными машинами без явного триггера», — говорит Apple. «Современные современные системы RTS полагаться на эвристику и инженерные конечные автоматы для объединения жестов и звуковых данных для мультимодального принятия решений».
«Однако эти методы имеют ограничения, в том числе ограниченную адаптируемость, масштабируемость и вызванные человеческим фактором предубеждения, — продолжает Apple. — В этой работе мы предлагаем мультимодальную систему слияния аудио-жестов на основе нейронной сети, которая… данные жестов».
Дизартричная речь
Дизартрия — это состояние, при котором мышцы, используемые для речи, ослаблены из-за множества различных состояний, и говорить становится значительно труднее.
«Мы предлагаем персонализированную систему распознавания фраз на основе запросов по примерам, которая обучается с использованием небольших объемов речи, не зависит от языка, не использует традиционный лексикон произношения и хорошо обобщает серьезность различий речи», — говорится в предложении Apple. которые будут представлены на конференции.
«На внутреннем наборе данных, собранном у 32 человек с дизартрией, этот подход работает независимо от степени тяжести, — продолжает Apple, — и показывает улучшение припоминания на 60% по сравнению с коммерческой системой распознавания речи».
Перед конференцией
Apple также является одной из многих компаний, спонсирующих Семинар молодых женщин-исследователей речи, который проводится за день до конференции в субботу, 19 августа 2023 года.
«Семинар направлен на повышение интереса к исследованиям в нашей области среди женщин, которые еще не решили получить докторскую степень в области речевых наук или технологий, — говорится на официальном сайте, — но которые уже получили исследовательский опыт в своих университетах в индивидуальном или групповом порядке». проекты».
Этот семинар будет проходить в престижном Дублинском Тринити-колледже. 24-я конференция Interspeech проходит в конференц-центре Дублина.