Skip to main content

Каждый должен использовать персональный голос |  Мужчина записывает на айфон

Хотя Personal Voice был одной из самых захватывающих функций доступности, которые Apple объявила на этой неделе, вы, возможно, подумали, что это не имеет отношения к большинству людей. Но в сегодняшнем новом отчете говорится, что мы все должны воспользоваться этим, когда выйдет iOS 17.

Это связано с тем, что потеря речи может произойти очень внезапно из-за таких заболеваний, как БАС (боковой амиотрофический склероз). К тому времени, когда люди поймут, что им нужен синтезированный голос, который звучит как они сами, может быть уже слишком поздно…

От роботизированного голоса Стивена Хокинга до голосового банкинга

Мы все знакомы с синтезатором речи, которым пользовался покойный Стивен Хокинг. Он мог выбирать слова и фразы, которые произносились бы вслух, но очень механическим голосом.

Следующим важным достижением стала более естественная речь, подобная той, которую использует Siri.

Но лучший вариант для тех, кто больше не может говорить четко или вообще не может, — это голос, который звучит так же, как ваш.

Это возможно с помощью технологии, известной как голосовой банкинг. Ваш голос записывается, когда вы произносите набор фраз, и компьютерная система создает голос, который звучит точно так же, как ваш, изучая тембр, акцент, интонацию и ритм вашей речи.

Голосовой банкинг в настоящее время занимает недели

Обычный голосовой банкинг — трудоемкий процесс. Обычно для этого требуется, чтобы вы произнесли около 1500 фраз, и это может быть дорого и отнимать много времени.

Филип Грин, директор некоммерческой организации, занимающейся проблемами БАС, рассказал FastCo, что голосовой банкинг занял у него несколько недель.

Четыре года назад, когда Филип Грин поставил себе голос, ему пришлось записать 1500 фраз в учебных целях, и на это у него ушло несколько недель. Таким образом, он понимает, почему другие могут избегать столкновения с ним.

«Честно говоря, у вас на уме гораздо больше вещей, чем «О, я должен потратить время на сохранение версии моего голоса, которая может мне понадобиться через два года, шесть месяцев или четыре года», — говорит Грин, член совета директоров Team Gleason, некоммерческой организации, которая обслуживает людей с БАС.

Team Gleason была основана бывшим игроком New Orleans Saints Стивом Глисоном после того, как ему поставили диагноз БАС в 2011 году.

Грин продолжает:

— Ты действительно не думаешь об этом. Но то, что мы пытаемся сделать, это сделать людей осведомленными. Сделай это, как только узнаешь [your diagnosis]потому что это, по сути, страховой полис, которым, как вы надеетесь, вам не придется пользоваться».

Когда люди могут использовать голос, похожий на их собственный, это может стать глубоко значимой частью опыта. «Я хочу, чтобы моя семья слышала мой синтетический голос и не думала, что я робот», — объясняет Грин. «Но что я тот же человек, что и до моего диагноза».

В некоторых случаях вы можете потерять способность использовать свой голос еще до того, как узнаете причину.

Моя мама скончалась в декабре после короткой семимесячной борьбы с БАС. Ее голос был одной из первых вещей, которые она потеряла. На самом деле, к тому времени, когда ей официально поставили диагноз БАС, ее голос уже практически исчез.

Персональный голос работает за 15 минут

Чего Apple добилась с Personal Voice, так это использования мощной системы искусственного интеллекта для выполнения процесса голосового банкинга всего за 15 минут.

Пользователи могут создать персональный голос, прочитав вместе с рандомизированным набором текстовых подсказок, чтобы записать 15 минут аудио на iPhone или iPad. Эта функция доступности речи использует машинное обучение на устройстве для обеспечения конфиденциальности и безопасности информации пользователей и легко интегрируется с Live Speech, чтобы пользователи могли говорить своим личным голосом при общении с близкими.

Вся обработка происходит на вашем устройстве

Одна из проблем, связанных с обычным голосовым банкингом, заключается в том, что он выполняется на сервере. Если этот сервер будет взломан, это создаст риск того, что кто-то завладеет вашим голосовым файлом и сможет совершать телефонные звонки, которые звучат так же, как вы.

Руководитель Apple по доступности Сара Херрлингер говорит, что компания очень внимательно относилась к такого рода рискам, поэтому вся обработка происходит локально на вашем собственном устройстве с использованием Neural Engine.

«Наряду с доступностью, одной из наших основных корпоративных ценностей, является конфиденциальность, и мы не считаем, что нужно отказываться от одного, чтобы получить другое», — говорит Херрлингер.

Каждый должен использовать персональный голос

Персональный голос не только сокращает время и усилия для тех, у кого уже диагностировано заболевание, которое, как известно, приводит к потере речи, но и является достаточно безболезненным, поэтому каждому имеет смысл сделать это в качестве страхового полиса.

Исполнительный директор Salesforce Брук Эби соглашается.

После того, как ей поставили диагноз БАС, Эби отправилась в Instagram и TikTok, чтобы поделиться своим путешествием, рассказать другим о БАС и, в целом, заставить мир более комфортно говорить о болезни и ее последствиях для тех, у кого она есть.

Разговаривая с другими участниками сообщества, «я постоянно слышу: «Хотел бы я поскорее перейти на голосовой банк», — говорит она. «Некоторые люди внезапно начинают просто невнятно произносить слова, и тогда становится слишком поздно голосовать. Они такие: «Неважно, это все равно не похоже на меня, так что я мог бы просто использовать [generic] голос робота».

Я обязательно этим займусь, а вы?

Фото: Soundtrap/Unsplash