Apple работает над тем, как читать сообщения iMessage голосом отправителя

Сообщения

В новой патентной заявке Apple описывается преобразование iMessage в голосовую заметку, воспроизводимую голосом, созданным пользователем с использованием образцов голоса отправителя.

Пользователи Apple уже могут отправлять аудиозаписи в iMessage или заставлять Siri читать им текстовые сообщения, но в патенте описывается способ заставить устройство читать текстовое сообщение голосом отправителя вместо Siri, используя голосовой файл.

«Голосовая модель предоставляется второму электронному устройству», — говорится в патенте. «В некоторых примерах сообщение принимается от соответствующего пользователя второго электронного устройства».

Это означает, что когда кто-то отправляет iMessage, он может прикрепить голосовой файл, который будет храниться на устройстве. Если это произойдет, получателю будет предложено решить, хотят ли они получать и сообщение, и голосовую запись.

«В ответ на получение сообщения будет получена голосовая модель соответствующего пользователя», — говорится в патенте. «На основе модели голоса предоставляется аудиовыход, соответствующий полученному сообщению».

Согласно патенту, рассматриваемый iPhone затем создаст профиль, подобный Siri, для голоса отправителя, а затем имитирует его при чтении этого сообщения и любых будущих сообщений, которые они получат от этого отправителя. Модель имитации голоса также может быть отправлена сама по себе, чтобы контакты человека могли загрузить ее перед сообщениями.

Это будет предлагать больше персонализации, когда друзья и семья переписываются друг с другом, вместо того, чтобы слышать голос Siri, когда она читает сообщения. Пары также могли слышать сообщения более личным образом, например, слышать «Я люблю тебя» голосом своего партнера.

Изобретателями патента являются Qiong Hi, Jiangchuan Li и David A. Winarsky. Винарски — директор Apple по технологии преобразования текста в речь, Ли — старший инженер-программист Siri для машинного обучения в Apple, а Ху ранее работал над Siri в компании.

Как обычно, с патентами это не обязательно станет реальностью, но это возможно, учитывая недавнюю работу Apple с искусственным интеллектом и голосами. Например, в iOS 11 Apple переключила голос Siri с использования записей голосовых актеров на модель преобразования текста в речь с использованием машинного обучения.

В 2020 году Apple приобрела компанию Voysis, которая работала над улучшением обработки естественного языка в виртуальных помощниках. Они использовали технологию WaveNet, которая была представлена программой Google DeepMind в 2016 году.

WaveNets — это «глубокие генеративные модели необработанных аудиосигналов», которые можно использовать для генерации речи, имитирующей любой человеческий голос.

Apple также начала использовать искусственный интеллект для озвучивания определенных жанров аудиокниг вместо людей. Таким образом, патент полностью относится к возможности того, что устройство Apple в конечном итоге научится читать сообщения человеческим голосом.