Skip to main content

В macOS есть несколько предложений для расшифровки аудио, некоторые из которых более продвинуты, чем другие.

Живая транскрипция речи или транскрипция уже существующих аудиофайлов со временем становится все более продвинутой. Вот лучшие варианты на Mac и способы их использования.

Транскрипция аудио может стать абсолютным кошмаром работы, когда приходится ставить на паузу, воспроизводить, перематывать и перепроверять каждый слог каждого слова, сказанного в аудиозаписи. Живая речь может быть еще хуже, поскольку вы можете не захотеть или не сможете просить кого-то повторяться бесконечно. Какими бы ни были ваши причины, вам доступно несколько вариантов расшифровки речи на Mac.

Транскрибируйте аудио с помощью Siri

У диктовки с помощью Siri есть свои недостатки.

У диктовки с помощью Siri есть свои недостатки.

Опция, доступная вам прямо из коробки, — Siri. Вы можете использовать Siri на любом Mac для расшифровки живого потока звука, поступающего через ваш микрофон. Однако сначала вам необходимо включить эту функцию.

Как включить диктовку с помощью Siri:

Откройте системные настройки. Войдите в меню настроек клавиатуры. Под «Диктовкой» отметьте опцию, чтобы включить диктовку. Установите предпочитаемый язык. Выберите ярлык для включения диктовки, который по умолчанию будет двойным нажатием клавиши управления.

Если диктовка через Siri включена, в некоторых случаях на вашем Mac, где вы можете печатать, вы можете нажать ярлык, и Siri начнет расшифровывать за вас. Заметные исключения из того, где Siri может печатать за вас, включают определенные веб-страницы в браузерах, отличных от Safari, например Документы Google в Google Chrome.

Что касается точности, Siri обычно может понять, что вы говорите, и диктовка хорошо сохраняется на нескольких языках. В чем Siri действительно отстает, так это в пунктуации, поскольку Siri расшифровывает большую часть речи как одну непрерывную строку текста. Хотя использование Siri может быть удобным, чтобы не набирать большой блок текста, если вы не хотите вслух указывать каждый знак пунктуации, возможно, вам лучше использовать приложение для транскрипции на основе искусственного интеллекта.

Транскрипция на основе искусственного интеллекта

На вашем Mac вы можете использовать две службы транскрипции на основе искусственного интеллекта: Otter.ai и Whisper Transcription. Обе службы позволяют пользователям самостоятельно записывать и расшифровывать аудио или импортировать аудиофайлы для расшифровки. Кроме того, обе службы имеют платные премиум-опции, которые позволяют вам подключать определенные приложения, такие как Slack или Zoom, для расшифровки звука во время звонков.

В обоих приложениях, чем чище аудиофайл, который вы предоставите, тем лучше будут ваши результаты. С расшифровкой звука, который вы вводите вживую, оба приложения работают очень хорошо. В целом оба приложения хорошо справляются с точным определением слов и соблюдением пунктуации. Однако у каждой услуги есть свои плюсы.

Пунктуационные способности OpenAI Whisper совершенно безупречны.

Пунктуационные способности OpenAI Whisper совершенно безупречны.

Whisper, созданный OpenAI, имеет явное преимущество: он позволяет вам транскрибировать аудио практически на любом языке, который вам когда-либо понадобится. На данный момент Otter может транскрибировать только английский язык. Преимущества более высокой точности и точной пунктуации, которые сервис уже имеет по сравнению с Siri, сохраняются и на других языках. Если вы хотите точно расшифровать неанглоязычный звук, Whisper, безусловно, лучший вариант, доступный на Mac. Приложение Whisper Transcription можно загрузить из Apple App Store.

Первоначальный пас Оттера может быть немного неточным с точки зрения точности.

Первоначальный пас Оттера может быть немного неточным с точки зрения точности.

Ключевым преимуществом Otter является его склонность к использованию в бизнесе. Звук, записанный в Otter, может различать говорящих, а также отмечать время записи. Otter также предлагает транскрипцию в режиме реального времени, которая оказывается на удивление точной. Транскрипция, приведенная после того, как Оттеру дали некоторое время, чтобы обработать звук, становится еще более точной, особенно с пунктуацией.

Пересмотренный проход Оттера очень точен, особенно с учетом временных меток и ярлыков говорящих.

Пересмотренный проход Оттера очень точен, особенно с учетом временных меток и ярлыков говорящих.

Взлом аудио

Последний вариант, доступный пользователям Mac для транскрипции звука, — Audio Hijack. Audio Hijack — это в первую очередь приложение для записи звука, но оно также имеет функцию транскрипции, основанную на Whisper Transcription от OpenAI. Audio Hijack может записывать и, в свою очередь, расшифровывать любой звук, воспроизводимый на вашем Mac.

Используя Whisper OpenAI, Audio Hijack может обеспечить точную транскрипцию. Единственная проблема, с которой некоторые пользователи могут столкнуться при использовании Audio Hijack, — это установка самого приложения. Для установки необходимо изменить настройки в режиме восстановления вашего Mac, что для некоторых пользователей может быть слишком долгим.

Независимо от того, каковы ваши потребности в транскрипции аудио, есть варианты, которые могут удовлетворить ваши потребности. У вас есть выбор: между точной транскрипцией за пределами английского языка или транскрипцией встречи с несколькими докладчиками.