Skip to main content

Транскрипция аудио MacWhisper

Мне нравится, когда статья, написанная одним из моих коллег, предупреждает меня о приложении, которое затем оказывается невероятно полезным, что и произошло, когда я прочитал статью Филипе о транскрипции аудио MacWhisper.

Сочетание моего подхода к кинопроизводству с использованием ремней и подтяжек и МакВиспера спасло тот день, когда видеозапись была почти испорчена какими-то выбившимися волосами…

В настоящее время я работаю над короткометражным безбюджетным документальным фильмом об аргентинском танго, в котором около дюжины человек рассказывают о том, почему они танцуют и как это изменило их как людей.

Формат представляет собой смесь интервью и танцевальных кадров, причем интервью сняты в гостиной моей квартиры. Часть интервью будет транслироваться на камеру, а большая часть будет транслироваться под танцевальные кадры.

Для звука я использую петличные микрофоны для интервьюируемых, а беспроводные передатчики передают звук прямо на камеру. Но, будучи твердым сторонником подхода «ремни и подтяжки», я также записываю отдельную звуковую дорожку на отдельный диктофон.

В одном из интервью возникла проблема с оригинальным звуком, которую можно было бы легко исправить, если бы она была очевидна сразу. Я мог бы просто отключить звук камеры, а затем использовать функцию автоматической синхронизации Final Cut Pro для синхронизации отдельной звуковой дорожки с видео и редактирования составного клипа.

Но проблема была довольно тонкой, и я не услышал ее, пока большая часть редактирования не была завершена. Волосы интервьюируемой иногда ударялись о микрофон, прикрепленный к ее блузке, создавая легкие «щелкающие» звуки. Они были настолько тихими, что я не услышал их во время монтажа, и я подозреваю, что большинство людей даже не заметили бы этого, но этого было достаточно, чтобы беспокоить меня, когда я позже просматривал отснятый материал.

На тот момент было уже слишком поздно синхронизировать отдельный аудиофайл, поскольку редактирование включало разделение интервью примерно на миллиард составных частей и использование фрагментов продолжительностью около 20 секунд из интервью продолжительностью столько же минут.

Что мне нужно было сделать, так это найти соответствующий звук в 20-минутном файле. Это был бы очень утомительный процесс, особенно потому, что в некоторых случаях я использовал половину предложения из одного раздела и объединял его с половиной предложения из другого. (Конечно, интервьюируемые должны были одобрить мои правки, чтобы убедиться, что они довольны тем, что я точно передал их мысли.)

Но запуск аудиофайла через MacWhisper означал, что всего через 90 секунд у меня была полная расшифровка с отметкой времени. Затем я мог найти фразу, использованную при редактировании, и сразу же перейти к этой части аудиофайла, чтобы заменить ею оригинал. Несколько изменений на уровне кадра позволили добиться правильной синхронизации видео и звука по губам. Весь процесс занял всего несколько минут. (Кстати, только мне или другим сложно определить, опережает ли звук видео или наоборот, когда оно отстает всего на два-три кадра?)

В любом подобном проекте в будущем получение этой расшифровки будет первым, что я сделаю, поскольку это также ускорило бы идентификацию клипов, которые я хотел использовать в первую очередь. Если вы работаете с аудио или видео, очень рекомендую. В бесплатной версии было все, что мне нужно, но я купил обновление Pro в качестве небольшой благодарности разработчику.

Аудиотранскрипция MacWhisper доступна как в бесплатной, так и в платной (разовая покупка за 25 долларов США) версиях.