Программы для расшифровки аудиозаписей в текст
Желание сэкономить на услугах транскрипторов подталкивает пользователей искать в сети готовые бесплатные программы по переводу аудио в текст. Такие программы, действительно, есть. Самые распространенные из них:
- Цезарь;
- ExpressScribe;
- DragonDictate и производные «Комбат», «Диктант», «Горыныч».
Как только обычный человек для своих бытовых нужд пытается воспользоваться подобной программой, его ожидает сюрприз. Ни одна из них не в состоянии сразу передать в тексте 100% смысл речи, распознать все слова и разделить (при надобности) выступления разных людей по лицам.
Дело в том, что пока не создали единую универсальную программу, которая бы справлялась с расшифровкой аудио в текст лучше и быстрее, чем человек.
Каждую программу необходимо для эффективной работы усовершенствовать «под себя»: настроить тембр (чтобы лучше распознавала ваш голос), поработать с фильтрами шумоочистки, пополнить электронный словарь новыми словами и т.д. И все равно, даже при минимальном присутствии посторонних звуков в аудио нет гарантии того, что программа преобразует речь в текст без ошибок. Необходима постоянная проверка, и, конечно, не обойтись без финальной корректировки.
Таким образом, включая время на подстройку программы, бесчисленные остановки записи и проверку записанного, конечную корректировку текста, вы потратите на перевод аудио в текст с помощью программы в два-три раза больше времени, чем если бы записывали текст вручную. Это и есть второй сюрприз от программ-переводчиков: они вовсе не экономят время расшифровки.
Как выгодно использовать программы перевода аудио в текст?
Эффективность использования данных программ зависит от исходных данных:
- вида аудиозаписи (речь одного человека или запись конференции с несколькими участниками);
- качества записи (слышимость голосов, наличие посторонних шумов);
- потребности в аудиометках, тайминге и пр.;
- языке воспроизведения.
Например, если вам необходимо транскрибировать аудиозапись собственной речи, вы вполне можете воспользоваться русскими бесплатными программами типа «Горыныча». Только учтите, что вначале придется повозиться с настройками программ, чтобы их максимально адаптировать под тембр своего голоса. А еще придется потратить время на тщательную проверку и коррекцию готового текста.
Если стоит задача перевести в текст аудиозапись конференции, семинара или другого мероприятия с голосами нескольких участников; если требуется проставить тайм-метки и определить владельца каждого голоса, наиболее подойдет транскрибатор «Цезарь». Но он платный. Эту программу для оптимизации процессов расшифровок используют профессионалы в Аудиобюро. Но даже она не заменяет полностью человеческого участия. Некоторые фрагменты приходится прослушивать несколько раз, чтобы уловить точный эмоциональный посыл и максимально корректно отобразить в тексте смысл сообщения.
Для расшифровки английской речи в текст можно воспользоваться помощью DragonDictate(русский язык программа не распознает). Однако, даже этот перевод нуждается в тщательной финальной корректировке.
Несколько слов о трудоемкости процесса расшифровки аудио
На сегодняшний день самым актуальным способом расшифровки является труд людей-стенографистов. Никакие программы не способны полностью заменить профессионалов в этом виде услуг. Некоторые записи плохого качества даже самые хорошие программы вообще не могут расшифровать. Приходится трудится над такими записями по несколько часов (а то и дней) команде профессионалов с тонким слухом.
Сам процесс расшифровки (даже с использованием программ-помощников) забирает раза в 2-3 больше времени, чем длительность самой звукозаписи. Это при условии хорошего качества звука и четкости голосов.
Обычному пользователю сети без опыта расшифровщика для того, чтобы качественно перевести звук в текст с помощью программ требуется потратить очень много времени и сил. Которые можно использовать гораздо эффективней, если заказать транскрибацию в Аудиобюро.