Google обновляет свой Cloud Speech API

API облачной речи Google, который позволил разработчикам использовать сервисы Google для транскрипции разговорных слов в текст с момента его запуска в 2016 году, сегодня получает большое обновление.

Наиболее интересным из них является добавление поддержки 30 новых языков в дополнение к 89 языкам, которые уже есть в сервисе (хотя, честно говоря, Google включает в себя множество региональных вариантов английского, испанского и арабского языков в общем количестве). Эти новые языки включают такие как: бенгальский, латышский и суахили, и, по словам Google, охватывают около миллиарда спикеров.

Кроме того, Google также представила несколько новых основных функций службы. Среди них — поддержка временных меток на уровне слов. Идея здесь состоит в том, чтобы пометить каждое слово своей меткой времени, чтобы разработчики могли, например, легко позволить своим пользователям слышать, как звучало данное слово. Это особенно интересно для расширенных транскрипционных и переводческих услуг, которые используют этот API для ускорения их рабочих процессов. «Наличие способности сопоставлять звук с текстом с отметками времени значительно сокращает время, затрачиваемое на корректуру расшифровки стенограмм», — говорит соучредитель Happy Scribe, Андре Басти, чья компания использует услугу транскрипции за $ 0,10 за минуту

Продолжительность файлов, которые разработчики загружают в службу, теперь также может составлять до 3 часов — от 80 минут в предыдущей версии. Разработчики могут также запросить расширение квоты для загрузки файлов, которые еще длиннее.

Как и раньше, разработчики могут получить 60 минут бесплатной обработки звука через API речи, и каждые дополнительные 15 секунд оплачиваются в размере 0,006$.

Поделиться в социальных сетях:

Добавить комментарий