Обзор функции преобразования текста в речь

Функция преобразования текста в речь (TTS) в Voice SDK использует сервис, основанный на Wit.ai, для создания аудиофайлов из текстовых строк. Настройка TTS осуществляется через единый prefab TTSService, а воспроизведение TTS-клипов в сценах — с помощью скрипта TTSSpeaker.

Чтобы TTS работал стабильно, Voice SDK управляет кэшированием TTS-файлов во время выполнения или по мере необходимости. Если потоковая передача TTS-аудиофайлов не подходит для вашего приложения, вы можете использовать заранее загруженные статические файлы перед сборкой приложения.

Настройка

Чтобы настроить TTS для вашего приложения после импорта плагина, выполните следующие действия:

Откройте сцену, в которой планируется использовать TTS.

Сгенерируйте новую конфигурацию Wit Configuration через меню Meta > Voice SDK > Voice HUB. Убедитесь, что конфигурация успешно обновилась и отображает доступные голоса.

Выберите Assets (Объекты) > Create (Создать) > Voice SDK > TTS > Add Default TTS Setup (Добавить настройку TTS по умолчанию).

В иерархии сцены перейдите в только что созданный игровой объект TTS, чтобы выбрать игровой объект TTSWitService, и настройте инспектор в соответствии с вашими потребностями:

Используйте TTSWit > Request Settings (Настройки запроса) > Configuration (Конфигурация), чтобы выбрать созданный ранее файл Wit Configuration, сгенерированный на шаге 2.

После того как конфигурация настроена, перейдите в раздел Preset Voice Settings (Настройки предустановленных голосов) и настройте все голоса, которые могут использоваться совместно несколькими TTSSpeakers. Подробнее см. в статье Настройка голосов для TTS. TTS Service Settings

В разделе TTS Runtime Cache (Script) настройте параметры автоматической выгрузки клипов из памяти. Подробнее см. в статье Опции кэша TTS.

Если нужно, измените расположение и имя каталога кэша на диске в разделе TTS Disk Cache (Script) (Кэш TTS на диске (скрипт)). TTS Runtime Cache Settings

Переместите или продублируйте объект TTSSpeaker во всех местах приложения, где требуется воспроизведение речи.

Измените каждый TTSSpeaker в инспекторе в соответствии с вашими потребностями:

В разделе Voice Settings (Настройки голоса) выберите Voice Preset (Предустановка голоса) для конкретного динамика или выберите Custom (Пользовательская), чтобы применить настройки для конкретного говорящего.

Настройте AudioSource, чтобы добавить TTSSpeaker в пользовательскую аудиогруппу или переключить звук с 2D на 3D.

С помощью скрипта используйте следующие методы TTSSpeaker для загрузки и воспроизведения текста.

Используйте метод Speak(textToSpeak : string) скрипта TTSSpeaker для запроса и произнесения указанного текста при загрузке.

Используйте метод SpeakQueued(textToSpeak : string) скрипта TTSSpeaker для запроса и произнесения указанного текста.

Отправьте пользовательский скрипт TTSSpeaker в любой метод Speak/SpeakQueued для запроса специфических обратных вызовов событий загрузки и воспроизведения текста.

Используйте метод Stop() скрипта TTSSpeaker, чтобы немедленно остановить загрузку и воспроизведение всех TTS-клипов.

Используйте метод Stop(textToSpeak : string скрипта TTSSpeaker для немедленной остановки загрузки и воспроизведения определенной текстовой строки.

Примечание. Ознакомьтесь с примером реализации TTS в Samples/TTSVoices/TTSVoices.unity.