Разработка
Разработка
Выберите платформу

Обзор функции преобразования текста в речь

Функция преобразования текста в речь (TTS) в Voice SDK использует сервис, основанный на Wit.ai, для создания аудиофайлов из текстовых строк. Настройка TTS осуществляется через единый prefab TTSService, а воспроизведение TTS-клипов в сценах — с помощью скрипта TTSSpeaker.
Чтобы TTS работал стабильно, Voice SDK управляет кэшированием TTS-файлов во время выполнения или по мере необходимости. Если потоковая передача TTS-аудиофайлов не подходит для вашего приложения, вы можете использовать заранее загруженные статические файлы перед сборкой приложения.

Настройка

Чтобы настроить TTS для вашего приложения после импорта плагина, выполните следующие действия:
  1. Откройте сцену, в которой планируется использовать TTS.
  2. Сгенерируйте новую конфигурацию Wit Configuration через меню Meta > Voice SDK > Voice HUB. Убедитесь, что конфигурация успешно обновилась и отображает доступные голоса.
  3. Выберите Assets (Объекты) > Create (Создать) > Voice SDK > TTS > Add Default TTS Setup (Добавить настройку TTS по умолчанию).
  4. В иерархии сцены перейдите в только что созданный игровой объект TTS, чтобы выбрать игровой объект TTSWitService, и настройте инспектор в соответствии с вашими потребностями:
    1. Используйте TTSWit > Request Settings (Настройки запроса) > Configuration (Конфигурация), чтобы выбрать созданный ранее файл Wit Configuration, сгенерированный на шаге 2.
    2. После того как конфигурация настроена, перейдите в раздел Preset Voice Settings (Настройки предустановленных голосов) и настройте все голоса, которые могут использоваться совместно несколькими TTSSpeakers. Подробнее см. в статье Настройка голосов для TTS. TTS Service Settings
    3. В разделе TTS Runtime Cache (Script) настройте параметры автоматической выгрузки клипов из памяти. Подробнее см. в статье Опции кэша TTS.
    4. Если нужно, измените расположение и имя каталога кэша на диске в разделе TTS Disk Cache (Script) (Кэш TTS на диске (скрипт)). TTS Runtime Cache Settings
  5. Переместите или продублируйте объект TTSSpeaker во всех местах приложения, где требуется воспроизведение речи.
  6. Измените каждый TTSSpeaker в инспекторе в соответствии с вашими потребностями:
    1. В разделе Voice Settings (Настройки голоса) выберите Voice Preset (Предустановка голоса) для конкретного динамика или выберите Custom (Пользовательская), чтобы применить настройки для конкретного говорящего.
    2. Настройте AudioSource, чтобы добавить TTSSpeaker в пользовательскую аудиогруппу или переключить звук с 2D на 3D.
  7. С помощью скрипта используйте следующие методы TTSSpeaker для загрузки и воспроизведения текста.
    1. Используйте метод Speak(textToSpeak : string) скрипта TTSSpeaker для запроса и произнесения указанного текста при загрузке.
    2. Используйте метод SpeakQueued(textToSpeak : string) скрипта TTSSpeaker для запроса и произнесения указанного текста.
    3. Отправьте пользовательский скрипт TTSSpeaker в любой метод Speak/SpeakQueued для запроса специфических обратных вызовов событий загрузки и воспроизведения текста.
    4. Используйте метод Stop() скрипта TTSSpeaker, чтобы немедленно остановить загрузку и воспроизведение всех TTS-клипов.
    5. Используйте метод Stop(textToSpeak : string скрипта TTSSpeaker для немедленной остановки загрузки и воспроизведения определенной текстовой строки.
Примечание. Ознакомьтесь с примером реализации TTS в Samples/TTSVoices/TTSVoices.unity.
Логотип навигации
Русский
© 2026 Meta