Loading...
Loading...
将文本合成为语音(TTS)。使用火山引擎豆包语音合成 API,支持流式合成、多种音色、语速/音调/音量调节、Markdown 过滤和 LaTeX 公式播报。当用户需要把文字转成语音、生成朗读音频、配音、旁白、播报,或提到「文字转语音」「TTS」「语音合成」「朗读」「配音」时使用本技能。
npx skill4agent add volcengine/agentkit-samples byted-text-to-speechMODEL_SPEECH_API_KEYreferences/setup-guide.md| 参数 | 简写 | 必填 | 说明 |
|---|---|---|---|
| | 是 | 要合成的文本内容 |
| | 否 | 输出音频文件路径(默认自动生成) |
| | 否 | 发音人,默认 |
| 否 | 音频格式: | |
| 否 | 采样率,如 16000、24000(默认 24000) | |
| 否 | 语速 [-50, 100],100 代表 2.0 倍速,-50 代表 0.5 倍速,默认 0 | |
| 否 | 音调 [-12, 12],默认 0 | |
| 否 | 音量 [-50, 100],100 代表 2.0 倍音量,-50 代表 0.5 倍音量,默认 0 | |
| 否 | 比特率,对 mp3 和 ogg_opus 格式生效(如 64000、128000),默认 64000 | |
| 否 | 过滤 markdown 语法(如 | |
| 否 | 启用 LaTeX 公式播报(使用 latex_parser v2,自动开启 markdown 过滤),默认关闭 |
status"success""error"local_pathformaterrorlocal_pathPermissionError: MODEL_SPEECH_API_KEY ... 需在环境变量中配置MODEL_SPEECH_API_KEYreferences/setup-guide.mdreferences/docs-index.mdreferences/setup-guide.mdreferences/docs-index.md# 基本用法
python scripts/text_to_speech.py -t "欢迎使用火山引擎语音合成服务。"
# 指定发音人与输出格式
python scripts/text_to_speech.py -t "这是一段测试语音。" -s zh_female_vv_uranus_bigtts -o output.mp3 --format mp3
# 指定语速与采样率
python scripts/text_to_speech.py -t "语速和音调可调。" --speech-rate 10 --sample-rate 16000