alicloud-ai-entry-modelstudio
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseCategory: task
分类:任务
阿里云 Model Studio 入口(路由)
阿里云 Model Studio 入口(路由)
将需求路由到已存在的本仓库技能,避免重复模型/参数内容。
将需求路由到已存在的本仓库技能,避免重复模型/参数内容。
Prerequisites
前置条件
- 安装 SDK(建议在虚拟环境中,避免 PEP 668 限制):
bash
python3 -m venv .venv
. .venv/bin/activate
python -m pip install dashscope- 配置 (环境变量优先;或在
DASHSCOPE_API_KEY里设置~/.alibabacloud/credentials)dashscope_api_key
- 安装 SDK(建议在虚拟环境中,避免 PEP 668 限制):
bash
python3 -m venv .venv
. .venv/bin/activate
python -m pip install dashscope- 配置 (环境变量优先;或在
DASHSCOPE_API_KEY里设置~/.alibabacloud/credentials)dashscope_api_key
路由表(当前仓库已支持)
路由表(当前仓库已支持)
| 需求 | 目标技能 |
|---|---|
| 文生图 / 图像生成 | |
| 图像编辑 | |
| 文生视频 / 图生视频(i2v) | |
| 参考生视频(r2v) | |
| 语音合成(TTS) | |
| 实时语音合成 | |
| 音色复刻(Voice Clone) | |
| 音色设计(Voice Design) | |
| 向量检索 | |
| 文档理解 | |
| 模型清单抓取/更新 | |
| 需求 | 目标技能 |
|---|---|
| 文生图 / 图像生成 | |
| 图像编辑 | |
| 文生视频 / 图生视频(i2v) | |
| 参考生视频(r2v) | |
| 语音合成(TTS) | |
| 实时语音合成 | |
| 音色复刻(Voice Clone) | |
| 音色设计(Voice Design) | |
| 向量检索 | |
| 文档理解 | |
| 模型清单抓取/更新 | |
不匹配时
不匹配时
- 先澄清模型能力或输入输出类型。
- 若仓库缺少对应能力,建议新增技能后再执行。
- 先澄清模型能力或输入输出类型。
- 若仓库缺少对应能力,建议新增技能后再执行。
本仓库暂缺的常见能力(可优先补齐)
本仓库暂缺的常见能力(可优先补齐)
-
文本生成/对话(LLM)与多模态理解
-
文本/多模态向量与 Rerank
-
ASR 语音识别/转写/翻译
-
视频编辑(风格/口型/剪辑)
-
多模态/ASR 下载失败:优先用上面的公开 URL。
-
ASR 参数报错:使用的 data URI。
input_audio.data -
多模态向量 400:确认是数组。
input.contents
-
文本生成/对话(LLM)与多模态理解
-
文本/多模态向量与 Rerank
-
ASR 语音识别/转写/翻译
-
视频编辑(风格/口型/剪辑)
-
多模态/ASR 下载失败:优先用上面的公开 URL。
-
ASR 参数报错:使用的 data URI。
input_audio.data -
多模态向量 400:确认是数组。
input.contents
异步任务轮询模板(视频/长耗时任务)
异步任务轮询模板(视频/长耗时任务)
当 返回 时,用以下方式轮询:
X-DashScope-Async: enabletask_idGET https://dashscope.aliyuncs.com/api/v1/tasks/<task_id>
Authorization: Bearer $DASHSCOPE_API_KEY结果字段示例(成功):
{
"output": {
"task_status": "SUCCEEDED",
"video_url": "https://..."
}
}说明:
- 轮询间隔建议 15–20 秒,最多 10 次。
- 成功后下载 。
output.video_url
当 返回 时,用以下方式轮询:
X-DashScope-Async: enabletask_idGET https://dashscope.aliyuncs.com/api/v1/tasks/<task_id>
Authorization: Bearer $DASHSCOPE_API_KEY结果字段示例(成功):
{
"output": {
"task_status": "SUCCEEDED",
"video_url": "https://..."
}
}说明:
- 轮询间隔建议 15–20 秒,最多 10 次。
- 成功后下载 。
output.video_url
选择问题(不确定时提问)
确认问题(不确定时提问)
- 你要处理的是文本、图片、音频还是视频?
- 这是“生成”还是“编辑/理解/检索”?
- 是否需要语音(TTS/ASR)或向量检索(Embedding/Rerank)?
- 你要直接运行 SDK 脚本,还是只需要 API/参数说明?
- 你要处理的是文本、图片、音频还是视频?
- 这是“生成”还是“编辑/理解/检索”?
- 是否需要语音(TTS/ASR)或向量检索(Embedding/Rerank)?
- 你要直接运行 SDK 脚本,还是只需要 API/参数说明?
参考
参考
-
模型清单与链接:
output/alicloud-model-studio-models-summary.md -
具体 API/参数/示例:对应子技能的与
SKILL.mdreferences/*.md -
官方文档来源清单:
references/sources.md
-
模型清单与链接:
output/alicloud-model-studio-models-summary.md -
具体 API/参数/示例:对应子技能的与
SKILL.mdreferences/*.md -
官方文档来源清单:
references/sources.md