Loading...
Loading...
Compare original and translation side by side
1. Check captions: yt-dlp --list-subs "URL"
2. Has caption → Use /omnicaptions:download to get existing captions (better quality)
3. No caption → Transcribe directly with URL (don't download first!)1. 检查字幕:yt-dlp --list-subs "URL"
2. 已有字幕 → 使用 /omnicaptions:download 获取现有字幕(质量更高)
3. 无字幕 → 直接通过链接进行转录(无需先下载!)undefinedundefined
**Note**: Output defaults to current directory unless user specifies `-o`.
**注意**:除非用户通过`-o`指定,否则输出文件默认保存至当前目录。/omnicaptions:download/omnicaptions:download| Method | Description |
|---|---|
| Transcribe file or URL (sync) |
| Translate captions |
| Save text to file |
| 方法 | 描述 |
|---|---|
| 转录文件或链接(同步) |
| 翻译字幕 |
| 将文本保存至文件 |
pip install omni-captions-skillspip install omni-captions-skillsGEMINI_API_KEY.env~/.config/omnicaptions/config.jsonPlease enter your Gemini API key (get from https://aistudio.google.com/apikey):-k <key>GEMINI_API_KEY.env~/.config/omnicaptions/config.json请输入您的Gemini API密钥(获取地址:https://aistudio.google.com/apikey):-k <密钥>transcribetranslateconvertundefinedtranscribetranslateconvertundefined
| Option | Description |
|--------|-------------|
| `-k, --api-key` | Gemini API key (auto-prompted if missing) |
| `-o, --output` | Output file or directory (default: auto) |
| `-m, --model` | Model (default: gemini-3-flash-preview) |
| `-l, --language` | Force language (zh, en, ja) |
| `-t, --translate LANG` | Translate to language (one-step) |
| `--bilingual` | Bilingual output (with -t) |
| `-v, --verbose` | Verbose output |
| 参数 | 描述 |
|--------|-------------|
| `-k, --api-key` | Gemini API密钥(若缺失将自动提示输入) |
| `-o, --output` | 输出文件或目录(默认:自动生成) |
| `-m, --model` | 使用的模型(默认:gemini-3-flash-preview) |
| `-l, --language` | 强制指定语言(zh、en、ja) |
| `-t, --translate LANG` | 转录并翻译为指定语言(一步完成) |
| `--bilingual` | 生成双语字幕(需配合-t参数使用) |
| `-v, --verbose` | 输出详细日志 |-t <lang> --bilingualomnicaptions transcribe video.mp4 -t zh --bilingual-t <目标语言> --bilingualomnicaptions transcribe video.mp4 -t zh --bilingualundefinedundefined
Key features:
- `## [HH:MM:SS] Title` chapter headers
- `**Speaker:**` labels (auto-detected)
- `[HH:MM:SS]` timestamp at paragraph end
- `[Event]` for non-speech (laughter, music)
核心特性:
- 以 `## [HH:MM:SS] 标题` 格式作为章节标题
- 自动识别并添加 `**说话人:**` 标签
- 段落末尾添加 `[HH:MM:SS]` 时间戳
- 用 `[事件]` 标注非语音内容(如笑声、音乐)| Mistake | Fix |
|---|---|
| No API key error | Use |
| Empty response | Check file format (mp3/mp4/wav/m4a supported) |
| Upload timeout | File too large (>2GB); split first |
| Wrong language | Use |
| 问题 | 解决方法 |
|---|---|
| 无API密钥错误 | 使用 |
| 无返回结果 | 检查文件格式(支持mp3/mp4/wav/m4a) |
| 上传超时 | 文件过大(超过2GB);请先分割文件 |
| 语言识别错误 | 使用 |
| Skill | Use When |
|---|---|
| Convert output to SRT/VTT/ASS |
| Translate (Gemini API or Claude native) |
| Download video/audio first |
| 功能 | 适用场景 |
|---|---|
| 将输出转换为SRT/VTT/ASS格式 |
| 翻译字幕(支持Gemini API或原生Claude) |
| 先下载视频/音频文件 |
undefinedundefined
> **Note**: For translation, use `/omnicaptions:translate` (default: Claude, optional: Gemini API)
> **注意**:如需翻译字幕,请使用 `/omnicaptions:translate`(默认使用Claude,可选Gemini API)