youtube-digest
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseYouTube Digest
YouTube Digest
YouTube 영상 분석 → 요약/인사이트/번역 문서 생성 → 퀴즈 테스트.
YouTube视频分析 → 生成摘要/洞见/翻译文档 → 测验测试。
워크플로우
工作流
1. 메타데이터 수집
1. 元数据采集
bash
scripts/extract_metadata.sh "<URL>"추출: title, description, channel, upload_date, duration, tags
bash
scripts/extract_metadata.sh "<URL>"提取内容:title, description, channel, upload_date, duration, tags
2. Transcript 추출
2. Transcript提取
bash
scripts/extract_transcript.sh "<URL>" [output_dir]우선순위: 수동 자막(ko→en) > 자동 생성 자막(ko→en)
bash
scripts/extract_transcript.sh "<URL>" [output_dir]优先级:手动字幕(ko→en) > 自动生成字幕(ko→en)
3. 맥락 파악 (WebSearch)
3. 语境确认 (WebSearch)
웹 검색으로 고유명사 정확한 표기 수집:
"{영상 제목}" {채널명} summary"{발표자명}" {주제 키워드}
通过网页搜索收集专有名词的准确写法:
"{视频标题}" {频道名} summary"{演讲者姓名}" {主题关键词}
4. Transcript 교정
4. Transcript校正
자동 자막의 고유명사 오인식을 웹 검색 결과로 대체:
- Kora → Cora, cloud code → Claude Code, every → Every.to
使用网页搜索结果替换自动字幕中识别错误的专有名词:
- Kora → Cora, cloud code → Claude Code, every → Every.to
5. 문서 생성
5. 文档生成
markdown
---
title: {영상 제목}
url: {YouTube URL}
channel: {채널명}
date: {업로드 날짜}
duration: {영상 길이}
processed_at: {처리 일시}
---markdown
---
title: {视频标题}
url: {YouTube URL}
channel: {频道名}
date: {上传日期}
duration: {视频时长}
processed_at: {处理时间}
---{영상 제목}
{视频标题}
요약
摘要
{3-5문장 요약 + 주요 포인트 3개}
{3-5句摘要 + 3个核心要点}
인사이트
洞见
핵심 아이디어
核心思路
적용 가능한 점
可应用点
전체 스크립트 (한글 번역)
完整脚本(韩语翻译)
[00:00] ...
undefined[00:00] ...
undefined6. 파일 저장
6. 文件存储
위치:
research/readings/youtube/{YYYY-MM-DD}-{sanitized-title}.md存储路径:
research/readings/youtube/{YYYY-MM-DD}-{sanitized-title}.md7. 학습 퀴즈
7. 学习测验
3단계 × 3문제 = 총 9문제. AskUserQuestion으로 각 단계 3문제 동시 출제.
| 단계 | 난이도 | 출제 기준 |
|---|---|---|
| 1 | 기본 | 핵심 인사이트, 주요 개념 |
| 2 | 중급 | 인사이트 + 세부 내용 연결 |
| 3 | 심화 | 세부 내용, 적용/분석 |
문제 유형 상세:
references/quiz-patterns.md3等级 × 3道题 = 共9道题。通过AskUserQuestion同时发布每个等级的3道题。
| 等级 | 难度 | 出题标准 |
|---|---|---|
| 1 | 基础 | 核心洞见、主要概念 |
| 2 | 中级 | 洞见+细节内容关联 |
| 3 | 高级 | 细节内容、应用/分析 |
题型详情:
references/quiz-patterns.md결과 처리
结果处理
틀린 문제에 대해 정답과 해설 제공 후, 문서 끝에 퀴즈 결과 추가:
markdown
undefined为答错的题目提供正确答案和解析后,将测验结果添加到文档末尾:
markdown
undefined퀴즈 결과
测验结果
총점: 7/9 (78%) | 1단계 3/3 ✅ | 2단계 2/3 | 3단계 2/3
总分: 7/9 (78%) | 1级 3/3 ✅ | 2级 2/3 | 3级 2/3
오답 노트
错题本
Q5: {질문}
- 선택: B → 정답: C
- {1-2문장 해설}
undefinedQ5: {问题}
- 选择: B → 正确答案: C
- {1-2句解析}
undefined8. 후속 선택
8. 后续选项
퀴즈 완료 후 AskUserQuestion:
- 한 번 더 퀴즈: 다른 문제로 재테스트
- Deep Research: 웹 심층 조사 (참조)
references/deep-research.md - 종료: 마무리
测验完成后通过AskUserQuestion询问用户:
- 再做一次测验: 使用其他题目重新测试
- Deep Research: 网页深度调研(参考)
references/deep-research.md - 结束: 完成处理
참고사항
注意事项
자막 언어 우선순위
字幕语言优先级
- 한국어 수동 → 2. 영어 수동 → 3. 한국어 자동 → 4. 영어 자동
- 韩语手动 → 2. 英语手动 → 3. 韩语自动 → 4. 英语自动
불완전한 자막 처리
不完整字幕处理
- 고유명사 오인식: 4단계에서 일괄 대체
- 이해 불가 부분: 표시
[불명확]
- 专有名词识别错误: 第4步统一替换
- 无法理解的部分: 标注
[不明]
yt-dlp 옵션
yt-dlp选项
- : 자막 목록 확인
--list-subs - : 로그인 필요 시
--cookies-from-browser chrome
- : 查看字幕列表
--list-subs - : 需要登录时使用
--cookies-from-browser chrome
리소스
资源
- - 메타데이터 추출
scripts/extract_metadata.sh - - 자막 추출
scripts/extract_transcript.sh - - 퀴즈 문제 유형 상세
references/quiz-patterns.md - - Deep Research 워크플로우
references/deep-research.md
- - 元数据提取
scripts/extract_metadata.sh - - 字幕提取
scripts/extract_transcript.sh - - 测验题型详情
references/quiz-patterns.md - - Deep Research工作流
references/deep-research.md