youtube-digest

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

YouTube Digest

YouTube Digest

YouTube 영상 분석 → 요약/인사이트/번역 문서 생성 → 퀴즈 테스트.
YouTube视频分析 → 生成摘要/洞见/翻译文档 → 测验测试。

워크플로우

工作流

1. 메타데이터 수집

1. 元数据采集

bash
scripts/extract_metadata.sh "<URL>"
추출: title, description, channel, upload_date, duration, tags
bash
scripts/extract_metadata.sh "<URL>"
提取内容:title, description, channel, upload_date, duration, tags

2. Transcript 추출

2. Transcript提取

bash
scripts/extract_transcript.sh "<URL>" [output_dir]
우선순위: 수동 자막(ko→en) > 자동 생성 자막(ko→en)
bash
scripts/extract_transcript.sh "<URL>" [output_dir]
优先级:手动字幕(ko→en) > 自动生成字幕(ko→en)

3. 맥락 파악 (WebSearch)

3. 语境确认 (WebSearch)

웹 검색으로 고유명사 정확한 표기 수집:
  • "{영상 제목}" {채널명} summary
  • "{발표자명}" {주제 키워드}
通过网页搜索收集专有名词的准确写法:
  • "{视频标题}" {频道名} summary
  • "{演讲者姓名}" {主题关键词}

4. Transcript 교정

4. Transcript校正

자동 자막의 고유명사 오인식을 웹 검색 결과로 대체:
  • Kora → Cora, cloud code → Claude Code, every → Every.to
使用网页搜索结果替换自动字幕中识别错误的专有名词:
  • Kora → Cora, cloud code → Claude Code, every → Every.to

5. 문서 생성

5. 文档生成

markdown
---
title: {영상 제목}
url: {YouTube URL}
channel: {채널명}
date: {업로드 날짜}
duration: {영상 길이}
processed_at: {처리 일시}
---
markdown
---
title: {视频标题}
url: {YouTube URL}
channel: {频道名}
date: {上传日期}
duration: {视频时长}
processed_at: {处理时间}
---

{영상 제목}

{视频标题}

요약

摘要

{3-5문장 요약 + 주요 포인트 3개}
{3-5句摘要 + 3个核心要点}

인사이트

洞见

핵심 아이디어

核心思路

적용 가능한 점

可应用点

전체 스크립트 (한글 번역)

完整脚本(韩语翻译)

[00:00] ...
undefined
[00:00] ...
undefined

6. 파일 저장

6. 文件存储

위치:
research/readings/youtube/{YYYY-MM-DD}-{sanitized-title}.md
存储路径:
research/readings/youtube/{YYYY-MM-DD}-{sanitized-title}.md

7. 학습 퀴즈

7. 学习测验

3단계 × 3문제 = 총 9문제. AskUserQuestion으로 각 단계 3문제 동시 출제.
단계난이도출제 기준
1기본핵심 인사이트, 주요 개념
2중급인사이트 + 세부 내용 연결
3심화세부 내용, 적용/분석
문제 유형 상세:
references/quiz-patterns.md
3等级 × 3道题 = 共9道题。通过AskUserQuestion同时发布每个等级的3道题。
等级难度出题标准
1基础核心洞见、主要概念
2中级洞见+细节内容关联
3高级细节内容、应用/分析
题型详情:
references/quiz-patterns.md

결과 처리

结果处理

틀린 문제에 대해 정답과 해설 제공 후, 문서 끝에 퀴즈 결과 추가:
markdown
undefined
为答错的题目提供正确答案和解析后,将测验结果添加到文档末尾:
markdown
undefined

퀴즈 결과

测验结果

총점: 7/9 (78%) | 1단계 3/3 ✅ | 2단계 2/3 | 3단계 2/3
总分: 7/9 (78%) | 1级 3/3 ✅ | 2级 2/3 | 3级 2/3

오답 노트

错题本

Q5: {질문}
  • 선택: B → 정답: C
  • {1-2문장 해설}
undefined
Q5: {问题}
  • 选择: B → 正确答案: C
  • {1-2句解析}
undefined

8. 후속 선택

8. 后续选项

퀴즈 완료 후 AskUserQuestion:
  • 한 번 더 퀴즈: 다른 문제로 재테스트
  • Deep Research: 웹 심층 조사 (
    references/deep-research.md
    참조)
  • 종료: 마무리
测验完成后通过AskUserQuestion询问用户:
  • 再做一次测验: 使用其他题目重新测试
  • Deep Research: 网页深度调研(参考
    references/deep-research.md
  • 结束: 完成处理

참고사항

注意事项

자막 언어 우선순위

字幕语言优先级

  1. 한국어 수동 → 2. 영어 수동 → 3. 한국어 자동 → 4. 영어 자동
  1. 韩语手动 → 2. 英语手动 → 3. 韩语自动 → 4. 英语自动

불완전한 자막 처리

不完整字幕处理

  • 고유명사 오인식: 4단계에서 일괄 대체
  • 이해 불가 부분:
    [불명확]
    표시
  • 专有名词识别错误: 第4步统一替换
  • 无法理解的部分: 标注
    [不明]

yt-dlp 옵션

yt-dlp选项

  • --list-subs
    : 자막 목록 확인
  • --cookies-from-browser chrome
    : 로그인 필요 시
  • --list-subs
    : 查看字幕列表
  • --cookies-from-browser chrome
    : 需要登录时使用

리소스

资源

  • scripts/extract_metadata.sh
    - 메타데이터 추출
  • scripts/extract_transcript.sh
    - 자막 추출
  • references/quiz-patterns.md
    - 퀴즈 문제 유형 상세
  • references/deep-research.md
    - Deep Research 워크플로우
  • scripts/extract_metadata.sh
    - 元数据提取
  • scripts/extract_transcript.sh
    - 字幕提取
  • references/quiz-patterns.md
    - 测验题型详情
  • references/deep-research.md
    - Deep Research工作流