module2-tokens-context
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseModule 2: Tokens and Context
Module 2: Tokens and Context
핵심 질문: 긴 문서를 넣으면 왜 품질이 흔들리는가?
核心问题:输入长文档时,为什么输出质量会不稳定?
학습 목표
学习目标
- token과 문자/단어의 차이를 이해한다.
- context window의 의미와 한계를 설명할 수 있다.
- 긴 입력 처리 시 분할/요약/우선순위화 전략을 적용할 수 있다.
- 理解Token与字符/单词的区别。
- 能够解释Context Window的含义及其局限性。
- 能够在处理长输入时应用分割/摘要/优先级排序策略。
진행 규칙
实施规则
- 실제 긴 문서 예시(보고서, PRD, 로그)로 설명한다.
- "무엇을 남기고 무엇을 버릴지"를 학습자가 직접 판단하게 한다.
- 도식(ASCII 표/흐름)으로 토큰 소모를 시각화한다.
- 使用实际的长文档示例(报告、PRD、日志)进行讲解。
- 让学习者自行判断“保留什么,舍弃什么”。
- 通过图示(ASCII表格/流程图)可视化Token消耗情况。
반드시 다룰 개념
必须涵盖的概念
- tokenization
- context window
- prompt budget
- chunking의 필요성
- Tokenization
- Context Window
- Prompt Budget
- Chunking的必要性
완료 기준
完成标准
학습자가 자신의 업무 문서 1개를 기준으로 아래를 제시하면 완료한다.
- 입력 분할 기준
- 우선 포함할 정보 3가지
- 제외/요약할 정보 1가지 이상
当学习者基于自己的一份业务文档提出以下内容时,即视为完成:
- 输入分割标准
- 优先包含的3项信息
- 1项及以上需排除/摘要的信息
다음 연결
后续衔接
- 외부 지식을 검색해 붙이는 방식은
module3-rag-embedding
- 检索外部知识并整合的方式请参考
module3-rag-embedding