rag-architect

Compare original and translation side by side

🇺🇸

Original

English

🇨🇳

Translation

Chinese

RAG Architect - POWERFUL

RAG架构师 - 功能强大

Overview

概述

The RAG (Retrieval-Augmented Generation) Architect skill provides comprehensive tools and knowledge for designing, implementing, and optimizing production-grade RAG pipelines. This skill covers the entire RAG ecosystem from document chunking strategies to evaluation frameworks, enabling you to build scalable, efficient, and accurate retrieval systems.

RAG（Retrieval-Augmented Generation，检索增强生成）架构师技能为设计、实现和优化生产级RAG流水线提供全面的工具和知识。该技能涵盖从文档分块策略到评估框架的整个RAG生态系统，助力您构建可扩展、高效且准确的检索系统。

Core Competencies

核心能力

1. Document Processing & Chunking Strategies

1. 文档处理与分块策略

Fixed-Size Chunking

固定大小分块

Character-based chunking: Simple splitting by character count (e.g., 512, 1024, 2048 chars)
Token-based chunking: Splitting by token count to respect model limits
Overlap strategies: 10-20% overlap to maintain context continuity
Pros: Predictable chunk sizes, simple implementation, consistent processing time
Cons: May break semantic units, context boundaries ignored
Best for: Uniform documents, when consistent chunk sizes are critical

基于字符的分块：按字符数简单拆分（如512、1024、2048字符）
基于Token的分块：按Token数拆分，以适配模型限制
重叠策略：10-20%的重叠率，保持上下文连续性
优势：分块大小可预测，实现简单，处理时间一致
劣势：可能破坏语义单元，忽略上下文边界
适用场景：格式统一的文档，对分块大小一致性要求较高时

Sentence-Based Chunking

基于句子的分块

Sentence boundary detection: Using NLTK, spaCy, or regex patterns
Sentence grouping: Combining sentences until size threshold is reached
Paragraph preservation: Avoiding mid-paragraph splits when possible
Pros: Preserves natural language boundaries, better readability
Cons: Variable chunk sizes, potential for very short/long chunks
Best for: Narrative text, articles, books

句子边界检测：使用NLTK、spaCy或正则表达式
句子组合：合并句子直至达到大小阈值
段落保留：尽可能避免在段落中间拆分
优势：保留自然语言边界，可读性更好
劣势：分块大小可变，可能出现极短或极长的分块
适用场景：叙事文本、文章、书籍

Paragraph-Based Chunking

基于段落的分块

Paragraph detection: Double newlines, HTML tags, markdown formatting
Hierarchical splitting: Respecting document structure (sections, subsections)
Size balancing: Merging small paragraphs, splitting large ones
Pros: Preserves logical document structure, maintains topic coherence
Cons: Highly variable sizes, may create very large chunks
Best for: Structured documents, technical documentation

段落检测：通过双换行符、HTML标签、Markdown格式识别
分层拆分：尊重文档结构（章节、子章节）
大小平衡：合并小段落，拆分大段落
优势：保留文档逻辑结构，维持主题连贯性
劣势：分块大小差异极大，可能产生超大分块
适用场景：结构化文档、技术文档

Semantic Chunking

语义分块

Topic modeling: Using TF-IDF, embeddings similarity for topic detection
Heading-aware splitting: Respecting document hierarchy (H1, H2, H3)
Content-based boundaries: Detecting topic shifts using semantic similarity
Pros: Maintains semantic coherence, respects document structure
Cons: Complex implementation, computationally expensive
Best for: Long-form content, technical manuals, research papers

主题建模：使用TF-IDF、嵌入相似度进行主题检测
标题感知拆分：尊重文档层级（H1、H2、H3）
基于内容的边界：通过语义相似度检测主题转换
优势：维持语义连贯性，尊重文档结构
劣势：实现复杂，计算成本高
适用场景：长篇内容、技术手册、研究论文

Recursive Chunking

递归分块

Hierarchical approach: Try larger chunks first, recursively split if needed
Multi-level splitting: Different strategies at different levels
Size optimization: Minimize number of chunks while respecting size limits
Pros: Optimal chunk utilization, preserves context when possible
Cons: Complex logic, potential performance overhead
Best for: Mixed content types, when chunk count optimization is important

分层方法：先尝试大分块，必要时递归拆分
多级拆分：不同层级采用不同策略
大小优化：在适配大小限制的前提下，尽量减少分块数量
优势：分块利用率最优，尽可能保留上下文
劣势：逻辑复杂，可能存在性能开销
适用场景：混合类型内容，需要优化分块数量时

Document-Aware Chunking

文档感知分块

File type detection: PDF pages, Word sections, HTML elements
Metadata preservation: Headers, footers, page numbers, sections
Table and image handling: Special processing for non-text elements
Pros: Preserves document structure and metadata
Cons: Format-specific implementation required
Best for: Multi-format document collections, when metadata is important

文件类型检测：PDF页面、Word章节、HTML元素
元数据保留：页眉、页脚、页码、章节信息
表格与图片处理：对非文本元素进行特殊处理
优势：保留文档结构与元数据
劣势：需要针对特定格式实现
适用场景：多格式文档集合，元数据较为重要时

2. Embedding Model Selection

2. 嵌入模型选择

Dimension Considerations

维度考量

128-256 dimensions: Fast retrieval, lower memory usage, suitable for simple domains
512-768 dimensions: Balanced performance, good for most applications
1024-1536 dimensions: High quality, better for complex domains, higher cost
2048+ dimensions: Maximum quality, specialized use cases, significant resources

128-256维度：检索速度快，内存占用低，适用于简单领域
512-768维度：性能均衡，适合大多数应用
1024-1536维度：质量高，更适用于复杂领域，成本更高
2048+维度：质量最优，用于特殊场景，资源消耗大

Speed vs Quality Tradeoffs

速度与质量的权衡

Fast models: sentence-transformers/all-MiniLM-L6-v2 (384 dim, ~14k tokens/sec)
Balanced models: sentence-transformers/all-mpnet-base-v2 (768 dim, ~2.8k tokens/sec)
Quality models: text-embedding-ada-002 (1536 dim, OpenAI API)
Specialized models: Domain-specific fine-tuned models

快速模型：sentence-transformers/all-MiniLM-L6-v2（384维度，约14k Token/秒）
均衡模型：sentence-transformers/all-mpnet-base-v2（768维度，约2.8k Token/秒）
高质量模型：text-embedding-ada-002（1536维度，OpenAI API）
专用模型：针对特定领域微调的模型

Model Categories

模型分类

General purpose: all-MiniLM, all-mpnet, Universal Sentence Encoder
Code embeddings: CodeBERT, GraphCodeBERT, CodeT5
Scientific text: SciBERT, BioBERT, ClinicalBERT
Multilingual: LaBSE, multilingual-e5, paraphrase-multilingual

通用型：all-MiniLM、all-mpnet、Universal Sentence Encoder
代码嵌入：CodeBERT、GraphCodeBERT、CodeT5
科学文本：SciBERT、BioBERT、ClinicalBERT
多语言：LaBSE、multilingual-e5、paraphrase-multilingual

3. Vector Database Selection

3. 向量数据库选择

Pinecone

Managed service: Fully hosted, auto-scaling
Features: Metadata filtering, hybrid search, real-time updates
Pricing: $70/month for 1M vectors (1536 dim), pay-per-use scaling
Best for: Production applications, when managed service is preferred
Cons: Vendor lock-in, costs can scale quickly

托管服务：全托管，自动扩容
功能：元数据过滤、混合搜索、实时更新
定价：100万向量（1536维度）每月70美元，按使用量扩容付费
适用场景：生产应用，偏好托管服务时
劣势：供应商锁定，成本可能快速增长

Weaviate

Open source: Self-hosted or cloud options available
Features: GraphQL API, multi-modal search, automatic vectorization
Scaling: Horizontal scaling, HNSW indexing
Best for: Complex data types, when GraphQL API is preferred
Cons: Learning curve, requires infrastructure management

开源：支持自托管或云部署
功能：GraphQL API、多模态搜索、自动向量化
扩容：水平扩容，HNSW索引
适用场景：复杂数据类型，偏好GraphQL API时
劣势：学习曲线较陡，需要管理基础设施

Qdrant

Rust-based: High performance, low memory footprint
Features: Payload filtering, clustering, distributed deployment
API: REST and gRPC interfaces
Best for: High-performance requirements, resource-constrained environments
Cons: Smaller community, fewer integrations

基于Rust开发：高性能，内存占用低
功能：负载过滤、聚类、分布式部署
API：REST和gRPC接口
适用场景：高性能需求，资源受限环境
劣势：社区规模较小，集成工具较少

Chroma

Embedded database: SQLite-based, easy local development
Features: Collections, metadata filtering, persistence
Scaling: Limited, suitable for prototyping and small deployments
Best for: Development, testing, small-scale applications
Cons: Not suitable for production scale

嵌入式数据库：基于SQLite，本地开发便捷
功能：集合管理、元数据过滤、持久化
扩容：能力有限，适合原型开发和小型部署
适用场景：开发、测试、小型应用
劣势：不适用于生产级规模

pgvector (PostgreSQL)

pgvector（PostgreSQL）

SQL integration: Leverage existing PostgreSQL infrastructure
Features: ACID compliance, joins with relational data, mature ecosystem
Performance: ivfflat and HNSW indexing, parallel query processing
Best for: When you already use PostgreSQL, need ACID compliance
Cons: Requires PostgreSQL expertise, less specialized than purpose-built DBs

SQL集成：利用现有PostgreSQL基础设施
功能：ACID合规，可与关系型数据关联，生态成熟
性能：ivfflat和HNSW索引，并行查询处理
适用场景：已使用PostgreSQL，需要ACID合规时
劣势：需要PostgreSQL专业知识，专用性不及原生向量数据库

4. Retrieval Strategies

4. 检索策略

Dense Retrieval

密集检索

Semantic similarity: Using embedding cosine similarity
Advantages: Captures semantic meaning, handles paraphrasing well
Limitations: May miss exact keyword matches, requires good embeddings
Implementation: Vector similarity search with k-NN or ANN algorithms

语义相似度：使用嵌入余弦相似度
优势：捕捉语义含义，能很好地处理转述
局限性：可能遗漏精确关键词匹配，依赖高质量嵌入
实现方式：基于k-NN或ANN算法的向量相似度搜索

Sparse Retrieval

稀疏检索

Keyword-based: TF-IDF, BM25, Elasticsearch
Advantages: Exact keyword matching, interpretable results
Limitations: Misses semantic similarity, vulnerable to vocabulary mismatch
Implementation: Inverted indexes, term frequency analysis

基于关键词：TF-IDF、BM25、Elasticsearch
优势：精确关键词匹配，结果可解释
局限性：无法捕捉语义相似度，易受词汇不匹配影响
实现方式：倒排索引、词频分析

Hybrid Retrieval

混合检索

Combination approach: Dense + sparse retrieval with score fusion
Fusion strategies: Reciprocal Rank Fusion (RRF), weighted combination
Benefits: Combines semantic understanding with exact matching
Complexity: Requires tuning fusion weights, more complex infrastructure

组合方式：密集检索+稀疏检索，结合分数融合
融合策略：Reciprocal Rank Fusion（RRF）、加权组合
优势：结合语义理解与精确匹配
复杂度：需要调优融合权重，基础设施更复杂

Reranking

重排序

Two-stage approach: Initial retrieval followed by reranking
Reranking models: Cross-encoders, specialized reranking transformers
Benefits: Higher precision, can use more sophisticated models for final ranking
Tradeoff: Additional latency, computational cost

两阶段方式：先检索再重排序
重排序模型：Cross-encoders、专用重排序Transformer
优势：精度更高，可使用更复杂的模型进行最终排序
权衡：增加延迟与计算成本

5. Query Transformation Techniques

5. 查询转换技术

HyDE (Hypothetical Document Embeddings)

HyDE（假设文档嵌入）

Approach: Generate hypothetical answer, embed answer instead of query
Benefits: Improves retrieval by matching document style rather than query style
Implementation: Use LLM to generate hypothetical document, embed that
Use cases: When queries and documents have different styles

方法：生成假设答案，对答案而非查询进行嵌入
优势：通过匹配文档风格而非查询风格提升检索效果
实现方式：使用LLM生成假设文档，再对其进行嵌入
适用场景：查询与文档风格不同时

Multi-Query Generation

多查询生成

Approach: Generate multiple query variations, retrieve for each, merge results
Benefits: Increases recall, handles query ambiguity
Implementation: LLM generates 3-5 query variations, deduplicate results
Considerations: Higher cost and latency due to multiple retrievals

方法：生成多个查询变体，分别检索后合并结果
优势：提高召回率，处理查询歧义
实现方式：LLM生成3-5个查询变体，去重结果
注意事项：多次检索会增加成本与延迟

Step-Back Prompting

退阶提示（Step-Back Prompting）

Approach: Generate broader, more general version of specific query
Benefits: Retrieves more general context that helps answer specific questions
Implementation: Transform "What is the capital of France?" to "What are European capitals?"
Use cases: When specific questions need general context

方法：将特定查询转换为更宽泛、通用的版本
优势：检索有助于回答特定问题的通用上下文
实现方式：将“法国的首都是什么？”转换为“欧洲的首都有哪些？”
适用场景：特定问题需要通用上下文时

6. Context Window Optimization

6. 上下文窗口优化

Dynamic Context Assembly

动态上下文组装

Relevance-based ordering: Most relevant chunks first
Diversity optimization: Avoid redundant information
Token budget management: Fit within model context limits
Hierarchical inclusion: Include summaries before detailed chunks

基于相关性排序：最相关的分块排在前面
多样性优化：避免冗余信息
Token预算管理：控制在模型上下文限制内
分层纳入：在详细分块前先加入摘要

Context Compression

上下文压缩

Summarization: Compress less relevant chunks while preserving key information
Key information extraction: Extract only relevant facts/entities
Template-based compression: Use structured formats to reduce token usage
Selective inclusion: Include only chunks above relevance threshold

摘要：压缩相关性较低的分块，同时保留关键信息
关键信息提取：仅提取相关事实/实体
基于模板的压缩：使用结构化格式减少Token使用
选择性纳入：仅纳入相关性超过阈值的分块

7. Evaluation Frameworks

7. 评估框架

Faithfulness Metrics

忠实度指标

Definition: How well generated answers are grounded in retrieved context
Measurement: Fact verification against source documents
Implementation: NLI models to check entailment between answer and context
Threshold: >90% for production systems

定义：生成的答案在多大程度上基于检索到的上下文
测量方式：与源文档进行事实验证
实现方式：使用NLI模型检查答案与上下文之间的蕴含关系
阈值：生产系统需>90%

Relevance Metrics

Context Precision & Recall

上下文精确率与召回率

Precision@K: Percentage of top-K results that are relevant
Recall@K: Percentage of relevant documents found in top-K results
Mean Reciprocal Rank (MRR): Average of reciprocal ranks of first relevant result
NDCG@K: Normalized Discounted Cumulative Gain at K

Precision@K：前K个结果中相关结果的占比
Recall@K：在前K个结果中找到的相关文档占比
Mean Reciprocal Rank (MRR)：第一个相关结果的倒数排名的平均值
NDCG@K：K值下的归一化折损累积增益

End-to-End Metrics

端到端指标

RAGAS: Comprehensive RAG evaluation framework
Correctness: Factual accuracy of generated answers
Completeness: Coverage of all relevant aspects
Consistency: Consistency across multiple runs with same query

RAGAS：全面的RAG评估框架
正确性：生成答案的事实准确性
完整性：对所有相关方面的覆盖程度
一致性：相同查询多次运行结果的一致性

8. Production Patterns

8. 生产模式

Caching Strategies

缓存策略

Query-level caching: Cache results for identical queries
Semantic caching: Cache for semantically similar queries
Chunk-level caching: Cache embedding computations
Multi-level caching: Redis for hot queries, disk for warm queries

查询级缓存：缓存相同查询的结果
语义缓存：缓存语义相似查询的结果
分块级缓存：缓存嵌入计算结果
多级缓存：Redis存储热门查询，磁盘存储温查询

Streaming Retrieval

流式检索

Progressive loading: Stream results as they become available
Incremental generation: Generate answers while still retrieving
Real-time updates: Handle document updates without full reprocessing
Connection management: Handle client disconnections gracefully

渐进式加载：结果可用时立即流式返回
增量生成：在检索过程中同时生成答案
实时更新：无需全量重新处理即可处理文档更新
连接管理：优雅处理客户端断开连接的情况

Fallback Mechanisms

fallback机制

Graceful degradation: Fallback to simpler retrieval if primary fails
Cache fallbacks: Serve stale results when retrieval is unavailable
Alternative sources: Multiple vector databases for redundancy
Error handling: Comprehensive error recovery and user communication

优雅降级：主检索失败时 fallback 到更简单的检索方式
缓存 fallback：检索不可用时返回过期结果
备选数据源：多个向量数据库实现冗余
错误处理：全面的错误恢复与用户沟通机制

9. Cost Optimization

9. 成本优化

Embedding Cost Management

嵌入成本管理

Batch processing: Batch documents for embedding to reduce API costs
Caching strategies: Cache embeddings to avoid recomputation
Model selection: Balance cost vs quality for embedding models
Update optimization: Only re-embed changed documents

批量处理：批量处理文档嵌入以降低API成本
缓存策略：缓存嵌入结果避免重复计算
模型选择：平衡嵌入模型的成本与质量
更新优化：仅重新嵌入修改过的文档

Vector Database Optimization

向量数据库优化

Index optimization: Choose appropriate index types for use case
Compression: Use quantization to reduce storage costs
Tiered storage: Hot/warm/cold data strategies
Resource scaling: Auto-scaling based on query patterns

索引优化：为使用场景选择合适的索引类型
压缩：使用量化技术降低存储成本
分层存储：热/温/冷数据策略
资源扩容：根据查询模式自动扩容

Query Optimization

查询优化

Query routing: Route simple queries to cheaper methods
Result caching: Avoid repeated expensive retrievals
Batch querying: Process multiple queries together when possible
Smart filtering: Use metadata filters to reduce search space

查询路由：将简单查询路由到成本更低的方法
结果缓存：避免重复执行昂贵的检索
批量查询：尽可能批量处理多个查询
智能过滤：使用元数据过滤缩小搜索范围

10. Guardrails & Safety

10. 防护与安全

Content Filtering

内容过滤

Toxicity detection: Filter harmful or inappropriate content
PII detection: Identify and handle personally identifiable information
Content validation: Ensure retrieved content meets quality standards
Source verification: Validate document authenticity and reliability

毒性检测：过滤有害或不当内容
PII检测：识别并处理个人可识别信息
内容验证：确保检索到的内容符合质量标准
来源验证：验证文档的真实性与可靠性

Query Safety

查询安全

Injection prevention: Prevent malicious query injection attacks
Rate limiting: Prevent abuse and ensure fair usage
Query validation: Sanitize and validate user inputs
Access controls: Ensure users can only access authorized content

注入防护：防止恶意查询注入攻击
速率限制：防止滥用，确保公平使用
查询验证：清理并验证用户输入
访问控制：确保用户仅能访问授权内容

Response Safety

响应安全

Hallucination detection: Identify when model generates unsupported claims
Confidence scoring: Provide confidence levels for generated responses
Source attribution: Always provide sources for factual claims
Uncertainty handling: Gracefully handle cases where answer is uncertain

幻觉检测：识别模型生成无依据声明的情况
置信度评分：为生成的响应提供置信度等级
来源归因：对事实性声明始终提供来源
不确定性处理：优雅处理无法确定答案的情况

Implementation Best Practices

实现最佳实践

Development Workflow

开发流程

Requirements gathering: Understand use case, scale, and quality requirements
Data analysis: Analyze document corpus characteristics
Prototype development: Build minimal viable RAG pipeline
Chunking optimization: Test different chunking strategies
Retrieval tuning: Optimize retrieval parameters and thresholds
Evaluation setup: Implement comprehensive evaluation metrics
Production deployment: Scale-ready implementation with monitoring

需求收集：理解使用场景、规模与质量要求
数据分析：分析文档语料库特征
原型开发：构建最小可行RAG流水线
分块优化：测试不同分块策略
检索调优：优化检索参数与阈值
评估设置：实现全面的评估指标
生产部署：具备扩容能力的实现方案与监控

Monitoring & Observability

监控与可观测性

Query analytics: Track query patterns and performance
Retrieval metrics: Monitor precision, recall, and latency
Generation quality: Track faithfulness and relevance scores
System health: Monitor database performance and availability
Cost tracking: Monitor embedding and vector database costs

查询分析：跟踪查询模式与性能
检索指标：监控精确率、召回率与延迟
生成质量：跟踪忠实度与相关性评分
系统健康：监控数据库性能与可用性
成本跟踪：监控嵌入与向量数据库成本

Maintenance & Updates

维护与更新

Document refresh: Handle new documents and updates
Index maintenance: Regular vector database optimization
Model updates: Evaluate and migrate to improved models
Performance tuning: Continuous optimization based on usage patterns
Security updates: Regular security assessments and updates

文档刷新：处理新文档与更新
索引维护：定期优化向量数据库
模型更新：评估并迁移到更优模型
性能调优：基于使用模式持续优化
安全更新：定期进行安全评估与更新

Common Pitfalls & Solutions

常见陷阱与解决方案

Poor Chunking Strategy

分块策略不佳

Problem: Chunks break mid-sentence or lose context
Solution: Use boundary-aware chunking with overlap

问题：分块在句子中间断开或丢失上下文
解决方案：使用感知边界的分块策略并设置重叠

Low Retrieval Precision

检索精确率低

Problem: Retrieved chunks are not relevant to query
Solution: Improve embedding model, add reranking, tune similarity threshold

问题：检索到的分块与查询不相关
解决方案：改进嵌入模型、添加重排序、调优相似度阈值

High Latency

延迟过高

Problem: Slow retrieval and generation
Solution: Optimize vector indexing, implement caching, use faster embedding models

问题：检索与生成速度慢
解决方案：优化向量索引、实现缓存、使用更快的嵌入模型

Inconsistent Quality

质量不一致

Problem: Variable answer quality across different queries
Solution: Implement comprehensive evaluation, add quality scoring, improve fallbacks

问题：不同查询的答案质量差异大
解决方案：实现全面评估、添加质量评分、改进fallback机制

Scalability Issues

扩展性问题

Problem: System doesn't scale with increased load
Solution: Implement proper caching, database sharding, and auto-scaling

问题：系统无法随负载增加而扩容
解决方案：实现合理缓存、数据库分片与自动扩容

Conclusion

总结

Building effective RAG systems requires careful consideration of each component in the pipeline. The key to success is understanding the tradeoffs between different approaches and choosing the right combination of techniques for your specific use case. Start with simple approaches and gradually add sophistication based on evaluation results and production requirements.

This skill provides the foundation for making informed decisions throughout the RAG development lifecycle, from initial design to production deployment and ongoing maintenance.

构建高效的RAG系统需要仔细考量流水线中的每个组件。成功的关键在于理解不同方法之间的权衡，并为特定使用场景选择合适的技术组合。从简单方法入手，根据评估结果与生产需求逐步增加复杂度。

该技能为RAG开发生命周期的各个阶段提供了决策基础，从初始设计到生产部署及后续维护。

rag-architect

Original

Translation

RAG Architect - POWERFUL

RAG架构师 - 功能强大

Overview

概述

Core Competencies

核心能力

1. Document Processing & Chunking Strategies

1. 文档处理与分块策略

Fixed-Size Chunking

固定大小分块

Sentence-Based Chunking

基于句子的分块

Paragraph-Based Chunking

基于段落的分块

Semantic Chunking

语义分块

Recursive Chunking

递归分块

Document-Aware Chunking

文档感知分块

2. Embedding Model Selection

2. 嵌入模型选择

Dimension Considerations

维度考量

Speed vs Quality Tradeoffs

速度与质量的权衡

Model Categories

模型分类

3. Vector Database Selection

3. 向量数据库选择

Pinecone

Pinecone

Weaviate

Weaviate

Qdrant

Qdrant

Chroma

Chroma

pgvector (PostgreSQL)

pgvector（PostgreSQL）

4. Retrieval Strategies

4. 检索策略

Dense Retrieval

密集检索

Sparse Retrieval

稀疏检索

Hybrid Retrieval

混合检索

Reranking

重排序

5. Query Transformation Techniques

5. 查询转换技术

HyDE (Hypothetical Document Embeddings)

HyDE（假设文档嵌入）

Multi-Query Generation

多查询生成

Step-Back Prompting

退阶提示（Step-Back Prompting）

6. Context Window Optimization

6. 上下文窗口优化

Dynamic Context Assembly

动态上下文组装

Context Compression

上下文压缩

7. Evaluation Frameworks

7. 评估框架

Faithfulness Metrics

忠实度指标

Relevance Metrics

相关性指标

Context Precision & Recall

上下文精确率与召回率

End-to-End Metrics

端到端指标

8. Production Patterns

8. 生产模式

Caching Strategies