seo-sitemap
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseSitemap Analysis & Generation
站点地图分析与生成
Mode 1: Analyze Existing Sitemap
模式1:分析现有站点地图
Validation Checks
验证检查
- Valid XML format
- URL count <50,000 per file (protocol limit)
- All URLs return HTTP 200
- dates are accurate (not all identical)
<lastmod> - No deprecated tags: and
<priority>are ignored by Google<changefreq> - Sitemap referenced in robots.txt
- Compare crawled pages vs sitemap — flag missing pages
- XML格式有效
- 每个文件的URL数量不超过50000个(协议限制)
- 所有URL返回HTTP 200状态码
- 日期准确(并非全部相同)
<lastmod> - 无废弃标签:和
<priority>已被谷歌忽略<changefreq> - 站点地图在robots.txt中被引用
- 对比已抓取页面与站点地图,标记缺失页面
Quality Signals
质量指标
- Sitemap index file if >50k URLs
- Split by content type (pages, posts, images, videos)
- No non-canonical URLs in sitemap
- No noindexed URLs in sitemap
- No redirected URLs in sitemap
- HTTPS URLs only (no HTTP)
- 当URL数量超过50000时使用站点地图索引文件
- 按内容类型拆分(页面、文章、图片、视频)
- 站点地图中无非规范URL
- 站点地图中无noindex标记的URL
- 站点地图中无重定向URL
- 仅使用HTTPS URL(不使用HTTP)
Common Issues
常见问题
| Issue | Severity | Fix |
|---|---|---|
| >50k URLs in single file | Critical | Split with sitemap index |
| Non-200 URLs | High | Remove or fix broken URLs |
| Noindexed URLs included | High | Remove from sitemap |
| Redirected URLs included | Medium | Update to final URLs |
| All identical lastmod | Low | Use actual modification dates |
| Priority/changefreq used | Info | Can remove (ignored by Google) |
| 问题 | 严重程度 | 修复方案 |
|---|---|---|
| 单个文件中URL数量超过50000 | 严重 | 使用站点地图索引拆分文件 |
| 非200状态码的URL | 高 | 删除或修复失效URL |
| 包含noindex标记的URL | 高 | 从站点地图中移除 |
| 包含重定向URL | 中 | 更新为最终目标URL |
所有 | 低 | 使用实际修改日期 |
使用了 | 提示 | 可移除(谷歌已忽略) |
Mode 2: Generate New Sitemap
模式2:生成新站点地图
Process
流程
- Ask for business type (or auto-detect from existing site)
- Load industry template from directory
assets/ - Interactive structure planning with user
- Apply quality gates:
- ⚠️ WARNING at 30+ location pages (require 60%+ unique content)
- 🛑 HARD STOP at 50+ location pages (require justification)
- Generate valid XML output
- Split at 50k URLs with sitemap index
- Generate STRUCTURE.md documentation
- 询问业务类型(或从现有网站自动检测)
- 从目录加载行业模板
assets/ - 与用户协作规划站点结构
- 应用质量管控规则:
- 当位置页面数量达到30+时发出⚠️警告(要求60%以上的独特内容)
- 当位置页面数量达到50+时触发🛑强制停止(需提供合理性说明)
- 生成有效的XML输出
- 当URL数量超过50000时,使用站点地图索引拆分文件
- 生成架构文档
STRUCTURE.md
Safe Programmatic Pages (OK at scale)
可批量生成的安全程序化页面
✅ Integration pages (with real setup docs)
✅ Template/tool pages (with downloadable content)
✅ Glossary pages (200+ word definitions)
✅ Product pages (unique specs, reviews)
✅ User profile pages (user-generated content)
✅ 集成页面(含真实配置文档)
✅ 模板/工具页面(含可下载内容)
✅ 术语表页面(每个定义不少于200词)
✅ 产品页面(含独特规格、用户评价)
✅ 用户资料页面(含用户生成内容)
Penalty Risk (avoid at scale)
违规风险(避免批量生成)
❌ Location pages with only city name swapped
❌ "Best [tool] for [industry]" without industry-specific value
❌ "[Competitor] alternative" without real comparison data
❌ AI-generated pages without human review and unique value
❌ 仅替换城市名称的位置页面
❌ 无行业专属价值的“最佳[工具]适用于[行业]”类页面
❌ 无真实对比数据的“[竞品]替代方案”类页面
❌ 未经人工审核、无独特价值的AI生成页面
Sitemap Format
站点地图格式
Standard Sitemap
标准站点地图
xml
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<lastmod>2026-02-07</lastmod>
</url>
</urlset>xml
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<lastmod>2026-02-07</lastmod>
</url>
</urlset>Sitemap Index (for >50k URLs)
站点地图索引(适用于URL数量>50000的情况)
xml
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-pages.xml</loc>
<lastmod>2026-02-07</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-posts.xml</loc>
<lastmod>2026-02-07</lastmod>
</sitemap>
</sitemapindex>xml
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-pages.xml</loc>
<lastmod>2026-02-07</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-posts.xml</loc>
<lastmod>2026-02-07</lastmod>
</sitemap>
</sitemapindex>Output
输出结果
For Analysis
分析任务输出
- — analysis results
VALIDATION-REPORT.md - Issues list with severity
- Recommendations
- — 分析结果
VALIDATION-REPORT.md - 带严重程度标记的问题列表
- 改进建议
For Generation
生成任务输出
- (or split files with index)
sitemap.xml - — site architecture documentation
STRUCTURE.md - URL count and organization summary
- (或带索引的拆分文件)
sitemap.xml - — 站点架构文档
STRUCTURE.md - URL数量与组织架构摘要