arxiv-preflight

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

arXiv Preflight Check

arXiv提交前预检

Pipeline position: Phase 3a (submission readiness). Runs after Phase 2 fixes and PDF recompilation. Gate for arxiv-figures and arxiv-package. See
/manuscript-pipeline
for full execution order.
流水线阶段: 第3a阶段(提交就绪)。在第2阶段修复和PDF重新编译后运行,是arxiv-figures和arxiv-package的前置检查环节。完整执行顺序请查看
/manuscript-pipeline

Purpose

目标

Systematically validate a TeX/LaTeX project (or PDF submission) against all arXiv submission requirements, producing a structured pass/fail report with specific fixes for every violation found.
Companion skills:
  • manuscript-review
    — audits prose quality, structure, and claims
  • manuscript-provenance
    — audits computational reproducibility
  • arxiv-figures
    — optimizes figures for arXiv
  • arxiv-package
    — packages the submission tarball
This skill focuses exclusively on arXiv technical compliance — not prose quality or scientific content.
系统地验证TeX/LaTeX项目(或PDF提交件)是否符合所有arXiv提交要求,生成结构化的通过/失败报告,并针对发现的每一项违规提供具体修复方案。
配套工具:
  • manuscript-review
    — 审核文稿的文字质量、结构和论点
  • manuscript-provenance
    — 审核计算可复现性
  • arxiv-figures
    — 为arXiv优化图表
  • arxiv-package
    — 打包提交用的tarball文件
本工具仅专注于arXiv技术合规性审核——不涉及文稿质量或科学内容。

Workflow

工作流程

1. Ingest

1. 导入

Identify the submission directory. Locate:
  • Main
    .tex
    file(s)
  • All included files (figures,
    .bbl
    ,
    .bst
    , style files, subdirectories)
  • Any
    00README.XXX
    file
  • Any
    anc/
    directory
  • Compiled PDF (if available)
Read references/guidelines.md
识别提交目录,定位:
  • .tex
    文件
  • 所有包含的文件(图表、
    .bbl
    .bst
    、样式文件、子目录)
  • 任何
    00README.XXX
    文件
  • 任何
    anc/
    目录
  • 已编译的PDF(如果存在)
Read references/guidelines.md

2. Validation Passes

2. 验证环节

Execute all passes. For each check:
  • PASS — requirement met
  • FAIL — violation found (document exact file, line, specific fix)
  • WARN — advisory (not a blocker but may cause issues)
  • N/A — not applicable

Pass 1 — File Organization
  1. No absolute file paths in any
    .tex
    file (
    \input
    ,
    \includegraphics
    ,
    \include
    ,
    \bibliography
    )
  2. No spaces or special characters (
    &
    ,
    \
    ,
    :
    ) in filenames
  3. No auxiliary files that should be excluded:
    .aux
    ,
    .log
    ,
    .toc
    ,
    .lot
    ,
    .lof
    ,
    .dvi
    ,
    .ps
    ,
    .pdf
    (except figure PDFs)
  4. Required files present:
    .bbl
    if using BibTeX/BibLaTeX,
    .ind
    if using makeindex,
    .gls
    /
    .nls
    if using glossary/nomenclature
  5. No hidden files (starting with
    .
    ) except
    .tex
    -related configs
  6. No journal templates or referee letters included
  7. Subdirectory structure: no
    \include{}
    calls into subdirectories (use
    \input{}
    instead)
  8. If multiple
    .tex
    files with
    \documentclass
    : verify
    00README.XXX
    declares
    toplevelfile
Pass 2 — TeX/LaTeX Compliance
  1. Processor compatibility: figure formats match processor
    • DVI mode: only
      .ps
      /
      .eps
      figures
    • PDFLaTeX: only
      .pdf
      /
      .png
      /
      .jpg
      figures
    • No mixed formats without conditional compilation
  2. No
    psfig
    package usage (use
    graphicx
    )
  3. No
    \today
    macro in date fields
  4. No embedded JavaScript
  5. \pdfoutput
    testing uses
    ifpdf
    package, not
    \ifx\pdfoutput\undefined
  6. No shell-escape dependent packages without workarounds (
    minted
    frozencache=true
    )
  7. No
    xr
    package for external document references
  8. No double-spaced "referee" mode formatting
  9. Caption
    \cite
    calls use
    \protect\cite
  10. \include
    not used for subdirectory files
  11. BibLaTeX
    .bbl
    format version compatible with target TeX Live (3.3 for TL2025)
  12. All custom/non-standard style files included in submission
  13. No packages outside TeX Live distribution (check against common non-TL packages)
Pass 3 — Figure Validation
  1. All referenced figures exist at specified paths
  2. Figure formats match processor requirements
  3. No figures reference absolute paths
  4. No embedded animations, JavaScript, or interactive elements
  5. PNG files: check for oversized images (>34 Megapixel warning)
  6. Reasonable file sizes (flag individual figures >5MB, total figures >25MB)
  7. Alt text present in
    \includegraphics
    calls (advisory — accessibility best practice)
  8. \includegraphics
    uses
    graphicx
    package, not deprecated alternatives
Pass 4 — Bibliography Validation
  1. .bbl
    filename matches corresponding
    .tex
    filename
  2. If
    .bib
    included:
    .bbl
    also included (arXiv can process
    .bib
    but
    .bbl
    is safer)
  3. arXiv identifiers in references use correct format (
    YYMM.NNNNN
    )
  4. No extraneous formatting within e-print identifiers
  5. BibLaTeX
    .bbl
    format version check (examine
    \RequirePackage
    version in
    .bbl
    )
Pass 5 — Metadata Compliance (check
.tex
front matter)
  1. Title: no all-uppercase, no raw Unicode, cryptic macros expanded
  2. Authors: proper name format, no honorifics, no
    et al.
    truncation
  3. Abstract: no leading "Abstract" text, within 1920 character limit, no leading whitespace on lines
  4. Abstract: opaque TeX macros expanded, no formatting commands (
    \em
    ,
    \it
    )
  5. If comments metadata present: page count and figure count included (advisory)
Pass 6 — PDF Validation (if compiled PDF available)
  1. All fonts embedded (check with
    pdffonts
    or equivalent)
  2. No Type 3 (bitmap) fonts
  3. Machine readable (not scanned/bitmapped)
  4. No embedded JavaScript
  5. No security restrictions preventing text extraction
  6. Reasonable file size
Pass 7 — 00README.XXX Validation (if present)
  1. Valid directive syntax (each line:
    filename directive
    or standalone directive)
  2. Referenced files exist
  3. DVI-related directives use correct filename (no
    .tex
    extension)
  4. No conflicting directives
Pass 8 — Ancillary Files (if
anc/
directory present)
  1. No
    .tex
    files in
    anc/
    directory
  2. No PDFs with embedded JavaScript
  3. No internal references to
    anc/
    directory from
    .tex
    source
  4. Reasonable total size
Pass 9 — Common Error Scan
  1. %%BoundingBox
    at top of PS/EPS files (not at end)
  2. No
    \Bbbk
    conflicts between
    newtxmath
    and
    amssymb
  3. No ambiguous double subscript/superscript (
    a_x_y
    a_{x}_y
    )
  4. No concatenated source files
  5. No Scientific Workplace
    .rap
    files
  6. No modified versions of standard style files (
    epsf.sty
    ,
    epsfig.sty
    )
  7. hyperref
    with complex section names:
    bookmarks=false
    or proper PDF string handling

执行所有检查项。对于每一项检查:
  • 通过 — 符合要求
  • 失败 — 发现违规(记录具体文件、行号和修复方案)
  • 警告 — 建议项(不阻止提交但可能引发问题)
  • 不适用 — 不相关

检查1:文件组织
  1. 所有
    .tex
    文件中不得使用绝对文件路径(
    \input
    \includegraphics
    \include
    \bibliography
    命令)
  2. 文件名中不得包含空格或特殊字符(
    &
    \
    :
  3. 不得包含应排除的辅助文件:
    .aux
    .log
    .toc
    .lot
    .lof
    .dvi
    .ps
    .pdf
    (图表PDF除外)
  4. 必须包含所需文件:使用BibTeX/BibLaTeX时需包含
    .bbl
    ,使用makeindex时需包含
    .ind
    ,使用术语表/命名法时需包含
    .gls
    /
    .nls
  5. 不得包含隐藏文件(以
    .
    开头),除非是TeX相关配置文件
  6. 不得包含期刊模板或审稿意见
  7. 子目录结构:不得使用
    \include{}
    调用子目录中的文件(改用
    \input{}
  8. 若存在多个带
    \documentclass
    .tex
    文件:需验证
    00README.XXX
    中是否声明了
    toplevelfile
检查2:TeX/LaTeX合规性
  1. 处理器兼容性:图表格式与处理器匹配
    • DVI模式:仅支持
      .ps
      /
      .eps
      格式图表
    • PDFLaTeX:仅支持
      .pdf
      /
      .png
      /
      .jpg
      格式图表
    • 未使用条件编译时不得混合格式
  2. 不得使用
    psfig
    包(改用
    graphicx
  3. 日期字段中不得使用
    \today
  4. 不得嵌入JavaScript
  5. \pdfoutput
    检测需使用
    ifpdf
    包,而非
    \ifx\pdfoutput\undefined
  6. 依赖shell-escape的包需提供替代方案(如
    minted
    需设置
    frozencache=true
  7. 不得使用
    xr
    包引用外部文档
  8. 不得使用双倍行距的“审稿”模式格式
  9. 标题中的
    \cite
    调用需使用
    \protect\cite
  10. 不得对目录文件使用
    \include
  11. BibLaTeX
    .bbl
    格式版本需与目标TeX Live兼容(TL2025对应3.3版本)
  12. 所有自定义/非标准样式文件需包含在提交件中
  13. 不得使用TeX Live发行版之外的包(对照常见非TL包检查)
检查3:图表验证
  1. 所有引用的图表均存在于指定路径
  2. 图表格式符合处理器要求
  3. 图表不得引用绝对路径
  4. 不得嵌入动画、JavaScript或交互元素
  5. PNG文件:检查是否存在超大图片(超过34兆像素时发出警告)
  6. 文件大小合理(标记单个图表超过5MB、总图表超过25MB的情况)
  7. \includegraphics
    调用中包含替代文本(建议项——无障碍最佳实践)
  8. \includegraphics
    需使用
    graphicx
    包,而非已废弃的替代方案
检查4:参考文献验证
  1. .bbl
    文件名对应
    .tex
    文件名
  2. 若包含
    .bib
    文件:需同时包含
    .bbl
    文件(arXiv可处理
    .bib
    .bbl
    更安全)
  3. 参考文献中的arXiv标识符格式正确(
    YYMM.NNNNN
  4. 电子预印本标识符中不得包含多余格式
  5. 检查BibLaTeX
    .bbl
    格式版本(查看
    .bbl
    中的
    \RequirePackage
    版本)
检查5:元数据合规性(检查
.tex
前置内容)
  1. 标题:不得全大写,不得使用原始Unicode,需展开晦涩宏
  2. 作者:格式规范,不得包含尊称,不得使用
    et al.
    截断
  3. 摘要:不得包含开头的“Abstract”文本,字符数不超过1920,行首不得有空白
  4. 摘要:需展开不透明TeX宏,不得包含格式命令(
    \em
    \it
  5. 若存在注释元数据:需包含页数和图表数(建议项)
检查6:PDF验证(若存在已编译PDF)
  1. 所有字体均已嵌入(使用
    pdffonts
    或等效工具检查)
  2. 不得使用Type 3(位图)字体
  3. 机器可读(非扫描/位图文件)
  4. 不得嵌入JavaScript
  5. 不得设置阻止文本提取的安全限制
  6. 文件大小合理
检查7:00README.XXX验证(若存在)
  1. 指令语法有效(每行格式:
    文件名 指令
    或独立指令)
  2. 引用的文件均存在
  3. DVI相关指令使用正确文件名(无
    .tex
    扩展名)
  4. 无冲突指令
检查8:辅助文件(若存在
anc/
目录)
  1. anc/
    目录中不得包含
    .tex
    文件
  2. 不得包含嵌入JavaScript的PDF
  3. .tex
    源文件中不得引用
    anc/
    目录
  4. 总大小合理
检查9:常见错误扫描
  1. PS/EPS文件的
    %%BoundingBox
    需位于文件顶部(而非末尾)
  2. newtxmath
    amssymb
    之间不得存在
    \Bbbk
    冲突
  3. 不得存在模糊的双重下标/上标(如
    a_x_y
    需改为
    a_{x}_y
  4. 不得包含拼接的源文件
  5. 不得包含Scientific Workplace
    .rap
    文件
  6. 不得包含标准样式文件的修改版本(
    epsf.sty
    epsfig.sty
  7. 包含复杂章节名称的
    hyperref
    需设置
    bookmarks=false
    或正确处理PDF字符串

3. Generate Report

3. 生成报告

Produce a structured report:
markdown
undefined
生成结构化报告:
markdown
undefined

arXiv Preflight Report

arXiv提交前预检报告

Project: [directory name] Date: [date] Processor: [detected processor] Verdict: [READY / NEEDS FIXES / BLOCKED]
项目: [目录名称] 日期: [日期] 处理器: [检测到的处理器] 结论: [就绪 / 需要修复 / 阻塞]

Summary

摘要

CategoryPassFailWarnN/A
File Organization
TeX Compliance
Figures
Bibliography
Metadata
PDF
00README
Ancillary Files
Common Errors
分类通过失败警告不适用
文件组织
TeX合规性
图表
参考文献
元数据
PDF
00README
辅助文件
常见错误

Blocking Issues (FAIL)

阻塞问题(失败)

[Each with file, line number, specific violation, exact fix]
[每项包含文件、行号、具体违规内容、精准修复方案]

Warnings (WARN)

警告项(警告)

[Advisory items that may cause processing issues]
[可能引发处理问题的建议项]

All Checks

所有检查项

[Full pass/fail/warn/N/A status for every checkpoint]
undefined
[所有检查点的完整通过/失败/警告/不适用状态]
undefined

4. Output

4. 输出

Save report as
arxiv-preflight-report.md
in the project directory.
Present verdict and blocking issue count. If READY, confirm submission can proceed. If NEEDS FIXES, list the specific fixes in priority order.
将报告保存为
arxiv-preflight-report.md
到项目目录中。
展示审核结论和阻塞问题数量。如果状态为就绪,确认可以提交。如果状态为需要修复,按优先级列出具体修复项。

Core Principles

核心原则

  • Binary compliance. arXiv requirements are not suggestions — FAIL means the submission will be rejected or processing will break. WARN means it may cause issues.
  • Exact fixes. Every FAIL includes the specific command, line, or file change needed.
  • No false positives. Only flag violations against documented arXiv requirements. Do not impose style preferences or best practices as failures.
  • Processor-aware. All checks account for the detected TeX processor. PDFLaTeX rules do not apply to DVI-mode submissions and vice versa.
  • 二元合规性:arXiv的要求并非建议——失败意味着提交将被拒绝或处理失败,警告意味着可能引发问题。
  • 精准修复:每一项失败都包含所需的具体命令、行号或文件修改方案。
  • 无误报:仅标记违反arXiv文档化要求的问题,不将风格偏好或最佳实践列为失败项。
  • 处理器感知:所有检查都考虑检测到的TeX处理器,PDFLaTeX规则不适用于DVI模式提交,反之亦然。