quad-fact-check

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

4者クロスファクトチェック(Claude + Gemini + Codex)

4-Model Cross Fact-Checking (Claude + Gemini + Codex)

対象ドキュメントに対して、Claude Opus・Gemini Flash・Gemini Pro・Codex の4つの異なるAIで独立したファクトチェックを実施し、争点を議論して合意レポートを出力する。
Perform independent fact-checks on the target document using four different AIs: Claude Opus, Gemini Flash, Gemini Pro, and Codex, then discuss the issues and output a consensus report.

前提

Prerequisites

  • Gemini CLI (
    gemini
    ) がインストール済みであること
  • Codex CLI (
    codex
    ) がインストール済みであること
  • Flash はデフォルトモデル(
    -m
    指定不要)
  • Pro は
    -m gemini-3-pro-preview
    で指定
  • Codex は
    -m gpt-5.3-codex
    で指定
  • Gemini CLI (
    gemini
    ) is already installed
  • Codex CLI (
    codex
    ) is already installed
  • Flash is the default model (no need to specify
    -m
    )
  • Specify Pro with
    -m gemini-3-pro-preview
  • Specify Codex with
    -m gpt-5.3-codex

手順

Steps

Step 1: 対象の特定

Step 1: Identify the Target

  • 会話の文脈から対象ドキュメントを特定する
  • 対象が曖昧な場合は Daiki に確認する
  • Identify the target document from the conversation context
  • If the target is ambiguous, confirm with Daiki

Step 2: 4者による独立チェック

Step 2: Independent Checks by 4 Models

Opus(自身)

Opus (Self)

  • 対象ドキュメントを通読してファクトチェック
  • WebSearch で一次ソースを確認
  • Read through the target document and perform fact-checking
  • Verify primary sources via WebSearch

Gemini Flash

Gemini Flash

  • Bash で以下を実行:
bash
cat <ファイルパス> | gemini -p "以下のドキュメントをファクトチェックしてください。技術的事実の正確性、数値の整合性、内部矛盾、コード例の正確性を検証してください。各指摘には根拠を明記し、「要修正 / 改善推奨 / 正確」に分類して報告してください。"
  • Execute the following in Bash:
bash
cat <file-path> | gemini -p "Please fact-check the following document. Verify the accuracy of technical facts, consistency of numerical values, internal contradictions, and correctness of code examples. Clearly state the basis for each observation, and classify it as 'Needs Correction / Recommend Improvement / Accurate' in your report."

Gemini Pro

Gemini Pro

  • Bash で以下を実行:
bash
cat <ファイルパス> | gemini -m gemini-3-pro-preview -p "以下のドキュメントをファクトチェックしてください。技術的事実の正確性、数値の整合性、内部矛盾、コード例の正確性を検証してください。各指摘には根拠を明記し、「要修正 / 改善推奨 / 正確」に分類して報告してください。"
  • Execute the following in Bash:
bash
cat <file-path> | gemini -m gemini-3-pro-preview -p "Please fact-check the following document. Verify the accuracy of technical facts, consistency of numerical values, internal contradictions, and correctness of code examples. Clearly state the basis for each observation, and classify it as 'Needs Correction / Recommend Improvement / Accurate' in your report."

Codex (gpt-5.3-codex)

Codex (gpt-5.3-codex)

  • Bash で以下を実行:
bash
codex exec -m gpt-5.3-codex --ephemeral -s read-only "以下のドキュメントをファクトチェックしてください。技術的事実の正確性、数値の整合性、内部矛盾、コード例の正確性を検証してください。各指摘には根拠を明記し、「要修正 / 改善推奨 / 正確」に分類して報告してください。

$(cat <ファイルパス>)"
  • Execute the following in Bash:
bash
codex exec -m gpt-5.3-codex --ephemeral -s read-only "Please fact-check the following document. Verify the accuracy of technical facts, consistency of numerical values, internal contradictions, and correctness of code examples. Clearly state the basis for each observation, and classify it as 'Needs Correction / Recommend Improvement / Accurate' in your report.

$(cat <file-path>)"

Step 3: 結果の比較・争点抽出

Step 3: Compare Results & Extract Issues

  • 4者の結果を突き合わせる
  • 全員一致: そのまま採用(信頼度: 最高)
  • 3者一致 + 1者不一致: 争点として抽出
  • 2対2: 重要争点として抽出
  • 片方のみ検出: Opus が追加検証
  • Cross-reference the results from the 4 models
  • Unanimous agreement: Adopt directly (Reliability: Highest)
  • 3 agree + 1 disagree: Extract as an issue
  • 2 vs 2: Extract as a critical issue
  • Detected by only one model: Opus performs additional verification

Step 4: 争点の議論

Step 4: Discuss Issues

各争点について:
  1. Opus が WebSearch で追加の検証情報を収集
  2. 検証情報を添えて各 AI に再質問:
bash
echo "<争点の内容と追加検証情報>" | gemini -p "以下の争点について、追加情報を踏まえて見解を述べてください。"
echo "<争点の内容と追加検証情報>" | gemini -m gemini-3-pro-preview -p "以下の争点について、追加情報を踏まえて見解を述べてください。"
codex exec -m gpt-5.3-codex --ephemeral -s read-only "以下の争点について、追加情報を踏まえて見解を述べてください。

<争点の内容と追加検証情報>"
  1. 全ての回答を総合して最終判断を下す
For each issue:
  1. Opus collects additional verification information via WebSearch
  2. Re-query each AI with the verification information attached:
bash
echo "<Issue content and additional verification information>" | gemini -p "Please state your opinion on the following issue based on the additional information provided."
echo "<Issue content and additional verification information>" | gemini -m gemini-3-pro-preview -p "Please state your opinion on the following issue based on the additional information provided."
codex exec -m gpt-5.3-codex --ephemeral -s read-only "Please state your opinion on the following issue based on the additional information provided.

<Issue content and additional verification information>"
  1. Make a final judgment by synthesizing all responses

Step 5: 合意レポートの出力

Step 5: Output Consensus Report

markdown
undefined
markdown
undefined

4者クロスファクトチェック結果

4-Model Cross Fact-Check Results

対象: <ドキュメント名> チェック者: Claude Opus 4.6 / Gemini Flash / Gemini Pro / Codex (gpt-5.3-codex)
Target: <Document Name> Checkers: Claude Opus 4.6 / Gemini Flash / Gemini Pro / Codex (gpt-5.3-codex)

要修正

Needs Correction

#セクション内容合意
1......Opus ✅ Flash ✅ Pro ✅ Codex ✅
#SectionContentConsensus
1......Opus ✅ Flash ✅ Pro ✅ Codex ✅

改善推奨

Recommend Improvement

#セクション内容合意
#SectionContentConsensus

争点と議論

Issues & Discussions

争点OpusFlashProCodex結論
IssueOpusFlashProCodexConclusion

検出能力比較

Detection Capability Comparison

検出項目OpusFlashProCodex
Detection ItemOpusFlashProCodex

検証済み(正確)

Verified (Accurate)

<主要な検証済み項目のリスト>
undefined
<List of key verified items> ```

注意事項

Notes

  • Gemini・Codex の結果は必ず Opus が検証する(誤検出の可能性がある)
  • 争点は根拠に基づいて解決し、多数決で決めない
  • 各 AI への再質問は争点ごとに個別に行う
  • Codex が利用不可の場合は 3者(cross-fact-check 相当)にフォールバックする
  • Opus must verify the results from Gemini and Codex (there is a possibility of false positives)
  • Resolve issues based on evidence, not majority vote
  • Re-query each AI individually for each issue
  • If Codex is unavailable, fall back to 3-model cross fact-checking