jina-reader

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

Jina Reader 📖

Jina Reader 📖

Fetch a URL through Jina Reader and return the page as markdown text.
通过Jina Reader抓取指定URL,并将页面内容以Markdown文本格式返回。

Tool:
scripts/jina_reader.py

工具:
scripts/jina_reader.py

Use this script to fetch a page and emit markdown.
使用该脚本抓取页面内容并输出Markdown格式。

Inputs

输入参数

  • url
    : The target web page. If no scheme is provided,
    https://
    is assumed.
  • url
    :目标网页地址。如果未提供协议,默认使用
    https://

Outputs

输出结果

  • Markdown text to stdout by default, or to a file with
    --output
    .
  • 默认将Markdown文本输出到标准输出(stdout),也可通过
    --output
    参数指定输出到文件。

Options

可选参数

  • --output PATH
    : Write markdown to a file instead of stdout.
  • --timeout SECONDS
    : Request timeout (default: 30).
  • --output PATH
    :将Markdown内容写入指定文件,而非标准输出。
  • --timeout SECONDS
    :请求超时时间(默认:30秒)。

Examples

使用示例

bash
python scripts/jina_reader.py https://example.com
bash
python scripts/jina_reader.py example.com --output output.md
bash
python scripts/jina_reader.py https://example.com
bash
python scripts/jina_reader.py example.com --output output.md

Workflow

工作流程

  1. Choose the target URL.
  2. Run the script to fetch markdown.
  3. Use the markdown output for downstream tasks (summarize, quote, extract).
  1. 选择目标URL。
  2. 运行脚本抓取Markdown格式内容。
  3. 将Markdown输出用于后续任务(总结、引用、信息提取)。