jina-reader
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseJina Reader 📖
Jina Reader 📖
Fetch a URL through Jina Reader and return the page as markdown text.
通过Jina Reader抓取指定URL,并将页面内容以Markdown文本格式返回。
Tool: scripts/jina_reader.py
scripts/jina_reader.py工具:scripts/jina_reader.py
scripts/jina_reader.pyUse this script to fetch a page and emit markdown.
使用该脚本抓取页面内容并输出Markdown格式。
Inputs
输入参数
- : The target web page. If no scheme is provided,
urlis assumed.https://
- :目标网页地址。如果未提供协议,默认使用
url。https://
Outputs
输出结果
- Markdown text to stdout by default, or to a file with .
--output
- 默认将Markdown文本输出到标准输出(stdout),也可通过参数指定输出到文件。
--output
Options
可选参数
- : Write markdown to a file instead of stdout.
--output PATH - : Request timeout (default: 30).
--timeout SECONDS
- :将Markdown内容写入指定文件,而非标准输出。
--output PATH - :请求超时时间(默认:30秒)。
--timeout SECONDS
Examples
使用示例
bash
python scripts/jina_reader.py https://example.combash
python scripts/jina_reader.py example.com --output output.mdbash
python scripts/jina_reader.py https://example.combash
python scripts/jina_reader.py example.com --output output.mdWorkflow
工作流程
- Choose the target URL.
- Run the script to fetch markdown.
- Use the markdown output for downstream tasks (summarize, quote, extract).
- 选择目标URL。
- 运行脚本抓取Markdown格式内容。
- 将Markdown输出用于后续任务(总结、引用、信息提取)。