article-illustration-generator

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

Article Illustration Generator

文章插图生成器

This skill automatically generates relevant illustrations for a text article using the Gemini Image API and converts it into a visually appealing HTML file.
本Skill使用Gemini Image API自动为文本文章生成相关插图,并将其转换为视觉吸引力强的HTML文件。

Workflow

工作流程

  1. API Key Check:
    • First, check if the GOOGLE_API_KEY environment variable is set.
    • If not set, use the AskUserQuestion tool to ask the user if they have configured their API key.
    • If the user hasn't configured it, ask them to provide their Google API key.
    • Store the API key for use in the script execution.
  2. Input Analysis:
    • Read the user's article text.
    • Split the text into logical sections (paragraphs).
    • Identify key scenes for illustration (aim for 1 image every 2-3 paragraphs).
  3. Image Generation:
    • For each identified scene, generate a descriptive prompt based on the text context.
    • Use the
      google.genai
      SDK to generate images.
    • Model:
      gemini-2.5-flash-image
      (default, or user specified).
    • Config: Use
      aspect_ratio="16:9"
      or
      4:3
      for article images.
  4. HTML Construction:
    • Use the HTML template provided in
      assets/template.html
      ("故都的秋" style).
    • Insert the text and generated images (saved locally) into the HTML structure.
  1. API密钥检查:
    • 首先,检查是否已设置GOOGLE_API_KEY环境变量。
    • 如果未设置,使用AskUserQuestion工具询问用户是否已配置API密钥。
    • 如果用户尚未配置,请求他们提供Google API密钥。
    • 存储API密钥以供脚本执行使用。
  2. 输入分析:
    • 读取用户的文章文本。
    • 将文本拆分为逻辑段落。
    • 确定适合插图的关键场景(目标为每2-3段配1张图片)。
  3. 图像生成:
    • 为每个确定的场景,基于文本上下文生成描述性提示词。
    • 使用
      google.genai
      SDK生成图像。
    • 模型:
      gemini-2.5-flash-image
      (默认,或用户指定)。
    • 配置: 文章图片使用
      aspect_ratio="16:9"
      4:3
      比例。
  4. HTML构建:
    • 使用
      assets/template.html
      中提供的HTML模板(“故都的秋”风格)。
    • 将文本和生成的图像(保存到本地)插入到HTML结构中。

Resources

资源

This skill includes reference files in the
references/
directory:
  • references/template.html
    : The HTML/CSS template with serif fonts and clean layout. Use this as the base for the output file.
  • references/api_guide.md
    : Detailed documentation for the Nano Banana Pro (Gemini 3 Pro Image) API, which can be used for advanced image generation needs.
  • references/script_template.py
    : A Python script template containing the API calling logic.
本Skill在
references/
目录中包含参考文件:
  • references/template.html
    : 带有衬线字体和简洁布局的HTML/CSS模板,用作输出文件的基础。
  • references/api_guide.md
    : Nano Banana Pro(Gemini 3 Pro Image)API的详细文档,可用于高级图像生成需求。
  • references/script_template.py
    : 包含API调用逻辑的Python脚本模板。

Usage Guide

使用指南

When invoked, the agent should:
  1. Check API Key Configuration:
    • Use Bash to check if GOOGLE_API_KEY environment variable is set:
      echo $GOOGLE_API_KEY
      (Linux/Mac) or
      echo %GOOGLE_API_KEY%
      (Windows).
    • If empty or not set, use AskUserQuestion to ask: "您是否已经配置了 Google API Key?"
      • Option 1: "是,已配置为环境变量" - Proceed with the script.
      • Option 2: "否,我需要提供 API Key" - Ask for the API key and pass it as a command-line argument to the script.
    • If the user provides an API key, store it temporarily for this execution.
  2. Read the target article provided by the user.
  3. Plan the image insertion points.
  4. Execute the Python script (
    scripts/article_to_html.py
    ) with appropriate parameters:
    • If API key was provided by user:
      python scripts/article_to_html.py <article_file> <api_key>
    • If using environment variable:
      python scripts/article_to_html.py <article_file>
    • Optional parameters:
      --images N
      ,
      --model MODEL
      ,
      --ratio RATIO
      ,
      --size SIZE
  5. Verify the result and inform the user of the output location.
调用本Agent时,应执行以下步骤:
  1. 检查API密钥配置:
    • 使用Bash检查是否已设置GOOGLE_API_KEY环境变量:
      echo $GOOGLE_API_KEY
      (Linux/Mac)或
      echo %GOOGLE_API_KEY%
      (Windows)。
    • 如果为空或未设置,使用AskUserQuestion询问:“您是否已经配置了 Google API Key?”
      • 选项1:“是,已配置为环境变量” - 继续执行脚本。
      • 选项2:“否,我需要提供 API Key” - 请求用户提供API密钥,并将其作为命令行参数传递给脚本。
    • 如果用户提供了API密钥,临时存储该密钥以供本次执行使用。
  2. 读取用户提供的目标文章。
  3. 规划图像插入位置。
  4. 使用适当的参数执行Python脚本(
    scripts/article_to_html.py
    ):
    • 如果用户提供了API密钥:
      python scripts/article_to_html.py <article_file> <api_key>
    • 如果使用环境变量:
      python scripts/article_to_html.py <article_file>
    • 可选参数:
      --images N
      ,
      --model MODEL
      ,
      --ratio RATIO
      ,
      --size SIZE
  5. 验证结果并告知用户输出文件的位置。