image-generation-mcp

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

Image Generation via MCP

基于MCP的图片生成

MCP를 통한 AI 이미지 생성 스킬입니다. Gemini 모델 또는 호환 서비스를 사용하여 마케팅, UI, 프레젠테이션용 고품질 이미지를 생성합니다.
这是一项通过MCP实现的AI图片生成Skill。可使用Gemini模型或兼容服务,生成适用于营销、UI设计或演示场景的高质量图片。

When to use this skill

何时使用此Skill

  • 마케팅 에셋: 히어로 이미지, 배너, 소셜 미디어 콘텐츠
  • UI/UX 디자인: 플레이스홀더 이미지, 아이콘, 일러스트레이션
  • 프레젠테이션: 슬라이드 배경, 제품 시각화
  • 브랜드 일관성: 스타일 가이드 기반 이미지 생성

  • 营销素材:Hero图片、横幅、社交媒体内容
  • UI/UX设计:占位符图片、图标、插画
  • 演示文稿:幻灯片背景、产品可视化
  • 品牌一致性:基于风格指南生成图片

Instructions

操作指南

Step 1: Configure MCP Environment

步骤1:配置MCP环境

bash
undefined
bash
undefined

MCP 서버 설정 확인

检查MCP服务器配置

claude mcp list
claude mcp list

Gemini CLI 사용 가능 여부 확인

检查Gemini CLI是否可用

gemini-cli가 설치되어 있어야 함

需要已安装gemini-cli


**필수 설정**:
- Model name (gemini-2.5-flash, gemini-3-pro 등)
- API key reference (환경 변수로 저장)
- Output directory

**必要配置**:
- 模型名称(gemini-2.5-flash、gemini-3-pro等)
- API密钥引用(存储为环境变量)
- 输出目录

Step 2: Define the Prompt

步骤2:定义提示词

구조화된 프롬프트 작성:
markdown
**Subject**: [주요 피사체]
**Style**: [스타일 - 미니멀, 일러스트, 사진풍, 3D 등]
**Lighting**: [조명 - 자연광, 스튜디오, 골든아워 등]
**Mood**: [분위기 - 차분한, 역동적, 전문적 등]
**Composition**: [구성 - 중앙 배치, 삼분할 등]
**Aspect Ratio**: [비율 - 16:9, 1:1, 9:16]
**Brand Colors**: [브랜드 컬러 제약사항]
编写结构化提示词:
markdown
**主题**: [主要主体]
**风格**: [风格 - 极简、插画、照片风、3D等]
**光线**: [光照 - 自然光、工作室光、黄金时段等]
**氛围**: [氛围 - 沉稳、动感、专业等]
**构图**: [构图 - 居中布局、三分法等]
**宽高比**: [比例 - 16:9、1:1、9:16]
**品牌色彩**: [品牌色彩限制]

Step 3: Choose the Model

步骤3:选择模型

모델용도특징
gemini-3-pro-image
고품질복잡한 구성, 디테일
gemini-2.5-flash-image
빠른 반복프로토타이핑, 테스트
gemini-2.5-pro-image
균형품질/속도 밸런스
模型用途特点
gemini-3-pro-image
高质量需求复杂构图、细节丰富
gemini-2.5-flash-image
快速迭代原型制作、测试
gemini-2.5-pro-image
均衡需求质量/速度平衡

Step 4: Generate and Review

步骤4:生成与审核

bash
undefined
bash
undefined

2-4개 변형 생성

生成2-4个变体

ask-gemini "Create a serene mountain landscape at sunset, wide 16:9, minimal style, soft gradients in brand blue #2563EB"
ask-gemini "Create a serene mountain landscape at sunset, wide 16:9, minimal style, soft gradients in brand blue #2563EB"

단일 변수 변경으로 반복

仅更改单一变量进行重复生成

ask-gemini "Same prompt but with warm orange tones"

**리뷰 체크리스트**:
- [ ] 브랜드 적합성
- [ ] 구성 명확성
- [ ] 비율 정확성
- [ ] 텍스트 가독성 (텍스트 포함 시)
ask-gemini "Same prompt but with warm orange tones"

**审核检查表**:
- [ ] 品牌适配性
- [ ] 构图清晰度
- [ ] 比例准确性
- [ ] 文本可读性(含文本时)

Step 5: Deliverables

步骤5:交付物

최종 산출물:
  • 최종 이미지 파일
  • 프롬프트 메타데이터 기록
  • 모델, 비율, 사용 노트
json
{
  "prompt": "serene mountain landscape at sunset...",
  "model": "gemini-3-pro-image",
  "aspect_ratio": "16:9",
  "style": "minimal",
  "brand_colors": ["#2563EB"],
  "output_file": "hero-image-v1.png",
  "timestamp": "2026-01-21T10:30:00Z"
}

最终产出:
  • 最终图片文件
  • 提示词元数据记录
  • 模型、比例、使用说明
json
{
  "prompt": "serene mountain landscape at sunset...",
  "model": "gemini-3-pro-image",
  "aspect_ratio": "16:9",
  "style": "minimal",
  "brand_colors": ["#2563EB"],
  "output_file": "hero-image-v1.png",
  "timestamp": "2026-01-21T10:30:00Z"
}

Examples

示例

Example 1: Hero Image

示例1:Hero图片

Prompt:
Create a serene mountain landscape at sunset,
wide 16:9, minimal style, soft gradients in brand blue #2563EB.
Focus on clean lines and modern aesthetic.
Expected output:
  • 16:9 hero image
  • Prompt parameters saved
  • 2-3 variants for selection
提示词:
Create a serene mountain landscape at sunset,
wide 16:9, minimal style, soft gradients in brand blue #2563EB.
Focus on clean lines and modern aesthetic.
预期输出:
  • 16:9比例的Hero图片
  • 保存提示词参数
  • 提供2-3个变体供选择

Example 2: Product Thumbnail

示例2:产品缩略图

Prompt:
Generate a 1:1 thumbnail of a futuristic dashboard UI
with clean interface, soft lighting, and professional feel.
Include subtle glow effects and dark theme.
Expected output:
  • 1:1 square image
  • Low visual noise
  • App store ready
提示词:
Generate a 1:1 thumbnail of a futuristic dashboard UI
with clean interface, soft lighting, and professional feel.
Include subtle glow effects and dark theme.
预期输出:
  • 1:1方形图片
  • 低视觉噪点
  • 符合应用商店要求

Example 3: Social Media Banner

示例3:社交媒体横幅

Prompt:
Create a LinkedIn banner (1584x396) for a SaaS startup.
Modern gradient background with abstract geometric shapes.
Colors: #6366F1 to #8B5CF6.
Leave space for text overlay on the left side.
Expected output:
  • LinkedIn-optimized dimensions
  • Safe zone for text
  • Brand-aligned colors

提示词:
Create a LinkedIn banner (1584x396) for a SaaS startup.
Modern gradient background with abstract geometric shapes.
Colors: #6366F1 to #8B5CF6.
Leave space for text overlay on the left side.
预期输出:
  • 符合LinkedIn规格的尺寸
  • 预留文本安全区域
  • 符合品牌色彩

Best practices

最佳实践

  1. Specify ratio early: 의도하지 않은 크롭 방지
  2. Use style anchors: 일관된 미적 스타일 유지
  3. Iterate with constraints: 한 번에 하나의 변수만 변경
  4. Track prompts: 재현 가능성 확보
  5. Batch similar requests: 일관된 스타일 세트 생성

  1. 尽早指定比例:防止意外裁剪
  2. 使用风格锚点:保持一致的美学风格
  3. 带约束地迭代:每次只更改一个变量
  4. 跟踪提示词:确保可重复性
  5. 批量处理相似请求:生成一致的风格集

Common pitfalls

常见陷阱

  • 모호한 프롬프트: 구체적인 스타일과 구성 지정 필요
  • 크기 제약 무시: 대상 채널의 크기 요구사항 확인
  • 과도하게 복잡한 장면: 명확성을 위해 단순화

  • 模糊的提示词:需要指定具体的风格和构图
  • 忽略尺寸限制:确认目标渠道的尺寸要求
  • 过于复杂的场景:为了清晰性进行简化

Troubleshooting

故障排除

Issue: Outputs are inconsistent

问题:输出不一致

Cause: 안정적인 스타일 제약 누락 Solution: 스타일 레퍼런스와 고정 팔레트 추가
原因:缺少稳定的风格约束 解决方案:添加风格参考和固定调色板

Issue: Wrong aspect ratio

问题:宽高比错误

Cause: 비율 미지정 또는 지원하지 않는 비율 Solution: 정확한 비율 제공 후 재생성
原因:未指定比例或使用不支持的比例 解决方案:提供准确比例后重新生成

Issue: Brand mismatch

问题:与品牌不符

Cause: 컬러 코드 미지정 Solution: HEX 코드로 브랜드 컬러 명시

原因:未指定颜色代码 解决方案:用HEX代码明确品牌色彩

Output format

输出格式

markdown
undefined
markdown
undefined

Image Generation Report

图片生成报告

Request

请求信息

  • Prompt: [full prompt]
  • Model: [model used]
  • Ratio: [aspect ratio]
  • 提示词: [完整提示词]
  • 模型: [使用的模型]
  • 比例: [宽高比]

Output Files

输出文件

  1. filename-v1.png
    - [description]
  2. filename-v2.png
    - [variant description]
  1. filename-v1.png
    - [描述]
  2. filename-v2.png
    - [变体描述]

Metadata

元数据

  • Generated: [timestamp]
  • Iterations: [count]
  • Selected: [final choice]
  • 生成时间: [时间戳]
  • 迭代次数: [数量]
  • 最终选择: [最终版本]

Usage Notes

使用说明

[Any notes for implementation]

---
[实施相关的任何说明]

---

Multi-Agent Workflow

多Agent工作流

Validation & Retrospectives

验证与回顾

  • Round 1 (Orchestrator): 프롬프트 완전성, 비율 정합성
  • Round 2 (Analyst): 스타일 일관성, 브랜드 정합성
  • Round 3 (Executor): 출력 파일명, 전달 체크리스트 검증
  • 第一轮(编排器):检查提示词完整性、比例一致性
  • 第二轮(分析师):检查风格一致性、品牌符合性
  • 第三轮(执行者):验证输出文件名、交付检查表

Agent Roles

Agent角色

AgentRole
Claude프롬프트 구성, 품질 검증
Gemini이미지 생성 실행
Codex파일 관리, 배치 처리

Agent角色
Claude提示词构建、质量验证
Gemini执行图片生成
Codex文件管理、批量处理

Metadata

元数据

Version

版本

  • Current Version: 1.0.0
  • Last Updated: 2026-01-21
  • Compatible Platforms: Claude, ChatGPT, Gemini, Codex
  • 当前版本: 1.0.0
  • 最后更新: 2026-01-21
  • 兼容平台: Claude, ChatGPT, Gemini, Codex

Related Skills

相关Skill

  • frontend-design
  • presentation-builder
  • video-production
  • frontend-design
  • presentation-builder
  • video-production

Tags

标签

#image-generation
#gemini
#mcp
#design
#creative
#ai-art
#image-generation
#gemini
#mcp
#design
#creative
#ai-art