huashu-slides

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

AI Presentation Workflow

AI演示文稿工作流

Create professional presentations: Content → Design → Build → Assembly → Polish.
制作专业演示文稿的全流程:内容梳理 → 设计选型 → 幻灯片制作 → 组装导出 → 优化打磨。

Step 0: Choose Workflow Settings

第0步:选择工作流设置

At the start of every presentation task, ask the user TWO choices:
每次承接演示文稿制作任务时,首先询问用户两个选择:

0-A. Collaboration Mode

0-A. 协作模式

ModeDescriptionCheckpoints
Full AutoMinimal interaction. Confirm topic only, deliver final PPTX.1 checkpoint
Guided (recommended)Confirm outline, pick design, preview before assembly.3 checkpoints
CollaborativeReview every slide, approve every illustration, full control.Per-slide
If the user doesn't specify, default to Guided mode.
模式描述检查点
全自动最少交互,仅确认主题,直接交付最终PPTX。1个检查点
引导式(推荐)确认大纲、选择设计风格、组装前预览。3个检查点
协作式逐页审核幻灯片、确认每一张插画,完全掌控制作过程。逐页检查
如果用户未指定,默认使用引导式模式。

0-B. Assembly Method

0-B. 组装方式

MethodHow it worksBest for
Editable HTML (Path A)HTML slides + selective AI illustrations → html2pptx → editable PPTXNeed to edit text later, precise layout, corporate decks
Full AI Visual (Path B)Every slide as a complete AI-generated image → create_slides.py → image PPTXMaximum visual impact, artistic presentations, quick drafts
Trade-offs:
Path A: Editable HTMLPath B: Full AI Visual
TextEditable in PPTBaked into image (not editable)
Visual qualityGood with illustrationsExcellent — cohesive design
Layout controlPixel-preciseAI-interpreted
File sizeSmaller (~5-25MB)Larger (~30-80MB)
Chinese textPerfect (font rendering)Usually good (AI may occasionally misrender)
SpeedFaster (HTML creation)Slower (image generation per slide)
If the user doesn't specify, default to Path A (Editable HTML).

方式实现逻辑适用场景
可编辑HTML(路径A)HTML幻灯片 + 选择性AI插画 → html2pptx → 可编辑PPTX需要后续编辑文字、布局精准的企业对外演示文稿
全AI视觉(路径B)每页幻灯片为完整AI生成图片 → create_slides.py → 图片型PPTX追求极致视觉效果、艺术感强的演示文稿、快速草稿输出
优缺点对比:
路径A:可编辑HTML路径B:全AI视觉
文字编辑性PPT内可直接编辑嵌入图片内,不可编辑
视觉质量搭配插画效果良好极优,设计风格高度统一
布局可控性像素级精准由AI自主决定
文件大小更小(约5-25MB)更大(约30-80MB)
中文显示效果完美,字体渲染正常通常良好,AI偶尔会出现文字渲染错误
生成速度更快,仅需生成HTML内容更慢,每页都需要生成图片
如果用户未指定,默认使用路径A(可编辑HTML)

Step 1: Content Structuring

第1步:内容结构化

Turn raw material into a slide-by-slide outline.
Per slide, define:
  • Title — a complete assertion sentence (not a topic word)
  • Key points — 3-4 maximum
  • Visual type — illustration / chart / diagram / icon / quote
  • Path A: Illustration needed? — Yes/No. If yes, one-line description.
  • Path B: Visual scene description — one paragraph describing the complete slide visual (layout + imagery + mood).
Assertion-Evidence rule:
Bad titleGood title
Q3 SalesQ3销售增长23%,新用户是主要驱动力
Methodology我们通过双盲实验验证了这个结论
语言规则:slide内容一律用中文,仅保留必要的英文术语(人名、品牌名、技术专有名词)。 Section label(如 INSIGHT、TAKEAWAY)可用英文作为设计元素。
将原始素材转化为逐页的幻灯片大纲。
为每一页幻灯片定义以下内容:
  • 标题 — 完整的论点陈述句(而非仅关键词)
  • 核心要点 — 最多3-4条
  • 视觉类型 — 插画 / 图表 / 示意图 / 图标 / 引语
  • 路径A专属:是否需要插画? — 是/否,若是则提供一行描述。
  • 路径B专属:视觉场景描述 — 一段话描述完整的幻灯片视觉效果(布局+图像+氛围)。
论点-论据规则:
反面示例标题正面示例标题
Q3 SalesQ3销售增长23%,新用户是主要驱动力
Methodology我们通过双盲实验验证了这个结论
语言规则:slide内容一律用中文,仅保留必要的英文术语(人名、品牌名、技术专有名词)。 Section label(如 INSIGHT、TAKEAWAY)可用英文作为设计元素。

✅ Checkpoint 1 (Guided + Collaborative)

✅ 检查点1(引导式+协作式模式)

Present the outline as a table:
Path A:
| # | Title (assertion) | Key Points | Visual Type | Illustration? |
|---|-------------------|------------|-------------|---------------|
| 1 | Cover: ... | — | Decorative | Yes: ... |
| 2 | ... | 1. ... 2. ... | Chart | No |
| 3 | ... | 1. ... 2. ... | Illustration | Yes: ... |
Path B:
| # | Title (assertion) | Key Points | Visual Scene Description |
|---|-------------------|------------|--------------------------|
| 1 | Cover: ... | — | Dark gradient bg, large title centered, abstract network nodes |
| 2 | ... | 1. ... 2. ... | Split layout: text left, bar chart right, clean white bg |
| 3 | ... | 1. ... 2. ... | Full illustration: person at crossroads with floating clocks |
Ask the user:
  • Approve / adjust slide count
  • Path A: Approve / adjust which slides get illustrations
  • Path B: Approve / adjust visual scene descriptions
  • Any content to add or remove

将大纲以表格形式呈现给用户:
路径A:
| # | Title (assertion) | Key Points | Visual Type | Illustration? |
|---|-------------------|------------|-------------|---------------|
| 1 | Cover: ... | — | Decorative | Yes: ... |
| 2 | ... | 1. ... 2. ... | Chart | No |
| 3 | ... | 1. ... 2. ... | Illustration | Yes: ... |
路径B:
| # | Title (assertion) | Key Points | Visual Scene Description |
|---|-------------------|------------|--------------------------|
| 1 | Cover: ... | — | Dark gradient bg, large title centered, abstract network nodes |
| 2 | ... | 1. ... 2. ... | Split layout: text left, bar chart right, clean white bg |
| 3 | ... | 1. ... 2. ... | Full illustration: person at crossroads with floating clocks |
向用户确认以下内容:
  • 确认/调整幻灯片页数
  • 路径A:确认/调整哪些页面需要插入插画
  • 路径B:确认/调整视觉场景描述
  • 是否需要增减内容

Step 2: Design System

第2步:设计系统选型

Present 3 design system options for the user to choose from. Each is a complete visual language, not just a color palette.
CRITICAL: A design system is NOT just colors. It defines visual philosophy, typography ratios, composition rules, and emotional intent. This is the difference between "boring PPT" and "magazine-quality deck."
向用户提供3套设计系统选项供选择。 每套都是完整的视觉语言,而非仅调色板。
重要提示:设计系统绝不只是配色。 它定义了视觉理念、字体比例、排版规则和情感表达,这就是「 boring PPT 」和「杂志级演示文稿」的核心区别。

🗣️ Style Discussion (Optional, if user wants to explore)

🗣️ 风格讨论(可选,若用户有需求)

If the user says things like:
  • "我想要XX风格"(田中一光、瑞士国际主义、包豪斯、蒙德里安...)
  • "我不确定想要什么风格"
  • "能给我看看不同风格的例子吗"
Then consult the design movements reference:
references/design-movements.md
— 设计运动与风格参考库
This file maps classic design movements (Neo-Brutalism, Swiss Style, Bauhaus, etc.) to our AI-ready style presets. Use it to:
  1. Translate user's aesthetic language into actionable prompts
  2. Build shared vocabulary ("这个方向偏田中一光" vs "那个偏构成主义")
  3. Reference when designing new custom styles from scratch
After discussing movements, proceed to recommend 3 concrete presets below.

如果用户提出以下需求:
  • "我想要XX风格"(田中一光、瑞士国际主义、包豪斯、蒙德里安...)
  • "我不确定想要什么风格"
  • "能给我看看不同风格的例子吗"
请参考设计运动参考库:
references/design-movements.md
— 设计运动与风格参考库
该文件将经典设计运动(Neo-Brutalism、Swiss Style、Bauhaus等)与我们的AI可用风格预设对应,可用于:
  1. 将用户的审美描述转化为可执行的提示词
  2. 建立统一的沟通语言("这个方向偏田中一光" vs "那个偏构成主义")
  3. 从零设计新的自定义风格时参考
讨论完风格方向后,继续向用户推荐以下3个具体的预设风格。

Design System Presets

设计系统预设

⚠️ CRITICAL INSIGHT: 插画/漫画类风格的AI生成效果远好于「专业极简」类风格。 漫画/插画风格有明确的视觉语言(线条、角色、色块),AI可以充分发挥;极简风格(暗色底+发光文字+大量留白)缺乏视觉元素,生成出来「空」且「平」。
Pick 3 that match the topic/mood. Use the topic recommendation table below, then present each with its full description.
按主题自动推荐(优先从此表选):
主题类型第一推荐第二推荐第三推荐
品牌/产品介绍Snoopy温暖漫画Neo-Pop新波普浮世绘/敦煌(东方品牌)
教育/培训Neo-Brutalism学習漫画Snoopy温暖漫画
技术分享xkcd白板Neo-BrutalismLigne Claire
数据报告Pentagram编辑Fathom数据Ligne Claire
年轻受众Neo-Pop像素画孔版印刷
创意/艺术达达拼贴孔版印刷The Oatmeal
国风/东方敦煌壁画浮世绘Takram思辨
正式商务Pentagram编辑Müller-Brockmann网格Build极简
产品发布/keynote苏联构成主义Neo-PopPentagram编辑
内部分享Neo-BrutalismThe Oatmealxkcd白板
行业分析/咨询Fathom数据Pentagram编辑Müller-Brockmann网格
培训课件/教材Takram思辨温暖叙事学習漫画
投资/融资路演Build极简Pentagram编辑苏联构成主义
完整18种风格详细参考:
references/proven-styles-gallery.md
风格样例图片:
assets/style-samples/
目录

第一梯队(强烈推荐,效果极好):
1. Warm Comic Strip — Snoopy温暖漫画风
  • Philosophy: Peanuts漫画的温暖与哲理感——简单的角色说着深刻的话,日常场景中蕴含人生智慧
  • Visual world: 圆头小孩、小狗、小鸟组成一个温暖的小世界。背景极简(草地、天空、狗屋、树)。色调像泛黄的报纸漫画
  • Reference: "Like a Peanuts comic strip — warm, philosophical, charming"
  • Style guide:
    references/proven-styles-snoopy.md
  • ⚠️ 关键经验: 不要在prompt中过度约束视觉细节(颜色比例、构图位置、角色姿势),否则会严重降低多样性。只描述情绪和内容,让AI自由发挥
2. Manga Educational — 学習漫画风
  • Philosophy: Japanese educational manga (学習漫画) — a character GUIDES you through the concept with reactions and drama
  • Colors: Bright and warm palette, white bg with selective color panels, screen-tone gray for emphasis areas
  • Ratio: 60% illustration / 30% text (in bubbles) / 10% effects
  • Typography: Bold manga-style titles with impact, body text in speech/thought bubbles, onomatopoeia as decorative elements. Size contrast 3:1
  • Composition: Dynamic manga panel layouts (3-5 panels per slide), character reactions drive emphasis, speed lines for energy, dramatic angles
  • Visual language: Expressive anime-style characters, reaction faces (surprise, confusion, eureka!), manga effects (sweat drops, sparkles, speed lines), panel borders with varied thickness
  • Reference: "Like a 'Manga Guide to Statistics' page — a character walks you through the concept, reacting with surprise and delight"
3. Ligne Claire Comics — 清线漫画风
  • Philosophy: Hergé's Tintin tradition — maximum information clarity through visual restraint
  • Colors: White/cream (#FFFDF7) bg, black (#000000) outlines, flat saturated fills (3-5 solid colors, no gradients)
  • Ratio: 70% clean bg / 20% illustration / 10% text
  • Typography: Hand-lettered feel for titles, clean sans-serif for body. Speech bubbles for key quotes. Title:body = 2.5:1
  • Composition: Panel-based layouts (2-4 panels per slide), sequential left-to-right reading flow, clear gutters between panels
  • Visual language: Uniform-weight outlines, flat colors without shading or hatching, no gradients, precise details but zero visual noise
  • Reference: "Like a Tintin page explaining a concept — every panel advances understanding, nothing is decorative"
4. Neo-Pop Magazine — 新波普杂志风
  • Philosophy: Youth media / streetwear brand aesthetic, bold and playful
  • Colors: Cream (#FFF8E7) bg, black (#000000) text, color-blocking with hot pink (#FF1493) + cyan (#00CED1) + yellow (#FFD700)
  • Ratio: 50% bg / 25% color blocks / 25% content
  • Typography: Headlines 40-50% of slide area (typography AS the visual), thick black borders around text blocks, 10:1 size ratio vs body
  • Composition: Modular color blocks with "controlled chaos", stacked asymmetric layouts, thick borders
  • Visual language: Pixel-art 8-bit icons, cutout photography, speech bubbles, bold graphic surfaces
  • Reference: "Like a Supreme lookbook meets a HYPEBEAST article — treats typography as graphic art"
第二梯队(推荐,特定场景效果好):
5. Whiteboard Sketch — xkcd白板手绘风
  • Philosophy: xkcd meets a professor's whiteboard — extreme minimalism forces focus on the idea itself
  • Colors: White (#FFFFFF) bg, black (#000000) ink, ONE accent color for emphasis (red #FF4444 or blue #4488FF)
  • Ratio: 85% white space / 10% sketch / 5% accent highlight
  • Typography: Hand-drawn/handwritten feel for everything, rough uneven baselines, arrows and annotations everywhere. Key numbers can be large (60pt+)
  • Composition: Freeform whiteboard layout, hand-drawn arrows connecting concepts, diagrams and stick figures, informal and alive
  • Visual language: Stick figures, hand-drawn charts and graphs, wobbly lines, annotation arrows, circled keywords, equation-style layouts
  • Reference: "Like an xkcd 'What If?' explanation — simple drawings that make complex ideas instantly click"
6. Soviet Constructivism — 苏联构成主义
  • Philosophy: Revolutionary propaganda poster — power through geometry and limited color
  • Colors: Revolutionary red (#CC0000) 40% + black (#1A1A1A) 25% + cream white (#F5E6D3) 30%
  • Typography: All text rotated 15-30 degrees, NO horizontal lines, bold condensed
  • Composition: Diagonal wedge from bottom-left to top-right, geometric shapes growing small to large (visual crescendo)
  • Visual language: NO gradients, pure flat fills + sharp edges, three-color limit, propaganda poster energy
  • Reference: "Like a 1920s Rodchenko poster — power, urgency, and geometric precision"
7. Warm Narrative — 温暖叙事风
  • Philosophy: Friendly storytelling, like a TED talk visual or Airbnb pitch deck
  • Colors: Warm cream (#FDF6EC) bg, dark charcoal (#3D3D3D) text, coral (#E17055) accent
  • Ratio: 60% warm bg / 25% content / 15% illustration
  • Typography: Headlines bold and warm, 3:1 ratio to body. Short sentences, not bullets
  • Composition: Illustration occupies 40-50% of slide, text wraps around visuals, rounded shapes
  • Visual language: Flat vector illustrations with warm palette, people-centric imagery, storytelling flow
  • Reference: "Like a Mailchimp or Notion brand presentation — approachable and human"
更多风格(第二/三梯队) 详见
references/proven-styles-gallery.md
,包括:The Oatmeal信息图漫画、敦煌壁画、浮世绘、孔版印刷Risograph、等轴测Isometric、Bauhaus包豪斯、工程蓝图Blueprint、复古广告Vintage Ad、达达拼贴Collage、像素画Pixel Art

第四类:Professional / Editorial 设计系统(Path A 专用)
⚠️ 以下风格 强烈建议使用 Path A(HTML→PPTX)。它们依赖精确排版、数据可视化和网格系统,AI图片生成无法达到所需精度。口腔行业分析案例已验证 Path A + Pentagram编辑风格的出色效果。
8. Pentagram Editorial — 编辑杂志风(信息建筑派)
  • Philosophy: Pentagram/Michael Bierut — 字体即语言,网格即思想。用极度克制的设计让数据和内容自己说话
  • Colors: 奶油白(#FFFDF7) bg, 近黑(#1A1A1A) text, ONE accent color (如橙红#D4480B或品牌色)
  • Ratio: 60% whitespace / 30% content / 10% accent
  • Typography: 粗黑标题(28pt+) + 轻正文(10-13pt), 英文section label作为设计元素 (INSIGHT / PART 03)
  • Composition: 瑞士网格系统, 2px黑色边框卡片, 精确的水平分隔线, 数据可视化内嵌
  • Visual language: 极简图标, 条形图/饼图/趋势线, callout框, tag标签
  • Reference: "Like a McKinsey insight report meets Monocle magazine — data-rich but editorially elegant"
  • 执行路径: Path A only(HTML→PPTX)
  • 实战验证: 口腔行业分析15页deck(
    _temp/口腔行业分析/slides/
9. Fathom Data Narrative — 数据叙事风(科学期刊派)
  • Philosophy: Fathom Information Design — 每一个像素都必须承载信息。科学严谨+设计优雅
  • Colors: 白(#FFFFFF) bg, 深灰(#333) text, 海军蓝(#1A365D) primary + 一个highlight color
  • Ratio: 50% charts/data / 30% text / 20% whitespace
  • Typography: GT America/Graphik风格的sans-serif, 大数字(60pt+)作为视觉锚点, 精确的脚注/来源标注
  • Composition: 高信息密度但不拥挤, 注释系统嵌入布局, small multiples图表阵列, 精确的时间线
  • Visual language: 散点图, 热力图, timeline, 带注释的图表, 数据标签精确到小数
  • Reference: "Like a Nature paper's data supplement meets a Bloomberg data feature"
  • 执行路径: Path A only(HTML→PPTX)
10. Müller-Brockmann Grid — 瑞士网格风(纯粹主义派)
  • Philosophy: Josef Müller-Brockmann — 客观性即美。数学精确的网格系统让任何混乱的信息变得有序
  • Colors: 白(#FFFFFF) bg, 黑(#000) text, 最多一个强调色
  • Ratio: 70% structured grid / 20% text / 10% accent
  • Typography: Akzidenz-Grotesk/Helvetica, 严格的8pt基线网格, 绝对左对齐, 字重对比(300 vs 700)
  • Composition: 8列数学网格, 所有元素对齐到网格线, 绝对不允许装饰元素, 功能主义至上
  • Visual language: 纯几何图形, 黑色线条表格, 精确对齐的列表, 无图标无插画
  • Reference: "Like the original Swiss Style poster — timeless, rational, zero decoration"
  • 执行路径: Path A only(HTML→PPTX)
11. Build Luxury Minimal — 奢侈极简风(当代品牌派)
  • Philosophy: Build Studio — 精致的简单比复杂更难。用大量留白和微妙字重变化传达高端感
  • Colors: 纯白(#FFFFFF) bg, 深灰(#2D2D2D) text, 单一accent(品牌色)极少量使用
  • Ratio: 75% whitespace / 15% text / 10% accent
  • Typography: 字重变化极微妙(200-600), 标题巨大(48pt+)但轻, 正文小而精(12pt), 字间距宽松
  • Composition: 黄金比例构图, 元素极少, 每页只说一件事, 呼吸感优先
  • Visual language: 高端产品图(如果有), 极简图标线条, 大面积纯色块, 圆角卡片
  • Reference: "Like an Apple keynote meets a Celine lookbook — confident restraint"
  • 执行路径: Path A(HTML→PPTX)
12. Takram Speculative — 日式思辨风(东方哲学派)
  • Philosophy: Takram — 技术是思考的媒介。用柔和的科技感和概念原型图传达深度思考
  • Colors: 暖灰(#F5F3EF) bg, 深灰(#3D3D3D) text, 鼠尾草绿(#8B9D77) accent
  • Ratio: 55% warm bg / 25% diagrams / 20% text
  • Typography: 圆润的sans-serif, 标题不用粗体而用大尺寸(36pt+), 正文温暖(14pt), 行高宽松(1.8)
  • Composition: 柔和阴影(blur 20px+), 圆角(16px+), 概念图/流程图作为核心视觉, 卡片式布局
  • Visual language: 概念原型图, 柔和渐变, 流程图即艺术, 手绘感图标, 自然色调
  • Reference: "Like a Takram project page — where technology feels thoughtful, not aggressive"
  • 执行路径: Path A(HTML→PPTX,配图可AI辅助生成)
更深入的风格细节:参考
design-philosophy
skill 的
references/design-styles.md
,包含20种设计哲学的完整提示词DNA
⚠️ 重要经验:插画/漫画类风格的AI生成效果远好于「专业极简」类风格。 漫画/插画风格有明确的视觉语言(线条、角色、色块),AI可以充分发挥;极简风格(暗色底+发光文字+大量留白)缺乏视觉元素,生成出来「空」且「平」。
根据主题和氛围选择3套匹配的风格,优先使用下方的主题推荐表,然后向用户展示每个风格的完整描述。
按主题自动推荐(优先从此表选):
主题类型第一推荐第二推荐第三推荐
品牌/产品介绍Snoopy温暖漫画Neo-Pop新波普浮世绘/敦煌(东方品牌)
教育/培训Neo-Brutalism学習漫画Snoopy温暖漫画
技术分享xkcd白板Neo-BrutalismLigne Claire
数据报告Pentagram编辑Fathom数据Ligne Claire
年轻受众Neo-Pop像素画孔版印刷
创意/艺术达达拼贴孔版印刷The Oatmeal
国风/东方敦煌壁画浮世绘Takram思辨
正式商务Pentagram编辑Müller-Brockmann网格Build极简
产品发布/keynote苏联构成主义Neo-PopPentagram编辑
内部分享Neo-BrutalismThe Oatmealxkcd白板
行业分析/咨询Fathom数据Pentagram编辑Müller-Brockmann网格
培训课件/教材Takram思辨温暖叙事学習漫画
投资/融资路演Build极简Pentagram编辑苏联构成主义
完整18种风格详细参考:
references/proven-styles-gallery.md
风格样例图片:
assets/style-samples/
目录

第一梯队(强烈推荐,效果极好):
1. 温暖漫画风 — Snoopy温暖漫画风
  • 设计理念:Peanuts漫画的温暖与哲理感——简单的角色说着深刻的话,日常场景中蕴含人生智慧
  • 视觉元素:圆头小孩、小狗、小鸟组成一个温暖的小世界。背景极简(草地、天空、狗屋、树)。色调像泛黄的报纸漫画
  • 参考描述:"类似Peanuts花生漫画风格,温暖、有哲理、富有吸引力"
  • 风格指南:
    references/proven-styles-snoopy.md
  • ⚠️ 关键经验: 不要在prompt中过度约束视觉细节(颜色比例、构图位置、角色姿势),否则会严重降低多样性。只描述情绪和内容,让AI自由发挥
2. 教育漫画风 — 学習漫画风
  • 设计理念:日式教育漫画(学習漫画)—— 由角色通过反应和戏剧化表现引导用户理解概念
  • 配色:明亮温暖的调色板,白色背景配合选择性彩色面板,网点灰色用于突出重点区域
  • 占比:60% 插画 / 30% 对话气泡文字 / 10% 特效元素
  • 排版: bold漫画风格标题富有冲击力,正文放在对话/想法气泡中,拟声词作为装饰元素。标题与正文字号比例3:1
  • 构图:动态漫画分镜布局(每页3-5个分镜),角色反应引导重点,速度线增加动感,戏剧化视角
  • 视觉语言:表现力强的动漫风格角色、反应脸(惊讶、困惑、恍然大悟!)、漫画特效(汗滴、闪光、速度线)、不同粗细的分镜边框
  • 参考描述:"类似《漫画统计学指南》内页风格——角色带你理解概念,伴随惊喜和愉悦的反应"
3. 清线漫画风 — 清线漫画风
  • 设计理念:埃尔热《丁丁历险记》传统风格——通过视觉克制实现最大化信息清晰度
  • 配色:白色/米白色(#FFFDF7)背景,黑色(#000000)轮廓,平涂饱和填充色(3-5种纯色,无渐变)
  • 占比:70% 干净背景 / 20% 插画 / 10% 文字
  • 排版:标题采用手写感字体,正文采用干净的无衬线字体。关键引语用对话气泡展示。标题与正文字号比例2.5:1
  • 构图:基于分镜的布局(每页2-4个分镜),从左到右的顺序阅读流,分镜间留白清晰
  • 视觉语言:统一粗细的轮廓线,无阴影或排线的平涂颜色,无渐变,细节精准但无视觉噪音
  • 参考描述:"类似解释概念的丁丁漫画内页——每个分镜都推进理解,没有多余装饰"
4. 新波普杂志风 — 新波普杂志风
  • 设计理念:青年媒体/街头潮牌审美,大胆活泼
  • 配色:米白色(#FFF8E7)背景,黑色(#000000)文字,搭配亮粉色(#FF1493)+青色(#00CED1)+黄色(#FFD700)的色块
  • 占比:50% 背景 / 25% 色块 / 25% 内容
  • 排版:标题占幻灯片面积的40-50%(排版本身就是视觉元素),文字块外围有粗黑边框,标题与正文字号比例10:1
  • 构图:模块化色块搭配「可控的混乱」,堆叠式不对称布局,粗边框
  • 视觉语言:像素风8位图标、剪切风格摄影、对话气泡、大胆的图形表面
  • 参考描述:"类似Supreme型录结合HYPEBEAST文章风格——将排版作为图形艺术"
第二梯队(推荐,特定场景效果好):
5. 白板手绘风 — xkcd白板手绘风
  • 设计理念:xkcd漫画结合教授白板风格——极致极简迫使注意力聚焦在观点本身
  • 配色:白色(#FFFFFF)背景,黑色(#000000)墨水,仅用一种强调色(红色#FF4444或蓝色#4488FF)突出重点
  • 占比:85% 留白 / 10% 手绘内容 / 5% 强调高亮
  • 排版:所有内容都采用手写/手绘感字体,基线粗糙不平,到处是箭头和注释。关键数字可放大到60pt以上
  • 构图:自由的白板布局,手绘箭头连接概念,图表和简笔画,非正式且有生命力
  • 视觉语言:简笔画人物、手绘图表、波浪线、注释箭头、圈出的关键词、公式类布局
  • 参考描述:"类似xkcd《What If?》的解释风格——简单的绘图让复杂概念立刻清晰"
6. 苏联构成主义 — 苏联构成主义
  • 设计理念:革命宣传海报风格——通过几何图形和有限配色传递力量感
  • 配色:革命红(#CC0000)占40% + 黑色(#1A1A1A)占25% + 米白色(#F5E6D3)占30%
  • 排版:所有文字旋转15-30度,无水平线条,粗体压缩字体
  • 构图:从左下角到右上角的斜向楔形布局,几何图形从小到大递增(视觉渐强)
  • 视觉语言:无渐变,纯平涂填充+锋利边缘,仅限三种颜色,宣传海报的能量感
  • 参考描述:"类似1920年代罗德琴科海报风格——力量感、紧迫感、几何精准"
7. 温暖叙事风 — 温暖叙事风
  • 设计理念:友好的叙事风格,类似TED演讲视觉或Airbnb融资演示文稿
  • 配色:暖米色(#FDF6EC)背景,深炭灰(#3D3D3D)文字,珊瑚色(#E17055)强调色
  • 占比:60% 暖背景 / 25% 内容 / 15% 插画
  • 排版:标题粗体温暖,与正文字号比例3:1。用短句而非项目符号
  • 构图:插画占幻灯片的40-50%,文字环绕视觉元素,圆角形状
  • 视觉语言:暖色调平涂矢量插画、以人为中心的图像、叙事化流程
  • 参考描述:"类似Mailchimp或Notion品牌演示文稿风格——平易近人且人性化"
更多风格(第二/三梯队) 详见
references/proven-styles-gallery.md
,包括:The Oatmeal信息图漫画、敦煌壁画、浮世绘、孔版印刷Risograph、等轴测Isometric、Bauhaus包豪斯、工程蓝图Blueprint、复古广告Vintage Ad、达达拼贴Collage、像素画Pixel Art

第四类:专业/编辑类设计系统(仅路径A适用)
⚠️ 以下风格 强烈建议使用路径A(HTML→PPTX)。它们依赖精确排版、数据可视化和网格系统,AI图片生成无法达到所需精度。口腔行业分析案例已验证路径A + Pentagram编辑风格的出色效果。
8. Pentagram编辑风 — 编辑杂志风(信息建筑派)
  • 设计理念:Pentagram/Michael Bierut风格——字体即语言,网格即思想。用极度克制的设计让数据和内容自己说话
  • 配色:奶油白(#FFFDF7)背景,近黑(#1A1A1A)文字,仅用一种强调色(如橙红#D4480B或品牌色)
  • 占比:60% 留白 / 30% 内容 / 10% 强调色
  • 排版:粗黑标题(28pt+) + 轻量正文(10-13pt),英文section label作为设计元素 (INSIGHT / PART 03)
  • 构图:瑞士网格系统,2px黑色边框卡片,精确的水平分隔线,内嵌数据可视化
  • 视觉语言:极简图标、条形图/饼图/趋势线、callout框、tag标签
  • 参考描述:"类似麦肯锡洞察报告结合Monocle杂志风格——数据丰富但编辑感优雅"
  • 执行路径:仅路径A(HTML→PPTX)
  • 实战验证: 口腔行业分析15页deck(
    _temp/口腔行业分析/slides/
9. Fathom数据叙事风 — 数据叙事风(科学期刊派)
  • 设计理念:Fathom信息设计风格——每个像素都必须承载信息。科学严谨+设计优雅
  • 配色:白色(#FFFFFF)背景,深灰(#333)文字,海军蓝(#1A365D)主色 + 一个高亮色
  • 占比:50% 图表/数据 / 30% 文字 / 20% 留白
  • 排版:GT America/Graphik风格无衬线字体,大数字(60pt+)作为视觉锚点,精确的脚注/来源标注
  • 构图:高信息密度但不拥挤,注释系统嵌入布局,small multiples图表阵列,精确的时间线
  • 视觉语言:散点图、热力图、timeline、带注释的图表、精确到小数的数据标签
  • 参考描述:"类似《自然》论文的数据补充材料结合彭博数据专题风格"
  • 执行路径:仅路径A(HTML→PPTX)
10. Müller-Brockmann网格风 — 瑞士网格风(纯粹主义派)
  • 设计理念:Josef Müller-Brockmann风格——客观性即美。数学精确的网格系统让任何混乱的信息变得有序
  • 配色:白色(#FFFFFF)背景,黑色(#000)文字,最多一个强调色
  • 占比:70% 结构化网格 / 20% 文字 / 10% 强调色
  • 排版:Akzidenz-Grotesk/Helvetica字体,严格的8pt基线网格,绝对左对齐,字重对比(300 vs 700)
  • 构图:8列数学网格,所有元素对齐到网格线,绝对不允许装饰元素,功能主义至上
  • 视觉语言:纯几何图形、黑色线条表格、精确对齐的列表、无图标无插画
  • 参考描述:"类似原始瑞士风格海报—— timeless、理性、零装饰"
  • 执行路径:仅路径A(HTML→PPTX)
11. Build奢侈极简风 — 奢侈极简风(当代品牌派)
  • 设计理念:Build Studio风格——精致的简单比复杂更难。用大量留白和微妙的字重变化传达高端感
  • 配色:纯白(#FFFFFF)背景,深灰(#2D2D2D)文字,单一强调色(品牌色)极少量使用
  • 占比:75% 留白 / 15% 文字 / 10% 强调色
  • 排版:字重变化极微妙(200-600),标题巨大(48pt+)但字重轻,正文小而精(12pt),字间距宽松
  • 构图:黄金比例构图,元素极少,每页只传递一个信息,呼吸感优先
  • 视觉语言:高端产品图(如有)、极简图标线条、大面积纯色块、圆角卡片
  • 参考描述:"类似Apple keynote结合Celine型录风格——充满自信的克制"
  • 执行路径:路径A(HTML→PPTX)
12. Takram日式思辨风 — 日式思辨风(东方哲学派)
  • 设计理念:Takram风格——技术是思考的媒介。用柔和的科技感和概念原型图传达深度思考
  • 配色:暖灰(#F5F3EF)背景,深灰(#3D3D3D)文字,鼠尾草绿(#8B9D77)强调色
  • 占比:55% 暖背景 / 25% 示意图 / 20% 文字
  • 排版:圆润的无衬线字体,标题不用粗体而是用大尺寸(36pt+),正文温暖(14pt),行高宽松(1.8)
  • 构图:柔和阴影(模糊20px+)、圆角(16px+)、概念图/流程图作为核心视觉、卡片式布局
  • 视觉语言:概念原型图、柔和渐变、流程图即艺术、手绘感图标、自然色调
  • 参考描述:"类似Takram项目页面风格——技术显得有思考温度,而非攻击性"
  • 执行路径:路径A(HTML→PPTX,配图可AI辅助生成)
更深入的风格细节:参考
design-philosophy
skill 的
references/design-styles.md
,包含20种设计哲学的完整提示词DNA

🎨 Custom Character Style (User-Defined)

🎨 自定义角色风格(用户定义)

Users may want to reference specific cartoon/anime aesthetics. When a user says "do it in Doraemon style" or "like Studio Ghibli", treat this as a style reference, not a request to draw copyrighted characters. Build a custom Design System by extracting the visual DNA of that style.
How to convert a character reference into a Design System:
User saysExtract these visual traits
"Doraemon style"Round shapes, bright primary blue + white + red, simple backgrounds, cute proportions, magical gadget reveals
"Studio Ghibli"Watercolor textures, natural greens and sky blues, detailed backgrounds with simple characters, warmth and wonder
"Calvin and Hobbes"Dynamic ink brushwork, expressive motion lines, philosophical contrast between fantasy and reality, lush outdoor scenes
"One Piece manga"Bold dynamic lines, exaggerated proportions, dramatic action poses, high energy, thick outlines
"Crayon Shin-chan"Crude crayon-like lines, flat bright colors, comedic proportions, everyday scenarios made absurd
"Adventure Time"Geometric simple shapes, pastel candy colors, thin outlines, whimsical surreal backgrounds
Template for custom style:
[User Style]: "[reference name]"
→ Shape language: [round/angular/geometric/organic]
→ Line quality: [thin uniform / thick varied / sketchy / brushwork]
→ Color palette: [specific colors extracted from that aesthetic]
→ Character style: [proportions, expressiveness level]
→ Background treatment: [detailed/minimal/abstract]
→ Emotional tone: [warm/energetic/philosophical/surreal]
用户可能希望参考特定的卡通/动漫美学。当用户说“用哆啦A梦风格制作”或“类似吉卜力工作室风格”时,将其视为风格参考,而非要求绘制受版权保护的角色。通过提取该风格的视觉DNA来构建自定义设计系统。
如何将角色参考转化为设计系统:
用户需求提取的视觉特征
"哆啦A梦风格"圆形造型、明亮的基础蓝+白+红、简单背景、可爱比例、神奇道具展示
"吉卜力工作室风格"水彩纹理、自然的绿色和天蓝色、细节丰富的背景搭配简单角色、温暖和惊奇感
"卡尔文与霍布斯风格"动态毛笔笔触、富有表现力的运动线、幻想与现实的哲学对比、葱郁的户外场景
"海贼王漫画风格"大胆的动态线条、夸张比例、戏剧化的动作姿势、高能量、粗轮廓线
"蜡笔小新风格"粗糙的蜡笔感线条、平涂明亮配色、喜剧比例、日常场景的荒诞化
"探险活宝风格"几何简单造型、马卡龙糖果色、细轮廓线、异想天开的超现实背景
自定义风格模板:
[用户风格]: "[参考名称]"
→ 造型语言: [圆形/棱角/几何/有机]
→ 线条质感: [细且统一 / 粗且多变 / 草图感 / 毛笔笔触]
→ 调色板: [从该美学中提取的特定颜色]
→ 角色风格: [比例、表现力等级]
→ 背景处理: [细节丰富/极简/抽象]
→ 情感基调: [温暖/有活力/有哲理/超现实]

Typography Rules (All Presets)

排版规则(所有预设通用)

  • Max 2 font families (1 heading + 1 body)
  • Heading: bold, personality — ≥36pt (trend: even larger, as graphic surface)
  • Body: clean, readable — ≥18pt
  • Chinese: system default (PingFang SC / Microsoft YaHei)
  • Key principle: Typography is a DESIGN ELEMENT, not just an information container
  • 最多使用2种字体族(1种标题+1种正文)
  • 标题:粗体、有个性,字号≥36pt(趋势:更大,作为图形元素)
  • 正文:干净、易读,字号≥18pt
  • 中文:系统默认字体(PingFang SC / Microsoft YaHei)
  • 核心原则: 排版是设计元素,而不仅仅是信息载体

✅ Checkpoint 2 (Guided + Collaborative)

✅ 检查点2(引导式+协作式模式)

Ask the user to pick one of the 3 proposed design systems, or describe their own preference. Show the full description including philosophy, visual language, and reference.

请用户从3套提议的设计系统中选择一套,或者描述他们自己的偏好。展示完整描述,包括设计理念、视觉语言和参考示例。

Step 3: Build Slides

第3步:制作幻灯片



Step 3-A: HTML + Selective Illustrations (Path A)

第3-A步:HTML + 选择性插画(路径A)

Generate AI illustrations for key slides, then create HTML slide files.
Which slides need illustrations? Prioritize:
  1. Cover slide — always. Sets the visual tone.
  2. Key insight slides — the "aha moment" slides benefit most.
  3. Closing slide — optional but impactful.
  4. Data-heavy slides — charts/diagrams instead of AI art.
Illustration Generation — use
nano-banana-pro
skill:
bash
export $(grep GEMINI_API_KEY ~/.claude/.env) && \
uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "[description]" \
  --filename "[timestamp]-slide-[N]-[name].png" \
  --resolution 2K
Base Style Prompt — define ONE style suffix, append to every illustration:
[Base Style]: flat vector illustration, [palette background color] background,
[accent color] highlight elements, clean minimalist aesthetic,
professional presentation style, no text in image
Per-slide prompt = [specific content] + [Base Style]
Key rules:
  • Always include "no text in image" — text will be added as editable elements
  • Use descriptive paragraphs, not keyword lists
  • Specify hex colors explicitly
  • Use "flat vector" / "flat illustration" for consistency
Embedding in HTML slides:
html
<!-- Side illustration (recommended) -->
<div class="left"><!-- text content --></div>
<div class="right"><img src="illustration.png" style="width: 280pt; height: 280pt;"></div>

<!-- Background illustration -->
<body style="background-image: url('illustration.png'); background-size: cover;">
✅ Checkpoint 3-A (Guided: preview 2-3 key illustrations; Collaborative: every one)
Show generated illustrations. Ask: Approve / regenerate / style consistent?

为关键幻灯片生成AI插画,然后创建HTML幻灯片文件。
哪些幻灯片需要插画? 优先级:
  1. 封面页 — 必须,奠定视觉基调
  2. 核心洞察页 — “顿悟时刻”的页面收益最大
  3. 结束页 — 可选,但能提升冲击力
  4. 数据密集页 — 用图表/示意图代替AI插画
插画生成 — 使用
nano-banana-pro
skill:
bash
export $(grep GEMINI_API_KEY ~/.claude/.env) && \
uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "[description]" \
  --filename "[timestamp]-slide-[N]-[name].png" \
  --resolution 2K
基础风格提示词 — 定义一个统一的风格后缀,附加到每一张插画的提示词后:
[基础风格]: flat vector illustration, [palette background color] background,
[accent color] highlight elements, clean minimalist aesthetic,
professional presentation style, no text in image
单页提示词 = [具体内容] + [基础风格]
核心规则:
  • 始终包含“no text in image” — 文字将作为可编辑元素单独添加
  • 使用描述性段落,而非关键词列表
  • 明确指定十六进制颜色
  • 使用“flat vector” / “flat illustration”保持风格统一
嵌入HTML幻灯片:
html
<!-- 侧边插画(推荐) -->
<div class="left"><!-- 文字内容 --></div>
<div class="right"><img src="illustration.png" style="width: 280pt; height: 280pt;"></div>

<!-- 背景插画 -->
<body style="background-image: url('illustration.png'); background-size: cover;">
✅ 检查点3-A(引导式:预览2-3张关键插画;协作式:逐张确认)
展示生成的插画,询问用户:确认通过/重新生成/风格是否统一?

Step 3-B: Full AI Slide Generation (Path B)

第3-B步:全AI幻灯片生成(路径B)

Generate EVERY slide as a complete AI image — layout, text, visuals, all in one.
⚠️ THE #1 MISTAKE: Over-constraining the prompt with layout details and visual restrictions. More constraints = LESS creativity and diversity. The AI generates best when given mood + reference + content, NOT specific positions, color ratios, or character restrictions.
将每一页幻灯片生成为完整的AI图片 — 布局、文字、视觉元素全部一体化生成。
⚠️ 最常见错误:用布局细节和视觉限制过度约束提示词。 约束越多 = 创意和多样性越低。给AI提供氛围+参考+内容时生成效果最好,而非指定具体位置、颜色比例或角色限制。

The Golden Rule of AI Image Prompts

AI图片提示词黄金法则

SHORT prompts > LONG prompts. A 3-sentence prompt describing mood and content produces better results than a 30-line prompt specifying every visual detail. Specifically:
DON'T (kills diversity)DO (enables creativity)
Specify color ratios (60%/25%/15%)Describe the mood ("warm like a Sunday comic page")
Dictate layout positions ("title centered, image on right")Reference a specific aesthetic ("Peanuts comic strip")
Restrict characters ("NOT Snoopy — an original character")Let AI interpret the style naturally
List every visual element to includeDescribe what the viewer should FEEL
Repeat the base style in every per-slide promptDefine base style once, keep per-slide prompts short
短提示词 > 长提示词。 一段3句话描述氛围和内容的提示词,比30行指定每个视觉细节的提示词生成效果更好。具体来说:
错误做法(扼杀多样性)正确做法(释放创意)
指定颜色比例(60%/25%/15%)描述氛围(“温暖得像周日的漫画页”)
指定布局位置(“标题居中,图片在右侧”)参考特定美学风格(“Peanuts花生漫画风格”)
限制角色(“不要Snoopy,要原创角色”)让AI自然解读风格
列出所有要包含的视觉元素描述观看者应该感受到的情绪
每个单页提示词都重复基础风格只定义一次基础风格,单页提示词保持简短

Base Style Prompt — Keep it SHORT

基础风格提示词 — 保持简短

Define a base style once, append to every slide. Keep it under 5 lines. The base style sets the mood; per-slide prompts add the content.
[Base Style]:
VISUAL REFERENCE: [Specific art/design aesthetic in one sentence]
CANVAS: 16:9 aspect ratio, 2048x1152 pixels, high quality rendering.
COLOR SYSTEM: [Describe the mood/feel of colors, not exact ratios]
Example (good — concise):
VISUAL REFERENCE: Charles Schulz Peanuts comic strip — warm, philosophical, charming.
Characters include round-headed kids, a lovable beagle dog, and a small yellow bird.
CANVAS: 16:9 aspect ratio, 2048x1152 pixels, high quality rendering.
COLOR SYSTEM: Warm cream/newspaper tone background, soft muted pastels, warm ink lines.
Anti-pattern (bad — over-specified): Do NOT include typography sizes, color ratios, composition percentages, margin specifications, or visual weight distributions in the base style. These constraints reduce diversity without improving quality.
只定义一次基础风格,附加到每一页幻灯片的提示词后。控制在5行以内。 基础风格设定氛围,单页提示词补充内容。
[基础风格]:
视觉参考: [用一句话描述特定艺术/设计美学]
画布: 16:9比例, 2048x1152像素, 高质量渲染。
配色系统: [描述颜色的氛围/感受,而非精确比例]
示例(好的写法,简洁):
视觉参考: 查尔斯·舒尔茨Peanuts花生漫画风格 — 温暖、有哲理、有吸引力。
角色包括圆头小孩、可爱的小猎犬、黄色小鸟。
画布: 16:9比例, 2048x1152像素, 高质量渲染。
配色系统: 暖奶油/报纸色调背景, 柔和的莫兰迪色, 温暖的墨线。
反例(不好的写法,过度指定): 不要在基础风格中包含排版大小、颜色比例、构图占比、边距规范或视觉权重分布。这些约束会降低多样性,且不会提升质量。

Per-Slide Prompt Structure

单页提示词结构

Keep per-slide prompts short and focused. Do NOT repeat base style details or over-specify visual layout.
Create a [style] slide about [topic].

[Base Style]

DESIGN INTENT: [1 sentence — what the viewer should FEEL]

TEXT TO RENDER:
- Title: "[exact text]"
- Body: "[exact text]"

[Optional: 1-2 sentences describing mood or scene. Let AI decide composition.]
保持单页提示词简短聚焦。不要重复基础风格细节,也不要过度指定视觉布局。
创建一个[风格]幻灯片,主题是[主题]。

[基础风格]

设计意图: [1句话,描述观看者应该感受到的情绪]

要渲染的文字:
- 标题: "[准确文字]"
- 正文: "[准确文字]"

[可选:1-2句话描述氛围或场景。让AI决定构图。]

Example — GOOD vs BAD

示例 — 好与坏对比

BAD (traditional PPT — boring):
Design a professional presentation slide.
Professional presentation slide, 16:9 aspect ratio, 2048x1152 pixels.
Dark navy background, light gray text, gold accent.
Slide type: content. Layout: Title at top-left, two columns below.
Title: "看涨期权收益结构"
Body: "行权价: 100元, 权利金: 10元"
Visual: a line chart showing call option payoff
→ Result: Generic PPT that could come from any template
GOOD (magazine-level — stunning):
Create a slide that feels like a Bloomberg terminal data visualization
brought to life as editorial art.

VISUAL REFERENCE: Bloomberg Businessweek data feature meets cinematic lighting.
CANVAS: 16:9, 2048x1152, sharp rendering.
COLOR SYSTEM: Deep black (#0A0A0A) background 75%, white text 15%,
gold (#BF9A4A) accent 10%. The gold represents profit — it should GLOW.
TYPOGRAPHY: The number "110" rendered at 100pt as the dominant visual anchor
(the break-even point IS the story). Supporting text at 14pt, muted gray.

DESIGN INTENT: The viewer should instantly FEEL the asymmetry of options —
limited downside, unlimited upside. The visual must make this visceral,
not just informational.

TEXT TO RENDER:
- Hero metric: "110" (giant, gold, the break-even price)
- Title: "盈亏平衡点" (medium, white, above the number)
- Left data: "行权价 100" "权利金 10" (small, gray, understated)
- Insight: "亏损有底 盈利无限" (accent color, bottom)

VISUAL NARRATIVE: A single golden curve emerges from the left side of the slide,
flat and muted in gray at -10 (the maximum loss), then suddenly bending upward
at the strike price, transitioning from gray to brilliant gold as it rises
into the profit zone. The curve should feel like a ray of light breaking
through darkness. The profitable area above zero glows with warm gold
atmospheric lighting, like sunrise. The chart has NO grid lines, NO axes labels
cluttering the visual — just the pure, dramatic curve and the giant "110"
floating at the inflection point.
→ Result: An editorial data visualization that tells a story
坏的示例(传统PPT,无聊):
设计一个专业演示幻灯片。
专业演示幻灯片, 16:9比例, 2048x1152像素。
深海军蓝背景, 浅灰色文字, 金色强调色。
幻灯片类型: 内容页。布局: 标题在左上角, 下方两栏布局。
标题: "看涨期权收益结构"
正文: "行权价: 100元, 权利金: 10元"
视觉元素: 展示看涨期权收益的折线图
→ 结果:任何模板都能生成的通用PPT
好的示例(杂志级,惊艳):
创建一个类似彭博终端数据可视化的幻灯片,呈现为编辑艺术风格。

视觉参考: 彭博商业周刊数据专题结合电影级打光。
画布: 16:9, 2048x1152, 清晰渲染。
配色系统: 深黑色(#0A0A0A)背景占75%, 白色文字占15%, 金色(#BF9A4A)强调色占10%。金色代表利润,需要有发光效果。
排版: 数字"110"以100pt字号作为主导视觉锚点(盈亏平衡点就是核心故事)。辅助文字14pt,浅灰色。

设计意图: 观看者应该立刻感受到期权的不对称性——亏损有限,盈利无限。视觉效果要 visceral,而非仅仅是信息传递。

要渲染的文字:
- 核心指标: "110"(巨大,金色,盈亏平衡价格)
- 标题: "盈亏平衡点"(中等大小,白色,在数字上方)
- 左侧数据: "行权价 100" "权利金 10"(小号,灰色,低调呈现)
- 洞察: "亏损有底 盈利无限"(强调色,底部)

视觉叙事: 一条金色曲线从幻灯片左侧出现,在-10(最大亏损)处是平缓的灰色,然后在行权价处突然向上弯曲,从灰色过渡到耀眼的金色,上升进入盈利区间。曲线应该像一束冲破黑暗的光。零以上的盈利区域散发着温暖的金色氛围光,像日出。图表没有网格线,没有坐标轴标签干扰视觉——只有纯粹的、戏剧化的曲线和浮动在拐点处的巨大数字"110"。
→ 结果:一个能讲故事的编辑级数据可视化作品

Key Rules for Path B Prompts

路径B提示词核心规则

Prompt Quality Checklist (verify before every generation):
  1. Visual Reference — Does the prompt name a specific art style or publication? (NOT just "professional" or "modern")
  2. Mood, not Layout — Does the prompt describe what the viewer should FEEL, not where elements should be PLACED?
  3. Text Content — Are all texts to render listed clearly and accurately?
  4. Short Enough — Is the prompt concise? Long prompts with detailed specs REDUCE diversity. Remove anything the AI can decide on its own.
  5. NO Micro-Management — No hex color ratios, no typography sizes, no composition percentages, no character pose instructions.
Technical Rules:
  • Always specify resolution:
    2048x1152
    (2K, 16:9) for crisp text
  • Include ALL text verbatim — AI must render exact words
  • 中文优先: slide上的文字一律用中文,仅保留必要英文术语
  • Chinese text tip: Keep titles short (≤8 characters) for best rendering
  • Use descriptive paragraphs, not keyword lists
  • Generate in parallel: Run 3-5 slide generations concurrently for speed
  • Consistency: The Base Style is applied to EVERY slide. It's a system, not a suggestion
Generation command (same tool, but full-slide prompts):
bash
export $(grep GEMINI_API_KEY ~/.claude/.env) && \
uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "[full slide prompt]" \
  --filename "slide-[NN]-[name].png" \
  --resolution 2K
Quality check after generation:
  1. Text accuracy — verify all Chinese/English text rendered correctly
  2. Layout — elements positioned as described
  3. Style consistency — colors and design language match across slides
  4. If a slide has text errors → regenerate with adjusted prompt (simplify text or shorten)
✅ Checkpoint 3-B (Guided: preview all slides as a set; Collaborative: approve each)
Show ALL generated slide images to the user. Ask:
  • Text readable and accurate?
  • Visual style consistent across slides?
  • Any slides to regenerate?

提示词质量检查清单(每次生成前验证):
  1. 视觉参考 — 提示词是否指定了具体的艺术风格或出版物?(而非仅“专业”或“现代”)
  2. 氛围而非布局 — 提示词是否描述了观看者应该感受到的情绪,而非元素应该放置的位置?
  3. 文字内容 — 所有要渲染的文字是否清晰准确列出?
  4. 足够简短 — 提示词是否简洁?带有详细规范的长提示词会降低多样性。删除所有AI可以自主决定的内容。
  5. 没有微观管理 — 没有十六进制颜色比例、没有排版大小、没有构图占比、没有角色姿势指令。
技术规则:
  • 始终指定分辨率:
    2048x1152
    (2K,16:9)保证文字清晰
  • 包含所有准确文字 — AI必须渲染精确的文字内容
  • 中文优先: 幻灯片上的文字一律用中文,仅保留必要英文术语
  • 中文文字提示: 标题保持简短(≤8字)以获得最佳渲染效果
  • 使用描述性段落,而非关键词列表
  • 并行生成: 同时运行3-5个幻灯片生成任务提升速度
  • 一致性: 基础风格应用到每一页幻灯片,它是系统规则,而非建议
生成命令(同一工具,但使用全页提示词):
bash
export $(grep GEMINI_API_KEY ~/.claude/.env) && \
uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "[full slide prompt]" \
  --filename "slide-[NN]-[name].png" \
  --resolution 2K
生成后质量检查:
  1. 文字准确性 — 验证所有中/英文文字渲染正确
  2. 布局 — 元素位置符合描述
  3. 风格一致性 — 所有幻灯片的颜色和设计语言匹配
  4. 如果幻灯片有文字错误 → 调整提示词后重新生成(简化文字或缩短长度)
✅ 检查点3-B(引导式:预览整套幻灯片;协作式:逐页确认)
向用户展示所有生成的幻灯片图片,询问:
  • 文字是否可读且准确?
  • 所有幻灯片的视觉风格是否统一?
  • 是否需要重新生成某页?

Step 4: PPTX Assembly

第4步:PPTX组装

4-A: html2pptx Workflow (Path A)

4-A: html2pptx工作流(路径A)

Create HTML files per slide, convert with
html2pptx.js
:
javascript
const pptxgen = require('pptxgenjs');
const html2pptx = require(process.env.HOME + '/.agents/skills/pptx/scripts/html2pptx.js');

const pptx = new pptxgen();
pptx.layout = 'LAYOUT_16x9';
await html2pptx('slide1.html', pptx);
await html2pptx('slide2.html', pptx);
await pptx.writeFile({ fileName: 'output.pptx' });
HTML rules (from pptx skill):
  • Body dimensions:
    width: 720pt; height: 405pt
    (16:9)
  • ALL text must be in
    <p>
    ,
    <h1>
    -
    <h6>
    ,
    <ul>
    ,
    <ol>
    tags
  • Backgrounds/borders only on
    <div>
    elements
  • No CSS gradients — pre-render as PNG with Sharp
  • Use web-safe fonts only (Arial, Helvetica, Georgia, etc.)
  • Images:
    <img src="illustration.png" style="width: Xpt; height: Ypt;">
Known issue: Chinese characters in file paths can break image loading. Use symlinks to ASCII paths if needed:
bash
ln -sf "/path/with/中文/" /tmp/ascii-path
为每页幻灯片创建HTML文件,使用
html2pptx.js
转换:
javascript
const pptxgen = require('pptxgenjs');
const html2pptx = require(process.env.HOME + '/.agents/skills/pptx/scripts/html2pptx.js');

const pptx = new pptxgen();
pptx.layout = 'LAYOUT_16x9';
await html2pptx('slide1.html', pptx);
await html2pptx('slide2.html', pptx);
await pptx.writeFile({ fileName: 'output.pptx' });
HTML规则(来自pptx skill):
  • Body尺寸:
    width: 720pt; height: 405pt
    (16:9)
  • 所有文字必须放在
    <p>
    ,
    <h1>
    -
    <h6>
    ,
    <ul>
    ,
    <ol>
    标签内
  • 背景/边框仅能应用在
    <div>
    元素上
  • 不支持CSS渐变 — 用Sharp预先渲染为PNG
  • 仅使用网络安全字体(Arial, Helvetica, Georgia等)
  • 图片:
    <img src="illustration.png" style="width: Xpt; height: Ypt;">
已知问题: 文件路径中的中文字符可能导致图片加载失败。如有需要,创建软链接到ASCII路径:
bash
ln -sf "/path/with/中文/" /tmp/ascii-path

4-B: Image Assembly (Path B)

4-B: 图片组装(路径B)

Assemble generated slide images into PPTX using
create_slides.py
:
bash
uv run ~/.claude/skills/image-to-slides/scripts/create_slides.py \
  slide-01-cover.png slide-02-intro.png slide-03-definition.png ... \
  --layout fullscreen \
  --bg-color 000000 \
  -o output.pptx
Recommended layout for Path B:
fullscreen
— images fill the entire slide since they already contain all layout, text, and visuals.
LayoutUse case
fullscreen
AI-generated full-page slides (Path B default)
title_above
Image + editable title (hybrid approach)
title_left
Split: text + visual
center
Centered image with padding
grid
Multiple images per slide

使用
create_slides.py
将生成的幻灯片图片组装成PPTX:
bash
uv run ~/.claude/skills/image-to-slides/scripts/create_slides.py \
  slide-01-cover.png slide-02-intro.png slide-03-definition.png ... \
  --layout fullscreen \
  --bg-color 000000 \
  -o output.pptx
路径B推荐布局:
fullscreen
— 图片充满整页,因为已经包含了所有布局、文字和视觉元素。
布局适用场景
fullscreen
AI生成的整页幻灯片(路径B默认)
title_above
图片 + 可编辑标题(混合方案)
title_left
分栏布局:文字 + 视觉元素
center
居中带边距的图片
grid
每页多张图片

Step 5: Preview & Polish

第5步:预览与打磨

Preview

预览

Path A: Screenshot 3-4 key HTML slides with Playwright:
bash
npx playwright screenshot "file:///path/to/slide.html" preview.png \
  --viewport-size=960,540 --wait-for-timeout=1000
Path B: Show the generated slide images directly (they ARE the slides). Use
Read
tool to display 3-4 key PNGs.
路径A: 用Playwright截取3-4张关键HTML幻灯片的截图:
bash
npx playwright screenshot "file:///path/to/slide.html" preview.png \
  --viewport-size=960,540 --wait-for-timeout=1000
路径B: 直接展示生成的幻灯片图片(它们本身就是幻灯片)。使用
Read
工具展示3-4张关键PNG。

✅ Checkpoint 4 (All modes)

✅ 检查点4(所有模式)

Show preview to the user. The PPTX file is ready — ask:
  • Any slides to adjust?
  • Ready to open in Keynote/PowerPoint?
向用户展示预览。 PPTX文件已准备好,询问:
  • 是否需要调整某页幻灯片?
  • 是否可以导出为Keynote/PowerPoint兼容格式?

Final Polish (in Keynote/PowerPoint)

最终打磨(在Keynote/PowerPoint中)

  • Transitions and animations
  • Speaker notes
  • Brand logo placement
  • Path A: Final text adjustments (editable)
  • Path B: Text NOT editable — if text errors found, regenerate the slide image

  • 转场和动画
  • 演讲者备注
  • 品牌logo放置
  • 路径A:最终文字调整(可编辑)
  • 路径B:文字不可编辑 — 如果发现文字错误,重新生成该页幻灯片图片

Design Quick Reference

设计快速参考

5/5/5 rule: ≤5 words/line, ≤5 bullets/slide, ≤5 text-heavy slides in a row
Cognitive load: One idea per slide. ~1 min per slide. Slides complement speech, never duplicate it.
Visual hierarchy: F/Z-pattern reading flow. Title:body size ≈ 3:1. Every slide should have a visual element.
Detailed references:
  • references/proven-styles-gallery.md
    — 17 tested visual styles with tiered recommendations
  • references/proven-styles-snoopy.md
    — Snoopy/Peanuts style detailed per-slide templates
  • references/prompt-templates.md
    — Content generation and image prompts
  • references/design-principles.md
    — Full design framework, color palettes, typography
5/5/5规则: 每行≤5字,每页≤5个项目符号,连续最多5页文字密集的幻灯片
认知负载: 每页只传递一个观点。每页讲解时间约1分钟。幻灯片是演讲的补充,绝非复制演讲内容。
视觉层次: F/Z型阅读流。标题与正文字号比例≈3:1。每页都要有视觉元素。
详细参考:
  • references/proven-styles-gallery.md
    — 17种经过测试的视觉风格,带分级推荐
  • references/proven-styles-snoopy.md
    — Snoopy/Peanuts风格逐页模板详情
  • references/prompt-templates.md
    — 内容生成和图片提示词
  • references/design-principles.md
    — 完整设计框架、调色板、排版规则

Related Skills

相关技能

SkillRole
pptx
Advanced PPTX creation/editing (html2pptx, templates)
nano-banana-pro
AI illustration generation (Gemini 3 Pro Image)
multi-model
External AI for content drafting
design-philosophy
20种设计哲学深度参考(风格DNA + 场景模板 + 评审标准)。Professional/Editorial风格的详细提示词和评审指南在此
技能作用
pptx
高级PPTX创建/编辑(html2pptx、模板)
nano-banana-pro
AI插画生成(Gemini 3 Pro Image)
multi-model
外部AI用于内容草稿生成
design-philosophy
20种设计哲学深度参考(风格DNA + 场景模板 + 评审标准)。专业/编辑类风格的详细提示词和评审指南在此

Output

输出

  • .pptx
    files compatible with PowerPoint, Keynote, Google Slides
  • Web-safe fonts for cross-platform compatibility
  • AI illustrations as separate PNG files (reusable)

花叔出品 | AI Native Coder · 独立开发者 公众号「花叔」| 30万+粉丝 | AI工具与效率提升 代表作:小猫补光灯(AppStore付费榜Top1)·《一本书玩转DeepSeek》
  • 兼容PowerPoint、Keynote、Google Slides的
    .pptx
    文件
  • 跨平台兼容的网络安全字体
  • 单独的AI插画PNG文件(可复用)

花叔出品 | AI Native Coder · 独立开发者 公众号「花叔」| 30万+粉丝 | AI工具与效率提升 代表作:小猫补光灯(AppStore付费榜Top1)·《一本书玩转DeepSeek》