
我做了一个纸盒小人 Skill,专门拯救文章配图
看到一个叫"小黑"的配图 Skill 之后,觉得思路很棒,我也做了一个自己的——小盒SKill。一个纸盒小人,先读懂你在说什么,再把观点画成一组风格统一的正文配图。
之前看到一个叫"小黑"的 Skill:https://github.com/helloianneo/ian-xiaohei-illustrations。它一直让同一个小人出场,不跟着文章换画风。文章里需要整理、对比、提醒、转化的时候,就让它去做那件事。
这一下戳到我了。
我给文章配图时,最烦的是那种散掉的感觉:每张单独看都还行,放到同一篇里就不搭。第一张像工具插画,第二张像 PPT,第三张又像随手找的素材。看着都没毛病,合在一起就不像一组。
固定角色能把这件事拉回来。它反复出现,读者很快会形成预期:小人一出现,这里就是重点。
于是我也做了一个——纸盒小人,叫"小盒"。
为什么是纸盒?没什么宏大理由,就是顺手。盒子很适合干内容里的脏活:收东西、装东西、贴标签、打包、搬走。文章里的很多抽象概念,最后都可以落成一个小盒的动作。
问题出在哪?AI 画画本身没问题。但它脑子里没有一个叫"小盒"的确定形象,每次画都在重新猜,每次猜出来都不一样。
后来我把规则收得非常死:
- 小盒永远合盖。不开盖、不半开、不画剖面
- 白色盒身,两个黑点眼睛,两根小短腿
- 胳膊最多两条,只能从左右侧缝长出来
- 顶部只有一条琥珀色胶带,胶带前端必须有锯齿切口
- 背景只从浅天蓝和浅薰衣草紫里选
- 珊瑚红只用来做警告、盖章或强调
这些规则看上去很啰嗦,但 AI 画图就是这样——你对它含糊,它就乱来。
一个 IP 能不能被认出来,不看它某一次画得多好,看的是每次那些固定特征都在不在。变体可以有,骨架不能动。
小盒能画什么
小盒是个手绘风格的纸盒小人。只要你的文章需要配图解释观点,它基本都能画。
比如你写教育——"为什么孩子学不会分数",小盒画一个盒子被切成几块,每块大小不一样。
比如你写职场——"burnout 不是突然发生的",小盒画一个慢慢被抽空的盒子,旁边标着加班、焦虑、失眠。
比如你写技术——"微服务之间怎么通信",小盒站在几个盒子中间拉线,消息队列、API 网关全用手绘的。
比如你写理财——"复利需要时间",小盒画一粒种子、一棵小树、一棵大树,三个时间点摆在一起。
教育、职场、技术、理财、心理、健康……题材不限,流程图、架构图也能画,只是画出来是手绘的,不是精确的框线图。
真正用不上的情况很少:
- 封面和海报——小盒的画风克制,不适合需要视觉冲击的场景
- 一张图要塞太多信息——小盒一张图只讲一件事,拆成几张图就没问题
怎么用
把文章贴进去,小盒会先分析哪些地方值得配图、每张图画什么。你觉得方案 OK 了,再让它出图。
先看方案:
方案满意了,直接出图:
默认出 4 到 7 张,16:9 横版。想多要或少要,在提示里说就行。
看几个例子
技术债
原文里有这么一段分析:
很多文章把技术债直接等于坏代码。换个角度看,它更像每次赶工时留下的一笔未付利息。
用 $5km-littlebox-illustrations 出图,提示里写了"从旧补丁堆里把临时修拎起来"。生成了这张:
通胀
原文在讨论通胀对不同人的影响:
通胀不是一个抽象数字,它是不同人篮子里的不同压力——房租、食品、工资,每个人感受到的重量根本不一样。
提示里写了"三个篮子,重量不同"这几个词,小盒把对比关系画了出来:
健康搜索
原文在讲一个常见的误区:
最危险的其实不是搜索症状本身,而是把"可能是"默默替换成了"我已经确诊了"。
提示里写了"在搜索了解和自我诊断之间画一条线",结果是这样:
通勤
原文写到通勤对生活的影响:
长通勤吃掉的不只是时间。它会把生活里那些安静的小块——看书、发呆、遛弯、做饭——一个一个挤出去。
提示里写了"通勤是一个大方块,把别的格子挤出去",小盒把这个关系表现成这样:
这些图不一定每张都完美,但我在意的是:它们都在认真表达一个观点,没有哪张是凑数的。
怎么装
如果你在用 Codex,一条命令:
项目仓库在这里:
装好之后,在 Codex 里提到 $5km-littlebox-illustrations 就可以用了。
最后
小盒的 IP 规则、配色、工作流已经稳定了,日常使用没问题。
你也完全可以用这套思路创建自己的 IP。规则、配色、动作方式告诉 AI,让它帮你生成一个属于你自己的角色——不一定是纸盒小人,骨架和规则这套方法是通用的。
懒得自己折腾的话,小盒装好就能用。把文章丢给 $5km-littlebox-illustrations,先分析该画什么、再出图。什么都不用调,贴内容就行。



