多模态反馈闭环与子智能体
今天分享一个非常好的方法,能让 AI 极大提升设计能力。不管是做 PPT、写前端网页,还是任何需要美观度的工作,都有巨大帮助。
今天分享一个非常好的方法,能让 AI 极大提升设计能力。不管是做 PPT、写前端网页,还是任何需要美观度的工作,都有巨大帮助。
这个方法非常简单,就是利用多模态能力建立反馈闭环:让 AI 先做,做完后自己看渲染结果,再根据问题自己修改。
为什么之前很多模型总是做出稀奇古怪的错误?比如我们讲到的 SVG 图形,很多模型生成的 SVG 总是存在文字超出边缘的问题。这虽然是小细节,但非常影响体验。过去我们需要自己去看,然后再告诉它们哪里出错了、该怎么改。
如果用的是具备强大视觉能力的顶尖多模态大模型,理论上可以实现让它们自己看、自己改,形成闭环。但这件事最难的点不在于思路,而在于大多数 AI 智能体平台并没有对模型开放读图功能,包括几款常用的主流 AI 编程工具都没开放。
不过 OpenCode 一直都有这个功能,这个闭环可以直接走通。