仿写短视频口播文案
分析短视频口播文案的爆款元素,仿写一篇结构相似但内容全新的口播文案。当用户提供一个短视频文件(或字幕文本),希望分析其爆款逻辑并仿写同类风格文案时使用。
安装方式
手工下载
下载完整 Skill 压缩包,解压后可手动放入你的智能体技能目录。
AI 指令安装
把下面这句话直接发给你的 AI 智能体即可:
请安装来自 /static/content/resources/skills/video-copywriting-imitator/skill.zip 的 Skill。
本 Skill 来自《玩转 Skill:零门槛打造你的 AI 数字员工》第 8.4 节。 这是一个框架模板,核心流程是:提取字幕 → 分析爆款结构 → 仿写 + 自我核查。
scripts/extract_subtitle.py是占位文件,首次使用前需要让 AI 帮你生成完整脚本。
环境准备
本 Skill 的字幕提取脚本依赖以下工具:
- Python(3.8 及以上)
- ffmpeg(用于从视频中提取音频)
- FunASR(阿里达摩院开源语音识别工具,本地运行,中文识别效果好,完全免费)
首次使用时,如果脚本运行报错提示缺少模块或工具,直接告诉 AI 根据报错自动安装。FunASR 首次运行会下载几 GB 的模型文件,需要一些时间,请耐心等待。
云端替代方案:如果本地配置 FunASR 有困难(内存不足或不想折腾),可以改用云端语音识别接口(如阿里云语音识别、讯飞语音识别)。申请 API Key 后,告诉 AI 将脚本修改为调用云端 API 的方式即可。
使用场景
用户提供了一个爆款短视频文件(MP4、MKV 等格式),希望:
- 提取视频中的口播字幕
- 分析这条视频的爆款结构和关键元素
- 基于分析结果,为指定主题仿写一篇口播文案
工作流程
第一步:提取字幕
确认用户提供的视频文件路径,运行字幕提取脚本:
python scripts/extract_subtitle.py [视频文件路径] [输出文本文件路径]
等待脚本执行完毕,确认字幕文本文件已生成,才进入下一步。
如果 extract_subtitle.py 尚未生成(文件内容是占位说明),先执行以下步骤:
- 告知用户需要生成脚本
- 根据以下需求自动生成脚本代码并写入
scripts/extract_subtitle.py:- 输入:视频文件路径(支持 mp4、mkv、mov 等常见格式)
- 输出:纯文本文件,包含视频中全部口播内容
- 处理逻辑:先用 ffmpeg 从视频中提取音频(WAV 格式),再用 FunASR 的 paraformer-zh 模型识别中文语音,输出识别文本
- 异常处理:文件不存在或格式不支持时给出明确错误提示;依赖未安装时给出安装命令
- 生成后先做独立测试,确认脚本可正常运行
第二步:分析爆款元素
阅读提取出的字幕文本,从以下五个维度深入分析这条视频的爆款结构:
开场钩子
- 前几句话用了什么方式抓住注意力?(提问式、冲突式、悬念式、数据冲击式、反常识式……)
- 具体引用开头 1~3 句话,说明为什么这种方式有效
内容节奏
- 全文分几个段落/层次?
- 信息密度如何(是快速推进还是有停顿让观众消化)?
- 在哪里设置了转折或情绪高潮?
表达风格
- 语言口语化程度(是贴近聊天的口语,还是偏正式的书面语)
- 句子平均长短(短促有力还是舒展细腻)
- 是否有标志性口头禅、金句或特定的语气词
情绪曲线
- 从开头到结尾,情绪是如何变化的?
- 例如:平铺直叙 / 先抑后扬 / 层层递进 / 急转直下 / 共鸣收尾
结尾设计
- 用了什么方式引导观众互动?(关注/点赞/评论/转发/私信)
- 结尾是硬广形式还是软性引导?
将上述分析整理为结构化输出,展示给用户。
必须等用户确认以下两点再进入下一步:
- 分析结果是否准确?有没有理解偏差的地方需要修正?
- 仿写的主题是什么?(如果用户还未指定主题,此处询问)
第三步:仿写口播文案
根据用户确认的分析结果和指定主题,撰写一篇新的口播文案。
仿写原则:
- 保留:原视频中经验证有效的框架结构(如开头的提问式钩子、中间的三段递进、结尾的行动号召)
- 替换:具体的用词、句式、案例和表达方式,不得照搬原文的任何完整句子
- 保持:口语化风格,文案必须适合对着镜头朗读,避免书面腔
- 对齐:篇幅与原视频口播文案相近
第四步:自我核查(不可跳过)
写完口播文案后,必须执行以下三项核查,逐项检查完毕再输出:
- 原创性核查:将仿写文案与原字幕逐段对比,如果任何一段话与原文高度相似(超过 50% 词语相同),必须重写该段,直到对比通过
- 框架完整性核查:逐一检验分析阶段识别出的核心框架要素(开场钩子、情绪曲线设计、结尾引导等),确保每一项在仿写文案中都有体现;如有遗漏,补充完善
- 可读性核查:通读全文,将所有读起来拗口、不符合口语习惯、或者像"AI 写的"的句子重新改写,直到读起来自然流畅
三项核查全部通过后,输出最终的仿写口播文案。
注意事项
- 第一步字幕提取脚本执行完毕之前,不得进入第二步
- 仿写目标是学习框架,不是复制内容;核查环节不可省略
- 如果原视频内容涉及虚假信息、夸大宣传或不当言论,在分析时明确指出,仿写时主动规避
- 处理完成后直接输出最终文案,不需要做额外总结或复盘