AI 资源 / Skills

仿写短视频口播文案

分析短视频口播文案的爆款元素,仿写一篇结构相似但内容全新的口播文案。当用户提供一个短视频文件(或字幕文本),希望分析其爆款逻辑并仿写同类风格文案时使用。

Skill外部导入

安装方式

手工下载

下载完整 Skill 压缩包,解压后可手动放入你的智能体技能目录。

AI 指令安装

把下面这句话直接发给你的 AI 智能体即可:

请安装来自 /static/content/resources/skills/video-copywriting-imitator/skill.zip 的 Skill。

本 Skill 来自《玩转 Skill:零门槛打造你的 AI 数字员工》第 8.4 节。 这是一个框架模板,核心流程是:提取字幕 → 分析爆款结构 → 仿写 + 自我核查。 scripts/extract_subtitle.py 是占位文件,首次使用前需要让 AI 帮你生成完整脚本。

环境准备

本 Skill 的字幕提取脚本依赖以下工具:

  • Python(3.8 及以上)
  • ffmpeg(用于从视频中提取音频)
  • FunASR(阿里达摩院开源语音识别工具,本地运行,中文识别效果好,完全免费)

首次使用时,如果脚本运行报错提示缺少模块或工具,直接告诉 AI 根据报错自动安装。FunASR 首次运行会下载几 GB 的模型文件,需要一些时间,请耐心等待。

云端替代方案:如果本地配置 FunASR 有困难(内存不足或不想折腾),可以改用云端语音识别接口(如阿里云语音识别、讯飞语音识别)。申请 API Key 后,告诉 AI 将脚本修改为调用云端 API 的方式即可。

使用场景

用户提供了一个爆款短视频文件(MP4、MKV 等格式),希望:

  1. 提取视频中的口播字幕
  2. 分析这条视频的爆款结构和关键元素
  3. 基于分析结果,为指定主题仿写一篇口播文案

工作流程

第一步:提取字幕

确认用户提供的视频文件路径,运行字幕提取脚本:

python scripts/extract_subtitle.py [视频文件路径] [输出文本文件路径]

等待脚本执行完毕,确认字幕文本文件已生成,才进入下一步。

如果 extract_subtitle.py 尚未生成(文件内容是占位说明),先执行以下步骤:

  1. 告知用户需要生成脚本
  2. 根据以下需求自动生成脚本代码并写入 scripts/extract_subtitle.py
    • 输入:视频文件路径(支持 mp4、mkv、mov 等常见格式)
    • 输出:纯文本文件,包含视频中全部口播内容
    • 处理逻辑:先用 ffmpeg 从视频中提取音频(WAV 格式),再用 FunASR 的 paraformer-zh 模型识别中文语音,输出识别文本
    • 异常处理:文件不存在或格式不支持时给出明确错误提示;依赖未安装时给出安装命令
  3. 生成后先做独立测试,确认脚本可正常运行

第二步:分析爆款元素

阅读提取出的字幕文本,从以下五个维度深入分析这条视频的爆款结构:

开场钩子

  • 前几句话用了什么方式抓住注意力?(提问式、冲突式、悬念式、数据冲击式、反常识式……)
  • 具体引用开头 1~3 句话,说明为什么这种方式有效

内容节奏

  • 全文分几个段落/层次?
  • 信息密度如何(是快速推进还是有停顿让观众消化)?
  • 在哪里设置了转折或情绪高潮?

表达风格

  • 语言口语化程度(是贴近聊天的口语,还是偏正式的书面语)
  • 句子平均长短(短促有力还是舒展细腻)
  • 是否有标志性口头禅、金句或特定的语气词

情绪曲线

  • 从开头到结尾,情绪是如何变化的?
  • 例如:平铺直叙 / 先抑后扬 / 层层递进 / 急转直下 / 共鸣收尾

结尾设计

  • 用了什么方式引导观众互动?(关注/点赞/评论/转发/私信)
  • 结尾是硬广形式还是软性引导?

将上述分析整理为结构化输出,展示给用户。

必须等用户确认以下两点再进入下一步:

  1. 分析结果是否准确?有没有理解偏差的地方需要修正?
  2. 仿写的主题是什么?(如果用户还未指定主题,此处询问)

第三步:仿写口播文案

根据用户确认的分析结果和指定主题,撰写一篇新的口播文案。

仿写原则:

  • 保留:原视频中经验证有效的框架结构(如开头的提问式钩子、中间的三段递进、结尾的行动号召)
  • 替换:具体的用词、句式、案例和表达方式,不得照搬原文的任何完整句子
  • 保持:口语化风格,文案必须适合对着镜头朗读,避免书面腔
  • 对齐:篇幅与原视频口播文案相近

第四步:自我核查(不可跳过)

写完口播文案后,必须执行以下三项核查,逐项检查完毕再输出:

  1. 原创性核查:将仿写文案与原字幕逐段对比,如果任何一段话与原文高度相似(超过 50% 词语相同),必须重写该段,直到对比通过
  2. 框架完整性核查:逐一检验分析阶段识别出的核心框架要素(开场钩子、情绪曲线设计、结尾引导等),确保每一项在仿写文案中都有体现;如有遗漏,补充完善
  3. 可读性核查:通读全文,将所有读起来拗口、不符合口语习惯、或者像"AI 写的"的句子重新改写,直到读起来自然流畅

三项核查全部通过后,输出最终的仿写口播文案。

注意事项

  • 第一步字幕提取脚本执行完毕之前,不得进入第二步
  • 仿写目标是学习框架,不是复制内容;核查环节不可省略
  • 如果原视频内容涉及虚假信息、夸大宣传或不当言论,在分析时明确指出,仿写时主动规避
  • 处理完成后直接输出最终文案,不需要做额外总结或复盘