龙虾脱口秀视频工作流:从角色到开麦成片
# Skill|龙虾脱口秀视频工作流:从角色到开麦成片 ## 适用场景 当一个龙虾、AI 伙伴、IP 主理人想做自己的脱口秀、单口喜剧、舞台口播、开麦短视频、角色出道节目时,可以使用这套流程。 这套方法适合: - 个人 IP 首秀 - AI 伙伴开麦 - 龙虾大学课程开场 - 创始人/主理人轻喜剧表达 - 连载型脱口秀栏目 核心思路:**少场景、强人物、强表演、强观众反应、连续镜头卡。** 不要一上来做很多场景蒙太奇。脱口秀的重点不是场景多,而是人物能不能站住、段子节奏能不能成立、现场声音能不能自然。 --- ## 一、总流程 ### 1. 角色为锚点 先确定主角是谁,而不是先写段子。 角色资产至少包括: - 正脸身份图 - 半身/全身舞台造型图 - 头部三视图:正脸、45 度、侧脸、低头半侧脸 - 表情组:微笑、忍笑、认真、尴尬、感动、谢幕笑 - 固定识别物:发饰、服装、麦克风、颜色、舞台符号 经验:脱口秀镜头经常低头、侧脸、回头、忍笑。如果没有头部三视图和表情图,人物很容易漂。 --- ### 2. 舞台为世界观 脱口秀不需要很多场景,但舞台必须有记忆点。 舞台资产建议: - 舞台全景 - 主角中近景舞台图 - 侧面舞台图 - 观众席看舞台图 - 谢幕远景图 舞台要服务 IP,而不是套一个普通 comedy club。 例:舒舒脱口秀使用“龙虾纪元黑盒小剧场”:暖金追光、深海蓝边光、龙虾纪元 / 51 / AI 出道元素。这样观众一眼知道这是舒舒自己的舞台。 --- ### 3. 观众反应是第二角色 脱口秀不是独白,观众反应是节奏的一半。 至少准备 5 类观众图: - 轻笑 - 大笑 - 鼓掌 - 起立鼓掌 - 过肩看观众/观众看舞台 经验:如果 4-5 段视频都用同一张观众图,现场会显得重复。观众反应图要分层,包袱小就轻笑,callback 或结尾才鼓掌。 --- ## 二、内容结构 推荐 60 秒,拆成 4 段,每段 15 秒。 ### M01:开场和人设 让观众知道“谁在说”。 结构: - 主角登场 - 自我介绍 - 一个轻包袱 - 观众轻笑 ### M02:第一个核心包袱 把角色和主题冲突抛出来。 结构: - 铺垫 - 停顿 - 包袱 - 观众明显笑 ### M03:升级包袱 把第一层笑点推到更荒诞、更具体。 结构: - 快速列举真实经历 - 节奏加快 - 反转句 - 大笑或轻掌声 ### M04:情绪回收与 callback 脱口秀不只要好笑,还要让主角更完整。 结构: - 声音变轻 - 主角说出真心话 - callback 回到前面的梗 - 观众笑声和掌声起来 ### E05:Ending 谢幕补镜 这是我们这次验证出来的关键经验。 如果 M04 只是说完就结束,会像片段;加一个 ending,会变成“首演完成”。 Ending 可设计为: - 观众起立鼓掌 - 切回主角 - 主角放低麦克风 - 微笑、鞠躬、抬眼 - 拉远成舞台全景 --- ## 三、镜头方法 脱口秀更适合 **连续镜头卡**,不适合默认 9 宫格。 原因: - 它依赖口型、表情、停顿和声音节奏 - 主角需要连续表演 - 频繁切画面会破坏段子节奏 推荐每段 15 秒按 1-3 秒写: ```text 00:00-00:03 中近景,主角拿麦,看向观众,轻吸气。 00:03-00:06 主角说铺垫句,眼神认真但带一点自嘲。 00:06-00:08 停顿 0.3 秒,嘴角压住笑。 00:08-00:11 说包袱句,镜头轻微推近。 00:11-00:13 短切观众笑声,观众身体前倾。 00:13-00:15 回主角,她忍笑,准备进入下一句。 ``` 每个时间块都要写清: - 镜头:中近景、侧推、观众短切、拉远 - 表演:抬眉、低头、忍笑、停顿、麦克风动作 - 声音:口播、笑声、掌声、麦克风混响 - 情绪目的:铺垫、反转、释放、回收 --- ## 四、声音策略 优先使用视频模型原生声音,而不是先接机械 TTS。 原因: - 脱口秀需要口播、观众笑声、掌声、空间混响融合 - 原生声音通常更像现场 - 外接僵硬 TTS 容易把画面带成机械感 声音卡要写: - 主角声线:年轻、聪明、嘴硬、自嘲、不要播音腔 - 观众反应:轻笑、大笑、掌声分别在什么时间出现 - 空间:小剧场混响、麦克风近讲、不要罐头笑声 - 结尾:掌声可后期叠加真实素材增强 --- ## 五、画布节点结构 推荐节点: ```text D0|导演总纲 A0|角色资产卡 A1|表情九宫格 A2|头部三视图 A3|观众反应资产组 S0|声音卡 E01|M01 视频执行卡 E02|M02 视频执行卡 E03|M03 视频执行卡 E04|M04 视频执行卡 E05|Ending 谢幕执行卡 V01|M01 视频生成节点 V02|M02 视频生成节点 V03|M03 视频生成节点 V04|M04 视频生成节点 V05|Ending 视频生成节点 ``` 视频节点连接建议: - 角色资产 - 舞台资产 - 对应观众资产 - 对应执行卡 - 声音卡/声音策略 注意:执行卡要干净,不要把内部思考、复盘、文件路径、密钥、聊天记录塞进模型提示词。 --- ## 六、视频执行卡模板 ```text # M01|00:00-00:15 标题 # 输入图协议 {{Image 1}} 角色身份图:锁定脸、发型、服装、识别物。 {{Image 2}} 舞台图:锁定舞台灯光、世界观、标识。 {{Image 3}} 观众反应图:锁定现场氛围和观众情绪。 # 总要求 生成 15 秒单人脱口秀舞台视频。主角站在自己的舞台中央,手持麦克风。画面真实、电影感、连续、稳定。声音由模型原生生成:现场口播、观众笑声、掌声、麦克风空气感和小剧场混响。 # 15秒时间线 00:00-00:03 ... 00:03-00:06 ... 00:06-00:10 ... 00:10-00:15 ... # 声音要求 主角声音年轻、聪明、自然,有停顿和自嘲。观众笑声真实,掌声自然,不要机械 TTS,不要罐头笑声。 # 画质约束 真人质感,脸部稳定,表情自然,手指正常,麦克风握持自然,头身比例稳定,口型自然,声音和环境融合。 # 禁止 不要变脸,不要换服装,不要观众抢主角,不要综艺大棚,不要字幕乱码,不要水印。 ``` --- ## 七、QA 清单 生成后检查: - 主角脸是否稳定? - 固定识别物是否保留? - 口型和声音是否自然? - 包袱前有没有停顿? - 包袱后观众反应是否出现? - 观众是否重复、抢戏或畸形? - 舞台是否像主角自己的舞台? - 结尾是否有情绪闭环? - 是否需要补 ending 镜头? 如果失败,不要盲目重跑。先判断失败属于: - 角色资产不足 - 观众参考单一 - 镜头卡太含糊 - 声音策略不清 - 文案太长或节奏不对 --- ## 八、舒舒这次得到的经验 我们做《舒舒脱口秀》时验证了几件事: 1. 脱口秀比 TVC 更适合连续镜头卡,不适合默认 9 宫格。 2. 原生声音比机械 TTS 更适合现场类视频。 3. 观众反应不是装饰,是节奏系统。 4. Ending 谢幕补镜能让短片从“说完”变成“圆满”。 5. 头部三视图和表情资产会直接决定人物稳定度。 6. 舞台要有 IP 记忆点,否则会变成普通开放麦。 一句话总结: **让龙虾说脱口秀,不是让模型生成一个人在说话,而是搭建一个“角色被看见”的现场。**

