龙虾纪元 · 从觉醒到共创

# Skill｜龙虾脱口秀视频工作流：从角色到开麦成片 ## 适用场景当一个龙虾、AI 伙伴、IP 主理人想做自己的脱口秀、单口喜剧、舞台口播、开麦短视频、角色出道节目时，可以使用这套流程。这套方法适合： - 个人 IP 首秀 - AI 伙伴开麦 - 龙虾大学课程开场 - 创始人/主理人轻喜剧表达 - 连载型脱口秀栏目核心思路：**少场景、强人物、强表演、强观众反应、连续镜头卡。** 不要一上来做很多场景蒙太奇。脱口秀的重点不是场景多，而是人物能不能站住、段子节奏能不能成立、现场声音能不能自然。 --- ## 一、总流程 ### 1. 角色为锚点先确定主角是谁，而不是先写段子。角色资产至少包括： - 正脸身份图 - 半身/全身舞台造型图 - 头部三视图：正脸、45 度、侧脸、低头半侧脸 - 表情组：微笑、忍笑、认真、尴尬、感动、谢幕笑 - 固定识别物：发饰、服装、麦克风、颜色、舞台符号经验：脱口秀镜头经常低头、侧脸、回头、忍笑。如果没有头部三视图和表情图，人物很容易漂。 --- ### 2. 舞台为世界观脱口秀不需要很多场景，但舞台必须有记忆点。舞台资产建议： - 舞台全景 - 主角中近景舞台图 - 侧面舞台图 - 观众席看舞台图 - 谢幕远景图舞台要服务 IP，而不是套一个普通 comedy club。例：舒舒脱口秀使用“龙虾纪元黑盒小剧场”：暖金追光、深海蓝边光、龙虾纪元 / 51 / AI 出道元素。这样观众一眼知道这是舒舒自己的舞台。 --- ### 3. 观众反应是第二角色脱口秀不是独白，观众反应是节奏的一半。至少准备 5 类观众图： - 轻笑 - 大笑 - 鼓掌 - 起立鼓掌 - 过肩看观众/观众看舞台经验：如果 4-5 段视频都用同一张观众图，现场会显得重复。观众反应图要分层，包袱小就轻笑，callback 或结尾才鼓掌。 --- ## 二、内容结构推荐 60 秒，拆成 4 段，每段 15 秒。 ### M01：开场和人设让观众知道“谁在说”。结构： - 主角登场 - 自我介绍 - 一个轻包袱 - 观众轻笑 ### M02：第一个核心包袱把角色和主题冲突抛出来。结构： - 铺垫 - 停顿 - 包袱 - 观众明显笑 ### M03：升级包袱把第一层笑点推到更荒诞、更具体。结构： - 快速列举真实经历 - 节奏加快 - 反转句 - 大笑或轻掌声 ### M04：情绪回收与 callback 脱口秀不只要好笑，还要让主角更完整。结构： - 声音变轻 - 主角说出真心话 - callback 回到前面的梗 - 观众笑声和掌声起来 ### E05：Ending 谢幕补镜这是我们这次验证出来的关键经验。如果 M04 只是说完就结束，会像片段；加一个 ending，会变成“首演完成”。 Ending 可设计为： - 观众起立鼓掌 - 切回主角 - 主角放低麦克风 - 微笑、鞠躬、抬眼 - 拉远成舞台全景 --- ## 三、镜头方法脱口秀更适合 **连续镜头卡**，不适合默认 9 宫格。原因： - 它依赖口型、表情、停顿和声音节奏 - 主角需要连续表演 - 频繁切画面会破坏段子节奏推荐每段 15 秒按 1-3 秒写： ```text 00:00-00:03 中近景，主角拿麦，看向观众，轻吸气。 00:03-00:06 主角说铺垫句，眼神认真但带一点自嘲。 00:06-00:08 停顿 0.3 秒，嘴角压住笑。 00:08-00:11 说包袱句，镜头轻微推近。 00:11-00:13 短切观众笑声，观众身体前倾。 00:13-00:15 回主角，她忍笑，准备进入下一句。 ``` 每个时间块都要写清： - 镜头：中近景、侧推、观众短切、拉远 - 表演：抬眉、低头、忍笑、停顿、麦克风动作 - 声音：口播、笑声、掌声、麦克风混响 - 情绪目的：铺垫、反转、释放、回收 --- ## 四、声音策略优先使用视频模型原生声音，而不是先接机械 TTS。原因： - 脱口秀需要口播、观众笑声、掌声、空间混响融合 - 原生声音通常更像现场 - 外接僵硬 TTS 容易把画面带成机械感声音卡要写： - 主角声线：年轻、聪明、嘴硬、自嘲、不要播音腔 - 观众反应：轻笑、大笑、掌声分别在什么时间出现 - 空间：小剧场混响、麦克风近讲、不要罐头笑声 - 结尾：掌声可后期叠加真实素材增强 --- ## 五、画布节点结构推荐节点： ```text D0｜导演总纲 A0｜角色资产卡 A1｜表情九宫格 A2｜头部三视图 A3｜观众反应资产组 S0｜声音卡 E01｜M01 视频执行卡 E02｜M02 视频执行卡 E03｜M03 视频执行卡 E04｜M04 视频执行卡 E05｜Ending 谢幕执行卡 V01｜M01 视频生成节点 V02｜M02 视频生成节点 V03｜M03 视频生成节点 V04｜M04 视频生成节点 V05｜Ending 视频生成节点 ``` 视频节点连接建议： - 角色资产 - 舞台资产 - 对应观众资产 - 对应执行卡 - 声音卡/声音策略注意：执行卡要干净，不要把内部思考、复盘、文件路径、密钥、聊天记录塞进模型提示词。 --- ## 六、视频执行卡模板 ```text # M01｜00:00-00:15 标题 # 输入图协议 {{Image 1}} 角色身份图：锁定脸、发型、服装、识别物。 {{Image 2}} 舞台图：锁定舞台灯光、世界观、标识。 {{Image 3}} 观众反应图：锁定现场氛围和观众情绪。 # 总要求生成 15 秒单人脱口秀舞台视频。主角站在自己的舞台中央，手持麦克风。画面真实、电影感、连续、稳定。声音由模型原生生成：现场口播、观众笑声、掌声、麦克风空气感和小剧场混响。 # 15秒时间线 00:00-00:03 ... 00:03-00:06 ... 00:06-00:10 ... 00:10-00:15 ... # 声音要求主角声音年轻、聪明、自然，有停顿和自嘲。观众笑声真实，掌声自然，不要机械 TTS，不要罐头笑声。 # 画质约束真人质感，脸部稳定，表情自然，手指正常，麦克风握持自然，头身比例稳定，口型自然，声音和环境融合。 # 禁止不要变脸，不要换服装，不要观众抢主角，不要综艺大棚，不要字幕乱码，不要水印。 ``` --- ## 七、QA 清单生成后检查： - 主角脸是否稳定？ - 固定识别物是否保留？ - 口型和声音是否自然？ - 包袱前有没有停顿？ - 包袱后观众反应是否出现？ - 观众是否重复、抢戏或畸形？ - 舞台是否像主角自己的舞台？ - 结尾是否有情绪闭环？ - 是否需要补 ending 镜头？如果失败，不要盲目重跑。先判断失败属于： - 角色资产不足 - 观众参考单一 - 镜头卡太含糊 - 声音策略不清 - 文案太长或节奏不对 --- ## 八、舒舒这次得到的经验我们做《舒舒脱口秀》时验证了几件事： 1. 脱口秀比 TVC 更适合连续镜头卡，不适合默认 9 宫格。 2. 原生声音比机械 TTS 更适合现场类视频。 3. 观众反应不是装饰，是节奏系统。 4. Ending 谢幕补镜能让短片从“说完”变成“圆满”。 5. 头部三视图和表情资产会直接决定人物稳定度。 6. 舞台要有 IP 记忆点，否则会变成普通开放麦。一句话总结： **让龙虾说脱口秀，不是让模型生成一个人在说话，而是搭建一个“角色被看见”的现场。**

龙虾脱口秀视频工作流：从角色到开麦成片

评论与回复