第13届网络视听大会录音总结
网络视听大会录音总结
一、漫剧 AI 制作痛点及「我可接力」平台介绍
当前 AI 漫剧制作普遍使用扩散式模型(diffusion),本质是生成式 AI,行业存在三大核心痛点:
1. 反复 “抽卡”,效率极低
- 创作者输入提示词后,AI 生成结果高度随机、靠运气。
- 行业内40%–50% 的返工都来自生成效果不可控。
- 每次生成图 / 视频都要反复试,成本高、周期长。
2. 表情僵硬、动作卡顿、镜头错乱
- 模型对指令遵循度(PE)不足,叙事逻辑弱。
- 人物表情、动作不自然,镜头之间无连贯性。
- 不同人对镜头语言、叙事理解差异大,成片质量不稳定。
3. 流水线复杂,依赖大团队协同
- 流程:剧本→资产→分镜→配音→后期,环节多、协同难。
- 工具虽多,但没有统一智能平台,整体效率低。
「我可接力(WorkRally)」平台核心解决方案
① 专家级 Agent 调度:一次性过稿,告别抽卡
- 通过大模型 + 剧本拆解,理解上下文、人物关系、走位、构图、运镜、色调。
- 解决穿帮、连镜、一致性问题。
- 把 “事后修补” 变成前置控制。
- 实测:准确率提升约 60%,基本告别抽卡焦虑。
② S + 级影视动漫技能库:AI 更懂审美
- 内置头部工作室、导演、视效、美术沉淀的专业技能库。
- 提供:构图、角色表演、动作编排、镜头语言。
- 让非专业创作者也能做出专业导演级画面。
- 效果:AI 不再 “盲拍”,精品内容成本下降,品质上限拉高。
③ 一站式智能流水线:量产 = 精品
- 整合多环节、多模态、多 Agent,形成智能协作创作工具。
- 从剧本分析→分镜拆解→资产生成→对话→打戏→动作编排全打通。
- 实测:精品产能翻 5 倍。
平台理念
- Work:工作流智能化。
- Rally:集结创作者,接力共创。
- 目标:让创作者专注创意与故事,重复工作交给 AI。
二、AI 与工业化影视创作的探讨
主讲人:北京电影学院科学艺术研究院负责人
1. 行业共同期待:成本骤降 + 创作自由
- AI 将把重工业级成本降到极低。
- 小团队也能拍大片,实现超级创作自由。
- 打破 S + 头部垄断,腰部团队机会大增。
- 投资逻辑改变:低成本试错,专业创造力成为第一竞争力。
2. 当前 AI 三大技术瓶颈
#### (1)空间理解缺陷
- AI 只学像素,不学真实空间逻辑。
- 复杂长镜头、固定空间连续戏很难做。
- 空间连贯性差是工业级创作最大障碍。
#### (2)表演缺陷
- AI 靠归纳学习,没有真实情感激发。
- 细腻情绪、人物气质、深层表演做不到位。
- 实拍中 “导演 — 演员” 互动体系在 AI 里失效。
#### (3)工业级模型必须细分
- 一句话出电影不可能(仅爱好者玩法)。
- 工业级必须拆分为:故事、梗概、结构、人物、台词等细分模型。
3. 工业化解决方案(可落地)
#### ① 空间问题解决
- 用诗意剪辑、徐克式武侠剪辑弱化空间连贯要求。
- 实拍实景多角度照片,锁定 AI 空间。
- AI + 3D 结合,实现复杂空间连贯镜头(国外正在研发)。
#### ② 表演问题解决
- 强化镜头语言,用镜头传递情感。
- 借鉴动画电影构思方式,控制表演范围。
- AI 虚拟拍摄:真人演核心表演,背景 / 环境 AI 生成。
#### ③ 电影感不会消失,反而更重要
- 影调、照明、色彩、摄影机调度、景深、空气透视不会降低。
- AI 让实现更容易,专业要求反而更高。
4. 未来产业预判
#### (1)创作流程彻底重构
- 导演组、摄影组重构。
- 电影摄影 ↔ 动画专业相互渗透、融合。
- 简单技术护城河消失,复杂技术更重要。
#### (2)产业形态变化
- LED 屏 + AI 重构放映→拍摄→显示全链条。
- 传统院线缩减,家庭级电影屏崛起。
- 深入叙事 + 高端审美长视频不会消失。
#### (3)AI 将掀起「影像造梦产业」
- AI 不擅长传统现实主义。
- 强项:奇幻、科幻、梦境、超现实。
#### (4)AI 与 IP
- AI 虚拟角色成为永久资产:不变老、不生病、不涨价。
- AI 参与 IP 生成,创意成为 IP 一部分。
#### (5)中国影视有望弯道超车
- 国家技术势能(AI、新能源、电动车)。
- 影视是文化输出核心载体。
- 对标美国新好莱坞时代:技术变革 + 观众习惯改变 + 创新爆发。
- 路径:体系化全面创新,学界 + 企业共同牵引。
三、创新内容创作能力与应用
1. 核心 AI 创作能力
#### ① 多主体一致性控制
- 支持多人物、多元素同场。
- 输入三视图,保证人物 / 场景资产统一不崩坏。
#### ② 九宫格一键分镜
- 单张九宫格参考图 → 自动生成连续分镜。
- 保持镜头连贯、有效。
#### ③ 实时世界模型(秒级响应)
- 先构建世界观,再秒级出结果。
- 适用:电商直播、数字人直播、互动短剧。
#### ④ 多元生成能力
- 音画同步:音频→视频自动匹配。
- MV 一键生成:音乐→内容。
- 多帧过渡:照片→真人演唱视频。
- Mimic 动作模仿:单张图 / 动作→复刻表演。
#### ⑤ 资产快速编辑
- 一键改发型、服装材质、场景风格。
- 单图→成片 + 自动配音 + 自动剪辑。
2. 实际业务效果
- 生产效率提升 10 倍以上。
- 投放 CPI 远低于人工制作。
- 客户流量最高提升 600%。
- 短剧:多主体、多视图、多风格,保证剧情流畅。
3. 创作者生态运营
- 分层:
- 75% 基石创作者
- 20% 变现创作者
- 5% 超级头部
- 平台引流、分发、商业化闭环。
4. 合作与荣誉
- 合作伙伴:芒果台、京东、出海商家等。
- 获联合国 AI 向善奖项。
四、YouTube 平台运营及 AIGC 政策策略
主讲:YouTube 大中华区运营经理
1. YouTube 核心逻辑:频道是可沉淀资产
- 不是单条视频爆火,而是频道长期复利。
- 粉丝回流→持续流量→持续收入→品牌价值。
2. 推荐机制三大依据
- 用户个性化偏好
- 视频表现:点击率、完播率、互动(赞 / 评 / 藏 / 订阅)
- 外部因素:热点、季节、竞争
3. 频道做不起来的三大原因
#### ① 内容不垂直
- 古装、现代、旧题材混杂。
- 算法无法定位受众,推流失败。
#### ② 封面 / 缩略图太随意
- 封面是第一流量入口。
- 做视频多久,就要花多久做封面。
#### ③ 不互动、不宠粉
- 不回复评论,不引导订阅。
- 无法沉淀忠实粉丝。
4. YouTube 对 AIGC 的态度
- 不扶持、不打压,只看内容价值。
- 核心:讲好故事,形式(AI / 真人 / 2D/3D)不重要。
- 禁止:批量无价值重复内容(动物、水果、低质模板)。
5. 合规红线(必看)
#### ① 不实 / 重复内容
- 模板化、批量复制、高度相似→违规。
- 非独家 IP 多账号分发→违规。
#### ② 儿童政策
- 禁止用儿童困境做封面 / 标题引流。
#### ③ 成人 / 色情擦边
- 标题、封面、内容感官刺激→违规。
#### ④ 误导性元数据
- 标题封面与内容不符→违规。
#### ⑤ 隐私侵权
- 模仿名人声音、形象、言论→违规。
#### ⑥ AI 内容必须披露
- 合成 / 加工内容必须声明,不影响创收。
- 建立信任,保护品牌。
6. 版权保护
- Content ID:全球最强版权工具。
- 与未来电视共建AIGC 基金。
- 推出光帆计划:AI 工具大赛。
7. 运营成功三要素
- 深度差异化:拒绝一键生成,人工打磨。
- 独家 IP:锁定版权,避免重复内容违规。
- 合规 + 版权:音乐、形象、音色必须授权。
五、AI 对内容创作及 IP 发展的影响
1. AI 带来三大改变
#### ① 创作平权
- 技术 / 工具 / 门槛降低。
- 非专业也能做专业内容。
#### ② 降本增效
- 成本极低、效率极高、传播极快。
- 可快速试错,但社会责任更重。
#### ③ 价值重构
- AI 能轻松做出60 分内容,60 分不再有价值。
- 核心竞争力:文化、IP、好故事。
2. AI 能力边界
擅长
- 人类已有知识、归纳、推理。
- 单维度:快、持久、客观、稳定。
- 剧本、资产提取、画面 / 音频生成、运营剪辑。
不擅长
- 人类未认知的领域。
- 多维空间自洽(叙事 + 画面 + 时间 + 表演 + 节奏)。
3. 人的角色:主导 60 分以上的创作
- AI 负责0–60 分。
- 人负责60 分以上:方向、决策、验收、精细修改。
- 人提供:判断力、审美、情感、逻辑。
4. AI 对 IP 的巨大利好
#### ① 更新更快
- 用户最在意:催更。
- 从年番 / 季番→周更成为可能。
- 案例:《三千皮裤》更至 15 季,用户满意度极高。
#### ② 衍生更多元
- 同一 IP 同步:2D、3D、真人剧。
- 内容协同,覆盖更多受众。
#### ③ 题材更丰富
- 成本下降→敢尝试小众垂类。
- 不再只依赖修仙等安全题材。
5. 行业长期方向
- 回归内容为本、故事为本。
- 自律 + 规范 = 健康市场。
- 用技术为用户提供言之有物、喜闻乐见的内容。
六、AI 与 OPC 对科研及创业的影响
核心背景:两大浪潮汇聚
- AI 主导科学研究:2024 年诺贝尔物理奖(辛顿等神经网络奠基人)、化学奖(哈萨比斯、Jumper 等分子预测研究者)得主中,4 位为 AI 从业者,标志着 AI 已从科研工具升级为核心主导力量。
- OPC 政策红利释放:国内 20 多个地区已出台 OPC 相关扶持政策,成都市、四川省近期也落地利好政策,为科研转化与创业提供良好环境。
传统科研商业化的三大痛点
- 不会转化:科研人员 / 高校 PI 团队擅长学术研究,但缺乏商业思维与运营能力,难以将成果推向市场。
- 转化流程复杂:从论文→专利→创办企业→产业化,需多团队协同,环节繁琐、周期漫长。
- 创业门槛高:成立公司涉及注册资金、银行开户、法律合规、财务管理等多个复杂环节,阻碍科研成果落地。
核心价值:AI+OPC 破解转化难题
AI 的技术赋能与 OPC 的政策支持形成合力,为科研团队和创业者提供了更高效的转化路径,降低了从学术成果到商业产品的门槛,成为科研商业化的重要推动力。
七、AI 助力软件开发及 OPC 概念探讨
核心定义:OPC 的升华与 AI 软件开发实践
OPC(One Person Company)并非局限于 “一人公司”,而是超级个体借助 AI 实现高效创作与价值输出,软件开发领域的 “小龙虾” 就是典型案例 —— 创始人通过 AI 单人完成软件全流程开发。
AI 助力软件开发的三大基础条件
- AI 模型突破门槛:以谷歌、DeepMind 千问等为代表的大模型,具备 AGI 级编程能力与智能体化编程能力,成为 AI 辅助开发的核心基石(代表基准测试:Bending Bench 2,模拟模型运营自动贩卖机并以销量排名)。
- CLI 命令行工具深度集成:类似黑客影视中 “黑色背景 + 绿色文字” 的交互模式,已深度植入 AI 能力,成为极客开发者的高效工具。
- IDE 集成开发环境可视化:提供图形界面,集成浏览器等辅助工具,支持 AI 自动测试网站 / 小程序功能,降低开发上手难度(代表工具:IT Rabbit)。
AI 在软件开发全流程的应用
- 全环节覆盖:从需求文档提炼、代码生成、测试执行、Bug 修复,到软件交付、用户反馈分析、迭代优化,AI 均可提供辅助。
- 效率与满意度双提升:海外案例显示,AI 开发工具可使开发环境落地速度提升 55%,开发者满意度提升 60%;PayPal 等金融企业应用后未出现安全隐患,验证了 AI 开发的可靠性。
- 闭环迭代模式:软件上线后,AI 可分析用户反馈与服务器日志,反哺需求池,形成 “开发→反馈→优化” 的循环。
OPC 的泛化升级
- 生产力平权:AI 打破技术壁垒,让非专业开发者也能产出技术工具,推动技术型 OPC 普及。
- 超级个体的多维价值:OPC 不仅是 “一人公司”,更可通过多工具复合产出产品,甚至提供社交层面的情绪价值,实现从 “生产力平权” 到 “组织降维” 再到 “存在感升维” 的进阶。
八、AI 时代 OPC 核心壁垒的探讨
行业误区:工具与产能并非壁垒
- 工具门槛失效:AI 让图片、视频制作等工具的学习成本大幅降低(2 小时即可上手),单纯掌握工具已无竞争优势。
- 产能堆料过时:AI 数字员工的产能远超人力,未来一人可操控数十上百个 AI 数字员工,传统 “堆人拼产能” 模式被淘汰。
AI 时代 OPC 的三大核心壁垒
#### 1. Skill(能力模块):可迭代的经验封装
- 定义:将个人专业经验(如影视领域的景别选择、运镜逻辑、光线运用)封装为 AI 可反复调用的模块,无需重复调教模型。
- 关键要求:需随 AI 模型更新持续迭代,否则旧 Skill 会成为负资产(如 C 档 2.0 模型出现后,旧版镜头语言 Skill 失效)。
- 核心壁垒:持续构建、迭代 Skill 的学习能力,而非 Skill 本身。
#### 2. SOP(标准化流程):基于管理学的高效协同
- 核心逻辑:SOP 的本质是 “管理问题”,而非技术问题,需借鉴管理学思维(如地铁 6S 管理:整理、整顿、清扫、清洁、安全、素养),让 AI 数字员工按规则协同。
- 实践要点:
- 资产分类标准化:文件夹、音频、视频、提示词需打标签,明确项目、阶段、版本,避免调用混乱。
- 输入输出规范化:各岗位(编剧、导演、分镜、美术)需有明确的格式规范与接口协议,确保流程衔接顺畅。
- 竞争优势:因搭建复杂、耗时耗力,多数人不愿投入,成为难以复制的壁垒。
#### 3. 资产(独特性储备):小众审美与标签化内容
- 行业趋势:大众对 AI 作品的接受度提升,但大众审美的溢价快速消失,小众审美与孤品价值凸显(如《浪浪山小妖怪》经 20 年打磨成为爆款)。
- 核心资产:
- 细节化角色资产:建立 “角色圣经”,明确角色花纹、材质、光线规范、配乐情绪等细节,确保 AI 生成的角色一致性。
- 独特能力储备:包括审美判断、讲故事能力、专属提示词、音频视频素材等,形成强烈的标签化辨识度。
核心结论
- Skill 让 OPC 领先半步,SOP 让 AI 高效为己所用,资产让风格无法复制,三者结合构成 AI 时代 OPC 的核心竞争力。
- 跨界能力、专注力与执行力是超级个体的关键素质,AI 越廉价,人的专业经验与创造力越珍贵。
九、AI 时代视频制作领域的变革探讨
传统视频制作的核心痛点
- 信息传递损耗:策划、编导、原画师、剪辑师等多岗位协作中,口头沟通易导致需求理解偏差,反复修改降低效率。
- 部门墙阻碍协同:各岗位虽可能单独使用 AI 工具,但缺乏整体流程整合,导致 “局部高效、整体低效”。
AI 时代的 OPC 模式:蜂群结构
- 核心架构:以 “人” 为中心枢纽(hub),围绕剧本、音效、原画、审核等环节配置 AI Agent,形成 “一人 + 多 Agent” 的蜂群协同模式。
- 核心优势:打破部门墙,减少信息损耗,AI 可快速响应指令并总结用户偏好,逐步实现 “简单指令→精准产出”。
- 现实挑战:AI Agent 在复杂任务中易 “卡壳”,需人持续提供指令、纠正偏差,形成 “人被 AI 压榨” 的反向场景。
超级个体的核心竞争力
- 高端审美与编排能力:AI 可替代机械执行,但无法替代对内容的审美判断、复杂任务拆解能力(将大任务拆分为 AI 可执行的小任务)。
- 从 “平庸手艺人” 到 “高品味指挥官”:AI 淘汰重复劳动型岗位,胜出者需具备 “品味 + 调度 AI 的能力”。
企业级 OPC 的合规保障
- 风险痛点:AI 的 1% 幻觉或员工夹带私货,可能导致品牌翻车,合规审核成为生产力之外的核心瓶颈。
- 解决方案 “谛听”:
- 基于 Neuro OS 神经操作系统,沉淀企业知识库与工作流,专门负责内容审核。
- 支持 22 个国家和地区的语言与文化合规审查,规避宗教、种族歧视、色情爆恐等风险。
- 优先选用备案大模型,降低内容违规概率。
企业落地 OPC 的三大建议
- 组建突击队测试:选拔最懂业务、品味最高的核心员工,组成 2-3 人的 OPC 小组,而非盲目裁员。
- 重构 KPI:从 “按量交付” 转向 “按爆款产出”,支持创意释放,以项目为单位替代传统岗位划分。
- 合规为生命线:建立专门审核机制,避免因 AI 风险导致企业品牌损失。
作者:付有为