当前,人工智能(AI,Artificial Intelligence)浪潮持续涌动,正以前所未有的速度、广度和深度渗透入社会生活的方方面面,大语言模型、多模态模型、文生图/文生视频模型、智能体等技术持续迭代,感知算法、认知科学和计算能力不断突破,生成式人工智能(Generative AI)的新产品、新模式、新应用层出不穷,结合“强化学习(RL,Reinforcement Learning)”的“思维链(COT,Chain of Thought)”改变了传统的人工智能“规模定律(Scaling Law)”,尤其是DeepSeek发布开源大模型火爆全球[1],为生成式人工智能的发展提供了更广阔的前景。
为了把握人工智能技术带来的历史性发展机遇,2024年中央广播电视总台(以下简称总台)相继发布了《中央广播电视总台人工智能使用规范》《中央广播电视总台人工智能发展白皮书(2024版)》,详细阐明了总台人工智能的总体目标、发展路径和规范要求。在此基础上,总台于2025年2月28日在人工智能大楼揭牌仪式上正式发布《中央广播电视总台人工智能发展白皮书(2025版)》,介绍了总台在人工智能创新应用方面取得的最新进展,重点描述了总台下一步构建人工智能媒体应用平台、打造“央视听媒体大模型2.0”的整体思路、关键系统与实施方法,为推动媒体行业与人工智能的融合走深向实、加快实现主流媒体的系统性变革提供借鉴与参考。
一 指导思想
总台成立以来,始终遵循人工智能赋能媒体制播、引领媒体创新、重构媒体生态渐进式发展的指导思想,积极探索人工智能技术在媒体领域的创新应用,在内容生产、传播分发、互动呈现和效果评估全流程中充分注入人工智能的赋能作用,显著提升媒体生产效率和安全播出水平。随着生成式人工智能技术的落地应用,总台把握发展机遇,立足“央视听媒体大模型”实现技术研发与节目生产的应用协同,引领了节目形态和传播模式的创新升级。当前,生成式人工智能技术仍在持续进化,总台的人工智能媒体应用仍有广阔空间,通过加速构建总台人工智能媒体应用平台、打造“央视听媒体大模型2.0”来培育壮大媒体领域新质生产力,运用人工智能打破传统生产模式的思维定义和技术壁垒,拓展全媒体内容传播边界与呈现形态,重塑媒体技术与应用生态,引领媒体行业转型升级。
二 基本原则
“白皮书”中提出人工智能技术在媒体领域发展与应用的四项基本原则,也是总台经过多年探索实践所积累出的“总台经验”。
◆积极探索,推动应用。支持先行先试,积极探索人工智能媒体创新应用,赋能媒体内容生产、传播分发、互动呈现和效果评估,积极推动人工智能在媒体生产传播领域的全面应用;
◆规范使用,确保安全。倡导发展和安全并重,对人工智能应用实行包容审慎和分类分级的规范监管,坚守新闻真实性这条“红线”,确保人工智能生成内容积极健康、向上向善,确保数据存储、内容版权、隐私保护等方面可管可控;
◆科技引领,提质增效。把握人工智能发展趋势,聚焦媒体制播呈现全流程的关键环节,运用人工智能实现媒体制播提质增效,加速培育媒体行业新质生产力;
◆开放包容,合作共赢。坚持共创共建共享,充分发挥总台海量视听语料数据优势和丰富的节目制播场景优势,联合国内生成式人工智能一流机构,共同打造和运营媒体行业领先的视听媒体大模型,推动媒体行业高质量发展。
三 生成式人工智能赋能总台媒体创新
1. 人工智能赋能广播电视和新媒体制播全流程
围绕“三个转变”目标,总台积极推进超清化、移动化、智能化新型媒体融合技术体系的建设,重点发挥人工智能技术在媒体制播流程中的赋能作用,紧密贴合总台生产需求,研发上线了字幕智能生成、语音合成、智能审核、智能横转竖、总台算法等一系列人工智能应用,将智能化能力注入生产传播链条,在策划辅助、录制拍摄、内容生产、内容审核、技术质量检测、媒资管理、内容推荐、用户互动各环节均形成了特色化的媒体智能应用,不仅在制播流程的各个环节都实现了“提质增效”目的,也有效提高了安全播出水平。
2. 生成式人工智能拓展全媒体内容生产新范式
依托人工智能工作室,总台研发了适用于多样化节目形态的大模型工具集,将大模型能力引入内容创作生产,尝试用AI辅助媒体在信息处理、内容呈现、场记模式、素材管理、剪辑制作等工作中进行模式创新,有效拓展了大模型在媒体行业的应用边界。
利用大模型的文生图/文生视频能力,结合后期传统的剪辑包装手段,总台在巴黎奥运会期间完成了AI微电影、AI宣传片等多款作品,取得了良好的社会舆论反响和显著的宣传效果。生成式人工智能在节目创作中起到了重要的辅助作用,显著提升了生产效率。
通过与数字人、扩展现实(XR,Extended Reality)虚拟化制作、体积视频(Volumetric Video)等前沿技术的紧密结合,生成式人工智能技术加速了多语种数字人、超写实数字人、轻量化三维建模、LED虚拟制作、XR互动应用等沉浸式媒体形态的规模化推广,为媒体传播形态创新提供了强大助力。
3.“央视听媒体大模型”引领媒体发展新浪潮
2023年7月,总台抢抓生成式人工智能先机,率先发布“央视听媒体大模型”,按照媒体垂直领域对人工智能的实际需求,以总台的海量视听数据和深度专业知识为驱动,形成国内首个面向媒体垂直领域的行业大模型。
当前,动画内容制作成为火爆全球的热门话题,“央视听媒体大模型”充分融入文生图、图生视频、文生视频等能力,提供行业领先的人工智能生成内容(AIGC,Artificial Intelligence Generated Content)动画生成模型,完成了中国首部AI生成动画片《千秋诗颂》的制作,提升了动画创作效率,扩展了视觉创意空间。
面向专业化的媒体制作,“央视听媒体大模型”提供体育赛事技战术数据分析能力,针对羽毛球、网球运动,通过多机位视频采集结合3D动作捕捉算法等技术,实现在运动员“零穿戴”的条件下获取比赛关键技战术信息,如关键球的过网速度、过网高度、球员位移等,该技术在2024年汤尤杯羽毛球赛、巴黎奥运会中得到实践应用。2025年亚冬会中,“央视听媒体大模型”为战术纷繁复杂的“冰上国际象棋”——冰壶项目提供了AI战术预测服务,能够利用AI仿真预测运动员的处理方法和赛事走向,并以虚拟现实(VR,Virtual Reality)形式加以呈现。
“央视听媒体大模型”还具备智能编辑和视频编创能力,自动对画面做出识别并形成准确场记,根据提示词剪辑出相应成片,为巴黎奥运会跳水、足球、跳高等多项赛事集锦提供快速、高效的编辑能力。
四 “央视听媒体大模型2.0”重构总台全媒体制播流程
作为颠覆性的使能技术,人工智能还需要颠覆性的行业应用来激发和释放新质生产力。总台具备海量视听语料数据和丰富的节目制播场景,为生成式人工智能应用提供了广阔空间。下一步,总台将加强人工智能媒体应用平台建设,引入国内多家大模型研发机构,成立研发共同体,打造媒体领域领先的“央视听媒体大模型2.0”,为综艺、体育、科教、动画、译制等节目制播场景,提供媒体内容创作辅助、个性化多模态生成、智能编创等技术支持,并重塑内容创意与生产范式,构建更加高效、创新的智能媒体生态,加速迈向全方位、深层次媒体智能化转型升级新阶段。总台人工智能应用平台总体架构如图1所示。
图1 总台人工智能应用平台总体架构图
1.夯实适配人工智能媒体应用的平台基础设施
人工智能技术的应用需要先进的基础设施予以支撑,总台将加速升级集信息计算、数据存储、网络运载、安全防护于一体的新型信息基础设施,构建分布式训练类算力、推理类算力高性能集群,建立面向基础资源支撑平台的运行一体化维护体系,实现多模态媒体数据的分级存储和管理,为人工智能应用提供安全、可靠、灵活、经济的基础设施服务。
2.构筑基于多模型底座的媒体制播应用平台
总台针对实际节目制作中生成式人工智能的使用需求,训练垂直于专业媒体领域的生成式人工智能大模型——央视听媒体大模型。同时,面对更为广泛的应用场景,接入外部大模型的通用技术,构建基于多个大模型底座的媒体AIGC应用平台,创新总台节目生产流程,赋能AI媒体行业生态。应用平台包括外部大模型对接模块、垂类大模型研发训练模块和大模型部署应用模块。
总台媒体AIGC应用平台以“5G+4K/8K+AI”科技创新加速赋能视听产业应用,面向总台节目制播场景,探索AI技术影视化应用,全面提升节目生产效率和创作质量,实现美术、分镜、视频、配音、配乐AI一站式解决方案。系统包含文本、图像、视音频等智能生成模块。
3.建设面向大模型应用的节目制播系统
“央视听媒体大模型2.0”的应用,会把大模型能力全面注入全媒体内容的策划、制作、传输、分发、呈现、评估各个环节,在赋能全媒体内容制播流程的同时,还会同步前期、后期等生产系统中海量视音频数据的汇聚和处理,形成高质量的多模态语料库,不仅为总台大模型的训练与应用提供可持续的数据资产供给,还能够为我国人工智能产业发展提供支撑。
演播室/转播车等前期系统采集数据时,可即时完成多格式数据的清洗、标注、分类和汇聚,确保实时数据更高的结构化和可用性。后期编辑系统制作生成的数据,包括成品节目、原始视音频片段、特效元素、智能生成素材、视音频元数据等,不仅为媒体传播提供内容,还将同步完成标准化清洗、分类与标签化,确保其高质量和可利用性,在媒资系统形成多模态数据汇聚。
4.打造全媒体智能传输分发体系
利用“央视频看电视”平台,结合人工智能大数据分析技术,根据用户画像、观看历史、互动行为等数据,精准把握观众喜好,为不同细分群体定制个性化内容,还可以利用AIGC生成符合特定用户兴趣的内容,并通过智能推荐系统,实现内容的精准推送,提高用户满意度和黏性,进而提升广告效益和付费订阅率。为进一步提升总台新媒体传播能力,挖掘“央视频看电视”大屏潜在用户,通过与总台大模型结合,建设央视频大小屏融合智能传播系统,提供内容推荐、智能交互、动态码率、智能运维以及广告替换等功能,为用户提供更加便捷、高效、个性化的投屏体验。
5.构建基于大模型的节目评估体系
基于大模型构建覆盖总台节目播前、播中、播后全生命周期的智能评估体系,深度融合大模型的认知智能与行业经验,形成“预测—监测—复盘”全流程闭环评估机制,建立可解释、可操作、可迭代的智能决策支持系统,推动节目生产传播从经验驱动向大数据大模型智能驱动转变。
节目播出前,基于大模型构建预测分析系统,建立节目市场价值评估和收视预估模型,构建关键情节传播势能图谱,生成社交媒体热度演化模拟。在节目播出期间,基于大模型构建智能监测中枢系统,对用户行为数据、社交媒体传播数据等进行实时收集感知与智能分析,并提供动态反馈机制,基于传播效果归因分析,提供宣发策略迭代建议。节目播出后,基于大模型建立多维评价体系与知识沉淀机制,建立多维评价体系,构建内容要素与传播效果关联网络,生成结构化改进建议知识库,为后续可持续性打造更优质、更符合观众需求、更具市场竞争力的节目提供有力支持。
五 结语
当前,生成式人工智能正在引领新一轮科技革命和产业革命,其迅猛发展不仅将深刻改变人类社会的生活方式和工作模式,还将推动媒体形态的全面革新,为人类社会带来前所未有的机遇与挑战。以内容生产制作为主的媒体行业,是生成式人工智能技术赋能应用的天然舞台,可以预见,未来不仅传统的生产流程会得益于人工智能技术的优势实现重构,媒体传播形态和呈现形式的底层逻辑也可能会产生革命性变化,这为媒体行业全方位重塑产品、技术和应用生态提供了前所未有的发展机遇。
为推动我国人工智能快速发展,总台将充分发挥海量的高质量视听语料数据、丰富的媒体制播应用场景优势,构建人工智能媒体应用平台,联合人工智能科创机构共同打造“央视听媒体大模型2.0”,积极建设中文语料库,发力探索生成式人工智能技术在媒体领域的创新应用。生成式人工智能技术与媒体业务的深度融合,必将加速培育形成媒体领域的新质生产力、新质传播力、新质竞争力,促进媒体行业的体系升级、流程再造和生态重塑,为媒体行业高质量发展提供源源不断的技术动力。