传媒业作为内容创作和传播的核心领域,成为大模型技术落地的关键场景。互联网公司和主流媒体积极采用大模型,以优化内容制作、分发和使用者真实的体验。多模态大模型的兴起,极大提升了传媒业的生产效率和内容质量。此外,国家和地方政府持续推出利好政策,鼓励人工智能的创新应用,促进了大模型在传媒业的深度整合。未来,传媒业大模型的发展面临着机遇与挑战并存的局面。一方面,AI 技术作为新质生产力将会促进促进传媒业的升维转型,另一方面,其导致的传播风险与伦理问题值得重视。
本文著录格式:郭全中,苏刘润薇,彭子滔 . 广播电视新闻类客户端统一资源管理平台的构建 [J].中国传媒科技,2025,32(1):6-10.
作者简介:郭全中(1976—),男,安徽临泉人,中央民族大学新闻与传播学院教授,博士生导师,网络站点平台企业未来的发展与治理研究中心主任,研究方向为传媒经济与管理、大数据、人工智能、平台经济、互联网治理。苏刘润薇(2001—),女,北京海淀人,中央民族大学新闻与传播学院硕士研究生,研究方向为大数据传播。彭子滔(2000—),男,河北石家庄人,中央民族大学新闻与传播学院硕士研究生,研究方向为传媒经济与管理、AI应用与治理、数字经济。
OpenAI与谷歌引发了多模态大模型的激烈竞争,并推动多模态成为大模型发展的主流路径。2023年下半年,OpenAI相继发布了文生图模型DALL·E 3 以及具有视觉理解功能的模型GPT-4V、GPT-4 Turbo,随后谷歌也正式上线了多模态大模型Gemini 1.0。2024年2月,OpenAI的首款文本生成视频模型Sora横空出世,表现出极为惊艳的物理世界理解与模仿能力,其能够基于文本提示生成长达60秒的视频,通过多角度镜头构建逼真的三维空间,且保持了视频主体的连贯与稳定。三个月后,GPT-4o与Project Astra的问世,分别代表了OpenAI和谷歌在大模型领域的最新进展。这两款产品摒弃了传统“拼接式”多模态模型的级联处理,构建了一个“端到端(end-to-end)”的原生多模态大模型,即所有输入和输出的信息均由同一个神经网络直接处理,提升了信息处理的连贯性与准确性,并且大幅度的降低时延,以此来实现了实时语音、视频交互以及情感表现 [1]。
在此背景下,国内大模型亦聚焦于多模态方向进行更新迭代。第一,在智能助手辅助创作上,2024 年4 月,月之暗面公司旗下的 Kimi进行了功能上的逐步优化与升级,新增了语音输入及播报功能,并能根据对话内容的上下文智能调用外部工具以扩展其自身功能,从而更好地使用户得到满足需求。第二,在多模态生成能力上,腾讯自主研发了混元文生图算法模型,已被大范围的应用于素材创作、商品合成、游戏出图等多项业务及场景中;2024 年 1月,阿里巴巴对通义千问视觉语言大模型进行了升级,推出了Qwen-VL-Max 版本;智谱AI发布的新一代基座大模型GLM-4,在多模态语义理解、数学计算、逻辑推理等多个领域均展现出卓越的性能;同年4月,生数科技与清华大学联合发布了中国首个具备长时长、高一致性、高动态性特点的文生视频大模型Vidu;同年6 月,快手推出了其自主研发的文生视频模型可灵,而华为则发布了盘古大模型5.0,能够理解和生成包括雷达、红外、遥感等多种模态的信息。
在发展层面,国家持续出台了利好政策,鼓励人工智能整体发展,多个省市也积极做出响应,发布了AI产业的相关支持类政策。2023年12月,工业与信息化部、国家发展改革委等八部门联合印发《关于加快传统制造业转变发展方式与经济转型的指导意见》,强调从创新驱动发展、数字技术赋能、产业融合互促等方面构建虚实结合的产业智能化新生态。2024年,我国首次将“人工智能 +”行动计划写入《政府工作报告》(以下简称《报告》),标志着国家层面对AI产业进行顶层设计。具体而言,《报告》提出从供需双侧协同发力:一是在供给侧“大力推进现代化产业体系建设,加快发展新质生产力”,二是在需求侧“着力扩大国内需求,推动经济实现良性循环”[2],共同驱动AI产业与经济社会的深度融合。除此之外,各地方政府也出台一系列具有地方特色的政策措施,如《北京市促进机器人产业创新发展的若干措施》、广东省《关于加快建设通用AI产业创新引领地的实施意见》。各地2024年《政府工作报告》也对人工智能等信息技术给予了重点关注。
在规范层面,2023年8月15日,国家网信办联合多部门发布《生成式人工智能服务管理暂行办法》,在鼓励生成式人工智能技术在各行各业创新应用的基础上,对其服务持包容审慎态度,实行分类分级监管,进一步平衡了生成式人工智能的发展与安全。2024年7月2日,工业和信息化部等四部门联合印发《国家人工智能产业综合标准化体系建设指南(2024 版)》,从基础共性、基础支撑、关键技术、智能产品与服务、赋能新型工业化、行业应用、安全 / 治理七个方面,明确了人工智能标准体系建设的重点方向,该指南的出台将引领人工智能产业的高质量发展。
2023年下半年以来,百度、阿里巴巴、腾讯等我国互联网巨头,在自身大模型技术与产品的基础上,竞相推出了传媒领域的垂类大模型应用与服务。例如,在影视创作方面,阿里大文娱在2024年6月发布了自研影视妆造大模型“神力霓裳”,已经应用于多部古装剧的造型图案生成,极大地丰富了影视创作的创意空间,提升了创作效率与质量。
此外,众多有实力的科技企业也纷纷加入传媒业大模型应用的探索行列中,赋能媒体的业务流程和生态建设。例如,科大讯飞的“传媒大模型”为内容生产的每一个环节提供了智能化工具支持,涵盖了智能创作、内容安全审核、智能多语种翻译等多种功能。拓尔思自主研发的“拓天·M”媒体行业大模型,依托全国各类媒体资源构成的庞大、高质量、高时效的数据库,满足媒体行业在内容生产智能助手、新一代搜索与推荐、多模态传播与服务等核心业务场景下的智能化创新需求。万兴科技发布了国内首个音视频多媒体大模型“天幕”,集文生主题视频、文生3D视频、AI歌手、视频AI配乐、数字人播报等多媒体能力于一身,未来还将加速推进现有产品的智能化升级,持续拓展泛知识、泛营销、泛娱乐等垂类领域场景,构建起一个开放、协同的多媒体生态体系。
在“大融合”时代下,“互联网 + 跨界”是媒体深层次地融合的整体思路 [3]。鉴于互联网企业是技术创新的先锋,并且拥有雄厚的资金与人才储备,主流媒体通过跨界合作,能够高效对接并整合这些稀缺资源,从而加速媒体大模型的建设与应用。2024年5月,每经传媒与腾讯合作,将腾讯的混元大模型融入每日经济新闻旗下科技公司自主研发的“雨燕智宣”AI 短视频生成平台,实现了文本、图像、视频等多模态内容的智能化生产。四川日报报业集团携手阿里云的通义大模型,基于自身传媒知识库与智媒技术体系,构建了封面“智媒云传媒行业大模型”,全面赋能媒体生产、用户交互及内容安全治理等关键环节。在追随技术应用的同时,部分主流媒体还积极投身于媒体大模型的自主研发之中,展现出强大的自主创新能力。
当下,大模型技术最广泛的应用场景发生在互联网业务环境中。互联网巨头凭借其庞大的企业规模和用户基数、雄厚的资本实力以及多元化的业务场景,为大模型的部署与应用提供了坚实的支撑,包括大模型运行所需的强大算力、海量数据资源、大规模用户覆盖以及多元化的落地场景。
互联网巨头的大模型应用主要集中在企业效能提升方面。第一,在广告收入方面,根据腾讯的财务报告,大模型技术是广告技术平台升级和业务高质量增长的重要因素,特别是视频号、游戏业务相关服务在2023年实现了用户使用时长的翻倍增长,大模型技术成为腾讯业绩的新增长引擎。2024年一季度,视频号总用户时长同比增长超过80%,腾讯通过拓展商品品类和激励更多内容创作者参与直播带货,加强了视频号直播带货生态。第二,在电商领域,据阿里巴巴调研,约30% 受访的淘宝商家已经使用生成式AI。从商家经营(开店、发品、直播、广告、营销)到消费者体验(互动、搜索、交易、支付、评价、履约),每一个环节都有基于AI的工具创新探索,在不同程度上提升商家运营的效率。第三,在营销领域,大模型在全链路、全领域提升广告营销的智能化水平。以百度的轻舸平台为例,广告主可以用自然语言描述要推广的产品,轻舸平台能够根据用户搜索词、兴趣、意图,以秒级的速度生成广告文案、图片素材等。轻舸平台能够快速生成创意内容,如2分钟产出100条文案、5分钟完成数字人口播视频,并直接执行广告投放,智能覆盖长尾场景,实时调整策略以最大化转化效果。
第一,人机协同成为主流决策模式,新闻采集效率提高 [4]。传统的新闻采集依赖于记者的“新闻眼”和“新闻鼻”,在现实或互联网中寻找线索并判断新闻价值。而大模型的智能算法则具备强大的数据处理能力,可以辅助人类记者捕捉新闻趋势与热点,为选题策划提供参考。
第二,AIGC融入媒体内容生产,智能创作提升内容生产力。AIGC 即人工智能生成内容,作为媒体内容创作的前沿技术,标志着内容生产方式的革新 [5]。与传统的专业生成内容(PGC)、用户生成内容(UGC)、机器生成内容(MGC)相比,AIGC以AI为主体,实现了内容的自动化创作,尤其是在多模态大模型的加持下,内容的多模态转换成为可能 [6],在媒体领域的应用日益广泛。
Sora推出后,《千秋诗颂》作为中国首部运用 AI技术的系列动画片启动,该片基于国家统编语文教材中的200多首诗词,利用央视的“央视听媒体大模型”将这些诗词转化为国风动画。此外,“央视频”公众号还发布了采用全流程AI制作的中国神话微短剧《补天》的预告片。
第三,大模型辅助事实核查,减轻媒体审核压力。大模型技术以其对多模态内容的深度理解能力 [7],为媒体内容的自动核查提供了强有力的辅助。例如,2024年6月,山东大众报业集团自研大模型“壹点天玑传媒大模型”正式获得境内深度合成服务算法备案清单,该模型能够实现内容的安全生产,能够有效减少 AI 幻觉,生成最优内容,此外,壹点天玑还具备投诉处理、AI 标识、非法内容拦截等功能,为保障媒体内容的真实性与合规性提供了有力保障。
第一,AI Agent是媒体与用户智能交互的应用。2024年5月10 日,在封面科技研发的“智媒云传媒行业大模型”驱动下,封面新闻客户端推出了“智能语音助手”“AI 新闻图谱”“智能动屏”“智能摘要”等系列新功能。用户只需轻声呼唤“小封小封”,客户端内的智能助手便会播报个性化的私人资讯。
第二,大模型拓展元宇宙新闻传播空间。新华社推出了全国首个AIGC驱动的“元卯”元宇宙系统,能够从人、内容、场景赋能新闻行业,包括极速数字人API服务、积木AIGC视频生产系统。中国日报推出“中华文明探源者”、中国日报首位数字员工元曦,以元宇宙为传播空间,带领全球网友一起探索源远流长、博大精深的中华文明,共同触摸不同文明交融互鉴的历史脉络。
互联网巨头凭借其在算力、数据、用户、商业场景以及资金和技术实力等方面的优势,将带动大模型新一轮的迭代升级与创新应用。第一,互联网巨头打造了庞大的数据中心,为大模型的训练、推理和迭代升级提供高性能的计算集群、大规模并行处理系统以及高效能存储设备。例如,阿里云在全球共运营着89个数据中心,形成了覆盖全球的云计算服务网络 [8],通过优化算法与并行处理技术,阿里云能够显著缩短大模型的训练周期,提高训练效率,确保大模型在短时间内完成复杂的计算任务,实现快速响应和高效决策。第二,互联网巨头企业在多年的运营过程中积累了海量的高质量数据,数量庞大的用户群体为大模型的训练和优化提供源源不断的优质资源。第三,互联网巨头在B端和C端均有着成熟且多元化的商业场景,极大地拓展了大模型的应用边界,还为大模型的优化与测试提供了丰富且真实的环境。第四,互联网巨头雄厚的资金实力和技术底蕴,构建了大模型研发与优化的坚实后盾。互联网头部企业资金储备充足、人才密度高,技术积累雄厚,具备强大的创新引擎,能够迅速响应市场需求的变化,灵活调整研发策略。
基于大模型的AI 技术兴起标志着媒体进入了一个新的战略窗口期。作为推动传媒业态深刻变革的核心驱动力,新技术如同“大脑”与“引擎”,引领着媒体行业向智能化进化,开启了媒体深度融合与发展的新篇章 [9]。第一,采编流程遵循大模型的规律进行数智化重构,在此基础上新闻生产流程、人才培养方案、业务盈利模式将发生深刻变革。第二,AI-auto(人工智能助手)的应用,将会进一步推动“人智协同”,破解多元复合型人才窘境。在AI大模型的辅助下,媒体全员将会熟练掌握智能化采编技巧,提升内容生成效能和创意能力。第三,在AI技术的应用下,媒体内部激励约束机制将会进一步完善健全,实现更加精准、高效与人性化的管理。第四,大模型的应用产品推动媒体的降本增效。在视觉表达方面,借助大模型可以降低海报、视频等融媒体产品的制作成本。AI合成主播将会扩大应用范围,进一步降低媒体的成本。
AI Agent即人工智能体,是具备环境感知、智能决策和动作执行等多种行为的智能实体,也是大模型落地的重要抓手,具备应用广泛性、行为主动性、落地灵活性、功能丰富性等特征。AI Agent与传媒业的融合,将极大释放传媒业的生产力,带来新的竞争格局。第一,AI Agent凭借其多样化的功能体系,将引领传媒业“破壁突圈”,重塑传媒优势。从个性化的交互体验到信息的即时追踪与分析,再到深度定制化的服务方案,AI Agent功能覆盖广泛,涵盖效率提升、商业智能服务、教育资源、生活品质优化、娱乐游戏互动等多元领域。在每个领域内,AI Agent又进一步细化为具体场景下的解决方案。AI Agent与传媒业的深度融合,不仅促进了传媒业内部的转型升级,更为传媒业以多元化方式赋能实体经济,开启了全新的可能性。第二,AI Agent将以其高度灵活的落地形式,引领互联网应用的生态变革。不同于传统APP的固定框架,AI Agent的设计紧密围绕用户的实际需求与特定场景展开,它能够根据不同场景、不同用户群体的需求进行定制化服务,实现功能的灵活组合与快速迭代。AI Agent的高度灵活性与定制化能力,有望重塑互联网应用变革。第三,AI Agent的落地实践如同移动互联网发展初期APP所扮演的关键角色,AI Agent在重塑用户与互联网交互方式的同时,将深刻重塑互联网竞争格局 [10]。AI Agent作为AI原生应用领域的超级入口,将构建起全新的生态系统。在这个生态系统中,各类AI服务与应用相互连接、相互促进,形成了一个庞大互联智能网络。随着AI Agent技术掀起新的竞争篇章,互联网企业的竞争格局将会进一步重塑。
透视元宇宙的演进蓝图,其进化路径可概括为云游戏的沉浸式娱乐、数字孪生的精确映射和虚实共生的深度融合。在数字孪生阶段,核心技术聚焦于元宇宙环境的构筑与虚拟实体的维护 [11]。Sora的诞生表现出大模型应用对于物理法则的领悟与模拟能力,构筑世界模型进一步走向了现实。特别是Sora的文本生成视频功能,大幅降低了三维场景、角色与动态创作的成本,不仅能够为元宇宙勾勒出现实世界的数字镜像,更能创造出灵动的虚拟角色,推动元宇宙世界智慧生态的形成 [12]。
从元宇宙的技术构成来看,元宇宙技术簇包括区块链、交互、电子游戏、AI、智能网络及物联网等核心技术,以及诸多关联的技术。目前,元宇宙的短板被逐渐补齐。脑机接口技术方面,在国内外已有多项成功的案例。空间计算领域,苹果Vision Pro的问世,缝合了数字内容与现实世界,营造身临其境且人机互动的全新体验。算力支撑环节,英伟达的Chat With RTX预示着AI模型将会向个人终端本地部署方向延伸,加速个性化模型新纪元的到来 [13]。智能网络技术层面,华为的5.5G全场景解决方案与通信大模型,正引领网络技术的革新。可以预见的是一个以世界模型为核心,结合token/patch 机制、空间计算及脑机接口的元宇宙技术集成框架正逐步成形 [14]。
大模型日益渗透至日常生产、生活的方方面面,一系列伦理道德问题浮出水面,业界、学界以及政府部门都对AI的健康、持续与责任发展给予了持续关注。价值对齐与传播风险治理成为规范大模型稳健前行的关键抓手。
价值对齐作为生成式大模型伦理治理维度的核心,成为推动AI伦理问题解决的着力点 [15]。价值对齐聚焦于算法的透明度与公正性建设,使大模型的内容生成与人类核心价值观念保持一致 [16],消除因涌现风险导致的算法偏见与歧视。展望未来,大模型的研发将会走上无偏见算法的开发与全面严谨的评估体系建设并驾齐驱的旅程。这一过程不仅追求技术性能的优化,更将道德的培育置于重要位置,以实现在个人隐私数据保护、合成媒体内容监管以及社会服务等领域实现技术的安全应用。通过价值对齐,大模型将赢得公众信任,走向更广泛的应用空间。
当前,生成式人工智能的传播风险覆盖了信息采集、生成、分发、反馈的全链条生命周期,形成了四大主要类别,即数据风险、算法风险、内容风险与认知风险。数据风险主要涉及隐私侵犯与版权问题,在训练阶段尤为突出。算法风险则涵盖了低可解释性的算法黑箱、算法偏见的复杂性以及生成式AI特有的涌现风险。内容风险来源于生成式AI赋能信息生产时,降低了高仿真内容的生成门槛,导致深度伪造、不良信息及非法内容的泛滥,严重干扰了信息的真实性和可信度。认知风险则触及人类价值与知识体系的根本,可能诱发网络欺诈、AI幻象及信任危机,长远影响人类社会的发展轨迹。因此,合理合法合规的大模型管理规范出台,将会随着大模型在各个领域的深度应用持续进行。
伴随大模型技术性能持续升级与应用落地,Al已成为新基础设施,AI技术带来的社会不平等可能持续加剧,这种由于AI技术使用差异造成的社会差异,可称之为“AI 鸿沟”。
“AI 鸿沟”为传媒业带来两个分化。首先是互联网企业与传统媒体的进一步分化。互联网企业早已转型为科技赋能的信息生产、分发与开发综合体,他们利用科技这一生产要素,不断推进数据信息的商业化价值发掘,引领着传媒业的技术创新与扩散,持续推动行业的转型升级 [17]。相比之下,传统媒体精耕细作于内容生产,在业务拓展、商业运营方面面临着技术壁垒与转型挑战。第二重分化体现在大型媒体与小型媒体之间。大型媒体机构往往拥有充足的资金、技术与人才优势,在AI大模型的助力下,将会进一步降低大媒体机构的内容生产成本、扩大机构的内容影响范围、提升机构的多模态的生产能力、抢占用户的注意力和时间。而小媒体机构的发展进一步受挤压,面临着转型发展的困境。总体来看,将会呈现出显著的“马太效应”。
在个人层面上,AI鸿沟具体表现在三个方面。首先,技术掌握者与技术边缘群体之间的鸿沟日益凸显,那些未能紧跟AI时代步伐的人群,如老年群体,将面临着技术门槛导致的不便,甚至在数字生活中被边缘化。其次,AI技术和自动化技术的应用将重塑就业市场,使得某些传统岗位将会逐渐消失,部分技能水平相对滞后或未能持续自我提升的个体陷入困境,进一步拉大其与AI熟练劳动者之间的差距,甚至面临着严峻的就业压力。再者,AI技术的算法不透明性与潜在偏见,加剧了信息获取与认知的不平等,加深了认知偏差,对个人权益造成隐性侵害,甚至固化社会阶层,放大既有社会不公 [18]。因此,AI发展进程中的人文关怀变得尤为重要。在追求技术进步的同时,如何保障的基本权益,防止社会分裂,成为AI伦理与政策制定亟待解决的关键议题。
[1]郭全中,苏刘润薇. 作为新基础设施的AGI:以 GPT-4O 等新一代生成式人工智能为例 [J]. 新闻爱好者,2024(7):16-21.
[3]郭全中. 媒体深度融合的“大融合”思路及实施关键[J].现代传播(中国传媒大学学报),2022,44(9):1-7.
[4]李明德,刘娇杨. 新质生产力引领下的全媒体传播体系建设[J]. 编辑之友,2024(10):53-62.
[5]韦路,陈曦.AIGC时代国际传播的新挑战与新机遇[J].中国出版,2023(17):13-20.
[6]高婷. 人工智能大模型时代学术期刊出版的新变:趋势、场景及反思[J]. 出版广角,2024(5):76-80.
[7]杨奇光,张宇.Sora与多模态内容生产:文生世界、计算游戏与编辑治理 [J]. 中国编辑,2024(6):64-70.
[9]陆先高. 变革与创新:AI 引领媒体融合发展新趋势[J]. 传媒,2024(12):9-11.
[14]郭全中,张金熠. 作为视频世界模拟器的Sora:通向AGI的重要里程碑[J]. 新闻爱好者,2024(4):9-14.
[15]王沛然. 从控制走向训导:通用AI的“直觉”与治理路径[J]. 东方法学,2023(6):188-198.
[16]闫坤如. 人工智能体价值对齐的分布式路径探赜[J]. 上海师范大学学报(哲学社会科学版),2024,53(04):131-139.
[17]郑权,唐远清.“主体间距”与多元化理解:互联网群体传播中的信息误解[J]. 编辑之友,2024(3):72-78.
下一篇:法治网法治日报登报发稿要求