首页打开

黄淼:传媒技术:大模型浪潮席卷下的探索与调适

青年记者 | 2024-02-02 17:07:46原创

来源:青年记者

作者:黄淼(北京邮电大学数字媒体与设计艺术学院副教授)

来源:《青年记者》2024年第1期

导 读:

本文从内容生产力、内容生产机制、内容分发效率、数字人应用、内容监管挑战五个方面梳理过去一年中大模型技术在传媒领域的应用与探索,以期为媒体对大模型技术的应用提供参考。


2023年,大模型技术掀起的浪潮席卷包括传媒业在内的社会各个领域,以ChatGPT为代表的新技术力量将生成式人工智能产业推向新阶段。ChatGPT的母公司OpenAI推出的“GPT-4”实现了通用人工智能在多模态领域的质变。国内走在互联网技术前沿的公司如百度、腾讯、阿里巴巴、字节跳动纷纷开始在大模型领域投入研发力量,同时发力于基础技术与市场应用两个层面。传媒行业以内容创作及传播为核心业务,这恰是大模型技术最为擅长的任务,由此传媒业成为受到影响最显著的行业之一。2023年国内外各大互联网科技企业均已涉足传媒业的垂直大模型应用,早在2月就有超过100家机构媒体宣布接入百度“文心一言”大模型,其中包括新华社、澎湃新闻等主流媒体机构。

大模型技术的颠覆性创新力量

与此前的智能技术相比,大模型技术可以适配更广泛的媒介场景,从日常信息服务到专业内容创作,再到深度媒介化形塑下的各类在线活动,大模型基于强大的内容生成及理解力量,使技术从社会行动的辅助者变为主导者,进而有能力改变人们在各个社会知识领域的行为方式[1]。基于大模型的人机对话,相比搜索引擎具有更高的匹配效率,相比推荐引擎具有更个性化的供给价值。然而,面对新技术的席卷之势,部分行业实践领导者却希望暂停大模型技术研发。2023年3月,生命未来研究所呼吁所有人工智能实验室立即暂停比“GPT-4”更强大的人工智能系统的训练,暂停时间至少为6个月,联名签署公开信者包括特斯拉创始人埃隆·马斯克、苹果联合创始人斯蒂夫·沃兹尼亚克等上千位人工智能研究专家。[2]在国内,针对短时间内快速涌现的生成式人工智能应用,国家网信办等七部门于2023年7月联合发布的《生成式人工智能服务管理暂行办法》为大模型技术在内容产业中的应用发展划定了“红线”和“底线”,如此及时的监管行动对于建立良性市场秩序具有重要意义。

“颠覆性创新”(Disruptive Innovation)是由哈佛大学商学院教授克莱顿·克里斯坦森提出的理论,用以描述技术革新对产业中原有企业和新创企业的不同影响,强调具有技术优势的企业才能赢得竞争优势。大模型正是这样一种给传媒产业带来复杂影响的技术革新。因此,大模型技术的横空出世引发了传播学界的热议。有学者认为,大模型开启智能互联时代,它将带来对人的重大赋能赋权,也将促成传播领域的生态级变革。[3]也有学者认为,大模型技术使传播指向一个无限开放系统的可能性,受其驱动的智能媒体取代社交媒体成为人类主导性传播机制,这将带来全新的风险和治理挑战。[4]还有学者从人机协同视角分析大模型的影响,人机交流虽然可以给人们带来相应的满足,但也可能对人际交流形成挑战与破坏。[5]随着“GPT-4”和“Gemini”问世,基于大模型技术的应用将日趋完备,这也将进一步加速生成式人工智能对传媒业各个环节的重塑作用。综合以上背景,本文从内容生产力、内容生产机制、内容分发效率、数字人应用、内容监管挑战这五个方面梳理过去一年中大模型技术在传媒领域的应用与探索。

大模型进一步释放内容生产力

大模型技术在其发展过程中不断推进对内容生产力的更多解放。百科全书式的“GPT-3.5模型”可以快速产出专业内容,如游戏代码、营销文案;具备多模态能力的“GPT-4”不仅可以在极短时间内产出万字长文,还可以兼容视听内容的理解与生成。大模型技术已覆盖到传媒生产力的多个细分领域。在新闻生产中可以节省信息收集与整合的时间成本;在文艺创作中可以在整合丰富元素的基础上启迪创作想象力,等等。

在专业内容生产领域,大模型的优势目前而言体现在信息整合、标签细化和智能摘要上。其一,“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据以及5500亿事实的知识图谱等。这样的信息储备可以为内容生产提供丰富的参考和依据。其二,大模型技术可以更加细化标签力度,让内容标签颗粒度更细、泛化性更强,将专业生产力从机械重复的归类和筛选工作中解放出来,使专业生产力可以更多投注于更需要原创智慧及价值观判断的任务中。其三,大模型技术可以提供智能标题和智能摘要生成,服务于传媒领域的大模型可以在较短时间内对各类研究报告提取30-50种摘要,显著节省人力编辑的劳动力成本。

尽管大模型技术潜力巨大,对内容生产力的激活作用也已显现,但这项新技术与传媒内容生产力之间的关系还值得慎重考虑。传媒内容生产力的核心价值在于创造知识,在新闻领域是记者与编辑职业信念、专业素质及岗位技能融合的成果,在文化艺术领域则是创作者知识积累与灵感迸发的产物。换言之,传媒劳动力的价值体现在将人类社会文化积淀作为精神产物的外化过程,而不仅仅是对已有数据化信息的整合。在这个意义上,大模型技术对内容生产力的释放作用应以节省重复低效劳动为目标,而不是取代专业优质创造力。

大模型重构内容生产机制

大模型对内容生成机制的重构意义在于,它将内容生产中的人工智能技术从辅助位置推向主导位置。[6]进入互联网时代尤其是移动互联时代后,用户和各类社会机构加入内容生产主体中,MGC(机器生产内容)和AIGC(生成式人工智能)则推动非人行动者加入生产主体的行列。但在大模型应用到来之前,AIGC参与的内容生产还是以人为主导,技术仅作为人工在信息储量、计算速度和精准程度上的补充与辅助。而大模型技术从知识构建的基本元素开始参与内容生产,其颠覆作用由此而生[7]。

国内外主流媒体积极探索通过与互联网科技企业合作实现大模型技术赋能于媒体智能化。在国内,人民网与百度于2023年初合作发布媒体行业大模型“人民网-百度·文心”,该模型基于双方在预训练大模型技术和传媒领域的经验推出,引入人民网舆情数据中心相关样本数据。7月,中央广播电视总台与上海AI实验室、联合发布“央视听媒体大模型”可根据视频内容一键生成风格各异的解说词,还支持用户通过聊天对话的形式深挖视频蕴含的信息。2023年中,腾讯云智能在传媒领域推出多个垂直大模型。绘画模型实现“文本输入—图像输出”、支持超过25种绘画风格;图像识别领域的OCR(光学字符识别)大模型,借助端到端算法,解决特定场景识别难题,减少训练成本和训练时长;数据分析领域的大模型,实现零专业门槛的对话式分析,为业务一线提供决策支持;人机交互领域的行业大模型中枢,对接海量知识和工具,支持多模态理解,使智能客服更智能、更高效。在国外,美联社与OpenAI达成一项为期两年的协议,双方将共享部分新闻内容和技术,美联社借助ChatGPT提升生产效率,而后者则利用前者的媒体资源库训练AI算法。

在商业营销领域,大模型技术的优势是在精准洞察市场趋势变化的基础上支持高质量的文案产出。腾讯云智能研发的“混元大模型”支持用户通过参数选择、多轮输入,对生成内容进行控制、调优,生成专属内容,提升文案创作效果及可用性。讯飞AI营销构建“星火营销大模型”专门针对“专家级能力培养慢、个性化创意批量难、精细化运营成本高”的用户痛点,同时服务于前链路品牌广告与后链路效果运营。

大模型提升内容分发效率

进入移动传播时代之后,基于互联网的内容分发效率相对于大众传播时代已有极大提升。然而在此过程中,自Web2.0以来用户日渐上升的主体性却被无形消解着——用户只能被动接受平台价值驯化的算法驱动的信息流。但是大模型技术以人机对话的传播形式将信息搜寻的主动权交还给用户[8],即用户需要主动键入提示词才能获得回应,并且可以随时改变对话方向,不断调整对自我需求的认识,键入更准确的提示词,从而深入既定话题,达成信息搜寻目标。相比传统推荐引擎,大模型技术的优势有三。其一,大模型基于前文内容优化和完善针对用户的个性化偏好的理解与分析;其二,大模型结合对话产生的时空场景,包括用户在软件中沉淀的既往偏好数据,并对当下提示词与既往偏好进行整合;其三,大模型可以自动生产新的提示词或句子,引导用户选择新提示词,或者调整原有提示词。概言之,大模型支持下的信息交互过程可以不断循环上述过程,在每一次提供服务时实现自身的学习完善。

百度是国内大模型技术领军企业,又是搜索市场领跑者,所以两项业务的结合水到渠成。百度搜索平台负责人认为,大模型推动搜索业务迎来代际变革。[9]传统搜索引擎的使用效果取决于用户是否选择恰当的搜索工具、是否输入准确的命令词、是否具备从搜索结果的排序列表中筛选出符合需求的结果。大模型出现后,对话式搜索显著降低用户筛选的成本,更重要的是,大模型会根据对话的上下文语境不断学习和适应用户需求。多轮次对话如同信息漏斗,将用户真正需要的信息过滤出来。

在国外,微软作为ChatGPT的投资者之一,在ChatGPT爆火之后也很快将大模型嵌入其旗下的必应搜索引擎中。大模型嵌入后一个月,微软官方称必应每日活跃用户首次突破1亿人,每天有三分之一的用户会与基于ChatGPT开发的“Bing Chat AI”交互。谷歌为应对微软必应采用大模型技术所带来的竞争压力,紧随其后推出名为Bard的大模型应用。2023年底,谷歌又推出名为“Gemini”的新AI模型,并声称该模型在一系列智力测试中的表现优于OpenAI的“GPT-4模型”和“专家级”人类。[10]对于搜索业务而言,大模型的嵌入可以整合信息筛选与融合的过程,帮助用户部分摆脱被信息海洋包围的负担,让传统搜索的精确度、便捷性与体验感上升到一个新的高度。

2023年,除大模型快速发展外,主流媒体在内容分发上的技术创新也成效显著,依旧聚焦于对主流媒体算法的巩固与强化。中央广播电视总台自2021年启动“总台算法”的开发和建设,通过算法驱动内容传播的思想性、艺术性和商业性协调统一,打造主流媒体的价值认知算法;由封面新闻旗下的封面科技打造的正能量、热流量、强安全的“灵知”主流媒体算法正式发布,给出了全场景、全链条的智能化解决方案。

大模型助推数字人降本增效

大模型以极低门槛实现多模态内容生成,使其可以脱离内容而泛化为一种人机对话的媒介,恰好匹配数字人应用需求。得益于大模型技术的助推,我国数字人市场规模呈现加速增长趋势,预计到2025年将增长到480.60亿元,从业者认为大模型使数字人进入一个“真正可用的阶段”。[11]

大模型出现之前,数字人已经普遍存在,如虚拟主持人、虚拟主播,以及电商、教育等各场景下的智能机器人。传统数字人可以满足好奇心和简单的信息需求,但仍存在许多技术不足,如机器思维明显,无法满足情感需求等,大模型有助于解决这些问题。具体而言,大模型技术带来四个方面的能力增益。[12]其一,大模型可用于多模态内容识别与生成,显著提升人机对话的丰富度和体验感;其二,大模型基于无监督学习的模型,不需要训练数据即可学习自然语言规律,解决重度依赖标记数据的成本问题;其三,大模型具有强大参数,使生成内容更符合人类习惯,完善数字人的人格属性。基于以上优势,百度、阿里、腾讯等平台均已上线大模型支持的数字人服务。数字人应用主要分为演绎型和服务型两类。传媒产业中的应用多为第一类,即通过数字人的虚拟化载体,模拟高质量的主持人,使其服务成本更低、效率更高、范围更广。[13]例如,民生节目的主持人熟悉医院和医疗专家,但限于劳动力无法广泛推广,大模型可以把主持人的知识库复制到数字人,服务于更多场景和用户。以腾讯云发布的“智能小样本数智人生产平台”为例,只需要3分钟的视频就可以完成建模,整个制作过程耗时控制在24小时以内,生产成本从百万级别降低至了数千元。[14]更重要的是,成本降低的同时,效能却得到提升。在大模型出现以前,数字人在外形上差异度较小,而且只能根据统一脚本“照本宣科”地回答问题。而在大模型的赋能下,数字人不仅外貌特征可以自定义设计,智能化、交互性也有了很大提升。概言之,大模型技术使数字人成本降低、周期缩短、门槛降低、体验提升、范围拓展。

大模型内容生产力亟待有效监管与引导

大模型技术在内容生产效率上确实具备超出人工的明显优势,但由于大模型依赖“可获取的数据知识”进行内容生产的模式,所以在很大程度上消解了新闻场域效应,各种原本处于新闻场域中的博弈力量对具体的新闻内容生产者或者生产机构的影响大大降低[15],还有可能带来“以讹传讹”或“一本正经的胡说八道”的不良局面。实际上,在各类大模型技术应用出现之前,随着人工智能的快速普及化,社会各界已经展开有关知识幻觉、数据安全、个人隐私、道德伦理等诸多问题的讨论,快速爆发的行业急需监管措施的规制与引导。因此,国家出台多项政策引导大模型技术的应用发展方向。2023年1月,国家网信办等多部委发布的《互联网信息服务深度合成管理规定》正式生效。网信办等七部门7月发布《生成式人工智能服务管理暂行办法》,由此加速行业整顿步伐。

作为对国家政策导向的积极响应,人民日报社正努力走出一条“用AI治理AI”的人工智能治理之道,可为其他媒体提供参考:依托人民网建设传播内容认知全国重点实验室,推出涉政智能审核平台“人民审校”等四款产品,初步建立智能化的安全风控体系以及人工智能意识形态风险评测体系。人民日报社传播内容认知全国重点实验室于2023年10月成立科技伦理委员会,以持续发挥国家媒体的行业引领与社会服务职能。

参考文献:

[1]胡翼青,胡欣阅.作为语言基础设施的ChatGPT[J].新闻记者,2023(06):21-27.

[2]赵颖.“危险!立刻停下所有大型AI研究!”[EB/OL].(2023-03-29).https://baijiahao.baidu.com/s?id=1761696024175554001&wfr=spider&for=pc.

[3]喻国明.ChatGPT浪潮下的传播革命与媒介生态重构[J].探索与争鸣,2023(03):9-12.

[4]方兴东,顾烨烨,钟祥铭.ChatGPT的传播革命是如何发生的?[J].现代出版,2023(02):33-50.

[5]彭兰.从ChatGPT透视智能传播与人机关系的全景及前景[J].新闻大学,2023(04):1-16+119.

[6]郭全中,袁柏林.AI能力新突破下的AIGC:内容生产新范式[J].青年记者,2023(13):66-69.

[7]喻国明,苏芳,蒋宇楼.解析生成式AI下的“涌现”现象——“新常人”传播格局下的知识生产逻辑[J].新闻界,2023(10):4-11+63.

[8]官璐,何康,斗维红.微调大模型:个性化人机信息交互模式分析[J/OL].新闻界,1-9[2023-12-15]https://doi.org/10.15897/j.cnki.cn51-1046/g2.20231123.001.

[9]今天,大语言模型革新百度搜索[EB/OL].(2023-05-25).https://baijiahao.baidu.com/s?id=1766867507366951867&wfr=spider&for=pc.

[10]谷歌发布最新人工智能模型Gemini智力测试优于“专家级”人类[EB/OL].(2023-12-07).https://baijiahao.baidu.com/s?id=1784594036179661494&wfr=spider&for=pc.

[11]商汤大模型升级 AI数字人步入真正可用阶段[N].中国经营报,2023-07-07.

[12]董静怡.虚拟人能否靠ChatGPT迎来巨大突破?[N].21世纪经济报道,2023-02-20(08).

[13]王威.文化与科技的双向奔赴——AIGC驱动媒体产业变革[J].视听界,2023(05):19-21.

[14]周春媚.大模型重塑赋能 数字人迎来爆点[N].证券时报,2023-11-04(A04).

[15]吴小坤.ChatGPT信息“革命”对新闻业的冲击与挑战[J].探索与争鸣,2023(03):26-29.

本文引用格式参考:

黄淼.传媒技术:大模型浪潮席卷下的探索与调适[J].青年记者,2024(01):16-19.

责任编辑:焦力