AI写作财经评论能否匹配人类记者的专业度?——基于HSM模型的在线实验分析

360影视 2025-01-17 10:21 2

摘要:过去,AI写作在新闻生产中通常被用于主观性、逻辑性较弱的新闻体裁。然而,随着近来AI能力的提升,AI写作能否被扩展到更具主观性、创意性的新闻生产环节当中引发了讨论。财经评论兼具结构性、主观性和逻辑性,其本身也是用以探究AI写作应用边界的一类较为合适的新闻体裁。

本刊官方网站:

摘要

过去,AI写作在新闻生产中通常被用于主观性、逻辑性较弱的新闻体裁。然而,随着近来AI能力的提升,AI写作能否被扩展到更具主观性、创意性的新闻生产环节当中引发了讨论。财经评论兼具结构性、主观性和逻辑性,其本身也是用以探究AI写作应用边界的一类较为合适的新闻体裁。基于系统化-启发式(HSM)模型,本研究通过两组情境实验考察了AI作为评论作者对财经评论感知专业度的影响及其具体作用机制。研究一在未提示受众关注作者的情况下,探讨了受众对AI生成与人类撰写的财经评论之间感知专业度的差异。结果显示,当受众通过系统化处理路径阅读财经评论时,很难区分AI与人类记者撰写的评论在专业度上的差异。研究二采用2(实际作者:人类 vs. AI)×3(作者署名:人类记者 VS. AI VS.不署名)因子设计,通过在线实验探讨启发式处理路径下,受众对不同作者的财经评论的差异化感知机制。结果表明,当受众注意到评论的作者身份时,署名为AI的财经评论可以通过权威启发式(authority heuristic)和机器启发式(machine heuristic)提高内容的感知专业度,而受众对AI写作的态度能够有效增强机器启发对内容感知专业度的提升作用。但是,署名与否则会降低受众的权威启发式水平进而折损受众对于内容的专业度感知。结合两研究来看,过往专业财经媒体赖以生存的权威性、专业性在当前的AI时代也开始面临着极大挑战。因此,应对AI写作的冲击有必要充分重建财经媒体的权威性和专业性。

作者简介

陆泓承,清华大学新闻与传播学院博士研究生。

人工智能(AI)在新闻生产中的嵌入程度不断深入,越来越多的新闻领域和生产环节开始引入AI技术。当前,人工智能技术已经被广泛用于信息搜集、数据分析以及数据可视化等辅助性生产环节当中。然而,随着基于大模型的生成式AI(Generative AI)越发智能、专业,AI写作的逻辑性、可读性逐渐向人类靠近,学界和业界对于AI在新闻业中的参与限度进一步展开了畅想和讨论(郝雨,文希,2023;谢湖伟,简子奇,沈欣怡,2023)。

在财经新闻领域,由于财经文本具有标准性强、数据性强等特点,业界较早就尝试将AI写作技术应用于新闻快讯和短篇报道的撰写,财经新闻领域可以看作是AI应用于新闻生产中的重要前哨(张弩,周宇翔,杨恬,2023)。但同时,由于财经新闻的专业性高、对于市场的影响更为直接,财经新闻中的评论与分析部分当前仍主要是专业记者来人工撰写(李华林,2023)。然而,AI能否更进一步参与到更具主观性、创造性的内容(例如:新闻评论、解释性报道、深度访谈)生产中,这一问题在财经新闻领域存在着一定张力,而财经新闻的专业性是一大关注焦点。

和其他领域相比,财经新闻领域有着更多的AI经验、生产的内容也更接近主观和客观的边界,其本身是探索AI是否能被应用到更具主观性和专业性的内容生产上的重要“实验田”。随着AI的逻辑和写作能力不断提升,接近甚至达到人类水平,使用AI进行财经新闻的评论和深度分析是否可以成为可能?AI的进一步参与是否削弱新闻内容的专业性?为了解答以上困惑,本研究基于“启发式-系统化模型”(Heuristic-systematic model,HSM),探讨财经新闻评论主体对于读者感知新闻专业性的影响机制以及边界条件。

一 文献综述

(一)财经新闻的专业性与AIGC

一直以来,财经新闻高标准性、强公开性、信息密度大的特点使其成为机器学习领域的重要训练材料,人工智能与财经新闻业之间的融合也累积了一定的研究材料与实践成果(Zhang et al.,2022)。与此同时,由于AI自动化生产有望解决财经新闻行业的长期痛点,业界、学界人士近来对于AI写作也有着较高关注。

无论是阅读还是撰写财经新闻,专业性都是该领域中必不可少且无法回避的一个重要门槛。对于财经记者来说,记者不仅需要掌握基本的新闻采写能力,更需要掌握专业的财经知识、财经敏感和财经判断能力,“专业性”一直是行业内的一大长期痛点(徐静君,徐涛,2017)。为了应对这一挑战,业内常见的做法是将记者专门化。通常,一个新入行的财经记者会被分配到一个更专业的领域,例如房地产、经济政策、资本市场等。在那个领域,记者可以积累经验、新闻信源并建立自己的权威性和专业性,这种做法被称为“跑口”(陈阳,2014)。即便如此,大部分财经记者写作时,仍需要大量参考和借助分析师、专家等外部专业人员的意见(Iddins,2021)。

近年来,AI写作的理解能力、联想能力和知识水平都展现出了极大的潜力(付晓光,吴雨桐,2021),也开始逐渐被一些财经媒体用于简短的标准性新闻写作中,但受限于过去AI的联系、预测能力较弱,较少有媒体通过AI进行新闻评论、深度报道等更具主观性的写作。2022年,随着AI大模型的出现,AI可以更深度地理解指令、处理非结构性文本,其在多方面能力上得到了显著提升(史安斌,刘勇亮,2023)。

尽管如此,由于财经新闻的特性属于硬新闻,受众严重依赖于专业和权威的意见,如教授、专业记者、分析师等(李华林,2023)。同时,财经新闻可以通过信息和情感效应影响市场信心和预期(程萧潇,2019)。因此,对于指导性和主观性内容,行业和学界一直对内容生产的自动化保持谨慎态度。其中,首要关切集中在人工智能生成内容(AIGC)是否足够做到准确和客观,能否对于新闻事实进行专业、合理的分析,其次就在于AI创作的财经新闻能否也可以像财经记者一样“专业”,或者说是被读者感受到是一样专业的(朱小沛,2018)。

对于第一个问题,当前已有足够证据证明AI确实具备足够的专业能力,而且随着技术的发展,它甚至可能会表现得比人类更好(许雪晨,田侃,李文军,2023)。然而,对于第二个有关感知专业水平的问题,目前还没有足够的证据来确认读者是否认为AI撰写的文章与人类记者撰写的文章同样具有专业性。本文聚焦财经新闻评论,这一领域在业内被认为既包含主观性也包含客观性,旨在探讨人们对AI和人类记者撰写的文章专业性认知的差异,以及影响这些认知的具体机制。通过考察不同读者对AI生成的内容与人类产出内容的专业质量的反应,该研究旨在阐明AI在财经新闻领域的能力和局限性,以及它可能如何影响读者信任和媒体格局。

(二)AI新闻写作与“专业性”

受众对于AI与人类记者的差异化认知是当前AI新闻写作应用研究的关注重点之一。Gutsche(2015)发现公众普遍认为AI创作的新闻更为客观、夹带更少个人感情,其可信度会高于人类记者。Jung等(2017)发现即使对于同一新闻,受众都会更倾向于信赖被标记为“AI创作”的新闻,这进一步验证了Gutsche(2015)的结论,也说明了受众对于“AI作者”这一身份信息有着较为特殊的认知机制。Longoni 和 Cian(2022)后来将这种效应命名为“机器话语效应”(word-of-machine effect)。

后续研究者进一步探索了这一效应背后的具体机制及其在不同情境下的表现。在起效情境上,机器话语效应在不同新闻领域(Liu & Wei,2019)、新闻类型(Tandoc Jr,Yao & Wu,2020)、文化背景(Jung et al.,2017)中会表现出不同的效力。在具体机制上,Jung等(2017)的研究表明,机器话语效应并不是基于内容的本身质量起效,而是通过署名等边缘特征影响受众。因此,区分AI作者和AI署名在机器写作效应中的功能至关重要。此外,研究也发现了感知偏见(Waddell,2019a,2019b)和机器启发式(陈阳,李宛真,张喆喆,2023;牟怡等,2019)等变量在感知过程中起到重要的中介作用,这也有必要在后文重点关注。

目前,大部分对于AI新闻写作的研究基本上都是针对整体意义上的“新闻”,关注焦点也更多聚焦于可信度、客观性等通常意义的新闻价值要素。即使有研究对于不同的新闻类型、议题进行区分,但大部分研究基本上也只是发现了差异存在,而并没有区分不同新闻类型差异化的具体机制。回到本研究,探讨AI与财经记者的财经评论差异,可信、客观固然也是重要的新闻价值,但这并非研究的关键所在。建构本研究的理论模型,有必要更关注“专业性”在理论模型中的位置。

但值得注意的是,本研究所关注的“专业性”本质上并不指代“算法本身是否专业”。不同算法、同一算法(甚至是同一人类作者)在不同主题和不同时期都表现出不同的专业性水平(郝雨,文希,2023),研究算法和人类在分析能力、分析精度等方面的表现事实上并不是研究真正关心的,这也完全可以通过客观材料直接进行验证。因此,无论是本研究还是学界、业界,“专业性”事实上更多关注的是“当受众发现评论主体是AI时,是否还会认为新闻本身是专业的?”换句话说,研究关注的本质问题其实是“评论主体身份”这一启发式线索对于受众感知专业度的影响,这也引申出了人机互动研究中常用的HSM模型。

(三)启发式-系统化(HSM)模型

“启发式-系统化模型”是双重加工模型中的重要理论,论述了个体进行信息处理、行为决定的不同路径,是当前学界研究人机互动的重要理论模型。其中,系统化加工表明个体投入了较高的认知努力,运用自身过往的知识与经验等来精细加工信息;启发式加工表明个体采用了启发式线索和简单的决策规则来快速做出判断。其中,HSM模型中的两种认知路径可以对应到详尽可能模式(Elaboration Likelihood Model)中的核心路径与边缘路径,但是HSM模型承认两种路径同时存在、相互影响,在解释人机互动时更常被采用。

在HSM模型最小努力原则、充分性原则的两大假设条件下,系统化认知只有在个体信息处理动机较高时才会占据主导,而其余时候个体总会无意识地受到启发式线索的影响。Rijo和Waldzus(2023)发现,“来源线索”是个体通过启发式加工验证信息质量和可信度过程中最重要的启发式线索。在传统新闻领域,权威启发式(authority heuristic)是与信源相关的被讨论得最多的一类启发式线索,也有大量研究证明了受众对于新闻可信度等内容质量层面的感知会受到信源权威性的影响(Alyukov,2023;Hilligoss & Rieh,2008)。对于财经新闻的读者而言,新闻内容关联的生活经验更少、对于读者的不确定性更大,因此读者在这一语境下更依赖于权威信源和专业意见。由此可以推论,读者在阅读财经新闻评论时将会在很大程度上受到权威启发式的影响。

在智能算法新闻领域,被讨论得最多的启发式类型主要为机器启发式。其中,“机器启发式”(machine heuristic)这一概念最早由Sundar(2008:74-76)提出,他们认为技术可供性所传递的线索可以激活用户对技术的启发式认知,从而影响用户对技术传递的信息的质量和可信度的判断。后续大量研究也进一步验证并探索了机器启发式对于受众对于信息质量、可信度等方面的具体影响(Waddell,2018)。大部分研究发现公众认为AI具有更强大的数据处理能力、不容易受到主观偏见影响,因此机器启发式会加强受众对于信息内容质量和可信度的感知(陈阳,李宛真,张喆喆,2023;蒋忠波,师雪梅,张宏博,2022;姚琦,周赟,2022)。其中,个体对于AI的态度(包括能力感知、新奇感、感知威胁等)对于机器启发式的发挥具有一定的调节作用。

然而,上述大部分研究基本都是基于实验法探究机器启发式对于信息可信度的效应,且较少对于不同的新闻领域和类型进行区分,以至于部分研究得出“硬新闻(甚至是新闻)中的机器启发式效应并不显著”的结论(牟怡,夏凯,Novozhilova,许坤,2019;姚琦,周赟,2022)。但事实上,这有可能是由于(硬)新闻中人类作者署名所触发启发式认知与AI署名所触发的启发式认知之间存在着相似的效应,而由于研究者都简单地将其认为是同一类型的启发式效应,从而导致研究简单地认为两类情境的启发式之间并不存在差别。基于这一点来看,区分好两类启发式之间的差异事实上是相当必要,但值得注意的是,Carlson(2015,2018)指出算法新闻本身也会形成一种新型的新闻权威认知。因此,虽然机器启发式被证明在受众阅读AI新闻的过程中发挥着重要作用,但是并不能简单地将权威启发式排除出受众阅读AI新闻的认知路径当中,更不能简单将权威启发式和机器启发式认为是互斥和对立的两种启发式认知路径。因此,本文认为在受众阅读AI写作和人类创作的财经新闻中均会存在权威启发式的认知,但两种启发式的作用存在差异;而AI写作财经新闻的特殊性同时还存在着机器启发式的认知,这也形成了区分两种阅读情境的重要线索。

此外,当前大部分研究基本上都只关注到了内容的可读性、可信度,而较少关注内容的专业性。一方面,如前文所述,专业性不仅是财经新闻领域中的重要新闻价值标准,同时也是可读性、可信度等其他价值的重要前提。另一方面,虽然大量研究的研究重点不是专业性,但是大量研究均发现了机器启发式与“感知作者能力”“新闻质量评价”等变量之间的相关性(陈阳,李宛真,张喆喆,2023;牟怡,夏凯,Novozhilova,许坤,2019),这也暗喻了启发式加工与感知专业度之间的关联。鉴于以上两点来看,基于HSM模型探究评论主体身份与感知专业度之间的关系路径是可行且有意义的。

基于研究目的和研究现状,本研究设计两轮控制实验,用以验证研究假设和回答研究问题。其中,研究一的目的主要是为了验证个体在阅读财经新闻评论时的认知路径,验证排除系统化处理对于研究结论的干扰。研究二的目的是进一步探究不同评论主体对于受众的感知专业度影响的具体路径,并且进一步验证主效应以及调节效应。

二 研究一:不提示评论主体条件下的

感知新闻专业度差异

(一)研究设计

根据HSM模型,受众在处理信息时同时存在系统化加工、启发式加工两种认知模式,而且两种模式均被证明对于受众的新闻感知存在影响。虽然当前已有研究证明了受众难以区分AI写作和人类创作的新闻作品(牟怡等,2019;姚琦,周赟,2022),但过往研究对于新闻议题和体裁基本不加区分且主要关注“可信度”这一变量,而由于本研究对新闻体裁进行了聚焦并在衡量变量上扩展到了“专业度”这一变量,因此很难简单地推论受众在该研究情境中也可以比较好地区分AI写作和人类创作的财经新闻评论的“专业度”,因此有必要通过实证研究对其进行验证。基于此,研究提出第一个研究假设:

假设1:在没有明确指出评论者身份的情况下,受众对于不同作者所进行评论的感知专业度差异不大。

为了验证研究假设1,本研究设计了研究1用以在经济传播研究情境中排除系统化加工对于感知专业度的影响。为了避免提示作者身份这一行为本身对于研究结论造成干扰,研究一的主要思路是在不告知且不提示受试评论主体的情况下(研究二会在实验前提示研究者“该篇文章既有可能是摘取自专业财经报刊专业财经评论员所作的文章,也有可能是通过生成式人工智能基于大数据、AI技术所自动生成的评论文章。”),让受试分别阅读由人类评论员、AI针对同一经济现象进行的财经评论,然后测量受试对于两条新闻的感知专业度、对于评论者身份的猜测,以排除系统化处理对于感知专业度的影响,为后续研究做铺垫并验证测量工具的可靠性和有效性。

此外,由于姚琦和周赟(2022)已通过实验验证过读者对于AI与人类记者写作的新闻报道的可信度具有相似感知且较难分辨新闻的真实作者,而陈阳、李宛真和张喆喆(2023)的研究验证了AI写作情境中感知内容质量和感知可信度之间的强相关关系,因此研究一也拟通过增加测量受众的“感知可信度”以验证和确保研究的效度。

(二)样本选取

研究通过“Credamo见数”调研平台招募线上受试者,一共发放问卷110份,回收有效问卷108份。研究通过“Credamo见数”平台的“流程控制-随机显示”功能随机分配受试者到两个不同的实验条件中。在进入实验前,每位受试都将通过该平台自动执行的随机程序被等概率地分配到以下两种条件之一:先阅读人类评论员撰写的财经新闻评论,或者先阅读由AI自动生成的财经新闻评论。其次,被试需要在30秒~4分钟以内阅读两篇长度一致、评论新闻事实一致的财经新闻评论(作者分别为AI和真人记者)。在本研究中,研究不提示这两篇新闻的来源。被试阅读后立即填写问卷,测试被试对于两条财经评论的专业性感知,其次要求研究者猜测两篇文章的作者身份。其中,研究设计了注意力检测题,不通过注意力检测的样本将被排除。在有效样本中,男性占39.42%,女性占60.58%;本科以上学历占50.9%,本科以下学历占49.1%;受试年龄范围主要集中在21岁~60岁,占比79.6%(M = 36.25)。遵循实验伦理,被试者填完问卷后会被告知本次实验目的以及材料的真实作者。实验结束后,通过有效性筛选的被试会被给予0.5~2元的报酬。

(三)研究材料

本研究中的操纵变量为“评论实际作者”,同一受试会被给到两篇财经评论要求阅读(顺序随机)。为了确保操纵的有效性,研究选取综合性较强、和受众接近性较弱的宏观新闻领域的“2023年中国中央经济工作会议”这一新闻事实作为评论对象。其中,人类评论员撰写的评论选自专业财经媒体《经济日报》发表于2023年12月15日的《供需协同发力巩固壮大发展优势——论贯彻落实中央经济工作会议精神》一文。由于当前较少有媒体采用AI进行财经评论写作,因此研究使用ChatGPT4.0 Turbo要求其基于10篇中国主流媒体对于“2023中央经济工作会议”的新闻报道进行专业的财经新闻评论,同时要求其写作长度、段数、用词难度等方面与人类记者保持一致。在研究一中,为了排除启发式加工的干扰,研究在实验材料的文章前后均不标记评论者署名。

(四)变量测量

本研究采用的测量量表大多来自英文文献,题项均以5级里克特量表进行测量,1表示“非常不同意”,5表示“非常同意”。为保证研究质量,研究关闭断点续答功能,每个IP地址仅能回答一次,且要求填答时间在两分钟以上才能被视为有效问卷。研究测量变量如下:

感知专业度。参考Ohanian(1990)的量表,共5个题项,包括“您如何评价这篇财经评论,它的作者:具有专家性、有专业经验、掌握多方面知识、具有熟练的技巧、有权威性”。

感知可信度。参考Flanagin和Metzger(2000)的量表,共4个题项,包括“您如何评价这篇财经评论,它是:准确的、客观的、真实的、值得信赖的。”

对评论主体的判断。参考姚琦和周赟(2022),在测量完被试感知专业度后,提示被试“以上两篇文章既有可能是专业财经记者的评论,也有可能是AI的评论”,要求被试回忆并判断每篇文章作者为专业财经记者、AI写作的可能性。

(五)结果分析

1.信度检验

在研究一中,对于“感知专业度”进行信度检验,财经记者评论的Cronbach’α系数为0.871,AI财经评论的Cronbach’α系数为0.869;对于“感知可信度”进行检验,财经记者评论的Cronbach’α系数为0.847,AI财经评论的Cronbach’α系数为0.859。测量变量α系数均高于0.8,量表的信度较高,可以采用。

2.对评论主体的判断

通过后验的配对样本t检验,研究发现被试能有效区分出两篇文章是否是由AI进行撰写,被试对于刺激物是否由AI撰写的可能性感知呈现出显著差异(t=-2.336, p=0.021

3.被试感知专业度的差异

无论在组内、整体,受试对于阅读材料的感知专业度与感知可信度之间均呈现出了显著的正相关关系。对于人类财经记者所撰写的财经评论,两变量之间的相关系数为0.86(p

但基于配对样本t检验,研究发现:在不提示实际作者的情况下,同一受试对于专业财经记者所撰写以及AI自动生成的财经新闻评论之间的专业度感知和可信度感知均不存在显著差异。

可见,虽然在提示受众让其回忆文章作者时,受众有能力可以区分两篇阅读材料的实际作者,但是在不被提示受试要去关注作者(启发式线索不足)的情况下,受众对于两篇阅读材料并不存在显著的差异化感知,对两篇阅读材料的可信度、专业度判断均不存在统计学意义上的显著差异。上述发现在一定程度上支持了研究假设1,也支持并扩展了“受众难以区分AI和人类记者的作品”这一结论。

三 研究二:提示评论主体条件下的

感知新闻专业度差异

通过研究一的验证,研究可以初步排除系统化处理对于研究结论的干扰,进而可以充分地聚焦到对于启发式处理的过程。然而,在提示评论主体条件下,受众对于新闻专业度形成感知的具体过程仍有待进一步挖掘。

(一)研究框架

基于研究目的和既有研究现状,研究提出以下研究框架,如图1所示。其中,自变量为评论“是否署名”“署名是否为AI”,因变量为“感知专业度”,中介变量为“权威启发式”“机器启发式”,调节变量为“对于AI写作的态度”。根据理论基础和研究框架,研究提出以下研究假设:

假设2-1:在提示评论者身份的条件下,权威启发式、机器启发式中介了评论员署名情况对于受众感知专业度的影响。

假设2-2:提示评论员署名可以激发受众的权威启发式认知,进而引发受众更高的感知专业度。

假设2-3:在提示评论者身份的条件下,评论署名为AI的财经新闻评论会激发受众的机器启发式认知,进而使得受众产生更高的感知专业度。

基于HSM模型,研究认为真正造成受众对于AI、人类记者所创作财经评论的专业性认知存在差异的核心原因在于启发式线索的差异,因此不同的启发式路径在评论主体身份对于受众感知专业度的影响路径中应当起到的重要的中介作用。本文预设在受众阅读AI写作和人类创作的财经新闻中均会存在权威启发式的认知,但两种启发式的作用存在效果上的差异;而AI写作财经新闻的特殊性同时还存在着机器启发式的认知,这也形成了区分两种阅读情境的重要差异。

假设2-4:对AI写作的态度对于机器启发式对感知专业度的影响具有调节中介效应。

根据Sundar(2008:74-79)所提出的MAIN模型,机器启发式源于技术可供性(affordance),因此个体对于AI写作的态度本身也会对于机器启发式具有正向调节作用。而且从现实角度来看,当前AIGC行业仍处于快速发展阶段,虽然目前人们对于AI的认知普遍较为正向,因此机器启发式对于个体的信息质量、可信度判断仍有着正向效应,但是未来人们对于AI的认知是否还能和当前一致仍然处于未知当中,因此讨论这一变量也能使得模型更为稳定,在长期上也更具参考价值。

(二)研究设计

为了验证上述研究假设,研究基于研究一的基础设计在线实验用以探讨受众对于财经新闻评论感知专业性形成的具体中间机制。其中,研究二的思路主要是在提示受试评论主体的情况下,进行2(实际作者:人类 vs. AI)× 3(作者署名:人类记者 VS. AI VS. 不署名)因子设计的在线实验,然后测量受试的权威启发式水平、机器启发式水平及其对于新闻的专业度感知,探究两类启发式认知的中介效应和“对于AI写作的态度”这一变量的调节效应。

(三)样本选取

研究通过“Credamo见数”调研平台确定样本框,并从中抽取受试者随机分配到6组中的1组,每组大约分配120人左右,共720人。研究通过“Credamo见数”平台的“流程控制-随机显示”功能随机分配受试者进入到6个不同的实验条件中。在进入实验前,每位受试都将通过该平台自动执行的随机程序被等概率地分配到以下六种条件之一(如表1)。

首先,被试需要登记其性别、年龄、收入、职业等个人信息,并且同时测量对于AI写作的态度。其次,被试需要在规定时间(30秒~4分钟)内阅读带有署名的财经评论材料。被试阅读后立即填写问卷,回忆阅读评论者姓名。通过操纵检验后,测量被试的机器启发式和权威启发式水平、对评论的感知专业度,各组问卷回收情况及各组见表1。遵循实验伦理,被试最后被告知本次实验目的以及实验材料的真实作者,通过有效性筛选的被试会被给予1元报酬。

(四)研究材料

研究二的文本材料与研究一保持一致,仅在标题和结尾处加上了拟定的作者署名。其中,人类作者署名为“《经济日报》评论员”,AI署名为“本文由ChatGPT4.0 自动生成”。

(五)变量测量

具体要求同研究一,研究二额外测量的变量主要如下:

权威启发式。参考Flanagin和Metzger(2003)的题项,共4项,包括“该篇文章的作者:来源是可信的、本身是诚信的、声誉很好、传达了真实有效的信息”。

机器启发式。参考Liu和Wei(2019)的题项,共3项,包括“与人类记者相比,AI作者:没有个人意图、更加客观、没有偏见”。

对于AI写作的态度。参考陈阳,李宛真,张喆喆(2023)的题项,共2项,包括“总体来看,你是否对于AI新闻持积极态度”“你是否看好AI写作在新闻领域的运用”。

(六)结果分析

1.信度检验

在研究二中,如表2,对于“机器启发式”进行信度检验,各变量均处于良好及可接受范围内,量表信度相对较好,可以采用。

2.操纵检验与主效应

为了保证操纵有效,对于第一至第四组,研究在受试阅读完后立刻要求受试回答新闻评论的作者,并且过滤回答错误以及回答“不知道”的样本。对于异常样本清洗后,研究对于各研究变量进行方差检验,如表2,各变量组间差异显著,研究在各组之间的区分有效。

基于研究一来看,受众在不被提示关注作者时较难区分两研究材料之间的专业度;然而,从研究二来看,受众整体上对于两篇文章形成了差异化的专业度认知,受试普遍认为实际作者为人类所作文章的专业度更高,说明“提示作者身份”确实导致了受众开始通过不同的认知路径开始去认知和解读两篇文章。从署名情况来看,不同类型的署名之间确实形成了显著的感知专业度差异,而且署名为AI的文章整体上得到了更高的感知专业度,这也初步说明了研究的操纵有效。

而且更进一步来看,在阅读正确标注作者的文章时,第三组(人类作者×人类署名)和第四组(AI作者×AI署名)受试对文章所产生的感知专业度之间不存在显著差异;将人类所撰写的文章标注为AI生成时,第一组(人类作者×AI署名)和第三组(人类作者×人类署名)受试对文章产生的专业性偏差也并不明显;而将AI撰写的文章标注为人类记者后,受试对于内容专业度的感知则出现了较大程度的折损。

通过对于署名是否为AI、是否署名作为自变量,以感知专业度作为因变量,年龄、学历等作为控制变量,研究通过简单线性模型验证主效应。署名是否为AI对于财经新闻评论的感知专业度存在显著的正向影响;是否署名对于财经新闻评论的感知专业度存在显著的负向影响,初步验证主效应存在且符合研究假设。

综上,署名存在与否以及不同的署名情况确实会对受众对于财经评论的专业度感知产生影响,且研究假设1也再次得证。

3.中介效应

由上文可知,在提示财经新闻评论作者的情况下,署名为AI的文章普遍能获得更高的感知专业度,而实际为AI写作的文章反而得到感知专业度相对较低,因此有必要充分理清其中的具体机制。

研究以“署名是否为AI”“是否署名”作为自变量,以“感知信任度”作为因变量,通过PROCESS Marco的自助抽样法(Bootstrap)、以95%的置信区间、5000次抽样次数验证“机器启发式”“权威启发式”的中介效应,检验结果如表3所示。

首先,如图2,对于“是否署名”,其与感知专业度之间的总效应显著,直接效应不显著,权威启发式起到了完全中介效应,而机器启发式的中介效应不显著,支持研究假设2-1。其中,总效应系数为-0.239,署名与否通过负向影响权威启发式,进而对感知专业度造成负面影响。从这一点来看,当受众通过启发式认知和处理财经评论时,虽然权威启发式能有效地正向影响受众对于评论的专业度感知,但具体的署名反而对于受众的权威启发式认知起到的却是负面影响,这事实上反映了当前中国财经专业媒体的公信力的减弱。

其次,如图3,对于“署名是否为AI”,其与感知专业度之间的总效应显著,直接效应不显著,权威启发式、机器启发式起到了完全中介效应,支持研究假设2-3,并进一步说明了AI评论员本身也能够激发受众的权威启发式认知,进而提升内容的感知专业度。其中,总效应系数为0.164,署名是否为AI通过正向影响权威启发式、机器启发式进而正向影响财经评论的感知专业度。其中,机器启发式的中介效应值为0.048,权威启发式的中介效应值为0.086,这不仅验证了署名为AI能有效激发受众的机器启发式进而提升受众的专业度感知,同时还能通过提升权威启发式进而提升受众的专业度感知。综上,研究假设2-1、2-3得到支持。

4.调节效应

为了验证假设2-4,研究进一步在第三节中介效应被验证成立的基础上,进一步考察当调节变量存在时的模型变化情况。根据研究假设,研究基于Process Macro的模型14,以署名是否为AI作为自变量,是否署名作为控制变量,机器启发式、权威启发式作为中介变量,感知专业度作为因变量进行了调节中介分析。与中介效应验证一致,直接效应不显著,权威启发式、机器启发式的完全中介效应显著,条件间接效应汇总结果如表4所示。

从结果来看,“对于AI写作的态度”只对机器启发式与感知专业度之间的关系具有显著的调节作用。进一步来看,AI写作态度对于两者的关系具有强化调节作用,作用效果如图4所示。随着人们对AI写作态度的增加,机器启发式的中介作用大小也随之增加,对AI写作持更积极态度的个体更容易通过机器启发式来影响他们对内容可信度的评价。换句话说,当人们对AI写作的接受程度更高时,他们对于内容是否由AI生成的认知在评价内容可信度时起着更大的作用,这也支持了研究假设2-4,并进一步明晰了机器启发式的作用机制。

四 结论与讨论

在人工智能写作不断普及的当下,本研究讨论了人工智能在更具主观性、专业性的财经评论写作领域中进一步应用和推广的可能性。基于HSM模型,本研究通过两组实验探讨了AI写作对于财经新闻评论专业度感知的影响机制。研究发现,在不提示受众关注作者的情况下,受众较难区分生成式人工智能和专业财经记者所撰写财经评论之间的专业性差异。在提示受众关注作者身份的情况下,受众会受到作者身份的影响,进而会采取权威启发式、机器启发式处理信息,从而会对AI署名的财经新闻评论产生更高的专业性感知。具体结论及对应启示如下。

(一)财经记者与媒体的权威性已经难以抵御AI写作的冲击

在传统的财经新闻理论中,权威性是财经记者和财经媒体“专业性”的重要来源,这也成为大量财经媒体和记者认为“自身不会被AI取代”的重要理由。但是,本研究的研究结论挑战了这一假设。

研究结果显示,虽然权威启发式在一定程度上仍能正向影响受众对内容的专业性感知,但人类记者的实际应用效果并不理想。相比于匿名文章,人类记者的署名反而可能削弱文章的权威性,进而降低受众对内容专业性的感知。甚至,尽管受众通过启发式认知可能会对实际由人类撰写的文章产生较高的专业度感知,但当他们得知这些评论的作者是具体的财经媒体记者时,这种认知可能反而会受损,进而还会降低对文章专业性的整体评价。

事实上,这也充分说明了当前财经记者和财经媒体所面临的危机和风险。在中国的财经媒体领域,由于渠道优势消退、财经自媒体崛起等原因,再加上传统财经媒体在预期管理、危机预警等方面的持续性失灵(Iddins,2021),专业财经媒体和记者的权威性正在逐渐消退。在当前情况下,即使在主观性较强、专业门槛较高的财经评论领域中,专业财经媒体和记者赖以生存的权威性、专业性都已面临如此挑战,更别提早已广泛应用AI写作的财经新闻领域以及其他更为结构化、非主观化的财经新闻领域。可见,应对AIGC时代的挑战,财经媒体和记者绝对不能坐以待毙,反而更应当形成危机意识,有必要更多地思考如何更好地维护、加强乃至重塑自身的权威性,如何更多地通过优质、深度、专业的内容强化自身的行业形象,这样才能更好地坚守财经媒体的关键命脉,巩固和确保专业媒体和记者的不可替代性。

(二)AI署名可以通过启发式提升财经评论的专业性感知

研究发现,虽然受众在不被提示关注作者的情况下难以区分人类作者和AI作者所撰写财经评论之间的专业性差异,但在被提示关注作者时会由于机器启发式、权威启发式对于署名为AI的财经评论产生更高的专业度感知。而且,当受众对于AI写作的态度越积极,机器启发式对于感知专业度的正向效果将会得到更多的强化。

这一结论对于理解和推动AI写作在财经新闻行业中的深度应用具有重要意义。一方面,这说明了财经新闻领域事实上已经具备了在更大范围内深度应用AI写作的条件。研究结果表明,当了解到文章的作者是生成式AI时,受众不仅不会认为AIGC的财经评论“不专业”“不权威”,反而会认为其与人类记者相比更为客观、权威、中立,也会因此对内容产生更高的专业性感知。就这一点来看,财经媒体未来也可以尝试更进一步地将AI写作引入到专业门槛更高、主观性要求更强的财经新闻生产当中,以此提升财经内容的生产效率,优化财经服务的内容质量。例如,当前许多的财经客户端都设立了专业、专门的实时短评服务,以此应对不断崛起的自媒体行业的冲击,但这些服务无形之中也给人类记者带来了巨大的时效性和工作量压力。未来,财经媒体或许可以更多地引入生成式AI对于新闻事实进行个性化、专门化的快速分析和评论,这不仅可以更有效率地解决当前的行业“痛点”,也可以更有效地为用户提供个性化服务。

另一方面,研究结论也进一步揭示了AIGC财经新闻语境下感知专业性的具体形成机制,也说明了未来发展和推广AIGC财经新闻工作的重点。从结果来看,受众对于财经内容专业度的认知事实上与内容本身的实际深度、实际专业度之间的关联并没有那么强烈,反而本质上更多是受到了作者身份等启发式线索的影响。而且,受众对AI写作态度的正向调节效应更进一步说明了这一点。未来,推广和普及AIGC财经新闻既需要继续不断地提升和优化AI写作的可读性和专业性,同时也应该聚焦于如何提升和优化受众对于AI写作的技术认知。然而,算法偏见、算法操纵等AI失范行为目前开始逐渐受到关注,受众未来是否还能对于AI保持如此新奇、正面、积极的看法,这一问题的答案至今仍未明朗。因此,未来在推广AIGC财经新闻服务时,也应当持续维护好受众对于AI写作的正面态度,这样才能更好地维持这一机制的有效运行。

(三)AI写作财经新闻评论合理署名具有必要性

但值得注意的是,在受众通过启发式处理解读财经评论时,尽管他们倾向于认为署名为AI的评论更具专业性,但实际上他们更加赞赏实际作者为人类财经记者撰写的内容。然而,当AI生成的财经评论错误地被标注为人类记者署名时,受众所产生的感知专业度将在所有情况中达到最低水平。实际上,这一现象强调了未来在AI与人类共同创作的行业环境中加强AI应用透明度和署名规范性的必要性。

目前,在财经新闻生产的实际流程中,引入生成式AI等人工智能用以辅助新闻写作、编辑等环节已经较为普及。然而,本研究的结论说明,如果受众留心作者身份,事实上有能力可以区分AI和财经记者所创作内容之间的专业性差异。如果财经记者未能充分披露AI创作的内容(特别是涉及判断性和主观性的部分),或者直接以自己的名义发布AI生成的内容,这种做法可能会削弱报道的整体专业性,并有还有可能降低公众对财经新闻的整体信任度。尤其是在当前,受众逐渐意识到人工智能在内容产业的广泛参与,并且未来将更加关注内容创作者的身份,这进一步强调了提高内容行业中AI透明度的重要性。未来,行业内有必要建立更为有效的AI内容披露机制,引导财经作者更加规范和合理地处理AI生成内容的署名问题,避免财经媒体和财经记者的权威性、专业性、可信度的命脉进一步丧失。

(四)局限与展望

本研究也仍存在一定局限性,有待于在未来的研究中对其进行进一步完善:首先,研究在受众人群类型上并未进行过多限制和区分,但事实上不同的财经素养和数字素养的用户对于AIGC的态度和接受程度也不尽相同,因此未来也可以基于受众的特征对于研究结论进行进一步扩展。其次,为了避免新闻接近性不同干扰研究结论,研究重点关注的财经议题仅局限于宏观经济政策,而没有进一步区分不同新闻议题之间的差异,未来的研究可以进一步考察在不同议题新闻中受众的差异化表现。最后,研究将人类作者仅限制在专业财经媒体,综合媒体、自媒体以及人工智能与人类共同署名等其他情况并未完全讨论,未来的研究也可以针对这一点进行进一步的延伸与扩展。

本文系简写版,参考文献从略,原文刊载于《国际新闻界》2024年第10期。

本期执编/张紫玉

全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!

您也可通过下方二维码或网址https://mall.11185.cn/h5/#/bkGoodsDetails?spuId=113613&from=imgShare&dsId=zxSWChat&dsModule=c3df4964-af5d-40a8-d6cc-a768b5306e52 ,进入中国邮政微商城订阅本刊。

来源:国际新闻界杂志

相关推荐