摘要:对公民进行算法意识的测评有助于为加强我国公民的算法感知和依赖程度研究提供现实依据,进而更有针对性地对算法意识较弱的公众进行算法知识普及与应用教育,更好解决弱势群体的数字化社会适应困难等社会问题,弥合其在智能算法时代所产生的新数字鸿沟。
作者:牛盼强(上海大学新闻传播学院教授、副院长);田美(上海大学新闻传播学院博士研究生)
来源:《青年记者》2024年第10期
导 读:
对公民进行算法意识的测评有助于为加强我国公民的算法感知和依赖程度研究提供现实依据,进而更有针对性地对算法意识较弱的公众进行算法知识普及与应用教育,更好解决弱势群体的数字化社会适应困难等社会问题,弥合其在智能算法时代所产生的新数字鸿沟。
一、媒介素养与算法意识
“媒介素养”这一概念由英国文化研究学者Leavis和Thompson最先提出,他们将媒介素养一词定义为人们对各种媒介信息的解读和批判能力,以及使用媒介信息为个人生活、社会发展所应用的能力[1]。美国学者James Potter也强调了这一观点,他表示:“当我们在使用媒介来理解我们接触到的信息时,我们会积极运用一种策略和方法——这就是我们的媒介素养。”[2]英国学者David Buckingham认为,媒介教育及学习过程中的知识、技能和才能构成我们的媒介素养[3]。1992年,美国传媒素养研究所对媒介素养给出了明确的定义:它包括几个方面,分别是人们面对媒介各种信息时的选择能力、理解能力、质疑能力、评估能力、创造和生产能力以及思辨的反应能力。
随着数智时代来临,有关算法素养的讨论兴起。美国里士满大学的教育学家Daniel L. Hocutt在其一项研究中指出公民具备算法素养的目的是能够以批判性的视角去审视和理解算法所能带来的全面影响;美国程序员Matthew Oldridge也强调大众需要了解到算法在他们的生活当中已经扮演了越来越重要的角色,无论这种角色是好是坏,他指出算法素养并非要求个体必须精通编程语言或编写代码的能力,而是在科技进步不断推动下,让每个人都能意识到在如今数智时代中了解算法变得愈发关键[4]。算法正在构建数字化生活模式,正确识别和理解算法已成为一种新的媒介素养。
挪威学者Gran将算法意识(Algorithmic awareness)定义为一项基础技能,是获得其他技能的先决条件,其认为算法意识是建筑在算法知识之上更高级的算法素养[5]。
许多学者对算法意识的定义基于算法知识的掌握和对算法的主观看法与应用,这种认知反馈的基础是基本知晓算法存在与否。Eslami等提出“算法是否可以作为一部分开放公开的系统组织向用户进行展示?”“如何教育用户更好地理解算法?”等几个关键问题,恰巧证明了需要将算法意识概念化为算法操作和实践的一部分[6]。Gran从研究者的视角出发,把算法意识视为个体对于算法如何作用于平台、服务及搜索引擎功能的一种认知能力,并且可以通过主动且具有批判性的方式去与其进行交互[7]。Brahim等对算法意识进行了更深入的阐述:它指的是个人对其所处媒介环境中的算法有敏锐的感知水平,主要包括算法是如何影响到用户使用和体验媒体平台的展示内容[8]。国内学者方正与Daniel L. Hocutt对于算法认知的理解相似,认为算法认知并非强调个人需要具备解读组成算法源码或相关程序技术的能力,而在于个体能否掌握算法的基本运作流程与逻辑[9]。邓胜利等提出算法意识应包含主体是否能识别出算法的存在,并对其实际运用状况有所觉察,他们主张相关用户能明辨各类算法的可信赖度,做出独立的选择决策,并且要清楚了解到算法的双重特性,深入理解其带来的益处与挑战[10]。同样的,洪杰文把算法意识界定为用户在利用新媒体工具时对其展示的算法技术所产生的了解与认知,涵盖了如算法是否存在、其运转方式及其潜在威胁风险等问题[11]。综上,本研究认为算法意识是指用户对其算法的认知理解与判断评估,包括对算法存在的感知、对其运行机制的洞察以及对算法可能造成的伦理风险的判断评估等方面的内容。
二、算法意识构成维度研究与测评框架建构
(一)算法意识构成维度与测评指标相关研究
目前,有关算法意识的实证研究不多,挪威、美国、德国等国家的学者已开始了对算法意识的大规模调研,但国内还未形成相关的研究成果。有关算法意识测量维度的研究中,国内研究大多采用专家评估以及深度访谈法建构有关算法意识测量的维度和框架,或基于“认知—情感—行为”理论去具体分析算法意识对用户行为意愿的重要作用。
根据美国的ACRL标准,2005年我国首次构建了完整且系统的关于信息素养能力的评价体系,即《北京地区高校信息素养能力指标体系》,该体系包括十二个细化层次,例如信息敏感度、信息应用程度、信息评估能力和信息价值观等[12]。邓胜利等将算法意识和批判性思维(对应主体和自我层面)作为算法素养的核心构成部分,包括算法敏感性、算法可信性、算法价值意识、算法风险意识、算法敏感性、算法可信性、算法风险意识[13]。Zarouali将算法意识定义为人们对算法在特定媒体环境中的行为的准确感知程度,以及算法对用户消费和体验媒体内容的影响,并将用户的算法意识分为内容过滤意识、自动决策意识、人机交互意识及道德考虑意识[14]。郭全中、李黎等基于用户视角的认知框架通过定性的深度访谈总结出算法意识所包含的三大类别:算法过滤意识、算法规制意识和算法批判意识[15]。基于社会认知理论,晏齐宏提出了算法感知的两层含义:一是通过实际应用认识到算法的存在;二是用户对算法运行原理主观能动性的理解。他进一步指出,年轻一代对于算法的认识由技术的角度和社会的角度组成,技术角度具体表现为实用主义和多元正确,社会角度主要包括主体隐私感知,科技进步与个人成长,自我意识和集体意识,以及算法的客观性及其背后价值观念展现等内容[16]。
(二)算法意识构成维度与测评问题设置
本研究基于相关研究及国家网信办于2022年8月、10月,2023年1月、4月和12月陆续发布的5次《境内互联网信息服务算法备案清单》文件内容,对算法意识测量进行梳理与总结,将算法意识的测量由基础到高级划分为两个层次维度[17]。一级指标包括:算法基础识别意识,即用户识别算法基本功能与用途的意识,这等同于上述学者们所谈论的是否意识到算法的存在以及如何运行;算法批判意识,即用户对于算法的判断和评估。进而分出个性化推送、排序类精选、调度决策、生成合成、检索过滤、算法黑箱与透明性、算法操纵与主体性、算法隐私侵犯、算法歧视与公平性9个二级维度指标。
在有关算法意识的定义中,Hamilton[18]、Swar[19]等众多相关学者都将感知算法的存在、理解算法所发挥的作用视为算法意识最基本的内涵。因此,本研究将其总结归纳为算法基础识别意识。国家互联网信息办公室发布的互联网信息服务算法备案信息的公告文件内容列出233种应用算法,该文件内容对算法类型和功能进行了类型划分,相对全面总结了当下我国的算法基础功能与应用类型,涵盖了如网易、360等众多国内大型企业及其相关产品。从算法类型上看共分为五大类型,分为个性化推送类、检索过滤类、排序精选类、调度决策类和生成合成类。本文将其纳入有关算法功能意识的衡量标准之中,即判断用户是否能在日常使用过程中意识到以上算法基础功能,同时根据此文件对算法功能的介绍,列出有关算法基础识别意识的测试问题。
挪威学者Gran将算法意识中尽可能多地进行批判性互动视为最高的算法素养[20]。邓胜利等基于熵权法建立算法素养评价模型,通过计算得出算法素养中批判性思维的权重(0.407)>算法知识与技能(0.332)>算法意识(0.186)>算法社会准则(0.075),体现了批判性思维在算法素养中的核心地位,并将算法甄选、算法数据评价,算法模型评价和算法结果评价作为衡量算法批判思维的重要指标[21]。郭全中等通过半结构访谈将算法批判的衡量指标确定为了对算法隐私入侵的批评,对算法黑箱与透明性的批判和对算法偏见与歧视的批判[22]。本研究将算法批判意识作为重要考核指标纳入算法意识的测量框架之中,将算法批判定义为是对算法所导致的伦理问题的相关批判。综合总结过往学者对于算法伦理问题的研究,本研究参考《互联网信息服务算法推荐管理规定》以及胡晓萌对算法伦理问题的总结,将算法批判意识主要分为对算法黑箱与算法透明的批判、对算法操纵与主体性失衡的批判、对算法隐私侵犯与数据安全的批判和对算法歧视与公平性的批判。[23][24]同时,根据相关文献列出有关算法批判意识的测试问题。综上,本研究将如何测评公民算法基础识别意识和算法批判意识总结为以下测评问题。
1.算法基础识别意识
(1)个性化推送
问题一:我能够意识到我所使用的资讯类平台在通过用户基础信息、历史点击、收藏行为、观看时长和用户匹配标签等用户数据为用户推荐可能感兴趣的资讯内容。
问题二:我能够意识到我所使用的资讯类平台可以根据用户的网络信息和设备信息进行广告投放。
问题三:我能够意识到我所使用的招聘类平台能够通过首页职位推荐,用户发布的职位信息、简历信息(用户属性信息)及选择填写的相关条件为用户推荐匹配度高的职位。
问题四:我能够意识到我所使用的社交类平台能够通过用户基础信息、历史浏览行为(点击、时长、点赞、评论、转发、不喜欢等)、近期兴趣、长期兴趣和当前热度,推荐用户可能感兴趣的社交内容。
问题五:我能够意识到我所使用的视频平台,能够通过用户的行为日志数据为用户推荐可能感兴趣的资讯和视频内容。
问题六:我能够意识到我所使用的购物平台能够通过用户的访问足迹、历史搜索数据、根据用户行为习惯和商品商户描述信息为用户推荐可能感兴趣的商品或服务信息。
问题七:我能够意识到我所使用的购物平台能够通过用户的位置信息、设备信息、授权信息,结合时间、地理、气候等客观因素,推荐给用户可能感兴趣的内容。
问题八:我能够意识到我所使用的视频平台能够通过用户的兴趣特征、活跃特征等数据为用户推荐可能感兴趣的音视频内容。
问题九:我能够意识到我所使用的出行类平台能够通过用户的历史行为特征、服务包属性特征、用户历史服务包偏好特征、交通工具基本属性特征等,推荐用户可能感兴趣的信息。
(2)排序精选
问题一:我能够意识到我所使用的社交类平台热搜榜单能够通过用户搜索、讨论、传播数据对热点内容进行排序。
问题二:我能够意识到我所使用的搜索平台能够根据事件相关统计信息及用户行为数据,对热点事件进行排序。
问题三:我能够意识到我所使用的购物平台能够通过用户的点击、加购、销量等数据按不同类目、属性对商品进行客观排序。
问题四:我能够意识到我所使用的资讯类平台能够通过干预策略对查寻内容进行排序。
问题五:我能够意识到我所使用的资讯类平台能够通过用户收藏、点赞和回复数据,对内容进行排序。
问题六:我能够意识到我所使用的视频平台能够通过用户浏览、搜索视频内容,形成相关精选榜单。
问题七:我能够意识到我所使用的送餐平台能够通过外卖榜单,精选好店好菜,通过月销量、好评率、复购率等,对商家、菜品进行排序。
(3)调度决策
问题一:我能意识到送餐平台能够计算用户订单的预计送达时间,并匹配合适的订单骑手。
问题二:我能意识到快递平台能够统筹区域内订单和骑手、预测包裹派送到达时间,将订单匹配给时间充裕、顺路的骑手。
问题三:我能意识到出行平台能够计算司机的预计到达和送达的时间,并为用户匹配合适的订单司机。
(4)生成合成
问题一:我能意识到视频平台能够在短视频制作场景里,利用生成模型对用户上传图片、视频进行编辑和重新生成,实现属性编辑、风格转换等。
问题二:我能意识到购物平台有形象图片制作功能,能够识别照片中人物表情动作,生成相关形象图片。
问题三:我能意识到在即时通信场景中的语音转文字功能。
问题四:我能意识到在送餐/物流等平台,电话智能客服识别智能客服中的文字/语音问题、实现对用户的简单问题给出解决方案。
(5)检索过滤
问题一:我能意识到平台可以通过用户输入的查询词,搜索满足我需求的资讯信息。
问题二:我能意识到平台能够对发布的文本、图片、音视频等信息进行内容安全风险识别,发现和处置违法违规信息内容。
问题三:我能意识到票务平台能够通过用户输入的出发城市和到达城市信息,结合中转方案的总耗时、价格和是否有票等特征,搜索满足需求的内容。
2.算法批判意识
(1)算法黑箱与透明性
问题一:我能意识到我依法享有算法知情权。
问题二:我能意识到算法中有关权力运作的隐蔽性。
问题三:我能意识到算法的高度专业性和复杂性使得我们难以理解。
问题四:我能意识到算法中有关责任归属难分辨的问题。
(2)算法操纵与主体性
问题一:我能意识到算法开发者出于某种商业目的会对用户进行量化评估。
问题二:我能意识到算法在屏蔽信息,控制热搜榜单与舆论等。
问题三:我能意识到算法在“诱导用户沉迷”。
问题四:我能意识到算法在虚假注册账号、非法交易账号、操纵用户账号。
问题五:我能意识到我有权选择不针对其个人特征的选项,或者便捷的关闭算法推荐服务的选项。
(3)算法隐私侵犯
问题一:我能意识到算法通过收集用户的数据,监控用户在互联网上的行为,以实现个性化的媒体内容,这对用户造成了隐私侵犯。
问题二:我能意识到算法可以根据用户的精准画像和消费定位,向用户精准投放互联网广告,这对我造成了隐私侵犯。
问题三:我能意识到算法未经允许过度收集和存储有关用户的个人敏感数据,这对用户造成了隐私侵犯。
问题四:我能意识到算法会未经允许将用户的个人数据买卖给第三方,这对用户造成了隐私侵犯。
(4)算法歧视与算法公平性
问题一:我能意识到算法对用户进行的性别歧视。
问题二:我能意识到算法对用户进行的年龄歧视。
问题三:我能意识到算法对用户进行的种族、出生国歧视。
问题四:我能意识到算法对用户进行的“个性化定价”和“大数据杀熟”等歧视举动。
问题五:我能意识到人机对话过程中人工智能“说出”歧视性言辞等现象。
三、算法意识测评维度认同度调查
(一)认同度检验
本研究编制了“公民算法意识认同度调查问卷”以验证测评框架的合理性与认同度。问卷采用Richter五级性量表的评分方式,对算法意识的重要程度和一、二级维度,进行了认同度调查。赵龙轩等人的研究发现,高学历群体具有更高的算法意识[25],因此本研究筛选的问卷调查对象要求学历为硕士及硕士以上。本研究采用“风铃系统”搜集数据,借助该平台的有偿“样本服务”功能,平台组织自有样本库中的人群随机进行填写。本次数据搜集目标参与人数488人,有效问卷数450,有效问卷率92%。调查结果表明,对算法意识2个一级测评维度的认同度较高,对算法基础识别意识、算法批判意识2个一级维度“比较认同”和“完全认同”的认同度之和分别为77.11%、77.33%。同时对个性化推送、排序类精选、调度决策、生成合成、检索过滤、算法黑箱与透明性、算法操纵与主体性、算法隐私侵犯、算法歧视与公平性9个二级指标“比较认同”和“完全认同”的认同度之和分别为73.33%、74%、65.78%、68%、74.44%、68.44%、71.11%、76%和71.56%。
(二)信效度检验
通过对问卷结果进行计算得出问卷的KMO值为0.856,且Bartlett球形检验对应的p值小于0.001。两个因子的累计方差贡献度为73.672%,其中算法基础识别意识和算法批判的克隆巴赫α系数分别为0.772和0.734。上述结果表明该量表具有较好的信效度,研究构建的公民算法意识测评框架得到进一步验证。
四、结语
在数智时代,算法意识被称之为元技能,是算法素养的基础内涵以及重要的组成部分。本研究探究了算法意识的定义、测评维度和框架,并初步为维度进行了对应的问题设置。对公民进行算法意识的测评有助于为加强我国公民的算法感知和依赖程度研究提供现实依据,进而更有针对性地对算法意识较弱的公众进行算法知识普及与应用教育,更好解决弱势群体的数字化社会适应困难等社会问题,弥合其在智能算法时代所产生的新数字鸿沟。期待后续相关研究为共同提升我国公民算法意识和算法素养科普教育提供更具实操性的衡量标准。
【本文为国家社科基金项目“社交媒体科学传播不确定性对传播效果的影响机制研究”(批准号:21BXW075)成果】
参考文献:
[1][5][7][20]GRAN A B, BOOTH P, BUCHER T. To be or not to be algorithm aware: a question of a new digital divide?[J]. Information, communication & society, 2021,24(12):1779-1796.
[2][6]Eslami M. Rickman A.Vaccaro K,et al. I Always Assumed that I Wasn't Really That Close to Her: Reasoning about Invisible Algorithms in News Feeds[C]. ACM Conference on Human Factors in Computing Systems,2015:153-162.
[3]Buckingham D.Media education in the UK: moving beyond protectionism[J].Journal of Communication, 2010, 48(1):33-43.
[4]Lee A, SO C.Promoting media and information literacy (MIL) in Hong Kong:a network model strategy[C].International Conference of the Media and Information Literacy for Knowledge Societies, Moscow, Russian Federation, 2012.
[8][14]Zarouali B, Boerman S C, de Vreese C H. Is this recommended by an algorithm?The development and validation of the algorithmic media content awareness scale (AMCA-scale)[J]. Telematics and Informatics,2021,62:101607.
[9]方正.“数字规训”与“精神突围”:算法时代的主体遮蔽与价值守卫[J].云南社会科学,2021(01):150-157.
[10][13][21]邓胜利,许家辉,夏苏迪.数字环境下大学生算法素养评价体系及实证研究[J].图书情报工作,2023(02):23-32.
[11]洪杰文,陈嵘伟.意识激发与规则想象:用户抵抗算法的战术依归和实践路径[J].新闻与传播研究,2022(08):38-56+126-127.
[12]曾晓牧,孙平,王梦丽,等.北京地区高校信息素质能力指标体系研究[J].大学图书馆学报,2006(03):64-67.
[15][22]郭全中,李黎,雷蕾,等.论算法意识:基于用户视角的认知框架[J].中国新闻传播研究,2022(05):21-38.
[16]晏齐宏.用户算法感知对反馈行为的影响机制研究:基于社会认知理论的分析[J].新闻与写作,2022(07):76-87.
[17]国家互联网信息办公室关于发布互联网信息服务算法备案信息的公告[EB/OL].(2022-08-12)[2023-07-11].http://www.cac.gov.cn/2022-08/12/c_1661927474338504.htm.
[18]Hamilton K , Karahalios K , Sandvig C , et al. A path to understanding the effects of algorithm awareness[J]. ACM,2014:631-642.
[19]SWART J. Experiencing algorithms: how young people understand, feel about, and engage with algorithmic news selection on social media[J].Social media+ society, 2021,7(2).
[23]互联网信息服务算法推荐管理规定[EB/OL].(2022-01-04)[2023-07-11].http://www.cac.gov.cn/2022-01/04/c_1642894606364259.htm.
[24]胡晓萌.算法主义及其伦理批判[D].长沙:湖南师范大学,2021.
[25]赵龙轩,林聪.“黑箱”中的青年:大学生群体的算法意识、算法态度与算法操纵[J].中国青年研究,2022(07):20-30.
本文引用格式参考:
牛盼强,田美.数智时代算法意识构成维度研究与测评框架建构[J].青年记者,2024(10):51-55.
来源:大众日报一点号