【来论】清华大学虞鑫:走出信息茧房误区,别再盲目指责算法

南方都市报APP • 隐私护卫队课题组
转载2024-06-12 20:38

编者按:在评论区里,不同人看到的回复内容不同,这是千人千面的个性化推荐结果,还是信息茧房?二者又有何区别?以下是本文作者——清华大学新闻与传播学院副教授、新闻舆论与国家治理研究中心执行主任虞鑫的思考。他认为,本质上,算法并不导致信息茧房,核心在于用户如何使用算法推荐类媒体。

最近看到一条评论说“我外婆经常刷到唱戏的,我爸经常刷到钓鱼的,我妈常看舞蹈,这就是信息茧房”。其实,不同人看到不同的内容,这本身是很正常的个性化推荐效果。评论里提到的现象其实只是个性化推荐的结果,而网友却认为是信息茧房,这种乱用是对信息茧房概念的误解,是典型的望文生义。长期以来,算法、个性化推荐、信息茧房这几个概念被混为一谈,是时候仔细甄别一下了。

信息茧房,应该是近几年中国网民不陌生的一个词。这是一个比喻,最早由美国哈佛大学法学院教授凯斯·桑斯坦在其著作《信息乌托邦》中提出,用以描述在信息传播过程中,公众只关注自己选择的内容和使自己得到愉悦的信息,久而久之就将自身桎梏于像蚕茧一般的“茧房”之中。

作为一个简单易明的比喻,“信息茧房”一词在近年来引发了大量关注,尤其是在讨论社交媒体、算法推荐技术时,人们也往往将算法和信息茧房绑定在一起。然而,大量的研究却表明,算法推荐技术和信息茧房之间并不存在必然的关系。在这个信息爆炸的时代,我们需要正确理解信息茧房的概念,不能盲目地将个性化推荐等同于信息茧房。

信息茧房隐喻的流行恰好与信息技术大规模应用于媒体领域处于同一时期,所以研究者自发地开展了大量研究,去探索算法技术是否会导致信息茧房这一命题。研究结果发现,在一些情形下基于内容的算法推荐策略,会导致用户短时间内接收到了同质化的信息;但在另一些情形下,算法推荐类媒体的使用时长也会增加用户对信息多样性的关注,从而避免信息茧房的形成。

在真实的媒介环境下,算法与用户之间的关系并非简单的技术主导一切,而是具有充分的张力——用户不仅是算法内容的接受者,也同样是算法内容的定制者,不同用户的使用行为就会导致不同的信息接收结果。本质上,算法并不导致信息茧房,核心在于用户如何使用算法推荐类媒体——这其实和人工智能算法出现之前的世界并无两样。

作为一种信息偏食现象的比喻,信息茧房的情况其实早已有之。就拿开头网络评论说的那样,“外婆经常刷到唱戏的,我爸经常刷到钓鱼的,我妈常看舞蹈”并不是算法媒体出现之后才有的现象,在报纸时代、杂志时代、广播时代、电视时代,外婆、爸爸、妈妈也是按照自己的兴趣去选择自己想要阅读收听收看的媒体内容。

在传统媒体时代,新闻传播学、市场营销学理论的重要任务,就是研究如何准确找到自己的受众,如何确定自己的分众市场。只不过在那个时候,媒体内容供给非常多样,大众的困惑在于如何在这些纷繁复杂的信息中寻找自己感兴趣的内容,以提高自己的信息效率。而到了智能媒体时代,大众的信息效率由于算法个性化推荐得以大幅度提升,信息选择多样性的问题反倒成为了显学。

在漫长的媒体发展和受众心理的研究历史上,个体的信息选择和信息效率一直是一对“此消彼长”的关系。正如在传统媒体时代,丰富的媒体内容供给增加了个体信息选择,而“利基市场”理论试图提高个体的信息效率,在智能媒体时代,基于人工智能的算法推荐增强了个体的信息效率,而搜索、热搜、广场等功能也提供一个超越个体兴趣而更加广泛的选择空间。换句话说,信息茧房的“筑茧”和“破茧”机制都同时存在。

再进一步说,其实对于算法类媒体平台而言,增强用户的信息效率和信息选择,都是增强用户长期留存的措施,因此算法推荐的目的也并非只有增强信息效率,反而也同样会拓展算法丰富性,以让平台内容更加多样。

算法并不是某一种特定的运算,而是一类算法的统称。根据技术原理的不同,算法一般可以分为三类:基于行为的协同过滤、基于内容的推荐和基于语义的推荐。协同过滤算法指的是依据行为的相似性进行推荐,将行为类似、情况相似的用户关联起来,从而向目标用户推荐该群体中其他用户浏览过的内容;基于内容的推荐算法则是从用户的历史浏览内容中提取标签,通过相似标签的推荐、或是与用户自身的标签相匹配建立模型,从而实现内容推荐;基于语义的推荐算法则是从用户历史数据中挖掘出潜在的关联规则,通过把握用户实际意图、分析潜在需求实现内容推荐,旨在推荐“相关”内容而不仅仅是“相似”内容。

上述的算法策略,旨在尽可能地同时维持信息效率和信息选择的可能性,打造一个既和用户使用行为相关联但又保持足够开放性的算法推荐系统——总而言之,算法与信息茧房之间不存在绝对的正相关性,最终的信息接收内容的丰富程度,是掌握在用户自己手上的。

事实上,国内外学术界关于信息茧房的研究,也正在从以算法为中心的技术主义转向以用户为中心的受众主义,聚焦于用户的个体特征、社会关联、特定情境展开研究。

首先,个体特征方面,作为源自选择性心理的媒介现象,信息茧房的形成首先地受到用户自身因素的影响。相较于“被动”地消费内容,不少用户在浏览内容时会主动将不感兴趣的内容标记为“不喜欢”,并通过点赞关注等方式达到驯化算法的目的。

其次,社会关联方面,社会网络分析的兴起为研究信息茧房提供了新的思路与方法,社会网络中存在着推动群体内部信息流动的“回声者”和与外部群体成员进行沟通的“桥梁者”,不同的用户在信息茧房的形成中有不同的作用。

最后,特定情境方面,在单一媒介、多元媒介、垂直媒体、水平媒体等不同的媒介环境下,用户信息偏好、媒介使用与多样化信息接触的关系均有不同。在内容情境上,人们在不同的议题中呈现的信息茧房效应亦可能存在区别,难以一概而论。

简单把算法作为导致信息茧房的原因的话,其实是非常不负责任的一种做法。千人千面的推荐效果本身并不等于信息茧房,而信息茧房效应的多少,越来越和受众自身的特征有关。

文/虞鑫 (清华大学新闻与传播学院副教授、新闻舆论与国家治理研究中心执行主任)

编辑:李玲

对这篇文章有想法?跟我聊聊吧
李玲3.46亿
南方都市报记者