如何霸榜热搜?骑手为何困在系统里?南都报告关注算法的秘密

南方都市报APP • AI前哨站
原创2022-12-22 10:52

12月22日,由南都个人信息保护研究中心联合清华大学人工智能国际治理研究院、人工智能治理研究中心(清华大学)主办的“2022啄木鸟数据治理论坛”在北京举行。南都人工智能伦理课题组在会上发布了《算法应用与治理观察报告(2022)》(以下简称“报告”)。

报告发现,在算法法规出台或立法层面,当前算法治理领域欧美起步更早,而我国对于算法治理的法规出台呈现出从单独条款到专门立法的特点。而目前国内算法公开渠道以官方的互联网信息服务算法备案系统为主,企业主动公开算法则多在热点事件发生之后。

···
算法治理正被各国推向前台

截至目前,目前全球已经有160多个国家出台了人工智能的伦理原则或指南,国际有关组织制定的人工智能标准进入“井喷期”。报告指出,国际人工智能治理工作正在加速可操作化,尤其表现在数据治理、算法治理、网络治理、监管政策等方面。

当前,我国对于算法治理的法规出台呈现出从单独条款到专门立法的特点。

比如,早在2019年,《电子商务法》就针对个性化推送做出规制:电子商务经营者根据消费者的兴趣爱好、消费习惯等特征向其提供商品或者服务的搜索结果的,应当同时向该消费者提供不针对其个人特征的选项,尊重和平等保护消费者合法权益。此后的《个人信息保护法》《网络信息内容生态治理规定》《网络音视频信息服务管理规定》等也都对算法做出了规制。

2022年3月1日,我国第一个专门针对算法推荐的部门规章——《互联网信息服务算法推荐管理规定》(下称《算法推荐规定》)正式实施,对信息茧房、流量造假、操纵舆论、劳工权益、“大数据杀熟”等突出的算法治理相关问题做出全面规范。目前《互联网信息服务深度合成管理规定》也已公布,明年1月10日起施行。

而纵观国外,欧美走在算法治理的前列,但两者的立法思路有所差异。欧盟倾向于将算法治理纳入既有的人工智能法律框架之中进行规制,建立统一的监管体系;美国则没有在联邦层面统一立法,而是采用多元治理主体、各州出台区域性规则的方式实现治理,较为灵活、分散。

此外,在国际组织层面,经济合作与发展组织(OECD)、二十国集团(G20)、电气和电子工程师协会(IEEE)等相继发布人工智能、算法等伦理指南,推动算法实现透明可释、公平公正、安全可控等。英国、日本、加拿大、新加坡等国家和地区也都出台了算法相关的法案。

在系统梳理了全球算法相关法规之后,报告发现,当前算法治理领域欧美起步较早。在数据治理框架下,欧盟选择通过赋予数据主体新型算法权利的方式对算法决策施加影响和控制;美国则率先在公共领域通过组建专门机构和人员的方式建立算法问责制。而目前,我国算法治理的立法体系已初步建成,构建起了立法层级广、多部门联动、快速扩张的法律体系。可以明显看到,立法监管聚焦的领域已经由此前的网络安全、数据信息保护拓展到了算法治理。

作为数字时代发展的驱动引擎,算法及其算力正在改变和重塑人类社会生活。为了进一步促进数字经济发展,有效应对算法引发的潜在风险,算法治理逐渐被推向各国的前台。

···
国内备案算法较简略,且常在舆情发生后公开

在立法文件纷纷出台的背景之下,国内企业或是回应监管部门要求,或是主动公开算法。

报告梳理发现,当前国内算法公开整体可分为两种渠道:一种是在国家统一的互联网信息服务算法备案系统(下称“备案系统”)上进行备案,另一种则是企业在自身平台上主动公开。

根据《算法推荐规定》,应用算法推荐技术可分为生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等五类。

据统计,目前在备案系统上备案的算法共有2022年8月、10月两批次备案的100条,涉及42家企业,备案信息包含算法名称、算法基本原理、算法运行机制、算法应用场景、算法目的意图、算法公示情况等,且备案算法按类别不同呈现出不同特点。不过整体而言,备案算法均呈现出内容较为晦涩简略,鲜少出现具体数字、比例或计算公式的特点。

除了备案系统上的备案算法之外,国内企业也会在自身平台上主动公开算法,但主动公开算法的企业数量较少,渠道较为分散,且多在热点事件发生之后公开。

比如,2021年1月,一则题为《花760元,“水军”能把一条虚假消息炒成5.4亿阅读量》的报道质疑微博存在“花钱买热搜”的情况。报道称,虚假消息“女儿患有哮喘,但被老师体罚哮喘儿童致吐血抢救”在短短几个小时内被转发过百万次,获得5.4亿次阅读,登上微博热搜。微博回应称,该话题从未上过热搜,5.4亿次阅读是话题#广州一小学体罚哮喘儿童至吐血抢救#的总阅读量,且主要是公安机关辟谣和新闻报道等正常内容产生的阅读量,同时,微博方也在此时首次公开了热搜管理规则。

而其公开的热搜管理规则与微博于今年8月在备案系统中备案的内容一致,主要信息都是热搜词的热度计算公式,即(搜索热度+讨论热度+传播热度)×互动率。

微信截图_20221221232558.png

微博热搜榜规则说明

另一则典型案例则来自于调度决策类算法。2020年9月8日,一篇文章《外卖骑手 困在系统里》通过描述多名骑手、配送站站长的经历,详细介绍了主流外卖平台中基于其调度决策算法为骑手设计的等级奖惩体系以及相关的KPI考核机制,并进一步探讨了在这一算法运行下的平台与骑手之间的关系,一度将外卖平台推上风口浪尖,引发了社会大众对于外卖平台及其调度决策算法的广泛讨论与极大争议。

一年后,美团在自己的微信公众号发布文章,详细介绍了“预估到达时间”算法和“订单分配”算法的基本逻辑和运行原理。饿了么则在今年发布的《2022蓝骑士发展与保障报告》中披露了当前本平台实行的“禁止最严算法”的规则,并介绍了将试点送达“时间点”调整为“时间段”显示、预估风险前置调整订单分配、骑士可自主调节背单量等具体方式。

微信截图_20221221232611.png

···
仍需建立统一的算法公开标准

整体来看,目前国内算法治理仍处在早期探索阶段,初步建立了算法治理的立法体系,并围绕互联网信息服务算法备案系统开展算法公开工作。

而通过梳理国内算法治理热点事件、公开现状等情况,报告也发现,企业多在回应舆情或监管要求时才会公开算法,存在主观能动性较弱等问题。

对于这一问题,公众表现出了明显的不满。根据报告的问卷调查结果,有约64%的受访者都认为不管是当前已在政府备案系统中备案的算法,还是企业在自家平台公开的算法,在解释工作上都做得“一般”或“不太好”。

但与此同时,多家企业的态度则是希望遵循既定的规则,减少合规风险,而不是自己主动去定义算法公开内容,或主动进行频繁的算法解释和公开。

因此,从这一角度来说,报告建议,未来可以在现有算法相关法规的基础上,由政府推动建立统一的算法公开标准,明确算法如何公开、公开到什么程度,以分层次的算法解释为中心促进算法适度透明。

同时,也应综合考虑算法的应用场景、处理数据的风险程度、算法使用的正向效益和可能的社会危害等多种维度,进一步细化算法监管的分类分级,落实多层次场景化、精细化的分级分类的算法治理工作。

出品:南都人工智能伦理课题组

采写:南都记者杨博雯 胡耕硕

编辑:蒋琳

更多报道请看专题:2022南都智库产品发布周
2022啄木鸟数据治理论坛

南都新闻,未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626
2