如何霸榜热搜？骑手为何困在系统里？南都报告关注算法的秘密

南都N视频APP · AI前哨站

原创2022-12-22 10:52

12月22日，由南都个人信息保护研究中心联合清华大学人工智能国际治理研究院、人工智能治理研究中心（清华大学）主办的“2022啄木鸟数据治理论坛”在北京举行。南都人工智能伦理课题组在会上发布了《算法应用与治理观察报告（2022）》（以下简称“报告”）。

报告发现，在算法法规出台或立法层面，当前算法治理领域欧美起步更早，而我国对于算法治理的法规出台呈现出从单独条款到专门立法的特点。而目前国内算法公开渠道以官方的互联网信息服务算法备案系统为主，企业主动公开算法则多在热点事件发生之后。

···

算法治理正被各国推向前台

截至目前，目前全球已经有160多个国家出台了人工智能的伦理原则或指南，国际有关组织制定的人工智能标准进入“井喷期”。报告指出，国际人工智能治理工作正在加速可操作化，尤其表现在数据治理、算法治理、网络治理、监管政策等方面。

当前，我国对于算法治理的法规出台呈现出从单独条款到专门立法的特点。

比如，早在2019年，《电子商务法》就针对个性化推送做出规制：电子商务经营者根据消费者的兴趣爱好、消费习惯等特征向其提供商品或者服务的搜索结果的，应当同时向该消费者提供不针对其个人特征的选项，尊重和平等保护消费者合法权益。此后的《个人信息保护法》《网络信息内容生态治理规定》《网络音视频信息服务管理规定》等也都对算法做出了规制。

2022年3月1日，我国第一个专门针对算法推荐的部门规章——《互联网信息服务算法推荐管理规定》（下称《算法推荐规定》）正式实施，对信息茧房、流量造假、操纵舆论、劳工权益、“大数据杀熟”等突出的算法治理相关问题做出全面规范。目前《互联网信息服务深度合成管理规定》也已公布，明年1月10日起施行。

而纵观国外，欧美走在算法治理的前列，但两者的立法思路有所差异。欧盟倾向于将算法治理纳入既有的人工智能法律框架之中进行规制，建立统一的监管体系；美国则没有在联邦层面统一立法，而是采用多元治理主体、各州出台区域性规则的方式实现治理，较为灵活、分散。

此外，在国际组织层面，经济合作与发展组织（OECD）、二十国集团（G20）、电气和电子工程师协会（IEEE）等相继发布人工智能、算法等伦理指南，推动算法实现透明可释、公平公正、安全可控等。英国、日本、加拿大、新加坡等国家和地区也都出台了算法相关的法案。

在系统梳理了全球算法相关法规之后，报告发现，当前算法治理领域欧美起步较早。在数据治理框架下，欧盟选择通过赋予数据主体新型算法权利的方式对算法决策施加影响和控制；美国则率先在公共领域通过组建专门机构和人员的方式建立算法问责制。而目前，我国算法治理的立法体系已初步建成，构建起了立法层级广、多部门联动、快速扩张的法律体系。可以明显看到，立法监管聚焦的领域已经由此前的网络安全、数据信息保护拓展到了算法治理。

作为数字时代发展的驱动引擎，算法及其算力正在改变和重塑人类社会生活。为了进一步促进数字经济发展，有效应对算法引发的潜在风险，算法治理逐渐被推向各国的前台。

···

国内备案算法较简略，且常在舆情发生后公开

在立法文件纷纷出台的背景之下，国内企业或是回应监管部门要求，或是主动公开算法。

报告梳理发现，当前国内算法公开整体可分为两种渠道：一种是在国家统一的互联网信息服务算法备案系统（下称“备案系统”）上进行备案，另一种则是企业在自身平台上主动公开。

根据《算法推荐规定》，应用算法推荐技术可分为生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等五类。

据统计，目前在备案系统上备案的算法共有2022年8月、10月两批次备案的100条，涉及42家企业，备案信息包含算法名称、算法基本原理、算法运行机制、算法应用场景、算法目的意图、算法公示情况等，且备案算法按类别不同呈现出不同特点。不过整体而言，备案算法均呈现出内容较为晦涩简略，鲜少出现具体数字、比例或计算公式的特点。

除了备案系统上的备案算法之外，国内企业也会在自身平台上主动公开算法，但主动公开算法的企业数量较少，渠道较为分散，且多在热点事件发生之后公开。

比如，2021年1月，一则题为《花760元，“水军”能把一条虚假消息炒成5.4亿阅读量》的报道质疑微博存在“花钱买热搜”的情况。报道称，虚假消息“女儿患有哮喘，但被老师体罚哮喘儿童致吐血抢救”在短短几个小时内被转发过百万次，获得5.4亿次阅读，登上微博热搜。微博回应称，该话题从未上过热搜，5.4亿次阅读是话题#广州一小学体罚哮喘儿童至吐血抢救#的总阅读量，且主要是公安机关辟谣和新闻报道等正常内容产生的阅读量，同时，微博方也在此时首次公开了热搜管理规则。

而其公开的热搜管理规则与微博于今年8月在备案系统中备案的内容一致，主要信息都是热搜词的热度计算公式，即（搜索热度+讨论热度+传播热度）×互动率。

微博热搜榜规则说明

另一则典型案例则来自于调度决策类算法。2020年9月8日，一篇文章《外卖骑手困在系统里》通过描述多名骑手、配送站站长的经历，详细介绍了主流外卖平台中基于其调度决策算法为骑手设计的等级奖惩体系以及相关的KPI考核机制，并进一步探讨了在这一算法运行下的平台与骑手之间的关系，一度将外卖平台推上风口浪尖，引发了社会大众对于外卖平台及其调度决策算法的广泛讨论与极大争议。

一年后，美团在自己的微信公众号发布文章，详细介绍了“预估到达时间”算法和“订单分配”算法的基本逻辑和运行原理。饿了么则在今年发布的《2022蓝骑士发展与保障报告》中披露了当前本平台实行的“禁止最严算法”的规则，并介绍了将试点送达“时间点”调整为“时间段”显示、预估风险前置调整订单分配、骑士可自主调节背单量等具体方式。