美团外卖配送时间算法首次公开,算法透明离我们还有多远?

21世纪经济报道 21财经APP 见习记者吴立洋,实习生李紫瑄
2021-09-18

南方财经全媒体见习记者 吴立洋 实习生李紫瑄 广州报道

9月10日,在人力资源社会保障部等四部门维护新就业形态劳动者劳动保障权益召开平台企业行政指导会当日,美团公司首次公开关于骑手配送时间的计算规则,介绍了预估送达时间背后的算法逻辑。在此之前,各外卖平台由于对骑手配送时间要求过为苛刻而广受社会诟病。

2020年9月8日,《外卖骑手,困在系统里》一文引发了舆论对于算法系统性剥削骑手的高度关注,今年5月,北大社会学博士2018年加入北京一骑手团队送了五个月外卖,其基于这一田野调查的论文详细阐述了平台对骑手的“劳动控制”机制,再次激起了对公众对平台算法的质疑。

算法就像一个巨大的黑箱,平台的终端用户不仅无法窥其全貌,也得不到有关算法的解释,不信任因此不断累积,公开算法的呼声也越来越强烈。

在国家对平台和资本监管力度持续加大的背景下,美团首先做出了回应。

美团公开部分算法

9月10日,美团在其官方微信公众号上发布了一篇名为“让外卖配送算法更透明,让更多声音参与改变”的推文。该文章公布了美团外卖订单页面显示的预估到达时间会在四个测算结果中取时间最长的一个,这四个结果分别是基于订单详情、区域供需等信息,基于城市地理及通行特征,基于出餐、到店、骑行、交付四段时间累加,以及基于不同配送距离所计算的时间。

文中还表示,美团正在进行两项持续迭代的调整,以进一步减轻骑手的压力。一是会在异常场景下,诸如在商家长期出餐慢、恶劣天气、节假日单量激增、小区难进入等情况下为骑手提供时间补充,二是在部分异常场景下,将“预估到达时间”变为“预估到达时间段”。

“但这只是整个配送算法中的策略部分,美团只公开了从哪些维度对配送时间进行计算,具体的细节并没有公开,况且这个策略也没什么特殊性,产品设计的时候考虑这些因素是再正常不过的了。”广州某人工智能企业算法工程师在接受21世纪经济报道记者采访时指出,“这篇文章更多不是在公开技术,而是解释自己没有压榨外卖员,说到底就是一种姿态的表达。”

美团选择做出这样的表态并非空穴来风,外卖平台的算法问题早已饱受诟病。

上述的报道和研究直指将算法应用于外卖配送员管理的伦理困境,即平台为了达到效率最大化所设定的一系列严苛算法,从派单,配送时间测算,路线规划,到奖惩规则等等,都给外卖员的工作带来了巨大的压力和风险,而且零工经济模式下一旦出现人身意外,外卖员的劳动权益难以得到保障。

近年来,国家有关部门的重视和监管也不断加码。7月26日,市场监管总局,国家网信办、国家发展改革委、公安部、人力资源社会保障部、商务部、中华全国总工会,共七个部门联合印发《关于落实网络餐饮平台责任 切实维护外卖送餐员权益的指导意见》,指出不得将“最严算法”作为考核要求,通过“算法取中”等方式,合理确定订单数量、准时率、在线率等考核要素,适当放宽配送时限,还督促平台及第三方合作单位为建立劳动关系的外卖送餐员购买社会保险。

8月27日,国家互联网信息办公室发布了关于《互联网信息服务算法推荐管理规定(征求意见稿)》公开征求意见的通知,要求算法推荐服务者要以适当方式公示算法推荐服务的基本原理、目的意图、运行机制等,接受社会监督。

“这可以看成是一场提前进行的危机公关。”上海大学新闻与传播学院副教授洪长晖在接受21世纪经济报道记者采访时表示,美团之所以公开算法规则,与其说是在让自身的运作变透明,毋宁说是在回应社会关切,回应社会对骑手与平台之间非均衡关系的关切,回应社会对互联网平台对用户、员工权益保障的关切。

美团回应了,但公众对算法的疑虑被解答了吗?

洪长晖认为,美团部分地公开配送时间的算法决策,能部分回应公众质疑,却不会打消所有疑虑的声音,“尤其是当骑手或消费者权益受到损害的极端个案再次出现时,质疑声音会再次放大。”

配送时间的优化策略被公之于众,却还有无数个把外卖骑手“困在系统里”的算法,比如配送路线的系统导航是否合理、骑手看到的要求送达时间与用户看到的预估达到时间是否一致,商家出餐慢、消费者不合理要求造成的后果是否由骑手承担等等问题依然隐藏在算法黑箱中。

算法公开难点何在

从美团所公开计算规则,到相关的论文、报道耗费了调查者大量的精力才摸清了外卖平台算法的一些底层逻辑,都透露出了算法公开的复杂与困难。

算法作为关系到其核心商业利益的技术,受到层层专利的保护,并不会轻易公开和出售。上海某通讯设备制造商算法工程师介绍,“算法是用计算机解决问题的一套程序、指令,原创的算法模型经过反复验证可以正常运行,这就形成了技术壁垒,不公开的重要原因就是为了防止竞争对手研究和破译”。

可算法公开并非完全没有先例,“已经成熟,大家都在研究,且不会对公司的技术壁垒造成影响的算法内容,还是会有公开的。”前述广州算法工程师表示,比如美团技术团队一直在其官网上撰写文章,进行一些介绍算法构成和实现原理的技术分享,省略技术细节,目的是让行业社区知道美团现在做到什么程度了。而在面向开源及私有软件项目的托管平台Github上,一些企业也会公开某些算法的源代码,公开技术细节,以供交流学习。

但是此类技术分享、源代码公开的方式对于非编程专业的公众和监管部门来说却难以具备实际的参考价值:多位受访专家向记者表示,一个平台的算法往往由一个技术团队编写完成,每人只负责一个小部分,从而组成一个完整的算法系统,这个系统可以依托数据集实现自我迭代与优化,该过程也被称为机器学习。数据集随着用户的增长不断更新,拥有千万甚至亿级用户的平台,就会有着非常复杂的数据集,因此算法模型也会迭代得更加复杂,并且不受人工控制。

其结果就是算法工程师本人可能都无法解释整个算法系统的全貌,公众和监管部门就更加难以理解清楚其工作原理,并判断算法是否存在程序编写或者机器学习的歧视,偏见,杀熟,侵犯隐私等问题。 

值得注意的是,当前算法的复杂性问题倒逼了另一种算法公开方式的产生——以易理解的方式解释算法。但是美团公开的“预计到达时间”计算规则又反映了对于算法的解释是有模糊空间的。根据中国人民大学法学院副教授丁晓东在其论文《论算法的法律规制》中的阐述,“基于大数据的算法与可解释性所要求的因果关系阐释具有完全不同的逻辑”,因此对算法的解释也是困难的。

如何推进算法透明化

算法公开的法律监管已经开始推进。前述网信办8月27日发布的关于《互联网信息服务算法推荐管理规定(征求意见稿)》,规定了算法推荐服务提供者应当制定并公开算法推荐相关服务规则,应当以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图、运行机制等。

上海申伦律师事务所律师夏海龙介绍,此部门规章正式施行后即具有法律效力,是人民法院审理相关案件的重要依据,能够要求企业进行算法公开,但是对于公示方式却没有统一和具体的形式或格式要求。

被称为“史上最严数据保护条例”的欧盟《通用数据保护条例》也规定了公司要以清晰平实的语言,提供有关个人隐私信息处理过程的解释,但是依然没有明确具体要解释什么内容、怎样解释,才是一个不会侵犯专利的、对用户和监管方有意义的解释。

可见法律层面对于如何具体推进算法透明化仍在摸索当中,另一方面,学界对此已有诸多研究。丁晓东在《论算法的法律规制》中指出,算法公开并非是一般性的算法架构或源代码的公开与解释,而应当是有意义和有特定指向的决策体系的公开,也就是重点公开相关算法与数据对主体会带来哪些影响。

“例如(可以公开)有关数据主体的相关数据的变化会对其决策产生哪些方向性变化,哪些被用于训练的数据记录与数据主体的数据最为相似,数据主体被归纳为某种类别的主要特征是什么,系统对数据主体进行分类的信任区间多大。”丁晓东在论文中引用了爱德华兹和维勒的分析。

与此同时,普通用户能够解读被公开的算法,算法透明化才更有意义。洪长晖对于如何提升公众对算法的理解能力,也给出了自己的见解,“首先要激发起用户了解算法的热情,其次要从整体上提升用户的知识素养,尤其是数据素养,也就是人们通过读取、理解、创建和传递数据,并把它们作为信息提取出来的一种能力。大致上,这种能力越高,对算法公开的呼声就越高,对算法规则理解就越到位。”

(编辑:曹金良)