链接 | https://zhuanlan.zhihu.com/p/404449570
作者 | 程引
机器学习与推荐算法授权转载
1. 什么是算法推荐?
根据草案的定义,「算法推荐技术」是指:
生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息内容。
与大众口中日渐妖魔化的挟持热搜、窃取隐私、疯狂弹窗的邪恶形象刚好相反。其实这些技术应用在我们生活的方方面面:
没有算法推荐技术,也就没有今天信息化的中国。
早上醒来看看今天有啥新鲜事,是推荐;真难办,不知道中午吃啥,打开外卖软件觅食,是推荐;淡黄的长裙穿了整个夏天,去电商平台看看我穿啥好看,是推荐;播放器里的歌听腻了,开启某云音乐心动模式,换换口味,是推荐;工作中遇到棘手的难题,敲进搜索框里看看人家怎么说,是推荐;妈妈发来的搞笑视频,天涯共此时的同乐,是推荐。
就如同我们无法选择关闭生活,我们也无法回到没有推荐算法的那天。
2. 为什么「关闭算法推荐」是做不到的?
因为算法推荐的本身就是服务的本身。
用户选择关闭算法推荐服务的,算法推荐服务提供者应当立即停止提供相关服务。
至少按照草案对算法推荐的定义,「关闭」是做不到的。
严格来说,给用户提供关闭算法推荐的选项,等同于希望让用户使用没有功能的服务。举例而言,对于选择关闭了外卖平台推荐系统的用户小胖,当他搜索「麻辣烫」时,平台应该返回什么样的结果才算合法呢?
按照热度推荐显然不可以,因为 TopPop 是一个不算低的
排序精选类算法基准,既然不可以使用推荐算法,当然排除;就算能用,引来庞大的流量会很快将这些店铺挤爆,而大多数店家将颗粒无收,本身也有违公平竞争;或者保持相关度的情况下,随机推荐呢?也不行,因为用到了诸如 DPP 的平衡多样性和相关性的
排序精选类算法,当下的许多推荐系统本来也就是这样设计的。所以最保险的方法是,给用户返回完全随机的结果:虽然用户搜的是「麻辣烫」,但是我们很可能只给他看一些卖「慕斯蛋糕」的店家。
对于想看看今天的新鲜事,或者关注一下国内外要闻的小红同学。既然选择不使用推荐系统,那么
检索过滤类算法已然违规。唯一的办法也许是,广泛地成立专门的人工编辑部。来决定每天的每个软件里面,希望给大家看的每一个内容的列表。但是如果小红把今天的列表里的新闻都看完了呢?实在对不起,今天没有了,请等明天吧。
小青加班到深夜,想打车回家,但她选择了「关闭算法推荐服务」的某打车软件。照理来说类似 KM 算法这样的
调度决策类算法,也已然违规了。于是她也就叫不来任何一辆车。她也许茫然地举着手机,正在黑夜中上下求索,软件给出这么一个选项究竟有什么意义呢?
再如草案提出:
不得设置
诱导用户沉迷或者高额消费等违背公序良俗的算法模型
既然是算法,就必然有明确的优化目标,如点击率预估等等。如果按照这个标准,几乎
所有的推荐算法都涉嫌诱导用户沉迷。不惟互联网广告业务,就算是实体店的广告,本质上也至少是「诱导用户购买」(香烟广告除外)。沉迷与否,如何界定?因此严格意义上来说:
关闭推荐算法,就是关闭服务本身。
3. 为什么限制推荐算法于国有损?
3.1 因为推荐算法是信息化经济的基石。
我国商务部指出,到2020年为止,基本上实现「电子商务交易额40万亿元、网络零售总额10万亿元、相关从业者5000万人」的三个指标。年交易额40万亿元是一个什么数量级呢?可以参考去年我国 GDP 首次突破了 100 万亿。我国电子商务的蓬勃发展,推荐系统技术所占的分量很容易被低估。
3.2 从国计民生的角度而言,说推荐算法是我国的经济支柱技术之一也不为过。
在我们国家,以推荐系统为核心的在线服务业,提升了各行各业的效率,而这也是我们远胜于其他国家的突出优势之一。正是草案中定义的,这一系列推荐算法等技术,将在线诊疗送上山高水远;让开源知识和在线教育以前所未有的深度和广度,风吹稻花香两岸;让一辈子没去过大城市的老农,能通过直播带货,令甘美的瓜果甜到千家万户的心尖。
3.3 推荐算法绝不是洪水猛兽。
我们的目标是「以国内大循环为主体」的新经济,我们还正在不断地「拉动内需」。在推荐系统技术高度精细化的今天,用户群体的任何变化(哪怕只是限制个性化推荐,对用户生态的冲击也可能是不低的),都有可能带来推荐效果的重大影响,经济上更是牵一发动全身。而另一方面,我们的信息技术产业,目前在国际上不论是技术还是应用,都有一席之地。无法想象如果有一天,我们在做研究,搞开发之前,还需要考虑哪些算法是「合法算法」,哪些算法是「非法算法」的尴尬局面。
4. 当我们讨论「关闭算法推荐」时,究竟在讨论什么?
我们希望保护用户的隐私不受侵犯。
正如上文所述,草案中的定义是不准确的,涵盖范围是有待商榷的。所谓「
关闭算法推荐」更可能是「
不同意收集数据」的词不达意。而作为用户,我们真正在意的是,不希望个人信息在不知情的状态下,被非法采集和牟利:
我们唯独不需要的,是宣布哪些算法是「违背公序良俗的」「非法算法」。
欢迎大家分享读后感或者提意见/建议~
喜欢的话点个在看吧👇