单身狗有福了!斯坦福教授化身丘比特,AI算法之箭帮你配真命爱侣

2022 年 2 月 14 日 新智元



  新智元报道  

编辑:袁榭 拉燕

【新智元导读】单身男女想脱单,与其拼自己人品,不如找个好的约会app,拼一拼app的配对算法有多强力。斯坦福大学商学院的副教授丹妮拉·萨班老师,在优化约会app算法这事上着实搭救了不少人。


 

对于现在很多青年男女来说,线上交友是脱单恋爱的第一步骤。在美国,互联网近十年来一直都是最有效的恋爱牵线工具,没有之一。
 
在红娘网站、约会APP刚开始重塑当代浪漫关系动态时,丹妮拉·萨班开始密切关注这类社交工具究竟是如何被设计出来的。
 
「10年前,我刚开始我的博士生涯,我很多同学都已经是约会app的积极用户了。我经常跟他们开玩笑,如果是我设计这些软件,我肯定弄得跟现在的软件不一样。」萨班说。她现在是斯坦福大学商学院运营、信息和技术副教授。
 
 

「数字红娘」大有改善空间


如今,萨班有研究来支撑她的表态了。在她的两篇论文中,她调研了社交类软件在设计时的不同选择,发现会对用户成功找到潜在伴侣这件事产生哪种效应。
 
大体来说,萨班的研究对「数字红娘」们大有启发。她的研究表明,哪怕靠算法找伴的模式可能和过去传统靠邂逅的方式不一样,但是算法肯定也会对爱神将会眷顾哪些人产生挺大的影响。
 
她的第一篇论文是和哥伦比亚商学院的副教授亚辛·卡诺里亚合写的。其中,萨班探究了某些规则的设定会对约会网站的产生什么样的影响。比方说,哪些用户可以主动发起和其他人的交流,或者说每个用户的档案里展示多少信息等等。
 
「如果我们仔细观察一下最流行的约会软件,就会发现有一些规则是不同的。比如说,在Tinder上,任何人都可以主动发起对话。但是在Bumble上,只有女性能先说话。」萨班说。
 
她的研究证明,只有少数群体的用户(对于异性恋用户来说,女性是少数群体)能优先发起对话的情况下,那么处于多数群体(男性)的用户就会获益。另外,如果档案中,有关用户「质量」的部分被隐藏掉,那么所有用户都会从这个规则中获益。
 
 
萨班和哥伦比亚大学商学院的Fanyin Zheng、德克萨斯大学的Ignacio Rios合作完成了第二篇论文。Ignacio在斯坦福大学商学院拿过博士学位。
 
三位研究人员和美国一个主流的约会平台合作,帮他们重新设计了匹配算法,选出用户档案中的哪些部分应该展示。他们发现,新设计的算法比起平台旧有的标准算法,让匹配成功率足足上涨了40%。
 
在这项研究里,萨班发现:给定约会软件的活跃用户数量,与线上联系对线下生活的影响显著性,哪怕对配对流程进行很小的一个优化,都意味着用户在寻找最佳伴侣时会事半功倍。
 
 
「我有很多朋友正谈着恋爱,他们很多都是从网恋开始的。这说明社交软件的设计绝对不是个无关紧要的问题。这事对社会会产生很大的影响。哪怕我们只能优化一点点,也能在每个人的现实生活中带来很大的改变效果。」
 

该让男追女还是女追男?

 
在他们合写的论文中,萨班和卡诺里亚设计了一个能模拟人们在约会平台上会如何表现的模型。该模型主要考虑两点,一个是男女的用户人数会有不同。一般来说男用户会比女用户多。
 
另一点是,约会网站会尽可能更精确的给用户打分。分数体现用户的「质量」,同时也是异性想认识某一用户的基础。
 
拿Tinder举例,他们有一款快淘汰了的约会评分体系Elo。Tinder靠右滑来表示喜欢某一用户,右滑的数量越多,表明喜欢该用户的人越多。
 
找工作的网站TaskRabbit、Upwork也都是用同样的办法。但是跟约会软件还是有不一样的地方。找工作的网站一般会明确地把用户找工作的成功率展示出来,而约会网站一般不会直接展示出来。
 
而研究人员的模型,就是为了观察如果约会网站也像找工作网站一样,把评分展示出来,会产生什么样的结果。
 
 
他们设计的模型表明,人数更多的男性群体,如果不让他们主动和人数较少的女性群体发起交流,那他们就不会那么频繁的被拒绝,甚至还能挑一挑回谁的消息。
 
这对男性来说是个好事,因为这件事意味着软件里别的男性会发现自己可选的变多了,就会想继续找更好的伴侣。(然而这个规则对女性成功找到伴侣的影响不是那么大)
 
「传统意义中的约会市场中,男性会比女性更难一点。因为男性必须更活跃才能获得和女性同样数量的配对。」萨班说到。
 
约会软件Bumble规定只有女性才能首先发起交谈,「这看起来对男性不利。毕竟,男性找对象已经很难了,现在不让他们主动,不是会更难吗?但是,根据我们的研究结果,这种设定对男的也许是件好事。」
 
另外,模型还表明,隐藏用户个人质量的评分是个好主意。因为这避免了有些用户只想找高质量的对象,找不着就最终离开这个网站的情景发生。
 
 
当然,以上的解释,用论文综述的原话是:为了更好理解双面配对平台的最优设计,研究者引入了假设的动态模型。模型中的策略行为主体必须承担发现自己对于每个潜在搭档价值的成本,并可非同步进行。
 
在模型值达到演化稳定的静态均衡后,研究者发现在很多设定中,平台可以通过限制行为主体来避免搜索工作的浪费。
 
在不均衡市场里,平台应该只让数量少的短面群体成员主动向数量多的长面群体成员发出接触要约,禁止长面群体发起要约。如此反而会让长面群体在均衡态中有更多选项。
 
当行为主体构成有垂直差异时,平台的如此做法,将在筛选成本降低到近无的情况中,让行为主体的福利有达到帕累托改进的可能。
 
两相参看,简直是浪漫诠释和凭实力单身的对照。
 

让优化算法来配对

 
萨班另一篇论文中,主旨是研究者对平台的问题进行建模,并且用计量工具将用户的点赞与登录几率量化为模型初始输入值。研究者改动了约会平台的配对程序,来估量过往配对之于用户未来点赞行为的因果效应。
 
研究者发现在近期内用户被配对次数与之后点赞数有负相关。利用此发现,研究者对约会平台的现有程序引入了一系列启发式算法,来决定用户每日能看到的对象档案数。
 
在模拟运行和实地试运行中,这些改动成功为约会平台用户提高了40%的配对成功率。此结果强调了提高约会平台运营效率时需正确考量约会交易双方的行为记录,过往配对的数量与偏好应被量化后包括在算法中。
 
 
用白话解释,这是什么意思呢?
 
其实是研究者观察了真正使用某一款不具名主流约会软件的人数。每个用户每天只能在软件上看一定数量的档案,不管一天登录多少次都只能看这么多(大部分是3个,如果充会员就能看9个)。
 
该约会平台同意使用研究人员设计的算法,来改变用户每天能看到谁的档案的权重。
 
研究人员利用平台的历史数据重新优化了算法,整合进了关于用户偏好的更加个性化的信息。他们还考虑到了用户登录的频率。登录不够频繁的用户,他们的档案推给其他用户的权重就会被相应降低。
 
如果说前两个因素还算好理解,那最后一个就显得比较反直觉。他们在观察了一个用户在软件上近期的使用经历中发现,匹配率高的用户一般就不太会在软件上继续点赞别人了。每一对新匹配会降低用户新点赞的8%~15%概率。
 
「这意味着,当一个人的匹配成功率很高的时候,系统再频繁地推给这个人别的用户档案就没什么太大意义了。还是给匹配率没那么高的人多推一点比较好。」
 
 
事实证明,研究人员的改进算法比平台之前推送个人主页的办法更成功。匹配成功率至少涨了27%,涨幅峰值是40%。
 
萨班说:「现有看法一般都会强调正确判断并理解用户的偏好。这肯定是最重要的。但是我们的研究发现,通过观察用户近期使用软件的经历,可以更好地理解用户某些决定的变化,在这一点上还有很大的改进空间。」
 
以研究结果的优势为基础,研究团队正在与约会软件开展进一步合作,将他们的算法应用到其他市场。在文章中,他们表示,他们的发现也与其他类型的线上配对平台相关,包括自由职业平台、接单平台、拼车平台还有住宿平台等等。
 
 
尽管如此,萨班还是表示,这并不代表应用这些改进是件容易的事。「我们不仅要准确判断用户偏好,还要考虑用户目前在平台上的体验——这事不容易,我也不会粉饰。」萨班表示。「不过,我认为这对用户来说是值得的。」


参考资料:

https://www.gsb.stanford.edu/insights/cupids-code-tweaking-algorithm-can-alter-course-finding-love-online




登录查看更多
0

相关内容

在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。 来自维基百科: 算法
专知会员服务
68+阅读 · 2021年7月10日
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
77+阅读 · 2021年3月31日
【斯坦福经典书最新版】语音语言处理,653页pdf
专知会员服务
51+阅读 · 2021年1月1日
专知会员服务
78+阅读 · 2020年12月22日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
111+阅读 · 2020年4月12日
985研究生,救不了本科双非
36氪
0+阅读 · 2022年3月26日
这届女生,开始拒绝「粉红税」
36氪
0+阅读 · 2022年3月7日
增长黑客,你得回到最初的地方
人人都是产品经理
0+阅读 · 2022年2月15日
聊聊社交产品中的信号与暗示
人人都是产品经理
0+阅读 · 2022年1月19日
2022,「算法」属于人民
人人都是产品经理
0+阅读 · 2022年1月5日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2015年8月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
19+阅读 · 2020年7月21日
VIP会员
相关资讯
985研究生,救不了本科双非
36氪
0+阅读 · 2022年3月26日
这届女生,开始拒绝「粉红税」
36氪
0+阅读 · 2022年3月7日
增长黑客,你得回到最初的地方
人人都是产品经理
0+阅读 · 2022年2月15日
聊聊社交产品中的信号与暗示
人人都是产品经理
0+阅读 · 2022年1月19日
2022,「算法」属于人民
人人都是产品经理
0+阅读 · 2022年1月5日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
相关基金
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2015年8月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员