来自公众号:HyperAI超神经
By 超神经
场景描述:寻找能够相伴一生的灵魂伴侣是很多人的美好愿望,但现实往往残酷。为此,基于大数据,机器学习,AI 算法的婚恋网站和应用纷纷出招,它们能够帮助广大单身男女解决这个问题吗?
关键词:AI 虚拟媒人 机器学习 推荐算法
昨天,是「分手日」吗?
微博新浪娱乐爆出宋慧乔和宋仲基声明调解离婚的消息,很多粉丝泪奔:童话般的爱情破灭了。
粉丝在朋友圈泪奔现场
据宋慧乔经纪公司韩国 UAA 声明,两人离婚原因是「性格不合」,但真实原因到底为何仍不清楚。据不可靠猜测,可能是宋仲基并不适合宋慧乔,而是适合贾玲……
双宋离婚的事情还没来得及消化,晚上
李晨范冰冰又宣布分手……
曾经有多甜,现在就多扎心
记得当初双宋 CP 刚出,在众人眼里他们是就是神仙眷侣的代名词,令多少人羡慕不已。结婚当天,媒体纷纷报道这一喜讯,还有算命先生说看两人八字是绝配。然而,短短一年半之后,却迎来这样的结局。
其实,除了这对 CP,还有很多明星也经历了甜蜜到扎心的婚姻。戴安娜王妃和查尔斯、威廉王子和灰姑娘凯特、姚晨与凌潇肃,金童玉女潘粤明与董洁等等,都是最初恩恩爱爱步入婚姻殿堂,最终却劳燕分飞,令旁人唏嘘。
在普通人中间,这样的情况就更不少见了。「永远在一起」、「不离不弃」这种誓言似乎总是很容易过期。寻找相爱的人并执手终老是一道人生难题。
国内超 2 亿单身男女求脱单
从数据上看,国内单身男女的初婚年龄越来越大,在一线城市,「30 而婚」已不算稀奇。
这背后的原因,一方面因为工作节奏快,压力大,没有太多的时间花在社交上;而另一方面,是因为,每个人都希望能够找到完美伴侣并白头到老,但这并不容易。
现在,国内已经有超过 2 亿的单身男女,95 后都已经开始出来相亲。
为了响应广大单身男女脱单的需求,近年来涌现出各种婚恋交友网站、App。无论是国内外,都在利用大数据、AI 算法帮单身男女匹配最适合他们的「Mr.Right」。
AI 这个虚拟媒人靠谱吗?
总的来看,目前现有的婚恋网站与应用基本分为基于用户大数据直接匹配、通过聊天机器人收集用户信息,再进行推荐以及通过面部识别功能进行匹配等类型 。
这些由数据和算法组成的「媒人」,是否靠谱呢?
1
基于神经网络,找到更适合的人
成立于美国加州的Banihal公司,通过机器学习,人工智能和神经科学方面的研究来解决伴侣匹配问题。
这个社交 App 已经稳定运行了五年
在创立 Banihal 的之前,创始人 Ishdeep Sawhney 想要结婚安定下来。但是他表示,每次见到朋友或者婚恋网站推荐的那个人,他都不能确定自己是否能和她一起度过接下来的 50~60 年。
于是,为了寻找能相伴一生的完美伴侣,他特地制定了一个长长的问题清单。因此,他总会被约会对象定义为「古怪的人」。
而这份问题清单,给了他灵感。他辞去苹果公司的工作,开始创建匹配网站 Banihal。
众多的婚恋网站都会给用户匹配年龄、职业、薪资之类硬性条件相符的对象,但是这样无法实现个性化匹配,而且并不一定兴趣相投,价值观相同。
Ishdeep Sawhney 则研究了神经科学,了解人们做决策的方式,希望从心理、精神层面进行匹配。
他创建的 Banihal 会在新用户注册时,提出 40 多个问题让用户回答,类似于心理学家亚瑟·阿隆的「让陌生人迅速相爱的36个问题」,利用这些问题让用户深入了解自己和自己的偏好。用户填完比较全面的资料后,系统会为其推荐 5 个最佳匹配。
他们用神经网络打造的算法,帮助用户匹配最完美的伴侣
据介绍,Banihal 使用精确的算法,通过名为 Rae 的软件确保婚姻成功。Ishdeep Sawhney 指出, Rae 软件将研究测试提供给应用程序和网站,以改善配对过程。Rae 能够挖掘潜意识信号。它已经通过人工智能和数据进行了升级,以提供更好的用户体验。
团队由大厂工程师组成,他们来自苹果、微软
此外,Banihal 基于人工智能的软件 Rae 持续更新用户的偏好,用户交互的次数越多,基于算法的软件 Rae 就会更新这些特征,以呈现最合适的匹配。
事实上,此类系统就是与亚马逊、淘宝等购物网站类似的推荐系统,利用基于机器学习的聚类算法确定趋于相似的人群。
相似性可以通过行为(例如他们购买或浏览的内容,他们如何支付,购买频率等等),或特征(例如他们的年龄,性别,位置等),或者综合这两方面来定义。然后,推荐引擎将根据某用户 XX 过去做过的事情,来预测他未来的选择,而且也会考虑其他「喜欢XX」的人的行为这些因素。
2
机器学习预测你的脱单概率
在滑铁卢大学,由于男女比例极不协调,缺少社交活动,所以一位数据科学家小哥哥尝试用机器学习帮自己脱单。(点击这里查看详情)
他首先对决定能否找到对象的影响因素进行分析。
具备哪些属性才能在众多男生中脱颖而出,受到妹纸们的青睐?小哥哥试着列出了男生的特征属性,想找出哪些假设是可以有数据支撑。
在上面这些情况中,他按照是否符合标准会赋予 1 或 0 这两个值。所以,我们是在衡量人们的上述属性和能找到对象之间的关系。
此外,他还分析了各种落单原因,健身、眼镜和自信成为最显著的 3 个变量:
健身:定期去健身房或运动的人有女朋友的概率会高出两倍以上(P值=0.02)
眼镜:不戴眼镜的人有女朋友的概率比戴眼镜的人会高出 70%(P值=0.08)
自信:有自信心的人有朋友的概率更高(P 值=0.09)
横轴和纵轴是人的性格特征变量
红色表示正相关,蓝色表示负相关
之后对这些变量之间的关系进行统计,数据显示从图中看起来{ 有女朋友,看起来自信,去健身房,不戴眼镜 }有相互关系。
做了这些准备工作之后,小哥哥训练了一个逻辑回归广义线性模型,根据我们前文列举的这些说明变量,预测是否会有女票。
借助 R 语言中的 glmnet 和 caret 包,他用弹性网络正则化训练了这个广义线性模型。然后用标准网格搜索法优化了超参数,在每次迭代中使用留一交叉验证法,并优化 kappa 系数。最终模型的交叉验证 ROC AUC 分数为 0.673。
也就是说模型在预测你找到女票的几率方面,比你凭感觉乱猜还是更靠谱些。
但是,据了解,小哥哥发布文章的四个月之后,还依然单身,不知道现在怎么样了……
脱单首先靠自己,不行再上 AI
据说,于茫茫人海中,遇见对的人的概率是五亿分之一,但是我们这辈子能够遇到多少人?有一部短片说,我们一生会遇到 826.35 万人,会和 39778 人打招呼,会和 3619 人熟悉,会和 275 人亲近,然而那个对的人,却不一定在这些人中。
你曾和对的人擦肩而过?还是还未相遇?
但是如果让机器来帮你寻找,就可以大大提高效率,在千万人之中,找出最合拍的那个人,可能再也不用你苦苦地「众里寻他千百度」。婚恋网站 eharmony称,每 14 分钟就有人在上面找到真爱。
不过,话说回来了,机器真的比自己还了解自己吗?机器匹配的两个人,会擦出爱情的火花吗?据网上数据显示,婚恋网的成功率也不过 10% 左右。
虽说,AI 帮你找到对的人,可能还不靠谱,但是它会帮你避开错的人,而减少让人痛苦的恋爱经历。人工智能工具会告诉你,不要跟那个带着漂亮跑车的人约会,因为他最后只会把你甩掉。也就是说,人工智能可以帮你鉴别「渣男渣女」,避免情感损失。
所以,脱单路上,你愿意找 AI 做你的红娘吗?
●编号948,输入编号直达本文
●输入m获取文章目录
人工智能与大数据技术