知乎上面,时常会出现一些“睿智”的问题。
比如,一颗陨石如何挑选自己的归宿:
又比如,公交车的职业操守如何:
这么可爱的问题,并非知乎独享。
知乎的大前辈Quora上面,也有一些脑回路别具一格的人类:
我的MacBook Air重量是2.3磅。
下载的东西多了之后,它会不会越来越重?
下载的小电影多了之后,它会不会爆炸?
既然,大家都喜欢这样可爱的问题,怎么才从千千万万个问题里面,把它们找出来呢?
重赏之下,必有勇夫。
Quora拿出25,000美元作为奖金,举办了一场Kaggle比赛:
比赛内容之一,就是让AI识别出建立在虚假前提上的问题,简称虚假问题 (Insincere Questions) 。
所以,怎样算是虚假前提?
还是举起开头的栗子,“陨石坠地前,那陨石坑已经存在”,这是个合格的虚假前提了。
第二,AI要识别的对象还包括,打着提问的旗号,实则在表达观点,这样的问题。
例如,对某一人群表现出歧视、攻击或者侮辱的问题:
第三,若是为给别人带来冲击力 (不为寻求答案) 而使用了性内容,也会成为缉拿对象。净化网络环境,也是保护祖国的花朵。
以上概括起来,任务就是揪出那些并非真心发问而另有用意的问题。
Quora说,站内已经在用机器学习与人类一同完成这项任务了,不过依然需要大家的帮忙。所以才为选手们提供了不错的回报:
冠军,12,000美元
亚军,8,000美元
季军,5,000美元
比赛用的数据,就是Quora里面的问题。官方提供的数据集,分为训练集合测试集。训练集里有超过130万个问题,测试集里有5.6万个问题。信息包括:问题ID,问题本身,以及问题是否虚假。
在此之外,选手不可以使用其他数据来训练模型。
比赛成绩,是由模型的F1分数决定的:
这里,问题只有两种分类,一是虚假,二是正常。F1分就是衡量二分类模型准确度的指标,兼顾了精确率 (Precision) 和召回率 (Recall) 。
这场为期3个月的比赛,一周前已经启动。现在,已经有超过750支队伍参与其中,排行榜也一直在变化。
窃以为,解锁不可描述的问题,应该是一项愉悦身心的活动。
那么,想要参加比赛的同学注意一下:
报名截止日期为2019年1月29日。
提交截止日期为2019年2月5日。
参赛地址在这里:
https://www.kaggle.com/c/quora-insincere-questions-classification
最后的最后,母交车到底能不能吸引公交车?
有理有据,令人信服。
— 完 —
年度评选申请
加入社群
量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)
活动策划招聘
量子位正在招聘活动策划,将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入,并希望你能有一些活动策划或运营的相关经验。相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态