会员服务 ·

悬赏17万：美国“知乎”的沙雕问题，需要AI来识别

2018 年 11 月 14 日 量子位

智栗发自凹非寺
量子位出品 | 公众号 QbitAI

知乎上面，时常会出现一些“睿智”的问题。

比如，一颗陨石如何挑选自己的归宿：

又比如，公交车的职业操守如何：

这么可爱的问题，并非知乎独享。

知乎的大前辈Quora上面，也有一些脑回路别具一格的人类：

我的MacBook Air重量是2.3磅。

下载的东西多了之后，它会不会越来越重？

下载的小电影多了之后，它会不会爆炸？

既然，大家都喜欢这样可爱的问题，怎么才从千千万万个问题里面，把它们找出来呢？

重赏之下，必有勇夫。

Quora拿出25,000美元作为奖金，举办了一场Kaggle比赛：

有毒问题在哪里？

比赛内容之一，就是让AI识别出建立在虚假前提上的问题，简称虚假问题 (Insincere Questions) 。

所以，怎样算是虚假前提？

还是举起开头的栗子，“陨石坠地前，那陨石坑已经存在”，这是个合格的虚假前提了。

第二，AI要识别的对象还包括，打着提问的旗号，实则在表达观点，这样的问题。

例如，对某一人群表现出歧视、攻击或者侮辱的问题：

第三，若是为给别人带来冲击力 (不为寻求答案) 而使用了性内容，也会成为缉拿对象。净化网络环境，也是保护祖国的花朵。

△ 来自山下智博

以上概括起来，任务就是揪出那些并非真心发问而另有用意的问题。

Quora说，站内已经在用机器学习与人类一同完成这项任务了，不过依然需要大家的帮忙。所以才为选手们提供了不错的回报：

冠军，12,000美元

亚军，8,000美元

季军，5,000美元

△ 如何在一夜之间学会编程？(急，在线等)

比赛用的数据，就是Quora里面的问题。官方提供的数据集，分为训练集合测试集。训练集里有超过130万个问题，测试集里有5.6万个问题。信息包括：问题ID，问题本身，以及问题是否虚假。

在此之外，选手不可以使用其他数据来训练模型。

比赛成绩，是由模型的F1分数决定的：

这里，问题只有两种分类，一是虚假，二是正常。F1分就是衡量二分类模型准确度的指标，兼顾了精确率 (Precision) 和召回率 (Recall) 。

这场为期3个月的比赛，一周前已经启动。现在，已经有超过750支队伍参与其中，排行榜也一直在变化。

窃以为，解锁不可描述的问题，应该是一项愉悦身心的活动。

那么，想要参加比赛的同学注意一下：

报名截止日期为2019年1月29日。

提交截止日期为2019年2月5日。

参赛地址在这里：
https://www.kaggle.com/c/quora-insincere-questions-classification

有问，必有答

最后的最后，母交车到底能不能吸引公交车？

有理有据，令人信服。

— 完 —

年度评选申请

加入社群

量子位AI社群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

活动策划招聘

量子位正在招聘活动策划，将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入，并希望你能有一些活动策划或运营的相关经验。相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

Quora

关注 2

社会化问答网站，结合了 Twitter 的 follow 关系、维基式协作编辑、 Digg 的用户投票等模式，是将现有 Web 2.0 产品的分散功能进行重新组合重装的创新模式

少标签数据学习，54页ppt

专知会员服务

205+阅读 · 2020年5月22日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知会员服务

69+阅读 · 2020年2月29日

如何用AI技术治理假新闻泛滥？看ASU大学舒凯等学者这篇《挖掘虚假信息和假新闻:概念、方法和最新进展》研究综述

专知会员服务

54+阅读 · 2020年1月11日

【重磅】斯坦福《2019人工智能指数报告》出炉，291页pdf了解AI态势进展

专知会员服务

60+阅读 · 2019年12月12日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

重磅！2019中国经济研判，涉及20个敏感问题…

笔记侠

10+阅读 · 2019年2月17日

知乎八年，大而不美

新榜

7+阅读 · 2019年1月26日

应对时间序列问题有何妙招(Kaggle比赛亚军)

七月在线实验室

32+阅读 · 2018年3月19日

NLP大赛冠军总结：300万知乎多标签文本分类任务(附深度学习源码)

数据挖掘入门与实战

5+阅读 · 2017年11月24日

AI都干过什么让人细思极恐的事？

全球创新论坛

4+阅读 · 2017年9月15日

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Arxiv

11+阅读 · 2019年9月23日

Image Captioning: Transforming Objects into Words

Arxiv

7+阅读 · 2019年6月14日

Learning to Focus when Ranking Answers

Arxiv

5+阅读 · 2018年8月8日

DeSIGN: Design Inspiration from Generative Networks

Arxiv

3+阅读 · 2018年4月3日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

4+阅读 · 2018年3月8日

VIP会员

悬赏17万：美国“知乎”的沙雕问题，需要AI来识别

智栗 发自 凹非寺量子位 出品 | 公众号 QbitAI

有毒问题在哪里？

△ 来自山下智博

△ 如何在一夜之间学会编程？(急，在线等)

有问，必有答

相关内容

智栗发自凹非寺
量子位出品 | 公众号 QbitAI