点击上方“CSDN”,选择“置顶公众号”
关键时刻,第一时间送达!
作者简介:杨光,CSDN 博客专家,中科院软件所研发工程师,曾参与网易热、网易花田的研发工作,擅长移动应用开发,平时喜欢弹琴,也经常在博客中写一些技术文章,欢迎一起交流讨论。博客:http://blog.csdn.net/steveyg
声明:本文精选自 CSDN 博客,已获作者授权,内容仅供技术学习交流。
最近一两天,“直播答题”已席卷互联网。王思聪力推《冲顶大会》、周鸿祎的花椒直播上线《百万作战》、今日头条&西瓜视频推出《百万英雄》、映客在线答题《芝士超人》、一直播的《黄金十秒》……仿佛一夕之间,众多互联网直播版《开心辞典》冒了出来。
这些直播答题的题目范围涉及很广,天文地理历史科学娱乐影视音乐诗歌礼仪等,每次活动共 12 道题,也难怪王思聪会挑衅地说“觉得自己很聪明可以来试试”,反正,规则就是 10 秒中之内未答题和答错题都将被淘汰,且无法角逐当期的奖金。
虽然通过邀请好友可以获得复活次数,但是毕竟复活很宝贵,而且每轮只能复活一次,如果复活之后答错会更加可惜。那么怎么样才能够短时间内提升我们的准确率呢?
原理说明
1. 手机进入冲顶大会(或其他答题类 App);
2. 获取屏幕截图:
iPhone 可以通过 WDA 进行图片截取,或者通过 AirPlay/QuickTime 投影到电脑上截取,Mac 显示 iPhone 屏幕可参考教程:https://jingyan.baidu.com/article/64d05a02514064de54f73b7c.html
Android 可以通过 adb 截图并拉取到本地。
#adb进行截图
adb shell screencap -p /sdcard/autojump.png
adb pull /sdcard/autojump.png .
3. 通过 OCR 将题目和选项识别出来,此处使用了百度的 OCR,你也可以选用任意你喜欢的 OCR,如 tesseract-ocr 等;
4. 使用三种方法对识别出的问题进行判断。
#直接用浏览器打开问题
def open_wabpage(question):
webbrowser.open('https://baidu.com/s?wd=' + question)
#根据问题搜索结果计算每个选项出现的次数
def words_count(question,answers):
print "根据词频:"
req = requests.get(url='http://www.baidu.com/s', params={'wd': question})
body = req.text
counts = []
for answer in answers:
num = body.count(answer)
counts.append(num)
print answer + " ---> " + str(num)
return counts;
#计算问题+每个选项搜索的结果数
def search_count(question,answers):
print "根据结果数量:"
counts = []
for answer in answers:
req = requests.get(url='http://www.baidu.com/s', params={'wd': question +"%20"+answer})
body = req.text
start = body.find(u'百度为您找到相关结果约') + 11
body = body[start:]
end = body.find(u"个")
num = body[:end]
num = num.replace(',', '')
counts.append(num)
print answer + " ---> " + str(num)
return counts
第一种方式是最直接的,但是打开浏览器比较耗时,而且不方便,所以将它作为优先级最低的可选操作。后两种方式能够较为准确的得出问题和每个选项之间的关联关系,综合他们的结果进行选择。
使用教程
1. 下载代码并安装 Python 2.7 环境,代码地址见文末;
2. 安装百度 ORC 库;
pip install baidu-aip
3. 在百度云(https://cloud.baidu.com/product/ocr.html)中创建一个项目,获取相应的 App ID、API Key 以及 secret_key,在 config.py 中进行替换;
4. 在 img_utils 中选择你喜欢的获取图片的方式,并且调整截图区域;
5. 在终端中运行。
python main.py
搜索相应的问题吧!
运行截图
更新
2018.01.11 冲顶大会增加了 API 直接抓题功能,几乎无需配置即可分析答案,详情见文末 GitHub。
辅助工具只能够提升准确率,对于一些很坑很怪的问题可能依然会存在一定问题,后面会不断对判断策略进行优化,也欢迎大家提出一些更优的策略。
代码地址:https://github.com/steveyg/AnswerHelper
————— 推荐阅读 —————
点击图片即可阅读