我们扒下了全网所有“年夜饭”菜谱,找到了最有年味的一道菜

2019 年 2 月 4 日 大数据文摘

大数据文摘 x 百度APP科技频道联合出品

作者:胡笳 张弛 蒋宝尚,可视化:赵玮雯


说起过年,最有仪式感的一道程序可能就是年夜饭了。


从远方风尘仆仆赶回来的一家人,围坐一起,觥筹交错,是每个中国人心中对“年”最深的印象。


但不同地区、不同的人对吃也有千百种看法。千滋百味是中国菜的特色,但中国的“年味”到底是怎样的?



回答这个问题似乎可以从数据分析上入手。


在咽了无数次口水后,文摘菌选取了几个美食网站,获取了所有带有“年夜饭”这一关键词的菜谱。在这些网站上,爬下的菜谱除了系统推荐,相当大的一部分内容是活生生的用户大厨们主动上传


简单来说,爬取这些“年夜饭”菜谱的过程,就像走进了千万家的除夕夜一样。文摘菌看着这一桌桌“年夜饭”备好出锅,关于中国“年味”的印象也就大致成形了。


分析过程


首先,当然是写爬虫,为了保证年夜饭分析的多样性,文摘菌踩点挑选了几个常用的美食网站:豆果美食、天天美食、美食天下、香哈网、心食谱等等,爬下了相关数据。



爬虫脚本使用Python的requests+BeautifulSoup+selenium三大库来完成。


由于手比较生,没实现全自动化,采用的是简单粗暴地按页爬方式。主要锁定了几个维度:菜名、用料、食材+数量搭配、其他(包含口味|工艺|耗时)、制作步骤、Tips、url。


requests和BeautifulSoup 用来提取页面上的美食信息,selenium 用来自动触发ajax刷新下一页。


因为数据量不多,所以这一次直接存在了txt文件里面,说实话,暂时用不到MySQL、Hadoop一类的东西了。


分析结果


大吉大利,除夕吃鸡!


先来看看,人们最喜欢吃的肉是什么呢?我们把食材中的肉类又做一次聚类,发现了如下事实:



可以看得出,鸡肉是除夕餐桌上不可撼动的存在,第二名猪肉的份额也不错,达到了18%,其次是鱼肉和虾。


似乎在多数中国人的印象里,猪肉才是除夕餐桌上的霸王,毕竟是猪年嘛。但是,就算加上其他类的中的排骨,五花肉等等,猪肉也打不赢鸡肉。


果然,大吉大利,还是得吃鸡!


萝卜香菜,各有所爱!


肉类看完了,那么除夕夜,中国人对于蔬菜的选择又是怎样的呢?



第一名,萝卜,小人参的称呼不是白得的。白萝卜、胡萝卜,好存放又百搭,必须是冬天中国人餐桌上常见菜式,而且领先优势明显,比第二名玉米高了13个百分点。


玉米排名第二,毕竟像玉米地瓜球这样的甜点也逐渐走向了餐桌。


让很多人又爱又恨的“香菜”也名列前茅,不吃香菜的同学们可能要大跌眼镜了。



盐、葱、姜是中国人最爱


再来看看调味料。



虽然对于豆腐脑的南北咸甜之争一直没有答案,但是到了大菜上,显然,中国人还是好咸口。


通过对调味料的聚类分析,我们可以看出,最受欢迎的调味品还是盐。其次是葱,姜。中国人对于提“味”的执念真的很深了。


(PS:同类词已经合并,例如糖和白糖,都算做糖。)


而其他材料,包括八角、香叶、桂皮这些比较小众了一些,用的也比较少,加起来一共占比10%。


一切“适量”


中国文化的“中庸之道”在年夜饭的菜谱中也体现的淋漓尽致。在描述调味料用量的时候,“适量”以超出第二名7倍的提及量,妥妥儿的排名第一。


虽然这个描述每次我看到都很头疼,适量到底是多少?这可能是困扰万千家庭的大难题。



“炒”它!


另一个比较好玩的数据是年夜饭最常用的烹饪技法。



文摘菌统计发现,年夜饭菜谱里接近20%的菜,都是用炒的方式烹饪的,而炒相对于炖和煮来说,所用的时间还是比较少的。


现在快节奏的生活方式,最直接的反映在了做饭上面。




排名第二的分别是拌和煮。嗯,这个统计结果也还算合理,毕竟一桌丰盛的年夜饭,怎么能少的了凉拌黄瓜、拌土豆丝、拌三丝这些凉菜。


中国菜的技艺复杂,煎炒炸蒸焖煮烧,“千奇百怪”。还有许多叫不上名字的做法已经占比达到了16%。


最有年味的菜原来是它!


好了,分析完食材原料烹饪技法,现在是时候完全按照分析结果,来杜撰一道最富有年味的菜了:


嫩鸡半只,适量胡萝卜,香菜和葱和蒜,生姜以及适量的酱油,盐和醋。然后少量的八角,花椒,桂皮。


鸡冼净切块,加料酒腌制备用。将萝卜切好,锅中放油,倒入腌好的鸡块,加八角,花椒,桂皮炒至鸡肉变色后,有香味出来时,加酱油调色,盛出备用。


锅中留油,放葱、姜、红辣椒爆香,再放入萝卜片翻炒片刻,倒入炒好的鸡块,再加入盐。


最后放入蒜再倒放调好的水淀粉,再略炒几分钟,加点酱油调色,加味精调味装盘即可。


炒出来可能是这个样子:



准备上桌。


志愿者介绍

后台回复志愿者”加入我们

听说点了「好看」的人都变好看了哦
登录查看更多
2

相关内容

专注美食的吃货社区,汇聚海量菜谱的常备工具,令厨房与餐桌成为一家人妙不可言的愉悦生活。 在这里,最活跃的美食杰出作者与热爱生活的美食家们,通过锅碗瓢盆、菜豆果蔬,为您呈现图文并茂、无比详细的菜谱,以及挥洒自如、满座惊艳的创意美食。
专知会员服务
30+阅读 · 2020年5月20日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
一文看懂怎么用 Python 做数据分析
大数据技术
24+阅读 · 2019年5月5日
金融风控面试十二问
七月在线实验室
20+阅读 · 2019年4月9日
我是一个爬虫
码农翻身
12+阅读 · 2018年6月4日
推荐一些适合小白练手的Python项目
数据挖掘入门与实战
6+阅读 · 2018年5月17日
Python除了不会生孩子,什么都会
算法与数学之美
3+阅读 · 2017年11月8日
Arxiv
4+阅读 · 2018年5月4日
Arxiv
7+阅读 · 2017年12月28日
VIP会员
相关VIP内容
专知会员服务
30+阅读 · 2020年5月20日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
相关资讯
一文看懂怎么用 Python 做数据分析
大数据技术
24+阅读 · 2019年5月5日
金融风控面试十二问
七月在线实验室
20+阅读 · 2019年4月9日
我是一个爬虫
码农翻身
12+阅读 · 2018年6月4日
推荐一些适合小白练手的Python项目
数据挖掘入门与实战
6+阅读 · 2018年5月17日
Python除了不会生孩子,什么都会
算法与数学之美
3+阅读 · 2017年11月8日
Top
微信扫码咨询专知VIP会员