大数据文摘 x 百度APP科技频道联合出品
作者:胡笳 张弛 蒋宝尚,可视化:赵玮雯
说起过年,最有仪式感的一道程序可能就是年夜饭了。
从远方风尘仆仆赶回来的一家人,围坐一起,觥筹交错,是每个中国人心中对“年”最深的印象。
但不同地区、不同的人对吃也有千百种看法。千滋百味是中国菜的特色,但中国的“年味”到底是怎样的?
回答这个问题似乎可以从数据分析上入手。
在咽了无数次口水后,文摘菌选取了几个美食网站,获取了所有带有“年夜饭”这一关键词的菜谱。在这些网站上,爬下的菜谱除了系统推荐,相当大的一部分内容是活生生的用户大厨们主动上传。
简单来说,爬取这些“年夜饭”菜谱的过程,就像走进了千万家的除夕夜一样。文摘菌看着这一桌桌“年夜饭”备好出锅,关于中国“年味”的印象也就大致成形了。
分析过程
首先,当然是写爬虫,为了保证年夜饭分析的多样性,文摘菌踩点挑选了几个常用的美食网站:豆果美食、天天美食、美食天下、香哈网、心食谱等等,爬下了相关数据。
爬虫脚本使用Python的requests+BeautifulSoup+selenium三大库来完成。
由于手比较生,没实现全自动化,采用的是简单粗暴地按页爬方式。主要锁定了几个维度:菜名、用料、食材+数量搭配、其他(包含口味|工艺|耗时)、制作步骤、Tips、url。
requests和BeautifulSoup 用来提取页面上的美食信息,selenium 用来自动触发ajax刷新下一页。
因为数据量不多,所以这一次直接存在了txt文件里面,说实话,暂时用不到MySQL、Hadoop一类的东西了。
分析结果
大吉大利,除夕吃鸡!
先来看看,人们最喜欢吃的肉是什么呢?我们把食材中的肉类又做一次聚类,发现了如下事实:
可以看得出,鸡肉是除夕餐桌上不可撼动的存在,第二名猪肉的份额也不错,达到了18%,其次是鱼肉和虾。
似乎在多数中国人的印象里,猪肉才是除夕餐桌上的霸王,毕竟是猪年嘛。但是,就算加上其他类的中的排骨,五花肉等等,猪肉也打不赢鸡肉。
果然,大吉大利,还是得吃鸡!
萝卜香菜,各有所爱!
肉类看完了,那么除夕夜,中国人对于蔬菜的选择又是怎样的呢?
第一名,萝卜,小人参的称呼不是白得的。白萝卜、胡萝卜,好存放又百搭,必须是冬天中国人餐桌上常见菜式,而且领先优势明显,比第二名玉米高了13个百分点。
玉米排名第二,毕竟像玉米地瓜球这样的甜点也逐渐走向了餐桌。
让很多人又爱又恨的“香菜”也名列前茅,不吃香菜的同学们可能要大跌眼镜了。
盐、葱、姜是中国人最爱
再来看看调味料。
虽然对于豆腐脑的南北咸甜之争一直没有答案,但是到了大菜上,显然,中国人还是好咸口。
通过对调味料的聚类分析,我们可以看出,最受欢迎的调味品还是盐。其次是葱,姜。中国人对于提“味”的执念真的很深了。
(PS:同类词已经合并,例如糖和白糖,都算做糖。)
而其他材料,包括八角、香叶、桂皮这些比较小众了一些,用的也比较少,加起来一共占比10%。
一切“适量”
中国文化的“中庸之道”在年夜饭的菜谱中也体现的淋漓尽致。在描述调味料用量的时候,“适量”以超出第二名7倍的提及量,妥妥儿的排名第一。
虽然这个描述每次我看到都很头疼,适量到底是多少?这可能是困扰万千家庭的大难题。
“炒”它!
另一个比较好玩的数据是年夜饭最常用的烹饪技法。
文摘菌统计发现,年夜饭菜谱里接近20%的菜,都是用炒的方式烹饪的,而炒相对于炖和煮来说,所用的时间还是比较少的。
现在快节奏的生活方式,最直接的反映在了做饭上面。
排名第二的分别是拌和煮。嗯,这个统计结果也还算合理,毕竟一桌丰盛的年夜饭,怎么能少的了凉拌黄瓜、拌土豆丝、拌三丝这些凉菜。
中国菜的技艺复杂,煎炒炸蒸焖煮烧,“千奇百怪”。还有许多叫不上名字的做法已经占比达到了16%。
最有年味的菜原来是它!
好了,分析完食材原料烹饪技法,现在是时候完全按照分析结果,来杜撰一道最富有年味的菜了:
嫩鸡半只,适量胡萝卜,香菜和葱和蒜,生姜以及适量的酱油,盐和醋。然后少量的八角,花椒,桂皮。
鸡冼净切块,加料酒腌制备用。将萝卜切好,锅中放油,倒入腌好的鸡块,加八角,花椒,桂皮炒至鸡肉变色后,有香味出来时,加酱油调色,盛出备用。
锅中留油,放葱、姜、红辣椒爆香,再放入萝卜片翻炒片刻,倒入炒好的鸡块,再加入盐。
最后放入蒜再倒放调好的水淀粉,再略炒几分钟,加点酱油调色,加味精调味装盘即可。
炒出来可能是这个样子:
准备上桌。
志愿者介绍
后台回复“志愿者”加入我们