Python 爬取 6271 家死亡公司数据,一眼看尽十年创业公司消亡史!

2019 年 11 月 29 日 CSDN

作者 | 朱小五

责编 | 刘静

段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司。

意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com/deathCompany),统计了2000-2019年之间比较出名的公司“死亡”数据。

小五利用python将其中的死亡公司数据爬取下来,借此来观察最近十年创业公司消亡史。


获取数据


F12,Network查看异步请求XHR,翻页。

成功找到返回json格式数据的url,

  
  
    
https://www.itjuzi.com/api/closure?com_prov=&fund_status=&sort=&page=1
不了解json的读者可以看 【python玩转Json数据】 ,部分爬虫代码(完整代码见文末下载地址):
  
  
    
def main():
    data = pd.DataFrame(columns=['com_name','born','close','live_time','total_money','cat_name','com_prov','closure_type'])
    for i in range(1,2): #设置爬取N页
        url= 'https://www.itjuzi.com/api/closure?com_prov=&fund_status=&sort=&page='+ str(i)
        html = requests.get(url=url, headers=headers).content
        doc = json.loads(html.decode('utf-8'))['data']['info']
        for j in range(10): #一页10个死亡公司
            data = data.append({'com_name':doc[j]['com_name'],'born':doc[j]['born'],'cat_name':doc[j]['cat_name'],
                    'closure_type':doc[j]['closure_type'],'close':doc[j]['com_change_close_date'],'com_prov':doc[j]['com_prov'],
                    'live_time':doc[j]['live_time'],'total_money':doc[j]['total_money']},ignore_index=True)
            time.sleep(random.random())
    return data
成功获取6271家死亡公司数据。


数说10年生死相


截止 2019 年 11 月 24 日,共有近6271家公司在 IT 桔子数据库中被标注为“已关闭”,我们挑选最近十年(2010-2019)的5765家公司,来看一看这十年,创业公司的消亡。 

大家常说1998年是中国互联网元年,2010年是移动互联网的元年。 

也难怪,2010年的移动互联网实在是太热闹了。微信、小米、美团、爱奇艺等都在这一年相继成立。

百度在谷歌退出中国后成为最大的受益者,淘宝成为阿里新的增长点,腾讯则宣布QQ同时在线超1亿人。自此,百度、阿里和腾讯正式成为“三巨头”——BAT。除此之外,网易的网游、新浪的微博、搜狐的视频和输入法也开始发力出击,移动互联网的竞争正式拉开帷幕。

2010 年来,历年出生及死亡的公司数量趋势如下图。

2013、2014 年是公司诞生潮,三年后,正好对应了2016、2017的一波死亡潮。在2017 年,超过 2000 家公司倒闭。

在这十年间,诸多“风口”起起伏伏。网约车、团购、直播、基因检测、共享单车、短视频、比特币、VR|AR、无人货架、人工智能、直播带货……   

每一个风口上,都站着数百头“猪”,试图借力分一杯羹。

百团大战、垂直电商大战、外卖大战、打车大战、单车大战,在这些著名的战场里,各种桥段令吃瓜群众们目不暇接。有老大老二打架,老三打没了;有老二老三合并,继续和老大抗衡的;也有老大老二合并,将其他家远远甩在后面的……    

还有像冲顶大会之类直播答题一样,办起来的时候,各家分庭抗礼来势汹汹,却从2018年的公历新年开始,没有挺到农历新年。

风口消亡的背后,是无数创业公司烧掉的钱,每个公司在一开始,都坚信可以烧倒对手,但烧着烧着把自己烧光了,却再也拿不到融资。

2019 年 3 月,团贷网的暴雷让这家曾拿过约 25 亿融资的 P2P 公司登上烧钱榜TOP1的宝座,同属于一个实控人唐军的小黄狗一个月后也在此汇合。

当年的爱屋吉屋在互联网+的热潮中,试图用互联网颠覆传统房产中介,但在线下房地产产业规则面前跌了一个大大的跟头。而专注深耕线下房产交易多年的链家,在时机成熟后推出的“自如”与“贝壳”,则不断得到了投资方的追捧。

而将王思聪拖到“老赖”深渊的熊猫直播,曾在成立后仅一年的时间内,就跃居行业第三,后续更是完成多轮融资,一时风头无二。但在短视频行业的兴起,与运营成本的水涨船高后,也逐步走向衰亡。

共享单车们也曾大战一场,战火烧过国内的各大城市,甚至烧到了海外。先倒下的酷骑单车虽然只在烧钱榜单名列第8,但是凭借着一年多(379天)烧掉了融资的10亿元,日均烧钱263.85万元,荣登最快烧钱榜首。

创业公司的消亡,究其原因必然是多方面的,除行业竞争激烈这一核心因素外,最主要的还是商业模式的匮乏。创业者内在对于如何维稳、如何盈利等方面欠缺的了解、思考与准备,不足以在行业稳定后,支撑他在风口来临之初的一腔热血豪情。

另外,“伪风口”与“伪需求”也曾迷住众多创业公司的眼。“共享经济”衍生出的共享单车、共享充电宝红红火火,但共享电话、共享厕纸、共享篮球什么的,倒也不必。

比较有意思的是,这个死亡公司数据库还加了一个#上香排行榜#,排行第一的果然是大名鼎鼎的“快播”。

还真是有的公司死了,(在人心里)他还活着;

有的公司活着,(在人心里)他已经死去。

相关爬虫源码已上传github:https://github.com/zpw1995/aotodata/tree/master/interest/6217

作者:朱小五,互联网公司数据分析师。热衷于Python爬虫,数据分析,可视化,个人公众号《凹凸玩数据》,有趣的不像个技术号~

声明:本文为作者投稿,版权归作者个人所有。
【End】

热 文 推 荐 

OceanBase 的前世今生
中国互联网 30 年
谁是当今最顶级的技术?SQL、Java、Python、C++ 皆上榜!
惊! 程序员真的把地府后台管理系统做出来了!
企业上云,如何做好服务器的安全?
自学编程、玩 vlog,90 后程序员们的冠军之路

警惕!程序员万字揭露被空姐骗到香港做传销的来龙去脉!

【经典必看】14个实用的数据库设计技巧

贾扬清:为什么说数据智能和云原生之间是“天作之合”?

大白话讲解比特币白皮书,十年后它依然是学习区块链的最佳资料,你真的读懂了吗?

  点击阅读原文,参加中国开发者现状调查!
你点的每个“在看”,我都认真当成了喜欢
登录查看更多
0

相关内容

JSON( Java Script Object Notation)是一种轻量级的资料交换语言,以文字为基础,且易于让人阅读。尽管 JSON 是在 JavaScript 的一個子集,但 JSON 是独立于语言的文本格式,並且采用了类似于 C 语言家族的一些习惯。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
2019年中国人工智能基础数据服务行业白皮书
艾瑞咨询
27+阅读 · 2019年9月16日
为什么AI公司都在一边融资,一边投资?
腾讯创业
6+阅读 · 2018年9月25日
周末深夜,学妹说她想做Python数据分析师
机器学习算法与Python学习
4+阅读 · 2018年6月7日
2017创业阵亡最全名单曝光,触目惊心!
今日互联网头条
5+阅读 · 2017年12月26日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
6+阅读 · 2018年2月7日
Arxiv
3+阅读 · 2017年12月18日
Arxiv
4+阅读 · 2016年12月29日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
相关论文
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
6+阅读 · 2018年2月7日
Arxiv
3+阅读 · 2017年12月18日
Arxiv
4+阅读 · 2016年12月29日
Arxiv
5+阅读 · 2015年9月14日
Top
微信扫码咨询专知VIP会员