2000亿条微博数据将被国图保存,后人能懂我们的梗么

2019 年 4 月 22 日 大数据文摘

大数据文摘出品

作者:宋欣仪、周素云


4月19日,国家图书馆互联网信息战略保存项目在北京启动,首家互联网信息战略保存基地落户新浪,新浪全平台内容纳入保存,合作覆盖多个领域。


在20年的发展历程中,新浪一直在引领新媒体行业发展,其内容已经多次被国家图书馆采集保存。国家图书馆与新浪共建首个互联网信息战略保存基地,看重的是新浪庞大的信息数据规模和领先的信息处理能力。


新浪网发布的新闻和微博上公开发布的博文,都将被互联网信息战略保存基地保存。截止在2018年12月,新浪网累计发布新闻超过2.1亿条、图片13亿张、视频4500万个、互动总量超过80亿,微博全站发布博文超过2000亿条、图片500亿张、视频4亿个、评论和赞总量近5000亿。新浪网和微博上新发布的内容,也将持续保存。


我和广大网友也是参加过国家战略项目的人了!文摘菌惭愧,也就为国家贡献了1800条。



有网友开始为后代担心,后人真的能读懂我们的梗么?


按照国际惯例, 早在2010年,Twitter就向美国国会图书馆捐赠推文数据,美国国会图书馆与Twitter当时发布的协议约定,Twitter将捐赠从Twitter成立到协议日期的所有公开推文,研究人员必须签署禁止商业用途以及内容重新分配的“通知”。事实上,很多国家都在开展互联网信息存档工作,国际上已完成或正在推进的相关项目大约有100多个。


沙雕日常上交国家,你有什么需要对后人解释的吗?





实习/全职编辑记者招聘ing

加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn


点「在看」的人都变好看了哦
登录查看更多
2

相关内容

新浪是最具影响力的中文网络媒体,1998 年 四通利方和华渊资讯网合并组建。
新浪通过门户网站和微博服务组成的数字媒体网络,帮助用户通过互联网和移动设备获得专业媒体和用户自生成的多媒体内容,并与友人进行兴趣分享。
2000 年 4 月 ,公司以「SINA」为代码正式登陆纳斯达克交易所。
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
组织|15000字解密华为的薪酬和激励体系
智慧云董事会
85+阅读 · 2019年6月19日
“科研圈”、领研网招聘实习生
科研圈
6+阅读 · 2019年3月5日
知乎八年,大而不美
新榜
7+阅读 · 2019年1月26日
已删除
生物探索
3+阅读 · 2018年2月10日
Knowledge Flow: Improve Upon Your Teachers
Arxiv
5+阅读 · 2019年4月11日
Arxiv
6+阅读 · 2019年4月8日
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
5+阅读 · 2018年5月5日
Arxiv
3+阅读 · 2018年4月3日
Arxiv
11+阅读 · 2018年1月11日
VIP会员
Top
微信扫码咨询专知VIP会员