【最全中华古诗词数据库】近14k唐宋古诗人, 55k首唐诗,60k宋诗

最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。


古诗是中华民族乃至全世界的瑰宝, 我们应该传承下去, 虽然有古典文集, 但大多数人并没有拥有这些书籍. 从某种意义上来说, 这些庞大的文集离我们是有一定距离的。而电子版方便拷贝, 所以此开源数据库诞生了. 


数据分析


唐诗高频词 唐诗作者作品榜
宋诗高频词 宋诗作者作品榜
宋词高频词 宋词作者作品榜
两宋喜欢的词牌名



古诗数据分发采用繁体字的分组 JSON 文件,保留繁体能更大程度地保存原数据。宋词数据分发采用 sqlite 数据库,使用简体字(无原因,采集源就是简体,如需繁体请自行转换)。


数据分发形式

其他类型结构数据

  • KomaBeyond / chinese-poetry-mysql 适用于 mysql 数据库的格式数据

  • (链接:https://github.com/KomaBeyond/chinese-poetry-mysql

古诗 JSON 结构

  
  
    

[
 {
   "strains": [
     "平平平仄仄,平仄仄平平。",
     "仄仄平平仄,平平仄仄平。",
     "平平平仄仄,平仄仄平平。",
     "平仄仄平仄,平平仄仄平。"
   ],
   "author": "太宗皇帝",
   "paragraphs": [
     "秦川雄帝宅,函谷壯皇居。",
     "綺殿千尋起,離宮百雉餘。",
     "連甍遙接漢,飛觀迥凌虛。",
     "雲日隱層闕,風煙出綺疎。"
   ],
   "title": "帝京篇十首 一"
 },
 ... 每单个JSON文件1000条唐诗记录.
]

作者 JSON 结构

[
 {
   "name": "太宗皇帝",
   "desc": "帝姓李氏,諱世民,神堯次子,聰明英武。貞觀之治,庶幾成康,功德兼隆。由漢以來,未之有也。而銳情經術,初建秦邸,即開文學館,召名儒十八人爲學士。既即位,殿左置弘文館,悉引內學士,番宿更休。聽朝之間,則與討論典籍,雜以文詠。或日昃夜艾,未嘗少怠。詩筆草隸,卓越前古。至於天文秀發,沈麗高朗,有唐三百年風雅之盛,帝實有以啓之焉。在位二十四年,諡曰文。集四十卷。館閣書目,詩一卷,六十九首。今編詩一卷。"
 },
 ...]


Github 主页:https://github.com/chinese-poetry/chinese-poetry

数据库官方页面:http://shici.store/

作者个人网站:https://jackeygao.io/

-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI算法各种资料、专业知识教程视频资料和与专家交流咨询!


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员