来源/作者:飞总聊IT
数据猿官网 | www.datayuan.cn
今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·云+社区
1
这个系列的写作难度比大数据系列要难很多,需要查很多资料,所以进展只能很缓慢了。一周能够出一篇现在是我的极限。
上次讲到SQL的时候,有人对NULL有些误会:
作者理解成了C语言指针没正确初始化导致的access violation。这和SQL的NULL不是一回事。
也有人专门给我NULL的题来挖坑检测我的水平:
不但出题还是故意设置干扰项,读者不用这样刁难我吧。至于答案为什么是NULL,就要看各位理解这个邪恶的NULL在SQL里面到底是什么语义了。
当然倍感欣慰的是我写的有些东西,虽然言简意赅,做过数据库内核的人应该是感悟非常深刻的。比如说现在腾讯云的数据库负责人,极客时间mysql专栏的作者丁奇的一番感悟:
无论如何,我会努力更新下去。但是这个系列的文章快不起来,正常情况我一周能够花在公众号的时间也是固定的,所以大家耐心等待吧。
很多人常常问我,选择重要还是努力重要。我上大学前觉得努力最重要,后来一路努力,读PhD发论文了,又发现论文选题的时候选择更重要。再后来,毕业前夕赶上了经济危机,才发现命好比什么都重要。
发明SQL的两个人,一个SQL论文发出来的同一年就去见了上帝。另外一个活到了今天。前者什么都没有享受到,后者倍享了SQL发明的荣光,获得了无数的殊荣。你说这两位作者在选择和努力上有什么区别吗?没有。但是命好,活得久,享受到的就不一样。
今天的故事讲的是一个命非常好的人。
2
我们打开今天的每一本大学本科的数据库教材,前面几章大同小异。关系代数肯定是要讲的,SQL也是要讲的。但是是不是缺了一点什么?
是的,每本书的第一章,讲的既不是关系代数,也不是SQL,是一个叫做Entity-Relation的模型,简称E-R模型。仔细想一下,你上数据库的时候是不是从画ER图开始的?
ER模型就是有实体有关系,实体之间的关系有1对1,1对多,多对多。深一点的还要讲is和as的区别等等。无论如何,这是一个很简单的模型。
但是回头去问一下数据库领域的PhD们,他们在博士资格考试的必读论文里,乃至被成为宝典的数据库的红宝书,Michael Stonebraker写的数据库PhD必读的论文集Readings in Database Systems里,可能没有一个人见过关于ER模型的论文。
这个问题在我读PhD的时候困扰了我很久。我一度去问我的博士导师,他也很困惑的看着我。所以后来我就专门的开始了解这件事情。
这让我找到了一篇诞生于1975年的论文:
这篇诞生于1976年的TODS论文,经过我从DBLP进一步查,发现是1975年第一届VLDB的时候的论文之一:
TODS是ACM Transaction on Database Systems,算得上是最好的数据库领域的杂志。VLDB是数据库领域两大最牛的会议之一,另外一个是SIGMOD。可见ER模型的诞生,比数据库的关系模型要晚了一些,比起SQL来也晚了,但是也没有晚得特别的离谱。
3
论文唯一的作者是Peter Pin-Shan Chen,英文名Peter Chen,中文名陈品山,台湾人。网上我找了一张照片:
Peter Chen1973年毕业于哈佛大学计算机系,博士学位。毕业后进入MIT做Assistant Professor,期间发表了这篇ER模型的论文,算得上是非常早期的数据库研究人员。1978年因为没有通过终身教职的评选,离开了MIT去了加州大学洛杉矶分校。在那边待了5年之后去了路易斯安娜州立大学。
之后Peter Chen就在路易斯安纳州立大学待了下来。一直到他退休。期间虽然有各种各样的短期访问等等。他也在台湾的一些学校里挂兼职。
Peter Chen提出ER模型的动机是希望这个模型成为数据库的基础模型,去挑战数据库的关系模型。这个挑战以现在的结果来看,当然是失败了。
但是ER模型作为一个模型,是非常的成功。它的影响力不仅仅是成为了每本数据库教材的第一章,更是在软件工程的诸多领域都产生了广泛的影响。Peter Chen也因此获得了无数的容易,包括成为了IEEE,ACM,AAAS等诸多机构的fellow。
不但如此,Peter Chen还设立了两个以他名字命名的基金会,给优秀的青年教师们发奖。其中一个叫Peter Chen Award,另外一个叫做 Peter Chen Big Data Young Researcher Award。
Peter Chen这一辈子只发表了这一篇牛逼的论文,这和写了SQL的论文的作者很类似。但是Peter Chen这辈子因为这篇论文倍享荣光。只是,可能Peter Chen的野心是用ER模型去挑战数据库的关系模型,所以作为数据库圈子里最早的研究人员之一,他在数据库圈里的认可程度,异常的低。
好在ER模型墙里开花墙外香,Peter Chen缺了数据库领域的认可,也照样混得不是一般的好。当然,还是有些人跳出来替Peter Chen抱不平的。
有个很著名的华人学者,做OS的就曾经在一次VLDB上跳出来说数据库圈子里面的人对不起Peter Chen。一边用着对方的ER理论写教材,一边不给对方任何的认可。
不过数据库圈认可不认可应该都不重要了,彪悍的人生只需要一篇论文。
——————
相关阅读:
END