InnoDB,5项最佳实践,知其所以然?

2018 年 8 月 8 日 架构师之路

缓存讲了一个月《缓存架构,一篇足够》。今天,开始写数据库。


第一篇,说说MySQL两个最常用的存储引擎,MyISAM和InnoDB。照自己的理解,把一些知识点总结出来,不只说知识点,多讲“为什么”。

一、关于count(*)
知识点
MyISAM会直接存储总行数,InnoDB则不会,需要按行扫描


潜台词是,对于select count(*) from t; 如果数据量大,MyISAM会瞬间返回,而InnoDB则会一行行扫描。


实践:数据量大的表,InnoDB不要轻易select count(*),性能消耗极大。

常见坑:只有查询全表的总行数,MyISAM才会直接返回结果,
当加了where条件后,两种存储引擎的处理方式类似

例如
t_user(uid, uname, age, sex);

  • uid PK

  • age index


select count(*) where age<18 and sex='F';
查询未成年少女个数,两种存储引擎的处理方式类似,都需要进行索引扫描。

启示:不管哪种存储引擎,都要建立好索引。


二、关于全文索引
知识点
MyISAM支持全文索引,InnoDB5.6之前不支持全文索引

实践:不管哪种存储引擎,在数据量大并发量大的情况下,都不应该使用数据库自带的全文索引,会导致小量请求占用大量数据库资源,而要使用《索引外置》的架构设计方法。

启示:大数据量+高并发量的业务场景,全文索引,MyISAM也不是最优之选。

三、关于事务
知识点
MyISAM不支持事务,InnoDB支持事务

实践:事务是选择InnoDB非常诱人的原因之一,它提供了commit,rollback,崩溃修复等能力。在系统异常崩溃时,MyISAM有一定几率造成文件损坏,这是非常烦的。但是,事务也非常耗性能,会影响吞吐量,建议只对一致性要求较高的业务使用复杂事务。
画外音:Can't open file 'XXX.MYI'. 碰到过么?

小技巧:MyISAM可以通过lock table表锁,来实现类似于事务的东西,但对数据库性能影响较大,强烈不推荐使用。

四、关于外键
知识点
MyISAM不支持外键,InnoDB支持外键

实践:不管哪种存储引擎,在数据量大并发量大的情况下,都
不应该使用外键,而建议由应用程序保证完整性

五、关于行锁与表锁
知识点:MyISAM只支持
表锁,InnoDB可以支持行锁

分析
MyISAM:执行读写SQL语句时,会对表加锁,所以数据量大,并发量高时,性能会急剧下降。
InnoDB:细粒度行锁,在数据量大,并发量高时,性能比较优异。

实践:网上常常说,select+insert的业务用MyISAM,因为MyISAM在文件尾部顺序增加记录速度极快。楼主的建议是,绝大部分业务是混合读写,只要数据量和并发量较大,一律使用InnoDB。

常见坑
InnoDB的行锁是实现在索引上的,而不是锁在物理行记录上。潜台词是,
如果访问没有命中索引,也无法使用行锁,将要退化为表锁
画外音:Oracle的行锁实现机制不同。

例如
t_user(uid, uname, age, sex) innodb;

  • uid PK

  • 无其他索引


update t_user set age=10 where uid=1;
命中索引,
行锁

update t_user set age=10 where uid != 1;
未命中索引,
表锁

update t_user set age=10 where name='shenjian';
无索引,
表锁

启示:InnoDB务必建好索引,否则锁粒度较大,会影响并发。


总结
大数据量,高并发量的互联网业务场景下,对于MyISAM和InnoDB

  • 有where条件,count(*)两个存储引擎性能差不多

  • 不要使用全文索引,应当使用索引外置的设计方案

  • 事务影响性能,强一致性要求才使用事务

  • 不用外键,由应用程序来保证完整性

  • 不命中索引,InnoDB也不能用行锁


结论
大数据量,高并发量的互联网业务场景下,请使用InnoDB:

  • 行锁,对提高并发帮助很大

  • 事务,对数据一致性帮助很大

这两个点,是InnoDB最吸引人的地方。

几个小的知识点,希望大家有收获。有说的不对的,欢迎大家指正,共同讨论。谢


相关文章:

缓存架构,一篇足够

58到家MySQL军规升级版

登录查看更多
0

相关内容

数据库( Database )或数据库管理系统( Database management systems )是按照数据结构来组织、存储和管理数据的仓库。目前数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
67+阅读 · 2020年3月9日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
最佳实践:阿里巴巴数据中台
AliData
26+阅读 · 2019年7月26日
微软开源项目提供企业级可扩展推荐系统最新实践指南
微软研究院AI头条
4+阅读 · 2019年2月25日
Flink 靠什么征服饿了么工程师?
阿里技术
6+阅读 · 2018年8月13日
浅入浅出深度学习理论与实践
机器学习研究会
5+阅读 · 2018年2月28日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
解密谷歌机器学习工程最佳实践——机器学习43条军规
人工智能头条
3+阅读 · 2017年9月19日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
11+阅读 · 2018年9月28日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关资讯
最佳实践:阿里巴巴数据中台
AliData
26+阅读 · 2019年7月26日
微软开源项目提供企业级可扩展推荐系统最新实践指南
微软研究院AI头条
4+阅读 · 2019年2月25日
Flink 靠什么征服饿了么工程师?
阿里技术
6+阅读 · 2018年8月13日
浅入浅出深度学习理论与实践
机器学习研究会
5+阅读 · 2018年2月28日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
解密谷歌机器学习工程最佳实践——机器学习43条军规
人工智能头条
3+阅读 · 2017年9月19日
Top
微信扫码咨询专知VIP会员