docs/数据库/MySQL/基础.md · cxylk/Java-Notes

1、给一个表加字段，或者修改字段，或者添加索引，需要扫描全表的数据

2、InnoDB的数据是按数据页为单位来读写的。

所以，当需要读一条记录的时候，并不是将这个记录本身从磁盘读出来，而是以页为单位，将其整体读入内存。每个数据页的大小默认是16kb

3、扫描行数是影响执行代价的因素之一。扫描的行数越少，意味着访问磁盘数据的次数越少，消耗的CPU资源越少。当然，扫描行数并不是唯一的判断标准。

4、在保证逻辑正确的前提下，尽量减少扫描的数据量，是数据库系统设计的通用法则之一。

关于count

InnoDB为什么不跟MyISAM的实现一样呢？因为多版本并发控制MVCC的原因，即一个记录存在多个版本。

count()的语义：count()是一个聚合函数，对于返回的结果集，一行行地判断，如果count函数的参数不是null，累计值就加1，否则不加，最后返回累计值。

count(*)、count(1)、count(主键id)都表示返回满足条件的结果集的总行数；而count(字段)则返回满足条件的数据行里面参数不为NULL的字段。

对于count(主键id)来说，InnoDB引擎会遍历整张表，把每一行的id值取出来，返回给server层，server层拿到id后，判断是不可能为空的，就按行累加。

对于count(1)来说，InnoDB遍历整张表，但不取值。server层对于返回的每一行，放一个数字“1”进去，判断是不可能为空的，就按行累加。

从这里看出，count(1)执行得要比count(主键id)快，因为从引擎返回id会涉及到解析数据行，以及拷贝字段值的操作。

对于count(字段)来说：

但是count(*)是例外，并不会把全部字段取出来，而是专门做了优化，不取值。count(*)肯定不是null，按行累加。

结论：按照效率排序的话：count(字段)<count(主键id)<count(1)≈count(*)