Mysql优化思路
首先构建脚本观察查询数,连接数等数据,确定环境原因以及内部SQL执行原因,然后根据具体原因做具体处理。
二、构建脚本观察状态
1 |
|
该命令可获取当前查询数量等信息,定时轮询并将结果重定向到文本中,然后处理成图表。
三、处理对策
1.若是规律性出现查询慢,考虑缓存雪崩问题。
对于该问题只需将缓存的失效时间处理成不要相近时间同时失效,失效时间尽量离散化,或者集中到午夜失效。
2.若非规律性查询缓慢,考虑设计缺乏优化
处理方法:
a:开启profiling记录查询操作,并获取语句执行详细信息
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
|
b:使用explain 查看语句执行情况,索引使用,扫描范围等等
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
c:相关优化手法
表的优化与列类型选择
列选择原则:
1:字段类型优先级 整型 > date,time > char,varchar > blob
原因:整型,time运算快,节省空间
char/varchar要考虑字符集的转换与排序时的校对集,速度慢
blob无法使用内存临时表
2:够用就行,不要慷慨(如 smallint,varchar(N))
原因:大的字段浪费内存,影响速度
以varchar(10), varchar(300)存储的内容相同,但在表联查时,varchar(300)要花更多内存
3:尽量避免使用NULL
原因:NULL不利于索引,要用特殊的字节来标注.
在磁盘上占据的空间其实更大
索引优化策略
1.索引类型
1.1 B-tree索引(排好序的快速查找结构)
注:Myisam,innodb中,默认用的是B-tree索引
1.2 hash索引
在memory表里,默认是hash索引,hash的理论查询时间复查度为O(1)
疑问:既然hash索引如此高效,为何不都用他?
a.hash函数计算后的结果是随机的,如果是在磁盘上放置数据,以主键为id为例,那么随着id的增长,id对应的行,在磁盘上随机放置。
b.无法对范围查询进行优化
c.无法利用前缀索引,比如在b-tree中,field列的值为“helloworld”,索引查询xx=hello/xx=helloworld都可以利用索引(左前缀索引),但hash索引无法做到,因为hash(hello)与hash(helloworld)并无关联关系。
d.排序也无法优化
e.必须回行,通过索引拿到数据位置,必须回到表中取数据.
2.b-tree索引的常见误区
2.1 在where条件常用的列上都加上索引
例:where cat_id=3 and price>100; //查询第3个栏目,100元以上的商品
误:cat_id和price上都加上索引。其实只能用上一个索引,他们都是独立索引.
2.2 在多列上建立索引后,查询哪个列,索引都将发挥作用
2.2 在多列上建立索引后,查询哪个列,索引都将发挥作用
正解:多列索引上,索引发挥作用,需要满足左前缀要求(层层索引)
以index(a,b,c)为例:
1 2 3 4 5 6 7 |
|
高性能索引策略
1.对于innodb而言,因为节点下有数据文件,因此节点的分裂将会变得比较慢,对于innodb的主键,尽量用整型,而且是递增的整型。
2.索引的长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多)。
3.针对列中的值,从左往右截取部分来建索引。
a.截的越短,重复度越高,区分越小,索引效果越不好
b.截的越长,虽然区分度提高,但索引文件变大影响速度
所以尽量在长度上找到一个平衡点使性能最大化,惯用手法:截取不同长度来测试索引区分度
区分度测试:
1 |
|
测试完成后可以按测试得出的最优长度建立索引
1 |
|
理想的索引
1.查询频繁
2.区分度高
3.长度小
4.尽量覆盖常用查询字段
纵横数据新上的美国站群服务器8C 现货
限量特价 速定! cn2限量一人3台
E5 16G 1T 8C 232IP
E5*2 32G 1T 8C 232IP
E5*2 32G 2T 8C 232IP
E5*2 32G 3T 8C 232IP
美国站群服务器 美国高防御服务器 欢迎在线客服