电商数据库设计及架构优化1(数据库开发规范)

原创 王明昌  2018-06-30 21:12 

### 数据库规范
数据库命名规范
所有数据库对象名称必须使用**小写**并且用下划线分割
数据库名称禁止使用数据库关键字(关键字需要使用反向单引号区分)
数据库命名最好见名知意,最好不要超32字符
临时表以tmp为前缀,并以日期为后缀
备份表以bak为前缀,并以日期为后缀,方便识别
所有存储相同数据的列名和列类型必须一致

所有表最好使用Innodb存储引擎
支持事务,行级锁,更好的恢复性,高并发下性能好
数据库和表的字符集统一使用utf8
汉字占3字节,ascii码占1字节
所有表和字段都需要加注释
进行数据字典的维护
控制单表数据量大小,建议在500万行以内
可使用历史数据归档,分库分表进行 控制数据量大小
谨慎使用MySQL分区表
建议使用物理分表的方式管理大表
MySQL限制最多存储4096列
减少磁盘io
有效利用缓存,避免读入无用的冷数据
禁止在表中建立预留字段
预留字段难做到见名知意
预留字段的类型
禁止在数据库存储图片/文件等二进制数据
禁止在线上数据库进行压力测试
禁止从开发环境/测试环境直连生产环境数据库

### 索引设计规范
1.限制每张表上索引的数量,建议每张表索引不超过5个
禁止给每一列都建立单独的索引
2.每个innodb表必须有一个主键
不使用UUID/md5/hash,字符串作为主键
主键是唯一非空的值

3.常见索引列的建议(在那些列上建立索引)
1.select/update/delete的where从句中的列建立
2.包含在order by / group by / distinct 中的字段
3.多表join的关联列

4.如何选择索引列的顺序
1.区分度最高的列放在联合索引的最左侧
2.尽量把字段长度小的列放在联合索引的最左侧
3.使用最频繁的列放在联合索引的最左侧

5.避免建立冗余索引和重复索引
6.对于频繁使用的查询优先考虑使用覆盖索引
例如:查询库存量
好处:
1.避免innodb表进行索引的二次查找
2.可以吧随机io变成顺序io,加快查询效率
7.尽量避免使用外键约束

### 数据库字段设计规范
1.优先选择符合存储需要的最小的数据类型
1.1尽量把字符串转化为数字类存储
例: INET_ATON('255.255.255.255')=4294967195
INET_NTOA(4294967195)='255.255.255.255'
1.2对于非负型的数据,优先使用无符号整型
1.3varchar(N)中的n代表的是字符数,而不是字节数
使用utf8存储汉字varchar(255)=765字节,可存255个汉字
1.4避免使用text/blob数据类型
text/blob数据类型的只能使用前置索引,并且是没有默认值的
会进行二次查询
不在内存读取,而通过磁盘读取
1.5避免使用enum数据类型
修改enum值必须使用alter语句
enum类型的order by 操作效率低,需要额外的操作
禁止使用数值作为enum枚举值
1.6尽可能的把所有列定义为not null
1.7使用timestamp或datetime存储时间
timestamp 存储年月日时分秒(4字节)1970/01/01/00:00:01--2038/01/19/03:14:07
datetime 存储年月日时分秒(8字节) 几乎不受限制
1.8金额相关的,必须使用decimal

### 数据库的sql开发规范
1.建议使用预编译语句进行数据库的操作
减少sql注入风险
减少sql编译的时间
SELECT SQRT(POW(?,2)+POW(?,2)) AS hypotenuse;
SET @a=3;
SET @b=4;
EXECUTE stmt1 USING @a,@b;//编译并绑定编译的对象
.......//释放语句
2.避免数据类型的隐式转换
隐式转换会进行索引的失效
SELECT *from use where id='111';(id字段数据类型为整型,这里输入的是字符串)
3.合理利用存在的索引,而不是增加索引
避免使用双%的查询条件
一个收sql只能利用到复合索引中的一列进行范围查询
使用left join 或not exists 来代替not in 操作(not in 也会造成索引失效)
4.程序连接不同数据库使用不同的账号,禁止跨库查询
优点:
1.为数据库迁移和分库留出余地
2.降低业务的耦合度
3.避免权限过大而产生的安全风险
5.禁止使用select * 全字段查询
缺点:
1. 消耗更多的cpu和io以及网络带宽资源
2. 无法使用覆盖索引的
优点:可减少表结构变更带来的影响
6.禁止使用不含字段列表的insert语句
insert into t values('a','b'); ❌
insert into t (c1,c2) values('a','b');✔️
可减少数据表的变更对数据造成影响
7.避免使用子查询,可以把子查询优化为join查询
缺点:
1. 子查询的结果无法使用索引
2. 会产生临时表,如果数据量大则会影响效率
3. 消耗过多的CPU和io资源
8.避免使用join关联太多的表
缺点:
1. 每多关联一个表多占用一部分内存
2. 会产生临时表操作,影响效率
MySQL最多可以关联61个表,建议不超过5个
9.减少同数据库的交互次数
1. 数据库更适合处理批量操作
2. 合并多个相同的操作到一起,提高处理效率

10.使用in 代替 or
in的值不要超过500个
in操作可以有效地利用索引
11.禁止使用 order by rand()进行随机排序
使用在程序中获得随机值,然后从数据库中获取
12.where从句中禁止对列进行函数转换和计算
缺点:
1. 会导致无法使用索引
13.在明显不会有重复值时使用union all 而不是union
union会把所有数据放到临时表中在进行去重操作
union all不会对结果集进行去重操作
14.拆分复杂的大sql为多个小sql
mysql 一个sql只能使用一个cpu进行计算
拆分后可提高效率

本文地址:https://www.wangmingchang.com/3988.html
关注我们:请关注一下我们的微信公众号:扫描二维码王明昌博客的公众号,公众号:wmc365
版权声明:本文为原创文章,版权归 王明昌 所有,欢迎分享本文,转载请保留出处!

发表评论


表情