这两天有空看了一下ppc2009大会的一些pdf,发现这次关于replication的讨论还是很多的,很多内容都很实用,就总结了一下。本人英文水平水平有限,难免有翻译的不对的地方,有疑问欢迎讨论:)
replication延时的类型
1. 固定性的延时
——slave的数据持续性的落后于master并且一直无法与master的数据保持一致。
——slave的数据经常在白天落后于master,而在晚上可以赶上并与master的记录保持一致。
这种类型的延时通常是由于slave服务器的负载已经到达了上限或在白天访问量大的时候到达上限造成的。
2. 非固定性的延时
——slave的数据只是短暂的落后于master,可在短时间内恢复
这类型的延时通常与批量任务和报表有关,效率差的查询也会导致这类延时
mysql replication的限制
mysql的replication是单线程的,意味着只能有效的使用一个cpu内核和一个磁盘,一条复杂的查询或者事务都导致进程被阻塞,不过现在针对5.1版本的多线程replication补丁,[url=http://forge.mysql.com/wiki/replicationfeatures/parallelslave]http://forge.mysql.com/wiki/replicationfeatures/parallelslave,还是pre版,有很多限制,感兴趣的可以去看看。
replication的容量
1. 理解什么是replication的容量
可以将replication暂停一个小时,重新启动replication后,观察slave的数据多久可以与master一致。从replication重新启动到和master数据一致所花费的时间与replication暂停的时间的比值就是replication的容量。
2. 建议保持replication的容量在3倍以上,即延迟一个小时的数据,slave只需要20分钟就能与master的数据一致。
replication的优化
1. 5.0的mysql中避免类似以下的更新语句
insert … select
update .... where
复杂的查询会导致replication线程阻塞。如果是insert或update与select结合的语句,可以讲select单独执行并保存在临时表中,然后再执行insert或者update。
如果使用的是5.1的mysql,新功能中的行级replication(rbr)可以解决这个问题。rbr可以将在master上通过复杂查询后更新的结果直接传给slave,slave可以直接将结果更新到数据库中。
2. 避免大的事务
太大的事务会造成replication长时间阻塞,数据会严重滞后于master。
slave服务器的硬件选择
更快的cpu内核,对于单线程的replication多核cpu是没有任何优势的。
更高速的硬盘,包括更高的转速和更好的高速缓存命中率,如果有钱的话上ssd吧
主从结构的扩展性问题
1. 如何降低写操作的频率
master的写操作会扩散到所有的slave上,所以高频率的写操作会降低slave的读操作效率。
至少保持一台slave做全库同步,其他的slave可以只做部分表的同步。当然,这需要web应用程序的配合来分配哪些查询读哪些slave。
将一些更新操作放到memcached中,例如session和计数器。
slave使用myisam引擎
将一些写入量很大的更新操作直接在slave上执行,而不通过replication。
2. 如何更有效的利用slave的硬件资源
使用分区
有选择的对表进行同步
在slave上对数据进行归档。
session的持久化
为不同的应用服务器分配不同的slave进行读操作。
或者根据查询类型的不同来分配不同的slave。
3. 如何使你的程序最大化的利用slave
将对数据更新不敏感的查询放到slave上,而需要实时数据的查询则放到master。
通过session的持久化,让做了修改的用户首先看到修改的内容,其他的用户可以等待slave更新后再查看新内容。
对于某些数据,可以用memcached来存放数据的版本号,读slave的程序可以先对比slave的数据和memcached数据的版本,如果不一致则去读master。用户和博客类的信息可以用这种方法。
在查询前可以通过show slave status检测slave的状态,然后根据返回的结果进行服务器的选择。
from http://www.chinaunix.net/old_jh/17/1479454.html
