事实上,mysql数据库的备份是一个让管理员一直很头疼的问题。各种工具虽然不少,但是各有优劣,想找到一个比较完美的方法却非常困难。mysqldump作为数据的逻辑备份工具,弱点在于无法进行在线热备,同时在数据库比较大的时候,网站空间,备份和恢复的时间是在长得让人无法接受。mysqlhotcopy虽然克服了普通系统命令备份必须关闭mysql服务的尴尬,但是这东西只能用于备份使用myisam存储引擎的数据表,并且只能在类unix环境中使用。如果使用mysql replication的话,倒是可以解决热备问题。但是你需要承担增加一台服务器的成本。同时,如果数据被无意或恶意的篡改、删除,那么slave服务器上的数据同样不能幸免。
相对于以上方法,在中、大规模的mysql应用环境中,我推荐使用lvm快照的方式来制作备份。为什么这种方式比较好呢?
原因如下:
1、 在大多数情况下,这种方式几乎算得上是热备。它无需关闭服务,只需要设置只读或者类似这样的限制。
2、 支持所有基于本地磁盘的存储引擎,比如myisam、innodb和bdb,香港虚拟主机,还支持solid、primext和faction。
3、 备份速度最快,因为你只需要拷贝相关的二进制数据文件即可。
4、 由于只是简单的拷贝文件,因此对服务器开销非常低。
5、 保存方式多种多样,你可以备份到磁带上、ftp服务器上、nfs服务器上或者其他什么网络服务器,以及使用各种网络备份软件来备份。做到这些很简单,说到底就是拷贝文件而已。
6、 恢复速度很快。恢复所需要的时间等于你把数据拷贝回来的时间。你可以想出更多的方法让这个时间变得更短。
7、 无需使用昂贵的商业软件。
当然,每个事物都有其两面性,它也存在一些缺点:
1、 很明显,你的系统需要支持快照。
2、 在一些公司里,系统管理员和dba属于不同的团队。而使用快照需要系统root权限。因此,你可能需要做一些团队协调工作或者干脆在dba team里安插一个系统管理员。这种事在某些公司很容易,但也可能很麻烦。
3、 无法确切的预计服务停止时间。因为,这种方法到底什么时候算热备什么时候不算,完全取决于flush table with read lock命令执行时间的长短。因此,我还是建议你在凌晨干这件事情。或者干脆定下一个维护时间段(比如某些网络游戏运营商的做法)。
4、 如果你把日志放在独立的设备上或者你的数据分布在多个卷上,那么就比较麻烦了。因为这样一来你就无法得到全部数据的一致性快照,这就是所谓的多卷上的数据问题。不过,有些系统可能自动做到多卷快照。
现在,我们来看看如果使用lvm的快照功能来制作mysql备份。
当然,首先我们准备好相应的环境。配置一个lvm,并且划分合适大小的lv,并且将其挂载到mysql的数据文件目录上。在这个例子中,你可以看到我已经建立好了一个名叫tube的数据库,并且里面包含一个叫做testdb的表,香港虚拟主机,并且已经写入了一些数据。
[root@server1 mysql]# df -h
filesystem size used avail use% mounted on
/dev/sda2 9.5g 3.6g 5.5g 40% /
/dev/sda1 99m 10m 84m 11% /boot
tmpfs 506m 0 506m 0% /dev/shm
/dev/sda6 99m 5.6m 89m 6% /home
/dev/sda3 4.8g 238m 4.3g 6% /var
/dev/mapper/testvg-mysql
194m 27m 158m 15% /var/lib/mysql
[root@server1 mysql]# mysql
welcome to the mysql monitor. commands end with ; or \g.
your mysql connection id is 4 to server version: 5.0.22-log
type ‘help;’ or ‘\h’ for help. type ‘\c’ to clear the buffer.
mysql> use tube;
reading table information for completion of table and column names
you can turn off this feature to get a quicker startup with -a
database changed
mysql> select * from testdb;
+——+——-+
| id | name |
+——+——-+
| 1 | kevin |
| 2 | tube |
+——+——-+
2 rows in set (0.00 sec)
接下来,连接到mysql上,运行flush tables with read lock。需要注意的是,如果你正在执行一个耗时比较长的查询,那么这条命令可能需要很长时间才能完成。因为,在这个时候,flush talbes with read lock需要等待在这一刻所有正在执行的查询执行完毕,甚至是对数据毫无改变的select。所以,如果你正在执行一个较长时间的查询,那么要小心。推荐你在凌晨干这件事情,或者干脆定下一个维护的时间段(类似很多网络游戏公司那样)。如果你所有的表都只是用innodb存储引擎,并且不需要同步二进制日志的话,那么这一步可以省略。
mysql> flush tables with read lock;
query ok, 0 rows affected (0.00 sec)
