背景:

    最近项目处于开发期,基本每天都有测试版本提交测试,为保证测试顺利进行,测试库也需要进行同步,一开始是直接拿开发库的备份库进行恢复,覆盖掉测试库,但是随着测试的进行,测试人员开始反馈他们制造的测试数据没有了,就改变了数据库同步方法,使用navicat的结构同步功能进行结构同步,但是每次都点来点去的实在太麻烦,更改回滚是个麻烦事而且没有技术含量。无意间寻觅到一个工具schemasync,可以对比开发库与测试库的差别生成patch和revert两个sql文件,其中path是正向更改,revert是更改后的回滚脚本,自此同步数据库结构只需要潇洒的敲一个命令执行一个脚本。

 

安装要求:

  • Python 2.4,2.5,2.6其他版本没试过,我用的是2.6

  • MySQL要求是5.0以上,我使用的是Percona5.6

  • MySQLdb,1.2.1p2以上

  • SchemaObject 0.5.3以上,安装时会自动安装,为解决中文乱码问题,需要安装前,下源码更改源码手动安装,下面会讲到怎么更改

安装依赖包

yum install -y MySQL-python python 

安装:

  下载wget 

   tar -zxvf tar -zxvf SchemaSync-0.9.2.tar.gz

   cd SchemaSync-0.9.2

   sudo python setup.py install

使用方法:

   

Usage:

                schemasync [options] <source> <target>

                source/target format: mysql://user:pass@host:port/database

                        A MySQL Schema Synchronization Utility

Options:

  -h, --help            show this help message and exit

  -V, --version         show version and exit.

  -r, --revision      如果要生成的文件名称已经存在了,启用这个参数会给新文件加个序列号

  -a, --sync-auto-inc   同步自增长值,一般都不需要

  -c, --sync-comments   同步备注,备注对于后期数据库维护比较重要,建议启用

  --tag=TAG         为生成的文件打tag,会在文件名中体现

  --output-directory=OUTPUT_DIRECTORY

                        生成patch和revert文件的路径,必须是绝对路径,默认为当前                  工作路径

  --log-directory=LOG_DIRECTORY  设置日志文件的路径,必须是绝对路径,默认是output-                      directory,文件名为schemasync.log

                        

选项都很简单,没什么值得需要强调的。

为了后期维护方便,我们要求每个字段都有注释,但是用英文注释建表的人痛苦,看的人也不舒服,注释还是中文大家使用起来更好一些。那么问题就来了,使用--sync-comments参数中文会乱码,导致字段备注不可用了。在之前公司也也遇到过此类问题,表的注释使用中文会导致一些工具操作后变成乱码,大家也没在技术上去解决乱码问题,而是强制要求开发注释使用英文,但是执行效果并不好,最后导致很多表注释就变成个一堆乱码。究其根源是程序作者根本就没考虑中文等字符集的事,python脚本里根本就没指定字符集,链接数据库默认使用了latin1字符集,导致最后生成的两个文件是ansi编码的。解决中文乱码就需要指定链接数据库字符集并且指定程序使用utf8编码。

避免中文乱码的安装及更改源代码过程如下:

安装SchemaObject

    wget

    unzip master.zip

    cd SchemaObject-master/

    将此目录及子目录下的py文件全部添加#--coding:utf8--!--指定utf8编码

    schemaobject/connection.py添加红色代码,指定链接数据库时字符集

    def connect(self, connection_url):

        """Connect to the database"""

        kwargs = parse_database_url(connection_url)

        if not (kwargs and kwargs['protocol'] == 'mysql'):

            raise TypeError("Connection protocol must be MySQL!")

        kwargs['charset']='utf8'

        self.db = kwargs.get('db', None)

        self.host = kwargs.get('host', 'localhost')

        self.port = kwargs.get('port', 3306)

        self.user = kwargs.get('user', None)

       

        # can't pass protocol to MySQLdb

        del kwargs['protocol']

        self._db = MySQLdb.connect(**kwargs)

    schemasync/utils.py文件头部添加

    #--!--coding:utf8--!--

    import sys

    if sys.getdefaultencoding() != 'utf8':

        reload(sys)

        sys.setdefaultencoding('utf8')

    修改完成成执行如下命令安装软件

    python setup.py install

安装SchemaSync:

  下载wget 

   tar -zxvf tar -zxvf SchemaSync-0.9.2.tar.gz

   cd SchemaSync-0.9.2

  把下载下来的源码包中的py文件全部指定utf8字符集,即如下文件

[root@vm-template-centos10022 SchemaSync-0.9.2]# find ./ -name '*.py'

./ez_setup.py

./setup.py

./schemasync/schemasync.py

./schemasync/syncdb.py

./schemasync/utils.py

./schemasync/__init__.py

均添加#-*- coding:utf-8 -*-

修改完成后执行如下命令安装软件:

python setup.py install

安装完成后验证中文乱码问题已解决

每次都指定密码也比较麻烦,自己写了一个shell脚本,每次只需要指定源ip,目标ip,端口号,库名就可以

mysqlha_sync2test.sh

#!/bin/bash

s_host=$1

d_host=$2

port=$3

db=$4

mysql_path="/usr/local/mysql-5.6.24"

sync_time=`date +"%H%M%S"`

sync_date=`date +"%Y%m%d"`

s_user='db_read_user'

s_pwd='123456'

d_user='root'

d_pwd='123456'

schemasync --tag="${sync_time}" --output-dir="/data/mysql_schemasync" --sync-comments mysql://${s_user}:${s_pwd}@${s_host}:${port}/${db} mysql://${d_user}:${d_pwd}@${d_host}:${port}/${db}

patch_file="/data/mysql_schemasync/${db}_${sync_time}.${sync_date}.patch.sql"

if [ -f $patch_file ]

then

    cd ${mysql_path}&&./bin/mysql -h${d_host} -P${port} -u${d_user} -p${d_pwd} $db < "${patch_file}"

else

    echo "结构一致,不需要Migration操作"

fi