[转帖]tungsten replicator:数据迁移利器【mysql 数据同步到 mongodb】_MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  MySQL, Oracle及数据库讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 1696 | 回复: 0   主题: [转帖]tungsten replicator:数据迁移利器【mysql 数据同步到 mongodb】        下一篇 
嘻嘻鼠霸
注册用户
等级:新兵
经验:66
发帖:3
精华:0
注册:2016-9-25
状态:离线
发送短消息息给嘻嘻鼠霸 加好友    发送短消息息给嘻嘻鼠霸 发消息
发表于: IP:您无权察看 2018-5-31 15:47:22 | [全部帖] [楼主帖] 楼主

tungsten-replicator 是一款开源的、高性能、跨数据库系统的复制引擎,可用作多种场景下的数据迁移组件。本文尝试利用该工具实现 mysql 数据到 mongodb 的同步。

一、初始环境设置:
103 主机:mysql 服务器,开启 log-bin,binlog_format 设置为 row 格式;端口 3700;安装过程不赘述
104 主机:mongodb 服务器;端口 225032;安装过程不赘述
两台机器有一个同名的账户,这里用默认的机器账户 webroot,两台机器配置信任关系,相互之间可免密码登录
二、配置同步账户:
登录 mysql 主机,为 tungsten-replicator 进程授权,因为这里 tungsten-replicator 是本机安装,故授权 ip 是 103;权限类型至少需要 replication slave、replication client、create database ,还需增删查改,建议授权 all privleges.

grant all privilegs on . to tungsten@'103' identified by ''tungsten;


三、下载 tungsten-replicator:
二进制压缩包下载网址: https://code.google.com/archive/p/tungsten-replicator/downloads
或者 githup 源码下载网址:https://github.com/vmware/tungsten-replicator
四、解压安装:
在 103 主机执行如下操作:

tar -zxf tungsten-replicator-2.2.0-292.tar.gz cd tungsten-replicator-2.2.0-292 ./tools/tpm install mysql2mongodb --dataservice-schema=qqnews_main --datasource-mysql-conf=/data/webroot/myrocksandmysql57/mysql57/etc/my.cnf --enable-heterogenous-master=true --install-directory=/data/webroot/tp_mysql --master=10.62.19.103 --replication-password=tungsten --replication-user=tungsten --skip-validation-check=InstallationScriptCheck --skip-validation-check=MySQLDefaultTableTypeCheck --start-and-report=true


在 104 主机执行如下操作:

tar -zxf tungsten-replicator-2.2.0-292.tar.gz cd tungsten-replicator-2.2.0-292 ./tools/tpm install mysql2mongodb --datasource-type=mongodb --enable-heterogenous-slave=true --install-directory=/home/webroot/tp_mongodb --master=10.62.19.103 --members=10.49.82.222 --replication-port=25032 --skip-validation-check=InstallationScriptCheck --start-and-report=true --topology=master-slave


参数解释:mysql2mongodb 是服务名字,唯一标识一对数据迁移服务;mysql 端通过 master 参数、datasource-mysql-conf 中包含的端口信息、replication-user、replication-password 信息连接上指定实例,之后同步 dataservice-schema 库数据;mongodb 端通过 members 参数、replication-port 连接指定的 mongo 实例(也可以是 mongos 入口),然后进行同步。如果 mongo 端同样做了授权:详细参数参见 ./tool/tpm help install 。

执行完成后,看到 state 是 ONLINE 状态即说明成功。此时可以看到在 install-directory 目录下如下:ls backups relay releases service_logs share thl tungsten

这步骤安装时候一直不能通过:当时报错是:

原因为配置 ssh 信任关系时候,两台机器可以相互登录,但本机不能免密码登录本机。分别将自己的密钥添加到认证文件中就好了;

另公司内为了安全,ssh 端口非默认的 22,那么这步安装时候要加参数: --net-ssh-option=port=36000 。

五、查看同步状态:

 cd /home/webroot/tp_mongodb cd tungsten/tungsten-replicator/ ./bin/trepctl status Processing status command... NAME VALUE ---- ----- appliedLastEventId : mysql-bin.000450:0000000000003937;59 appliedLastSeqno : 47980 appliedLatency : 0.635 channels : 1 clusterName : mysql2mongodb currentEventId : mysql-bin.000450:0000000000003937 currentTimeMillis : 1475138537477 dataServerHost : 10.62.19.103 extensions : host : 10.62.19.103 latestEpochNumber : 47957 masterConnectUri : thl://localhost:/ masterListenUri : thl://10.62.19.103:2112/ maximumStoredSeqNo : 47980 minimumStoredSeqNo : 0 offlineRequests : NONE pendingError : NONE pendingErrorCode : NONE pendingErrorEventId : NONE pendingErrorSeqno : -1 pendingExceptionMessage: NONE pipelineSource : jdbc:mysql:thin://10.62.19.103:3700/ relativeLatency : 88699.477 resourcePrecedence : 99 rmiPort : 10000 role : master seqnoType : java.lang.Long serviceName : alpha_mysql serviceType : local simpleServiceName : mysql2mongodb siteName : default sourceId : 10.62.19.103 state : ONLINE timeInStateSeconds : 179684.874 transitioningTo : uptimeSeconds : 179687.108 useSSLConnection : false version : Tungsten Replicator 2.2.0 build 292 Finished status command...


输出解释:status 状态表示同步进程工作状态,若有报错则会在这里看到。

起停同步进程:

cd /data/webroot/alpha/tungsten/tungsten-replicator ./bin/replicator restart


上下线数据迁移服务:

./bin/trepctl offline


默认是基于 binlog 全库开始同步,指定同步特定库表:

cd /data/webroot/alpha/tungsten/tungsten-replicator ../tools/tpm update mysql2mongodb --repl-svc-extractor-filters=replicate --property=replicator.filter.replicate.do=qqnews_main.test_fulltext


从指定的 pos 点开始同步:

cd /data/webroot/alpha/tungsten/tungsten-replicator && ./bin/trepctl offline ./bin/trepctl online -from-event mysql-bin.000006:1029

六、验证数据同步效果:
mysql 端建立一张表,并插入一条数据; use qqnews_main;craete table t (id int);insert into t set id=1;

mongo 端进行验证: use qqnews_main;db.t.find();

该步骤如果执行完成后,数据未能实时同步,可以通过./bin/trepctl 的输出配合进行调试。

七、缺点:
通过 tungsten-replication 同步之后的数据没法进行 check 比对,只能依赖业务层面 check
基准数据需要人工导入
部分 DDL 语句不能正常同步,如 drop table;drop database 等。




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论