数据迁移的套路

URML 2020-05-04

数据迁移的类型

随着业务的发展，存储也会经常性的需要迁移。以下场景是我们开发过程中经常遇到的

业务、团队在快速扩张，需要适当时机进行微服务的拆分，需要独立的数据库，将数据从源数据库迁移到新的数据库
单表的记录数比较大，需要进行分库分表。需要将老表的数据迁移到新的分表中。
存储选型不对，比如关系型数据库的相互迁移， PG, MySQL,Oracle的相互迁移。NoSQL的Mongo,Cassandra,Hbase的相互迁移。
机房的迁移，自建机房到云的相互迁移

这些场景都需要进行数据迁移，虽然细节的方案有不同之处，但是也会有一些共同之处。

数据迁移的方案

数据迁移简单来说就是将数据从一个地方挪到另外一个地方。
数据迁移的套路
因为我们的数据不是静态的，所以我们不能随便写个job迁移就好了。需要确保一些迁移上的标准

标准

数据一致性
迁移完数据不能丢记录，单条记录的数据不能缺字段。

不停机
数据在不断的写入，不能为了阻止写入，而不允许数据写入，需要保证业务写入的可用性。

迁移过程可中断、可回滚
这点要求很高，是确保数据万无一失的策略。在迁移数据的各个阶段发现有问题，都可以回滚到原来的库，保证业务正常运行。

迁移方案

数据迁移的套路

为了达到上述要求，一般采用双写策略。也就是写两份，既往老的写，也往新的写。

收敛读写
读写的入口越多，后续需要进行开关切换的地方就越多，就越容易出错，所以要尽可能的先将所有的读写入口都收敛到一个地方
双写
将增量的数据同时写入到两个存储系统。确保新的写入代码没问题。双写以写入老的为准，老的写入成功代表操作成功了，写入新的失败了需要记录失败日志，分析为何失败，进行修正和补偿
将老的存量数据迁移过来
老的存量数据迁移就是通过遍历id，写入新的存储。具体的方案有很多。可以使用同步工具，比如binlog +flink来处理。数据量比较少的就直接遍历就行。
数据校验
数据的一致性校验是重中之重，确保两边数据的记录数，单条记录的数据完整性。如果数据量不多，一般是全量校验。数据量很多，可以抽样校验。
切换新的读
数据校验通过后，就可以切换到新的读，万一还有问题，可以切换到老的读。排查问题，重新来过。
停止双写
在新的存储中安全平稳的运行了N天后，就可以停掉老的读了，整个迁移过程完成了。

注意事项

对于后端服务，存储是基石，是重中之重。稳定性要求是最高的。一定要确保数据是平滑迁移的，对业务无感知。
同时存储是有状态的，迁移难度比较大，开发者需要具备前瞻性，尽量在选型的时候慎重，选择合适的数据库，避免进行数据库迁移。发现数据库选型有潜在的问题时，需要当机立断，尽早迁移。不要以为出现问题的概率不大，就拖延了。否则一旦出现问题，就是重大故障，造成的损失难以估量。

: URML

相关推荐

Redis migrate数据迁移工具的使用教程

在工作中可能会遇到单点Redis向Redis集群迁移数据的问题，但又不能老麻烦运维来做。为了方便研发自己迁移数据，我这里写了一个简单的Redis迁移工具，希望对有需要的人有用。该工具已经编译成了多平台命令，直接从Github下载二进制文件执行就好了。把代码

afanti 0喜欢 / 0评论 2020-09-16

AWS RDS-MySql数据手动迁移(涉及,视图触发器,存储过程,函数等数据)

mysqldump -h rds地址 -u 用户名 -p 密码 --single-transaction --routines --triggers --databases 导出数据库名称 --se

zjuwangleicn 0喜欢 / 0评论 2020-06-25

如何实现企业上云

云计算数据中心业务应用系统迁移采用平台专用软件并通过P2V V2V实现 P2V技术将系统数据、环境配置、应用软件和业务数据整体以“快照”形式导入云平台计算资源池中，转为虚拟机方式运行。迁移过程中原有服务临死中断，待验证新的虚拟机业务应用正常运行后进行系统切

DonviYang 0喜欢 / 0评论 2020-06-25

tornado硬件监控系统-连接数据库与数据迁移（2）

#连接数据创建元类做映射。导入模型的继承父类。#创建连接,echo输出日志。登录数据库，创建上面的数据库名字。数据迁移，终端运行：

zhangxuelong 0喜欢 / 0评论 2020-06-14

数据向云迁移的四个阶段，你的企业处于什么位置？

对于具有不同数据需求的企业来说，因为不同部门和职能可能处于不同的阶段，所以每个阶段都有业务驱动力，推动IT和数据专业人员进一步创建，完善和利用云数据管理，来制定更好的业务决策。那么在在扩展的云数据基础架构中的四个阶段，有哪些需要注意的地方?处于这个阶段的企

CodingCao 0喜欢 / 0评论 2020-06-09

redis 数据迁移

创建 redis 备份文件也可用命令 BGSAVE，该命令在后台执行。AOF刷新日志到disk的规则：。appendfsync always # 每次有写操作都进行同步，非常慢，非常安全。官方的建议的everysec，安全，就是速度不够快，如果是机器出

王道革 0喜欢 / 0评论 2020-06-05

Docker 数据目录迁移解决方案

在docker的使用中随着下载镜像越来越多，构建镜像、运行容器越来越多, 数据目录必然会逐渐增大；当所有docker镜像、容器对磁盘的使用达到上限时，就需要对数据目录进行迁移。根据上面查到的路径，移动整个/var/lib/docker目录到数据盘的目的路径

tosim 0喜欢 / 0评论 2020-06-03

数据迁移(2) - 如何快速迁移

不能遗漏数据，虽然事后我们有数据校验的过程，但是设计数据迁移方案时，需要尽可能的包装数据不丢失。迁移过程可中断，可重试。比如先迁移10分之一的数据，再继续来。因为有迁移速度的要求，我们将每个步骤进行分解，确保每个部分可以异步化，并发处理。qps都能达到万级

hellobabygogo 0喜欢 / 0评论 2020-05-17

Redis数据导入导出以及数据迁移的4种方法详解

因为这种方式比较简单，所以我就先介绍它。分两步来实现，第一步先让源 Redis 生成 AOF 数据文件。redis-cli -h 源RedisIP -a password config set appendonly yes. dir 目录，可以通过 con

xiancaione 0喜欢 / 0评论 2020-02-07

网站数据迁移 ssh命令复制备份

//不显示压缩信息文件夹压缩

仁鱼 0喜欢 / 0评论 2020-05-02

记一次服务器升级需要备份一下SVN 进行SVN数据迁移

　　或者在windows下，win+R键入cmd回车打开命令窗口cmd，进入下列目录：。　　然后执行命令备份/导出。　　执行完毕之后,可以在E:\**文件夹\文件中找到备份好的文件,格式为full.svn.bak 将其文件拷贝到目标机器，或是存储备

leehbhs 0喜欢 / 0评论 2020-04-29

MySQL数据库数据迁移：从一个服务器到另一个服务器

mysqldump -h远程ip -u用户 -p密码 -P3306 --default-character-set=utf8 --databases 单个或多个数据库名称空格分开 | mysql -h127.0.0.1 -uroot -p -P3306

点滴技术生活 0喜欢 / 0评论 2020-02-22

virtual box虚拟机跨物理机迁移

VirtualBox保存虚机数据的是vdi文件，但是直接拷贝在新的VirtualBox中不能打开，因为每个vdi文件都包含了一个uuid的数据，如果直接拷贝，uuid在新的VirtualBox中是不能用的，所以会打开失败，我们需要给在原来vdi的基础上，生

coolaaron 0喜欢 / 0评论 2019-12-24

60TB 数据量的作业从 Hive 迁移到 Spark 在 Facebook 的实践

Facebook 经常使用分析来进行数据驱动的决策。在过去的几年里，用户和产品都得到了增长，使得我们分析引擎中单个查询的数据量达到了数十TB。我们的一些批处理分析都是基于 Hive 平台和 Corona进行的。Facebook 还针对包括 Hive 在内的

ITqingliang 0喜欢 / 0评论 2019-12-24

redis cluster异地数据迁移，扩容，缩容

由于项目的服务器分布在重庆，上海，台北，休斯顿，所以需要做异地容灾需求。当前的mysql，redis cluster，elastic search都在重庆的如果重庆停电了，整个应用都不能用了。现在考虑第一步做重庆和上海的异地容灾，大概测试了一下重庆的几台服

MLXY 0喜欢 / 0评论 2019-12-23

杉岩数据银行Documentum迁移方案

数据完成迁移之后：影像系统通过MOS提供的检索接口检索对象，得到对象名，进而根据对象名称获取对象。杉岩数据提供的Documentum迁移方案，结合SandStone MOS特有的NAS纳管特性，只需要4天的时间完成存量数据纳管以及2小时的停机时间窗完成增量

nan00zzu 0喜欢 / 0评论 2019-12-19

elasticdump 迁移 elasticsearch 数据

折腾了一会nodejs耐心尽失，果断使用docker方式。如果将数据导出为文件形式，需要将宿主机目录挂载至容器上。Wed, 11 Dec 2019 09:45:35 GMT | got 16 objects from source elasticsearc

sifeimeng 0喜欢 / 0评论 2019-12-12

elasticsearch迁移数据到新索引中

因为业务原因，需要修改索引的映射的某个字段的类型，比如更改Text为Keyword。1）、先新建索引，映射最新的映射实体。2）、迁移老索引的数据到新索引中。下面使用elasticsearch-head插件操作

心丨悦 0喜欢 / 0评论 2019-12-09

迁移上云之前，要向云提供商提出三个安全问题！

大量案例证明，企业业务迁移上云是很好的一条途径，尽管如此，许多企业领导者表示，将他们的旧系统从本地硬件转移到云上仍然存在担心。在本地硬件上投入大量资金的公司可能不愿意在类似的部署上投入更多资金，尽管云有明显的优势。乐动体育LD90.VIP企业可能会担心，在

Ezenwang 0喜欢 / 0评论 2019-11-21

迁移上云之前，要向云提供商提出三个安全问题！

量案例证明，企业业务迁移上云是很好的一条途径，尽管如此，许多企业领导者表示，将他们的旧系统从本地硬件转移到云上仍然存在担心。在本地硬件上投入大量资金的公司可能不愿意在类似的部署上投入更多资金，尽管云有明显的优势。企业可能会担心，在内部部署情况下可以正常运行

lightcloudDotcc 0喜欢 / 0评论 2019-11-20

程序员过关斩将--数据库快速迁移10亿级数据

数据库采用Sqlserver 2008 R2，单表数据量21亿。无水平或者垂直切分，但是采用了分区表。分区表策略是按时间降序分的区，将近30个分区。所以在频繁插入新数据的情况下，索引调整所耗费的性能比较低。经过相关人员咨询，大约40%的请求为单条Inser

erliang00 0喜欢 / 0评论 2019-11-19

迁移学习中如何利用权值调整数据分布？DATL、L2TL两大方法解析

本文综述了两篇在迁移学习中利用权值调整数据分布的论文。通过这两个重要工作，读者可了解如何在迁移学习中进行微调的方法和理论。深度神经网络的应用显著改善了各种数据挖掘和计算机视觉算法的性能，因此广泛应用于各类机器学习场景中。然而，深度神经网络方法依赖于大量的标

CandraLee 0喜欢 / 0评论 2019-11-04

HBase实践 | HBase TB级数据规模不停机迁移最佳实践

有关HBase集群如何做不停服的数据迁移一直都是云HBase被问的比较多的一个问题，目前有许多开源的工具或者HBase本身集成的方案在性能、稳定性、使用体验上都不是很好，因此阿里云提供了BDS迁移服务，可以帮助云上客户实现TB级数据规模不停机迁移。HBas

lanyizhengblog 0喜欢 / 0评论 2019-10-20

跨“云”数据迁移——阿里云 RDS 迁移至腾讯云 TencentDB

云计算在成本低、高可用的优势下，快速占领着硬件市场，已经成为互联网社会不可或缺的基础设施。但是在企业IT采用云服务的过程中，除了需要考虑到成本更需要关注风险分散。由于IT系统复杂、耦合度高、分布地域广等原因，单一的云服务商很难满足其全部需求。因此，业务部署

TencentTEG 0喜欢 / 0评论 2019-08-06

数据迁移工具Sqoop和DataX功能比较

最近由于项目需要，对Apache Sqoop和Taobao DataX工具进行了调研，这里是对二者功能的初步梳理，不会涉及技术细节和使用方法，留作日后选型参考。Sqoop是Apache下的顶级项目，用来将Hadoop和关系型数据库中的数据相互转移，可以将一

lxypeter 0喜欢 / 0评论 2017-08-09

gitlab 数据目录迁移

一般情况下，采用gitlab作为版本管理工具，内网环境需要搭建gitlab服务器，安装好gitlab应用之后，就开始使用，但是随着时间的推移，发现gitlab的repository会越来越大。一般，从运维角度而言，都会为gitlab的repository提

happyfreeangel 0喜欢 / 0评论 2019-10-30

oracle primavera p6自带工具数据迁移

双击打开，填写源数据的地址，用户，密码，下一步，填写批量处理条数，下一步需要等待很长时间直到完成。

大象从不倒下 0喜欢 / 0评论 2016-04-18

RPA助力医院数据迁移，如何做到经济与效率兼得？

RPA最合适的业务场景，除了重复有规律的工作流之外，还有就是要求业务系统稳定。其实医院的业务系统一旦业务流程确定，基本上在很长一段时间内不会升级变动，所以医院的非常适合使用RPA机器人。某综合医院为提高就医体验，针对一些需要持续健康管理的患者和有更高医疗体

kx0 0喜欢 / 0评论 2019-09-19

python 动态迁移solr数据过程解析

上项目的时候，遇见一次需求，需要把在线的其中一个 collection 里面的数据迁移到另外一个collection下，于是就百度了看到好多文章，其中大部分都是使用导入的方法，没有找到在线数据的迁移方法。于是写了python脚本，分享出来。在respon

etnahh 0喜欢 / 0评论 2019-09-04

SolrCloud 5.0 路由、Collection创建与数据迁移

SolrCloud的设计是为了提供高可用、容错，在分布式环境中进行内容索引和查询请求。SolrCloud 5.0，对自带的SolrCloud的启动脚本进行了改进，启动SolrCloud变的异常简单，执行。compositeId路由实现上述需求稍微麻烦一下，

devefx 0喜欢 / 0评论 2017-04-11

MySQL数据库迁移上云数据搬“家”不用愁

云上数据库能提升对数据库的使用及管理效率，给企业带来了很大经济效益。RDS服务助力数据库平稳高效迁移传统的MySQL 迁移主要是围绕着数据做工作，所以要保证业务平稳持续地运行的前提下做备份恢复。RDS能保障数据迁移时业务中断控制在分钟级，保证数据0丢失，操

一片荷叶 0喜欢 / 0评论 2019-09-07

使用 mysqldump 迁移 MySQL 数据企业实战

使用 mysqldump 工具的优点是简单易用、容易上手，缺点是停机时间较长，因此它适用于数据量不大，或者允许停机的时间较长的情况。迁移后的表不区分大小写，统一变为小写。已购买云服务器 ECS。在正式迁移之前，需要先在本地数据库中创建迁移账号，并将要迁移的

BeautifulApple 0喜欢 / 0评论 2019-03-07

laravel 数据迁移与 Eloquent ORM的实现方法

数据库可以说是后端开发最常用，也是最重要的部分。laravel 提供了很实用的 Eloquent ORM 模型类，简单、直观的与数据库进行交互。同时使用数据迁移管理数据库，可以与团队进行共享以及编辑。二者的更多介绍请查看下方的文档。请勿将本示例带入实际项目

Lingforme 0喜欢 / 0评论 2019-04-12

oracle数据迁移建表空间用户数据泵

创建路径，分配权限 create directory dir_dp as 'c:\';grant read,write on directory dir_dp to ttptest;*****************创建湖南用户 dmp文件 ttp_hn

javamao00 0喜欢 / 0评论 2014-12-23

hadoop 0.20.203 数据迁移至 cdh3u3

假如用hadoop0.20.203版本，hbase会提示hdfs不支持append特性而可能会导致数据丢失，而且事实上，这种情况在我们系统中已经遇到，在写数据的时候，rs挂掉，数据丢失。暂时准备把hadoop迁移到cdh3u3上，因为是不同版本之间的迁移，

NeboFeng 0喜欢 / 0评论 2012-08-29

lucene相关总结

第二天上午一来重新整理思路，奇怪的问题不能按常规的方法进行处理，回顾这次在产品站上的操作除了新功能的发布外还作了数据迁移，而这套系统一大特点就用了lucene技术，既然进行了数据迁移是不是应该进行重建索引，是不是因为数据迁移而导致索引不一致才导致程序找不到

oklinsong 0喜欢 / 0评论 2012-02-24

MySQL向Hive/HBase的迁移工具

ApacheHive是目前大型数据仓库的免费首选产品之一，使用ApacheHive的人是不会期望在小数据量上做什么文章，例如把MySQL中的数据搬到Hive/HBase中去，那样的话原先很快能执行完毕的SQL，估计在Hive上运行跟原来相比时间延长10倍都

leys 0喜欢 / 0评论 2011-04-21

华夏银行大集中核心业务系统数据迁移项目【转】

华夏银行采购国外核心业务系统产品来建设新的大集中核心业务系统，数据迁移是在保证全行各业务正常运营的情况下，实现数据从旧系统通过数据清理、筛选、分析、计算、调整等处理变为满足新一代核心业务系统的数据要求。整个迁移工作必须做到各系统的数据源数据能够准确、完整、

chenhui 0喜欢 / 0评论 2010-08-05

华夏银行大集中核心业务系统数据迁移项目【转】

华夏银行采购国外核心业务系统产品来建设新的大集中核心业务系统，数据迁移是在保证全行各业务正常运营的情况下，实现数据从旧系统通过数据清理、筛选、分析、计算、调整等处理变为满足新一代核心业务系统的数据要求。整个迁移工作必须做到各系统的数据源数据能够准确、完整、

wujun 0喜欢 / 0评论 2010-06-07

数据迁移：在新旧系统中切换数据

在信息化建设过程中，随着技术的发展，原有的信息系统不断被功能更强大的新系统所取代。从两层结构到三层结构，从C/S到B/S。在新旧系统的切换过程中，必然要面临一个数据迁移的问题。数据迁移，就是将这些历史数据进行清洗、转换，并装载到新系统中的过程。数据迁移的质

Ctommy 0喜欢 / 0评论 2009-04-08

hapi框架搭建记录(三)：Joi数据校验和Sequelize(数据迁移、填充数据)

hapi框架，用官网的简介来说就是：Hapi是构建应用程序和服务的丰富框架，它使开发人员能够专注于编写可重用的应用程序逻辑，而不是花时间构建基础设施。用自己的话简单来说，就是个类似express，koa之类的node服务基础框架。此篇博客是在阅读过掘金小册

nxcjh 0喜欢 / 0评论 2019-07-01

贝壳金服 TiDB 在线跨机房迁移实践

公司介绍贝壳金服是专注居住场景的金融科技服务商，起步于2006年成立的链家金融事业部，并于 2017年3月正式独立运营。截至2018年底，贝壳金服业务已覆盖全国90多个城市及地区，为超过130万用户提供了金融服务。现有集群已经使用 100 多个 Synce

BusterZR 0喜欢 / 0评论 2019-07-01

21世纪了还愚公移山？数据库这么迁移更稳定！

背景在系统的快速迭代过程中，业务系统往往部署在同一个物理库，没有做核心数据和非核心数据的物理隔离。随着数据量的扩大这种情况会带来稳定性的风险，如库的慢sql，磁盘，IO等等都会相互整体影响，从而影响核心系统的业务稳定性，因此需要将核心业务的业务表从原有库里

欢子 0喜欢 / 0评论 2019-07-01

windows下重装xampp并做mysql数据迁移的步骤

背景因为windows系统升级，导致原来安装的xampp的文件目录损坏，造成了xampp无法启动，需要重新安装xampp来解决服务器重启以及数据库的转移

jacklife 0喜欢 / 0评论 2019-07-01

【columnstore】mariadb columnstore 数据迁移

# mcsmysql -h 192.168.16.14 -uroot -p -P 4066 -q -e 'select * from new_users;' -N 'test' | cpimport -s '\t' -n 1 'test' 'new_use

89214456 0喜欢 / 0评论 2019-06-30

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

背景 08年左右，阿里巴巴开始尝试MySQL的相关研究，并开发了基于MySQL分库分表技术的相关产品，Cobar/TDDL，解决了单机Oracle无法满足的扩展性问题，当时也掀起一股去IOE项目的浪潮，愚公这项目因此而诞生，其要解决的目标就是帮助用户完成从

TheBeatles 0喜欢 / 0评论 2016-03-05

laravel 数据迁移与 Eloquent ORM

导语数据库可以说是后端开发最常用，也是最重要的部分。laravel 提供了很实用的 Eloquent ORM 模型类，简单、直观的与数据库进行交互。同时使用数据迁移管理数据库，可以与团队进行共享以及编辑。二者的更多介绍请查看下方的文档。请勿将本示例带入实际

c0a0c 0喜欢 / 0评论 2019-06-30

[转载]在线数据迁移经验：如何为正在飞行的飞机更换引擎

在线数据迁移，是指将正在提供线上服务的数据，从一个地方迁移到另一个地方，整个迁移过程中要求不停机，服务不受影响。根据数据所处层次，可以分为cache迁移和存储迁移；根据数据迁移前后的变化，又可以分为平移和转移。平移是指迁移前后数据组织形式不变，比如Mysq

KANSYOUKYOU 0喜欢 / 0评论 2015-02-25

JSON数据从MongoDB迁移到MaxCompute最佳实践

数据及账号准备首先您需要将数据上传至您的MongoDB数据库。本例中使用阿里云的云数据库 MongoDB 版，网络类型为VPC，测试数据如下。访问地址及端口号可通过在MongoDB管理控制台点击实例名称获取，如下图所示。")，用于存放JSON数据

qinggebuyao 0喜欢 / 0评论 2019-06-29