数据重构和转换mysql到hdfs和mongodb

问题描述 投票:-1回答:1

我们正面临数据迁移问题。我们有两个负载很重的表。我们曾经实时进行连接并从两个表中获取聚合数据。由于尺寸的增加,我们希望在mongodb中迁移它,并使用具有平坦db布局的重构来克服连接。我研究了很多,但我无法弄清楚确切的工具或框架。 Sqoop和flume将表从一个系统直接迁移到另一个系统但不重建。我无法弄清楚Spring XD或apache nifi是否按照我的需要进行转换。

伪步骤如下

第1步(从第一个系统获取)

1)var a =从年龄> 10的信息中选择id,姓名,年龄;

第2步(从第一个系统获取)

2)var b =选择地址,来自professional_detail的收入,其中id = a.id;

第3步(插入第二个系统)

3)插入到aggregate_table(id,年龄,名称,收入,地址)值(a.id,a,age,a.name,b.income,b.address)

哪个是最适合此的确切框架或工具?我们只想做sql查询,bash命令和java代码。没有其他语言

mysql data-modeling data-migration bigdata
1个回答
0
投票

基于问题和评论,可以肯定地说您需要ETL解决方案。

当你提到一些工具时,你似乎正在关注Hadoop生态系统,在这个空间中,Spark似乎是最符合您要求的。

© www.soinside.com 2019 - 2024. All rights reserved.