使用kettle将1亿数据导入mysql

一、导入思路二、准备一份亿级数据t_user.txttxt中数据只有连个字段，用;隔开，如下0;程序不就是0和1_01;程序不就是0和1_12;程序不就是0和1_2...可以通过一下程序生成生成的文件大约4G主要mysql所在的磁盘预留足够空间，由于有binlog日志和数据，所以大约会占用15G。三、建立数据库表t_user四、运行kettle1.在左侧转换，点击新建，在核心对象的【输入】中选择文

Blueeyedboy521

3007人浏览 · 2022-03-30 10:44:56

Blueeyedboy521 · 2022-03-30 10:44:56 发布

一、导入思路

在这里插入图片描述

二、准备一份亿级数据t_user.txt

txt中数据只有连个字段，用;隔开，如下

0;程序不就是0和1_0
1;程序不就是0和1_1
2;程序不就是0和1_2
.
.
.

可以通过一下程序生成
在这里插入图片描述
生成的文件大约4G
主要mysql所在的磁盘预留足够空间，由于有binlog日志和数据，所以大约会占用15G。

三、建立数据库表t_user

在这里插入图片描述

四、运行kettle

在这里插入图片描述

1.在左侧转换，点击新建，在核心对象的【输入】中选择文本，然后拖入右侧工作面

在这里插入图片描述
浏览选择文件t_user.txt，并且点击增加，添加到选中的文件

2.配置字段

在这里插入图片描述

3. 选择【输出】点击表输出，拖入到右侧工作面，配置mysql连接

在这里插入图片描述

3. 配置表输出

1）、选择目标表t_user

2）、配置提交记录数10000，表示每一万提交一次事务

3）、配置连接池，初始化100，命令参数，配置默认提交是false;其他保持默认

在这里插入图片描述

4）、配置选项，关闭预编译等

在这里插入图片描述
useServerPrepStmts:false；关闭预编译
useCompression:true；使用压缩
rewriteBatchedStatements:true；批量写入

4. 输入配置中切换到内容

配置分隔符;
模式设置mixed

在这里插入图片描述

5. 表输出设置线程数量

在表输出点击右键【改变开始复制的数量】设置10

6. 建立数据流向

在这里插入图片描述

7.启动迁移

在这里插入图片描述
可以发现多线程，mac测试15分钟左右导完

8.查询

在这里插入图片描述

技术共进，成长同行——讯飞AI开发者社区

技术共进，成长同行——讯飞AI开发者社区

更多推荐

AI Compass前沿速览：Kimi K2、InfinityHuman-AI数字人、3D-AI桌面伴侣、叠叠社–AI虚拟陪伴

Apertus是瑞士由EPFL、ETH Zurich和瑞士国家超级计算中心（CSCS）联合推出的首个大规模、开放、多语言的大型语言模型（LLM），作为瑞士AI倡议的一部分，旨在推动透明、开放且合规的AI发展。Midoo AI基于对AI工具聚合平台内容的分析，该平台汇集了多种人工智能工具，旨在提升用户在信息处理、内容创作及学习辅助方面的效率。在数据收集阶段，严格执行数据隐私和版权保护原则，仅使用公开

讯飞AI开发者社区

cover

基于Vue的高校课堂管理系统[Vue]-计算机毕业设计源码+LW文档

讯飞AI开发者社区

cover

[论文阅读] 人工智能+ | 突破LLM情报分析瓶颈！MAKR多Agent框架让长文本因果推理更精准

讯飞AI开发者社区

所有评论(0)

查看更多评论

Blueeyedboy521

@Blueeyedboy521

已为社区贡献2条内容