批处理文件并与数据库比较

2024-05-23

目前我正在开发一个 Spring-Boot 应用程序，该应用程序定期尝试处理包含用户数据的文件，其中每行都包含userId and departamentId隔开|例如123534|13。该文件将包含数百万条记录。

我的要求是以这样的方式将此数据加载到 mysql 数据库中：

如果处理过的ID的用户存在，不要做任何事
如果用户不存在create新用户
如果用户不在列表中但存在于数据库中，去掉它
如果数据库中不存在当前部门，创造它

我做了一些优化，比如

缓存部门以填充实体
批量收集用户进行保存并通过保存JpaRepository saveAll method

但我仍然对数据库进行了太多的数据库调用，我正在检查用户是否存在，以便为每条记录创建保存实体......

我的实体相当简单：

@Entity
@Table(name = "departaments")
public class Departament{

    @Id
    @Column(name = "id")
    private Long id;

    @Column(name = "name")
    private String name;

and:

@Entity
@Table(name = "users")
public class User {

    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    @Column(name = "id")
    private Long id;

    @ManyToOne
    @JoinColumn(name = "departament_id")
    private Departament departament;

有人遇到过这样的问题吗？

能不能再优化一下？

有什么好的加工模式吗？

这里有几件事：

对于用户来说，您的主要真实来源似乎是 CSV 文件。为什么不简单地截断并重新创建USER桌子？您可能会遇到一些问题（我理解引用完整性是not在你的场景中其中之一 - 或者是？），但你将免费删除用户（说实话，我无法完全想象你如何在当前设置中处理用户删除）。它会跑得更快禁用密钥检查 https://stackoverflow.com/questions/8210608/mysql-disable-enable-keys
您在使用时是否确实看到了性能改进saveAll？这不限制数量SELECT要执行的语句
您确定您在正确的抽象级别上操作吗？也许您可以使用普通 JDBC 而不是 JPA。使用 JPA，将会涉及大量的缓存/映射，从而导致大量的开销。通过 JDBC，您可以利用 MySQL 的INSERT IGNORE or INSERT ... ON DUPLICATE KEY UPDATE声明以获得你想要的东西
如果您选择上述任何一种，您可以尝试使用春季批次 https://www.petrikainulainen.net/programming/spring-framework/spring-batch-tutorial-writing-information-to-a-database-with-jdbc/用于更多声明性处理

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mysql

springboot

batchprocessing

批处理文件并与数据库比较的相关文章

rabbitmq和spring-rabbitmq中的DLX——拒绝消息的一些注意事项

我确实读过这个参考资料 https www rabbitmq com dlx html https www rabbitmq com dlx html 但这并不能解决我的疑问即如果接受消息没有问题 spring rabbitmq发送 a
使用唯一索引删除重复项

我在两个表字段 A B C D 之间插入相信我已经在 A B C D 上创建了唯一索引以防止重复然而我以某种方式简单地对这些做了一个正常的索引因此插入了重复项这是2000万条记录的表如果我将现有索引从普通索引更改为唯一索引或者只
Spring Boot应用程序一直在重新启动（重新启动循环） - spring.devtools

我有一个带有嵌入式 tomcat 的 spring boot 应用程序如果类路径中发生更改则使用 spring boot devtools 重新启动应用程序我的 IDE 是 Spring Tool Suite 我切换了自动构建因为
MySQL+子串怎么做？ + 替换？

我不太擅长 SQL 希望能够变得更好我在尝试执行某些表操作时遇到一些麻烦我希望能够从下面的 ProgUID 列中选择子字符串就像是 SUBSTRING table ProgUID 3 12 这将为我提供 ProgUID P CAMVE
通过连接从两个表中删除？

我有两个表如下 tbl1 tbl2 id article id title image whole news tags author older datetime 其中 tbl1 id gt tbl2 article id 如何从两个表中删
使用按位函数查询 BIT 字段时，MySQL 不使用索引

我的 MySQL 表中有一个 BIT 类型的字段我想使用位值存储记录的状态例如 1 status1 2 status2 4 status3 8 status4 每条记录可以同时具有多种状态对于 status1 和 status3 该值
MySql 最后插入 ID，连接器 .net

我正在使用 MySql Connector net 我需要获取最后一个查询生成的插入 id 现在我假设返回值是MySqlHelper ExecuteNonQuery应该是最后一个插入id 但它只返回1 我正在使用的代码是 int inse
显示表 FULLTEXT 索引列

我希望运行一个查询该查询将返回表中全文索引的列列表该表采用 MyISAM 格式我将使用 php 来构建查询理想情况下我会运行查询它会返回信息以便我可以构造一个以逗号分隔的列字符串例如名姓电子邮箱这在 MySQL 中可
使 pdo::query 静态

当我运行下面的代码时出现此错误我通常使用 msql 函数但我尝试使用 PDO 代替怎么了致命错误第 14 行无法静态调用非静态方法 PDO query
为什么 MySQL 创建带有 _seq 后缀的表？

我创建了一个 InnoDB 表名为foo在 MySQL 中一旦我对表执行插入操作我就会看到另一个表foo seq被建造如果我删除自动生成的表它会在下一次插入后出现是什么原因造成的听起来像是正在创建一个序列您是否有自动生成的主
无法启动 MySQL 服务器 - 控制进程退出并出现错误代码

我的 mysql 服务器停止后无法启动命令使用 sudo etc init d mysql restart Error 重新启动 mysql 通过 systemctl mysql serviceJob for mysql service
查询中列的顺序重要吗？

当从 MySQL 表中选择列时与表中的顺序相比选择列的顺序是否会影响性能不考虑可能覆盖列的索引例如您有一个包含行 uid name bday 的表并且有以下查询 SELECT uid name bday FROM table M
如何在 Laravel 查询中使用多个 OR,AND 条件

我需要 Laravel 查询帮助我的自定义查询返回正确结果 Select FROM events WHERE status 0 AND type public or type private 如何写这个查询Laravel Event w
如何在 Spring Boot 中使用@NotNull？

我有这样的依赖
截断 Mysql 表 Cron 作业？

我在如何使用 cron 作业截断 Mysql 表时遇到了一些麻烦无论我尝试什么我似乎都无法让数据库清除表格感谢您的帮助 mysql uderp example pexample hlocalhost Dexample e TRUNCA
第三个下拉菜单不从数据库填充

我有以下 Index php
InnoDB 因读未提交而死锁！ - Java - Glassfish - EJB3（JPA/Hibernate）

几天来我在使用 Glassfish EJB3 和 Mysql InnoDB 的 Java 应用程序上遇到了死锁问题配置 Mysql InnoDB Ver 14 12 Distrib 5 0 51a 适用于 debian linux gn
Pivotal Cloud Foundry - 连接到外部 Oracle 数据库

我正在创建一个 Spring boot 应用程序该应用程序连接到一个不由 PCF 管理或驻留在外部的 Oracle 数据库在我的本地开发环境中我在 application properties 文件中配置了数据库连接详细信息有人
Laravel leftJoin 仅右表的最后一条记录

我是 Laravel 的新手我有两张桌子 1 产品 2 价格 products id product int p key name varchar prices id price int p key id product int
Mysql 创建定义器

我创建了一个在 CentOS Web 服务器上运行的 Intranet Web 应用程序该应用程序使用另一个本地服务器始终是 CentOS 作为 MySQL 数据库在数据库内部我创建了例程这些例程总是这样开始 CREATE DEFI

随机推荐

使用 JavaScript 防止网页导航离开

如何使用 JavaScript 防止网页导航离开 Using onunload允许您显示消息但不会中断导航因为为时已晚然而使用onbeforeunload将中断导航 window onbeforeunload function re
Fast R-CNN 中 ROI 层的用途是什么？

In this https leonardoaraujosantos gitbooks io artificial inteligence content object localization and detection html关于目标
将文本字段限制为仅包含数字的最佳方法？

I m using the following Javascript to restrict a text field on my website to only accept numerical input and no other le
C# 中的 Stack<> 实现

我最近一直在实现递归目录搜索实现并且使用堆栈来跟踪路径元素当我使用 string Join 连接路径元素时我发现它们被颠倒了当我调试该方法时我查看了堆栈发现堆栈内部数组中的元素本身是相反的即最近 Push 的元素位于内部数组的
Rust 枚举中 str/String 值的最佳实践是什么？

我有一个非常赏心悦目的东西但我担心它的含义 derive Eq PartialEq Debug pub enum SmtpHost DOMAIN String IPV4 Ipv4Addr IPV6 Ipv6Addr UNKNOWN lab
如何监听第三方应用程序触发的数据库更改

我需要将 Ruby on Rails 应用程序与第 3 方应用程序集成该应用程序将共享一个公共 PostgreSQL 数据库也就是说 Rails 应用程序和第 3 方应用程序将使用相同的 PG 数据库是否可以在 Rails 应用程序中
如何绕过Access-Control-Allow-Origin？

我正在一个平台上对我自己的服务器进行ajax调用他们设置了阻止这些ajax调用的平台但我需要它从我的服务器获取数据以显示从我的服务器数据库检索到的数据我的 ajax 脚本正在运行它可以将数据发送到我的服务器的 php 脚本以允许其处
如何使用 C# SDK 更新 Facebook 访问令牌

我正在使用 Facebook C SDK 来获取尽可能多的数据例如帖子评论用户信息尽可能来自 Facebook 但我的程序在我的访问令牌在一段时间后过期后停止我必须重新启动程序我从以下位置获取了访问令牌Facebook 开发者工
Angular 2 将字符串转换为 md5 哈希

我找到了ts md5 https www npmjs com package ts md5包但在示例中它有一个hashStr方法但现在不行了类型上不存在属性 hashStr Md5 使用该错误后该错误会记录在我的控制台中我怎样才能
在 C 语言中，为什么数组的地址等于它的值？

在下面的代码中指针值和指针地址与预期不同但数组值和地址则不然怎么会这样 Output my array 0022FF00 my array 0022FF00 pointer to array 0022FF00 pointer to a
如何在打字稿中使用外部js

我通过 Typescript 代码生成 Angular JS 代码在一种情况下我需要将外部 JS 文件添加到我的打字稿文件中并且需要访问 js 文件中的类我像这样添加js文件
无法继承形状

为什么我不能使用继承 a 的类Shapes class http msdn microsoft com en us library ms604615 28v vs 90 29 我需要延长Rectangle具有一些方法的类但我想以与使用相同
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
在 bash 中从文件中读取星号字符 (*)

我正在从 txt 文件中获取行说输入 txt a b 然后我正在阅读它 bin bash file 1 ans 0 while read r line n line do echo line done lt file passing th
strlen() 编译时优化

前几天我发现你可以找到编译时strlen使用这样的东西 template
在 C++ 代码中转换字符串

我正在学习 C 并开发一个项目来练习但现在我想在代码中转换一个变量字符串就像这样用户有一个包含 C 代码的文件但我希望我的程序读取该文件并插入将其写入代码中如下所示 include
将错误消息添加到@Html.ValidationSummary

我使用标准 MVC3 Razor 视图和不显眼的 Javascript 验证使用 Html ValidationSummary将它们显示在表单顶部如果标准验证例如 Required 通过然后我运行一些非常自定义的客户端验证当用户点
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
将基本的 Node.js 应用程序部署到 openshift 在 git Push 上出现错误

我使用 openshift 网站上的过程设置了一个默认节点应用程序在我的 ubuntu 盒子上做了一个 git 克隆编辑了readme md 做了一次提交并尝试推送到仓库出现很多 npm fetch failed 错误以及很多 E
批处理文件并与数据库比较

目前我正在开发一个 Spring Boot 应用程序该应用程序定期尝试处理包含用户数据的文件其中每行都包含userId and departamentId隔开例如123534 13 该文件将包含数百万条记录我的要求是以这样的方式将此

批处理文件并与数据库比较

批处理文件并与数据库比较 的相关文章

随机推荐

热门标签

批处理文件并与数据库比较的相关文章