如何使用java或groovy计算目录上的md5校验和？

2023-12-27

我希望使用 java 或 groovy 来获取完整目录的 md5 校验和。

我必须将源目录复制到目标，校验源和目标，然后删除源目录。

我找到了这个文件脚本，但是如何对目录执行相同的操作？

import java.security.MessageDigest

def generateMD5(final file) {
    MessageDigest digest = MessageDigest.getInstance("MD5")
    file.withInputStream(){ is ->
        byte[] buffer = new byte[8192]
        int read = 0
        while( (read = is.read(buffer)) > 0) {
            digest.update(buffer, 0, read);
        }
    }
    byte[] md5sum = digest.digest()
    BigInteger bigInt = new BigInteger(1, md5sum)

    return bigInt.toString(16).padLeft(32, '0')
}

有更好的方法吗？

我有同样的要求，并选择我的“目录哈希”作为目录中所有（非目录）文件的串联流的 MD5 哈希。正如克罗津在评论中提到的类似的问题 https://stackoverflow.com/questions/9169137，您可以使用SequenceInputStream充当连接大量其他流的流。我在用着Apache 通用编解码器 http://commons.apache.org/proper/commons-codec对于MD5算法。

基本上，您可以递归目录树，添加FileInputStream实例到Vector对于非目录文件。Vector然后方便地有elements()方法提供Enumeration that SequenceInputStream需要循环遍历。对于 MD5 算法来说，这只是显示为一个InputStream.

一个问题是，您需要每次都以相同的顺序呈现文件，以便哈希值与相同的输入相同。这listFiles()中的方法File不保证顺序，所以我按文件名排序。

我正在为 SVN 控制的文件执行此操作，并且希望避免散列隐藏的 SVN 文件，因此我实现了一个标志来避免隐藏文件。

相关基本代码如下。（显然它可以被“强化”。）

import org.apache.commons.codec.digest.DigestUtils;

import java.io.*;
import java.util.*;

public String calcMD5HashForDir(File dirToHash, boolean includeHiddenFiles) {

    assert (dirToHash.isDirectory());
    Vector<FileInputStream> fileStreams = new Vector<FileInputStream>();

    System.out.println("Found files for hashing:");
    collectInputStreams(dirToHash, fileStreams, includeHiddenFiles);

    SequenceInputStream seqStream = 
            new SequenceInputStream(fileStreams.elements());

    try {
        String md5Hash = DigestUtils.md5Hex(seqStream);
        seqStream.close();
        return md5Hash;
    }
    catch (IOException e) {
        throw new RuntimeException("Error reading files to hash in "
                                   + dirToHash.getAbsolutePath(), e);
    }

}

private void collectInputStreams(File dir,
                                 List<FileInputStream> foundStreams,
                                 boolean includeHiddenFiles) {

    File[] fileList = dir.listFiles();        
    Arrays.sort(fileList,               // Need in reproducible order
                new Comparator<File>() {
                    public int compare(File f1, File f2) {                       
                        return f1.getName().compareTo(f2.getName());
                    }
                });

    for (File f : fileList) {
        if (!includeHiddenFiles && f.getName().startsWith(".")) {
            // Skip it
        }
        else if (f.isDirectory()) {
            collectInputStreams(f, foundStreams, includeHiddenFiles);
        }
        else {
            try {
                System.out.println("\t" + f.getAbsolutePath());
                foundStreams.add(new FileInputStream(f));
            }
            catch (FileNotFoundException e) {
                throw new AssertionError(e.getMessage()
                            + ": file should never not be found!");
            }
        }
    }

}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用java或groovy计算目录上的md5校验和？的相关文章

光学标记阅读器的开源库[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想要一个用于光学标记读取 OMR 的开源库有这样的库吗我想在我的 java 应用程序中使用这个库 zxing 可能对你有用 http
Java 多头中的斐波那契计算显示负值

我的斐波那契计算器工作正常但当数字增加时结果会出现负值就像它是一个Integer超过其最大值它正在使用缓存java util Map
Infinispan 复制缓存不复制对象以供读取

我们正在尝试在 Openshift 内的 Wildfly 11 上运行的两个 infinispan 节点上安装复制缓存当我们在一个节点上写入一个对象时它不会显示在另一节点上进行读取启动时节点在集群中连接并且可以看到彼此如日志中所
如何在 Java 中根据 XSD 1.1 验证 XML？

在 Java 中根据 XML Schema 1 1 验证 XML 文件的最佳方法是什么我从中获取了代码tutorial http www ibm com developerworks xml library x javaxmlvalida
Android - 内容值覆盖现有行

我正在尝试使用插入值ContentValues 我已将 5 个值插入到 5 列中运行应用程序后我只有最后一组值的行ContentValues 前四组未插入 ContentValues cv new ContentValues cv pu
为什么Java HashMap的最大容量是1<<30而不是1<<31？

Why is the maximum capacity of a Java HashMap 1 lt lt 30 and not 1 lt lt 31 even though the max value of an int is 231 1
使用 Java 检索 Window 进程的 CPU 使用率

我正在寻找一个 Java 解决方案来查找 Windows 中正在运行的进程的 CPU 使用情况查了一下网上关于Java解决方案的信息似乎很少请记住我并不是要查找 JVM 的 CPU 使用情况而是要查找当时在 Windows 中运行
UnsupportedOperationException：特权进程中不允许使用 WebView

我在用android sharedUserId android uid system 在我的清单中获得一些不可避免的权利从 HDMI 输入读取安卓盒子 http eweat manufacturer globalsources com s
如何使用java避免Mysql数据库中的“数据因列被截断”？

在我的 Java 程序中 Hibernate Bean 类定义一列例如 TimtableVO java Column name REPEAT DAYS private WeekdayType repeatDays hear Weekday
java中main的返回类型

我想知道为什么java中main方法只有void返回类型 public static void main String args 为什么main方法除了void之外没有其他返回类型 Thanks 简短的回答是因为这就是语言规范 http
在 Java 中查询 XML 的最简单方法

我有带有 XML 的小字符串例如 String myxml
AIX：IBM Java：java.net.SocketException：连接超时：可能是由于地址无效

当尝试与我们的服务器建立 SSL 连接时我们在 IBM AIX 上经常看到以下异常 java net SocketException Socket closed at com sun net ssl internal ssl SSLSoc
如何加快 jar 签名者的速度？

我使用 ant 来签署我的 jars 以进行网络启动部署 Ant signjar 在 Web 启动签名时非常慢如何加快签名过程我找到了一种可能的解决方案早些时候在构建脚本 ant signjar 中按顺序调用所有 jar 我们使用
从 AlertDialog 返回值

我想构建一个函数来创建 AlertDialog 并返回用户输入的字符串这是我用于创建对话框的函数如何返回该值 String m Text private String openDialog String title AlertDialo
Java中如何限制文件大小

我正在我的应用程序中创建一个文件并继续向该文件中写入一些内容但是当我的文件达到一定大小比如说 100 行后我想删除第一行并将新行写入底部要求是我的文件应该受到限制但它应该保留我写入文件的最新内容请告诉我在Java中是否可行
如何检测java控制台中而不是GUI中的箭头键？ [复制]

这个问题在这里已经有答案了我正在编写一个应用程序我需要检测其中的箭头键 C 有getch 函数我们想要获取输入然后添加对 ASCII 值的检查我们如何检测输入箭头键谢谢我写了一个Java类原始控制台输入 http www so
JTable中动态加载大量数据

这是我的问题我目前有一个 JTable 其中包含 5 000 到超过 200 000 行你知道我要说什么了数据已经加载到内存中了这不是问题但是如何我可以创建一个高效的 JTable 以便它只加载以下行是可见的并且任何事件仅作
从 AJP 连接器请求中检索 Shibboleth 属性

当我在 Apache 上运行 Shibboleth 身份验证时遇到了一个奇怪的问题当 Tomcat7 在后端运行时 Apache 通过 mod proxy ajp 发送所有内容 Shibboleth 的参数也是如此 In the 文档 h
使用 Tomcat 和 gradle 进行休眠

免责声明我是 Java 新手我正在尝试使用 Tomcat 和 Gradle 设置 Hibernate 构建运行正确但看起来像persistence xml文件未被读取我的项目结构如下 build gradle src main ja
Web 应用程序似乎启动了名为 [22] 的线程，但未能停止它。这很可能造成内存泄漏

我有一个 Web 应用程序后端有 Servlet 部署在 tomcat 上该应用程序是简单的java应用程序我经常在服务器日志中看到此错误严重 Web 应用程序似乎启动了一个名为 22 但未能阻止它这很有可能造成内存泄漏是否存

随机推荐

如何使用xsl打印百分位数

我正在尝试使用 HTML 报告生成 99 jmeter results detail report 21 xsl文件我可以使用以下代码打印 90
CSS 家谱与名称长度的对齐问题

我从 CSS3 Family Tree 的实验性多父版本开始 http thecodeplayer com experiment css3 family tree 2 http thecodeplayer com experiment cs
C# 相当于 VB“模块”

在 Visual Basic 中您可以使用模块作为存储松散代码的位置这些代码可以是可以从应用程序中的其他位置访问的方法和变量而无需首先初始化某些内容并且可以设置或更改变量状态并将始终保持该值我发现的最接近的是 C 中的静态方
如何检查模板类型是否是变体类型的类型之一？

考虑到变体类型和模板函数如何检查模板类型是否是变体的类型之一还有比下面更优雅的方式吗 typedef boost variant
如何开始使用 oauth for YQL 获取历史股票数据？

在我寻找市场数据源时我被引导至雅虎财经的 YQL 它看起来很棒对于公共使用查询来说非常简单但是公共版本的每日限制对于我的需求来说太小了我得到了我的 yahoo ID 来开始使用 oauth 但我找不到任何好的例子关于我想做的事情
如果 prevInstance 始终为 NULL，为什么它存在于 WinMain 和 wWinMain 中

由于我是初学者这可能是一个非常基本的问题我正在启动 DirectX 11 在创建第一个应用程序时使用了 wWinMain 在寻找 WinMain 和 wWinMain 之间的差异时我遇到了这个参数 prevInstance 根据MS
为什么 as_tibble() 将浮点数四舍五入到最接近的整数？

在 dplyr 0 7 4 和 R 3 4 1 中使用 as tibble 时我得到以下输出 mtcars gt aggregate disp cyl data mean gt as tibble 哪个输出 A tibble 3 x 2
从视频中提取音频作为 MP3 文件 C#

我想使用 C 从视频文件中提取音频作为 MP3 音频的比特率应该能够指定有人可以帮我解决这个问题吗我已经看过是否但我不确定是否可以在不提示 CMD 的情况下使用是否请不要向我推荐以下文章对于大于 700mb 的文件它无法正常
术语“add-migration”未被识别为 cmdlet 的名称

因此从一天到第二天我的迁移随机停止工作我做了添加迁移它说它没有被识别我正在使用 PM 因为这是一个 asp net mvc 并且前一天正在工作 add migration 术语 add migration 不被识别为 cmdlet
为类属性生成随机数

我有以下代码 from numpy import random class Person def init self name age random randint 18 65 self name name self age age 我希望
使用 linq 的存储库模式

当我使用两个不同的生成的 linq 代码时如何实现 Rob Conery 在 MVC Storefront 1 中显示的所谓存储库模式我是否需要像 Fredrik Normen 所讨论的那样实现真正的存储库模式存储库模式的目的是什么
如何在C++中捕获内存不足异常？

谁能告诉我如何捕获内存不足异常 for ex try while true int i new int catch lt what should be put here exception handling 还有这个 queue
Google 地图 V3 上的 SVG 标记

使用 Google Maps API v3 我的最终目的是创建一个给定长度和角度的箭头但现在我正在尝试创建一个 SVG 标记我正在使用丰富的市场效用 http google maps utility library v3 google
MySQL count(*) 一个月内每天返回 [BLOB-2B] 而不是数字

我将使用特定用户 ID vwr tid 计算一个月中每天的每一行一切正常结果显示在表格中但有一件事每天的计数不会出现它变成了 BLOB xx 而不是当天的行数这是我的代码 SELECT MONTH v YEAR V GROUP
接受给定数量的双精度数的可变参数模板方法？

template
无法在 vue 中使用 typescript 中的 Mixins

我有这样的文件夹结构 Page group vue Services groupMixin ts group vue 的脚本
如何在 Tensorflow 中显示隐藏层输出

在将模型与其存储的 protobuf 版本进行比较时我遇到了输出差异通过这个转换脚本 https github com amir abdi keras to tensorflow blob master keras to tensorf
为什么省略“#include ”有时会导致编译失败？

我是 C 初学者当我写代码时有时我会写 include
当应用程序不在前台时，firebase_messaging 不会自定义通知

我需要对来自 firebase 的有关来自用户的消息的通知进行分组 Firebase 推送通知是通过使用实现的分组 flutter local notification 插入这是在里面完成的onMessage 在 Firebase 配置期
如何使用java或groovy计算目录上的md5校验和？

我希望使用 java 或 groovy 来获取完整目录的 md5 校验和我必须将源目录复制到目标校验源和目标然后删除源目录我找到了这个文件脚本但是如何对目录执行相同的操作 import java security MessageD

如何使用java或groovy计算目录上的md5校验和？

如何使用java或groovy计算目录上的md5校验和？ 的相关文章

随机推荐

热门标签

如何使用java或groovy计算目录上的md5校验和？的相关文章