python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python hashlib存储文件MD5码

Python利用hashlib实现文件MD5码的批量存储

作者:winfredzhang

这篇文章主要为大家详细介绍了如何用Python和hashlib实现文件MD5码的批量存储功能,文中的示例代码讲解详细,感兴趣的小伙伴可以学习一下

简介

可以考虑以下几个可能的应用:

基于这些应用,我为你举了以下几个具体的场景:

你是一个软件开发者,你需要发布一个安装包给用户下载。为了保证安装包的完整性和安全性,你可以使用刚刚一段代码来生成安装包的MD5码,并将其存储在Access数据库中。当用户下载完安装包后,他们可以通过比较自己计算的MD5码和数据库中的MD5码来确认安装包是否正确无误。

你是一个数据分析师,你需要处理大量的数据文件。为了避免重复或错误的数据文件,你可以使用刚刚一段代码来生成每个数据文件的MD5码,并将其存储在Access数据库中。当你需要查询或分析某个数据文件时,你可以通过查找数据库中的MD5码来快速定位到相应的数据文件。

你是一个网络管理员,你需要备份服务器上的重要文件。为了节省空间和时间,你可以使用刚刚一段代码来生成每个重要文件的MD5码,并将其存储在Access数据库中。当你需要恢复某个重要文件时,你可以通过比较服务器上和备份设备上的MD5码来确定哪些文件需要更新或覆盖。

源代码

import os
import hashlib
import pyodbc
 
# Connect to the Access database
conn = pyodbc.connect(r'Driver={Microsoft Access Driver (*.mdb, *.accdb)};DBQ=./stocks.accdb;')
# conn = pyodbc.connect(r'Driver={Microsoft Access Driver (*.mdb, *.accdb)};DBQ=stocks.accdb;')
cursor = conn.cursor()
 
# Iterate over all files in the current folder
for file in os.listdir("."):
    # Skip subdirectories
    if os.path.isdir(file):
        continue
    # Get the full file path
    file_path = os.path.abspath(file)
    # Generate the md5 hash of the file content
    md5_hash = hashlib.md5()
    with open(file_path, "rb") as f:
        for chunk in iter(lambda: f.read(4096), b""):
            md5_hash.update(chunk)
    md5_hex = md5_hash.hexdigest()
    # Insert the file path and md5 hash into the database table
    cursor.execute("INSERT INTO filemd (filepath, md5) VALUES (?, ?)", (file_path, md5_hex))
 
# Commit and close the connection
conn.commit()
conn.close()

源代码说明

这段代码的主要功能是遍历当前文件夹下的所有文件,计算每个文件的MD5码,并将文件路径和MD5码存储在Access数据库中。具体来说,这段代码做了以下几件事:

效果如下所示

到此这篇关于Python利用hashlib实现文件MD5码的批量存储的文章就介绍到这了,更多相关Python hashlib存储文件MD5码内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文