L19-将多表分批次从数据库导出到Excel

2023-05-16

文章目录

- 1. 应用场景
- 2. 功能事项
- 3. 主要实现
- - 概览
  - 主要方法
- 4. 使用示例
- 5. 总结

1. 应用场景

最近经常需要手工从后台数据库导出某些数据表到Excel文件，而且源数据表的数据量大小不一，导致在导出到本地文件这个过程中需要根据情况来调整每个批次的写入数据量。为了避免反复的手工操作、高效率到多份离线数据，便做了这个小工具来一键完成任务。

2. 功能事项

支持一次性导出多个数据源表、自动获取各表的字段名。
支持控制批次的写入速率。例如：每5000行一个批次写入到excel。
支持结构相同的表导入到同一个Excel文件。可适用于经过水平切分后的分布式表。

3. 主要实现

概览

主要方法

首先需要安装第三方库pymssql实现对SQLServer的连接访问，自定义方法__getConn()需要指定如下五个参数：服务器host、登录用户名user、登录密码pwd、指定的数据库db、字符编码charset。连接成功后，通过cursor()获取游标对象，它将用来执行数据库脚本，并得到返回结果集和数据总量。
附上创建数据库连接和执行SQL的源码：

    def __init__(self,host,user,pwd,db):
        self.host = host
        self.user = user
        self.pwd = pwd
        self.db = db
 
    def __getConn(self):
        if not self.db:
            raise(NameError,'没有设置数据库信息')
        self.conn = pymssql.connect(host=self.host, user=self.user, password=self.pwd, database=self.db, charset='utf8')
        cur = self.conn.cursor()
        if not cur:
            raise(NameError,'连接数据库失败')
        else:
            return cur

方法3中写入Excel时，注意一定要用到Pandas中的公共句柄ExcelWriter对象writer。当数据被分批多次写入同一个文件时，如果直接使用to_excel()方法，则前面批次的结果集将会被后续结果覆盖。增加了这个公共句柄限制后，后面的写入会累加到前面写入的数据尾部行，而不是全部覆盖。

writer = pd.ExcelWriter(file)
df_fetch_data[rs_startrow:i*N].to_excel(writer, header=isHeader, index=False, startrow=startRow)

分批次写入到目标Excel时的另一个要注意的参数是写入行startrow的设置。每次写入完成后需要重新指下一批次数据的初始位置值。每个批次的数据会记录各自的所属批次信息。
利用关键字参数**args 指定多个数据源表和数据库连接。

def exportToExcel(self, **args):
    for sourceTB in args['sourceTB']:       
        arc_dict = dict(
            sourceTB = sourceTB,
            path=args['path'],
            startRow=args['startRow'],
            isHeader=args['isHeader'],
            batch=args['batch']
        )
        print('\n当前导出的数据表为：%s' %(sourceTB))
        self.writeToExcel(**arc_dict)
    return 'success'

4. 使用示例

如下是调用样例。先用类MSSQL创建对象，再定义关键字参数args，最终调用方法导出到文件即完成数据导出。

import pandas as pd
ms = MSSQL(host="localhost",user="test",pwd="test",db="db_jun")
args = dict(
sourceTB = ['tb2', 'tb1'],# 待导出的表
path='D:\\myPC\\Python\\',# 导出到指定路径
startRow=1,#设定写入文件的首行，第2行为数据首行
isHeader=False,# 是否包含源数据的标题
batch=5
)
# 导出到文件
ms.exportToExcel(**args)

5. 总结

本篇主要介绍完成多表(相同表结构)导出数据、分批次写入到同一Excel的实现过程，需要注意使用文件公共句柄、写入行初始化、关键字参数配置等。后续也可以继续扩展，将指定数据源表导出到指定目标文件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

L19-将多表分批次从数据库导出到Excel 的相关文章

c语言学生宿舍管理系统（文件（二进制文本存储），链表版）

实现简单的学生宿舍基本信息管理 xff0c 宿舍的基本信息包括楼号房间号面积所容纳人数已入住人数等 xff0c 系统以文本菜单形式工作登录时 xff1a 用户名为asd 密码任意 include lt stdio h gt inc
mock工程的编写和应用

mock方法体的编写 xff1a 首先明确自己要mock的方法 xff0c 需要传入的参数和需要返回的参数 xff0c 然后明确路径 xff0c 一 xff1a 如下图解 xff0c 我们需要mock一个传入json对象和传出json对象
Linux使用hdparm检测硬盘信息

一安装hdparm centos sudo yum install hdparm ubuntu 银河麒麟 sudo apt get install hdparm 二使用查看硬盘的读取速度及缓存速度速度 hdparm tT dev sd
linux系统导入CA证书

英文版出处 xff1a http majic rs blog system wide installation of certificates 因为众所周知的原因 xff0c 同步android源码成了非常痛苦的事情迫不得已采用了goag
C语言中无符号数和有符号数的左移和右移

在单片机开发中 xff0c 通常会使用左移和右移操作做快速的乘法和除法运算例如 xff0c 将0x0001左移1位 xff0c 相当于乘以2 1左移2位相当于乘以2 2 xff0c 以此类推 xff0c 左移n位 xff0c 相当于乘以2
UIButton-UIControlEvents(事件)

UIControlEvents UIControlEventTouchDown span class token comment 单点触摸按下事件 xff1a 用户点触屏幕 xff0c 或者又有新手指落下的时候 span UIControl
Debian普通用户获取root权限|sudo的安装与配置

Debian系统的普通用户需要安装软件时 xff0c 往往会收到 Permission denied 的提示 xff0c 这时候需要root权限那么如何在不登陆超级管理员账户的前提下拥有root权限呢 xff1f 对于大多数Linux系统
电脑桌面文件不见了怎么恢复?

众所周知 xff0c 我们都会在电脑桌面上放置各种文件文件夹等 xff0c 这样很容易造成文件堆积过多 xff0c 桌面杂乱无章 xff0c 影响查找文件速度这不可避免的要对电脑桌面进行整理 xff0c 但有时候我们会出现重要文件突然就
CCF之“毫无头绪”

1 CCF之任务调度 xff1a 试题编号 xff1a 201403 5 试题名称 xff1a 任务调度时间限制 xff1a 1 0s 内存限制 xff1a 256 0MB 问题描述 xff1a 问题描述有若干个任务需要在一台机器上运行
Matika版OpenStack伪生产环境部署-keystone

身份服务概述 OpenStack认证管理服务提供一个单点集成身份验证授权和服务目录服务其他OpenStack服务使用认证服务作为一个通用统一的API 此外服务提供用户的信息但不包括在OpenStack 如LDAP服务可以集成到一个
异步套接字基础：select函数以及FD_ZERO、FD_SET、FD_CLR、FD_ISSET使用说明

select函数 xff1a 系统提供select函数来实现多路复用输入输出模型原型 xff1a include lt sys time h gt include lt unistd h gt select函数 xff1a 系统提供se
7-53 两个有序序列的中位数（25 分）

已知有两个等长的非降序序列S1 S2 设计函数求S1与S2并集的中位数有序序列A 0 A 1 AN 1的中位数A N 1 2的值即第 N 43 1 2 个数 xff08 A 0为第1个数 xff09 输入格式输入分三行第一行给出序列
PROC系列之---/proc/stat/

包含了所有CPU活动的信息 xff0c 该文件中的所有值都是从系统启动开始累计到当前时刻 work 64 builder cat proc stat cpu 432661 13295 86656 422145968 171474 233 5
PROC系列之---/proc/pid/stat

proc stat 包含了所有CPU活跃的信息 xff0c 该文件中的所有值都是从系统启动开始累计到当前时刻 root 64 localhost cat proc 6873 stat 6873 a out R 6723 6873 6723
PROC系列之---/proc/pid/statm

proc statm 包含了所有CPU活跃的信息 xff0c 该文件中的所有值都是从系统启动开始累计到当前时刻 root 64 localhost cat proc self statm 654 57 44 0 0 334 0 输出解释 C
Linux下使用socket传输文件的C语言简单实现

简单的C语言实现 xff0c 客户端通过TCP协议向服务器端请求传输的文件 xff0c 服务器端收到请求后向客户端发送文件服务器程序和客户端程序应当分别运行在两台计算机上在运行服务器端的计算机终端执行 xff1a file server
设置linux进程优先级和CPU亲和性（转载）

进程cpu资源分配就是指进程的优先权 xff08 priority xff09 优先权高的进程有优先执行权利配置进程优先权对多任务环境的linux很有用 xff0c 可以改善系统性能还可以把进程运行到指定的CPU上 xff0c 这样一来
20130718：Linux内核编译

最近在学习操作系统概念一书 xff0c 有些实验需要在系统内核中增加一些新的系统调用 xff0c 由此便产生了修改内核源码并重新编译生成新内核的需求我的思路是首先搞定内核编译的流程 xff0c 确保有个可用的实验环境 xff0c 在
Linux Bash Shell 学习笔记

1 bash脚本的参数处理 BASH的参数可以用加数字编号来访问 xff0c 其中 xff1a 代表脚本的参数个数 1代表脚本的第1个参数 2代表脚本的第2个参数以此类推 xff0c n代表脚本的第n个参数 xff0c 但是 xff0c
L1-python中的特殊方法__str__

1 使用场景在Python的类的定义中 xff0c init 方法用来初始化实例属性当创建类对象并打印输出时 xff0c 默认输出结果会是一串地址符 xff0c 如 xff1a lt main Student object at 0x0

随机推荐

L3-python语言中的几种特征操作

汇总了目前碰到的几个Python有别于其它程序语言特征 xff0c 体现了Python语言自有的简洁与优雅 xff0c 可参考如下使用与注意事项列表推导式一行代码直接对列表元素进行翻倍操作 xff0c 比for的遍历 xff0c 简洁
7-13 统计工龄（20 分）

给定公司N名员工的工龄 xff0c 要求按工龄增序输出每个工龄段有多少员工输入格式输入首先给出正整数N xff08 10 5 xff09 xff0c 即员工总人数 xff1b 随后给出N个整数 xff0c 即每个员工的工龄 xff0c
L4-深度分析Python数据库(SQLServer)访问中的连接

1 环境准备首先就是要安装包 xff0c 直接使用pip命令安装即可 pip install pymssql 2 Python pymssql库的数据库访问分析参考下图 xff0c 描述了数据库连接在单次访问中的创建与关闭值得注意的是
L5-利用Python生成器巧解算法小题

介绍两个利用Python生成器替代传统的循环遍历操作来解决问题的例子经过思考与实践 xff0c 充分利用这种自有特征 xff0c 理解实现的细节 xff0c 感受这种编程方式的优雅 1 字符替换将 aeiou 进行替换 xff0c 规则
L6-Numpy中的随机函数

文章目录 1 rand 2 randn 3 randint 4 random 5 choice 6 随机种子seed 本文汇总了Numpy中常见的取随机数的函数 xff0c 介绍了基本用法 1 rand 指定的输出的二维数组的型 xff0c
L7-Python字符串格式化小结

文章目录一百分号 1 直接使用2 表达式赋值3 绑定变量名4 格式符汇总说明5 更精细化的控制二 format控制基本语法1 绑定变量名2 绑定对象属性3 通过下标取元素来赋值4 填充与对齐5 精度与类型6 千位分隔符本篇汇总了Py
L8-Flatten拍平多维数组的元素

文章目录案例说明1 最平凡 xff1a 数组索引访问2 最伤脑 xff1a 二次遍历列表生成器3 最灵巧 xff1a 活用函数sum 为什么sum 还可以这样玩 xff1f 4 最省心 xff1a 一步到位 xff0c Numpy fl
L9-Python内部变量的作用域问题

文章目录写在开头一连续等式判断二函数内部变量作用域的变更1 对外部变量不进行运算 xff0c 直接访问2 直接对外部变量进行操作运算3 新增global声明 xff0c 再操作写在开头分享记录两个有意思的案例 xff0c 平时碰
L10-简谈正则表达式中几个函数的使用

文章目录概述1 match 2 search 3 sub 4 compile 5 findall 6 finditer 7 split 8 subn 9 groups 10 贪婪模式与惰性模式注意事项概述正则表达式本身是一种小型的高
L11-Python中的高阶函数的使用

Python中的函数是一个对象 xff0c 既可以作为输入参数 xff0c 也可以作为返回结果在这里聊聊几个常用的高阶函数 xff0c 来看看函数是如何被作为输入参数返回结果来使用的 1 map 映射函数语法 xff1a map fu
L12-聊聊Python的装饰器

文章目录 1 基本介绍2 理解函数2 1 函数也是对象2 2 嵌套函数2 3 返回结果为函数2 4 函数作为输入参数 3 创建装饰器4 带参数的装饰器5 装饰器的应用监控日志 1 基本介绍定义在函数调用前后自动打印日志 xff0c 称
L13-理解Python中的特殊的返回值-函数

文章目录说明1 初识返回值函数2 辨识函数对象3 闭包的注意事项谨记如何避免 xff1f 说明在Python中 xff0c 一切函数即对象函数同时也可视作变量 xff0c 作为一个返回值下面通过实际案例来说明下 xff0c 当函数
c语言将两个递增的顺序表合并为一个递减的顺序表

eg xff1a 顺序表A xff1a 1 3 5 7 顺序表B xff1a 2 4 6 8 合并后的表C xff1a 8 7 6 5 4 3 2 1 思路 xff1a 从后往前遍历顺序表A和B xff0c 如果当前A表的数大于等于B表的数
L15-Python cookbook 数据结构与算法练习题

文章目录 1 解压赋值给多个变量2 解压可迭代对象赋值给多个变量3 查找集合中最大最小的N个元素 heap4 处理字典中的多值映射的两种方式 defaultdict 5 排序字典的键值对元素 OreredDict6 查找字典的相同点7 命
理解递归，从递归的本质说起

版权声明 xff1a 本文为博主原创文章 xff0c 遵循 CC 4 0 BY SA 版权协议 xff0c 转载请附上原文出处链接和本声明本文链接 xff1a https blog csdn net allenchenhh133 arti
靠写作能挣100万吗

不要被标题吓到 xff0c 今天说的就是关于写作 Fenng大说 xff0c 同等能力的人绝对要文字写得好的帅张说编程英语写作是程序员的3大底层能力写作能给我带来什么 xff1f 王朔曾说 xff0c 写作是一条狗 xff0c 只要
“老赖”罗永浩被群嘲：莫欺少年穷，莫笑中年败，莫嘲梦想狂

原文链接 xff1a https mp weixin qq com s x0fIynaA2hPi7blUoeYGxA 作者 l 粥左罗来源 l 粥左罗的好奇心 xff08 ID xff1a fangdushe007 xff09 转载请联系
L16-分析数据库中的左连接

许久以来 xff0c 在写表的左联接条件的时候 xff0c 似乎已彻底习惯了在右表上设置联接条件今天意外发现居然也可以在左表上设置 xff0c 而且顺势借用到了需求实践中重新翻看下官方文档的说明 xff0c 暂且也算温故而知新了联接类
高知的程序员必须甩脱穷人思维

版权声明 xff1a 本文为博主原创文章 xff0c 遵循 CC 4 0 BY SA 版权协议 xff0c 转载请附上原文出处链接和本声明本文链接 xff1a https blog csdn net mogoweb article det
L19-将多表分批次从数据库导出到Excel

文章目录 1 应用场景2 功能事项3 主要实现概览主要方法 4 使用示例5 总结 1 应用场景最近经常需要手工从后台数据库导出某些数据表到Excel文件 xff0c 而且源数据表的数据量大小不一 xff0c 导致在导出到本地文件这个过程中