如何在不使用 SQLAlchemy 引擎的情况下将数据帧写入 Postgres 表？

2023-11-29

我有一个数据框，我想写入Postgres数据库。此功能需要成为Flask app.

现在，我通过创建一个单独的脚本来运行此插入部分SQLAlchemy 引擎并将其传递给df.to_sql()将数据框写入数据库表。

但是当我将此功能集成到 Flask 应用程序中时，我已经与Postgres使用创建的数据库Psycopg2 连接池.

当被看时df.to_sql()文档中提到它使用SQLAlchemy 引擎。我没有看到任何其他连接机制。https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_sql.html#pandas-dataframe-to-sql

我的问题是，当我拥有现有连接时，为什么需要创建这个 SQLAlchemy 引擎。为什么我不能使用它们？

您可以使用这些连接并避免 SQLAlchemy。这听起来相当不直观，但它会比常规插入快得多（即使您要删除 ORM 并进行一般查询，例如使用executemany）。即使使用原始查询，插入也很慢，但您会发现COPY中多次提到如何加快 PostgreSQL 中的插入性能。在这种情况下，我采用以下方法的动机是：

Use COPY代替INSERT
不要相信 Pandas 会为此操作生成正确的 SQL（尽管，正如 Ilja Everilä 所指出的，这种方法实际上得到了在 V0.24 中添加到 Pandas)
不要将数据写入磁盘来创建实际的文件对象；把一切都记在记忆里

建议使用的方法cursor.copy_from():

import csv
import io
import psycopg2

df = "<your_df_here>"

# drop all the columns you don't want in the insert data here

# First take the headers
headers = df.columns

# Now get a nested list of values
data = df.values.tolist()

# Create an in-memory CSV file
string_buffer = io.StringIO()
csv_writer = csv.writer(string_buffer)
csv_writer.writerows(data)

# Reset the buffer back to the first line
string_buffer.seek(0)

# Open a connection to the db (which I think you already have available)
with psycopg2.connect(dbname=current_app.config['POSTGRES_DB'], 
                      user=current_app.config['POSTGRES_USER'],
                      password=current_app.config['POSTGRES_PW'], 
                      host=current_app.config['POSTGRES_URL']) as conn:
    c = conn.cursor()

    # Now upload the data as though it was a file
    c.copy_from(string_buffer, 'the_table_name', sep=',', columns=headers)
    conn.commit()

这应该比实际执行插入快几个数量级。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在不使用 SQLAlchemy 引擎的情况下将数据帧写入 Postgres 表？的相关文章

为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
如何使用 Selenium 和 ChromeDriver 解决 TypeError: 'module' object is not callable 错误 [重复]

这个问题在这里已经有答案了代码试验 from selenium import webdriver from selenium webdriver chrome options import Options as Chromeoptions
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
如何从pandas中的多列计算多列

我正在尝试使用函数从 pandas 数据框中的多个列计算多个列该函数采用三个参数 a b 和 c 并返回三个计算值 sum prod 和 quot 在我的 pandas 数据框中我有三个列 a b 和 c 我想从中计算列 sum pro
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

从 Javascript 代码中隐藏 Excel 选项卡

如何通过 Javascript 以编程方式隐藏 Excel 选项卡 ExcelSheetName Visible False 似乎不起作用我用谷歌搜索了很多但还没有收到正确的解决方案怎么做要隐藏 Excel 工作表请设置Visib
用 csv.DictWriter 写入部分行？

我有一个包含一组输入的 CSV 文件 Example A B C D 我想分析结果并为每一行输出一个 CSV 文件例如 B C The DictReader构建完整的字典其中包含键 A B C D The DictWriter按预期设置
#define _UNICODE 不适用于 MinGW + CodeBlocks

通常我使用 Visual Studio 但我切换到 mingw 我喜欢使我的应用程序可以轻松地从 unicode 和多字节更改在我的 mingw 项目中我有我的定义并包含如下内容 define WIN32 LEAN AND MEAN de
解析多个配置文件的最佳实践

解析多个配置文件的最佳实践是什么如果有的话我想解析mysql服务器配置并重新编写配置该配置允许发出多行例如 includedir etc mysql d 有趣的是某些配置可能位于主文件中但其他配置可能位于子文件中我认为 pyp
使用 PHP 将 URL 中的空格替换为 %20

我希望用 20 替换 url 中的所有空格实例我将如何使用正则表达式做到这一点谢谢你如果您只想用另一个字符串替换一段字符串则无需使用正则表达式使用str replace 应该绰绰有余 new str replace 20 your
Django：如何让 South 为添加到 INSTALL_APPS 的第三方应用程序创建表？

我正在尝试使用django 图像裁剪器 Link 在我的项目中我将其添加到settings py中的INSTALL APPS中并成功解决该应用程序需要一些数据库表才能使用所以我必须创建它们由于我一直在使用 South 因此我需要使用
iOS 库到 BitCode

我最近下载了 Xcode 7 beta Xcode 抱怨我的一些 C 库没有编译成 BitCode 我该如何告诉 Clang 生成与 iOS 兼容的 BitCode 我在 stackoverflow 上看到过类似的答案但我不知道它们是否适
如何将元组数据提取为单元素格式

我从以下内容中得到了良好的结果但是如何从元组中提取该数据换句话说如何清理数据这是数据库里的数据我跑出来了 gt gt gt policy id 2309L 118L 94L gt gt gt for i in policy id
Visual Studio代码EPERM操作不允许

每次我尝试在 vsc 上安装新扩展时我都会得到 Error while loading extensions EPERM operation not permitted 接下来它告诉我打开一个 obsolete 文件但它告诉我的文件路径
在没有 Java EE 应用服务器的情况下使用 Web 服务在 C# 和 Java 之间进行互操作？

我的处境很困难我们有一个公开基于 Java 的 API 的第三方企业系统然而我们是一个100 Net 导向的开发团队本质上我需要用 C 代码可以调用的东西来包装 Java API Web 服务固然很棒但我们的基础设施上唯一支持的
从网址中删除 web/app_dev.php/

我已经在 symfony 2 中完成了我的应用程序现在我想从网址中删除 web app dev php 我读到了这一点并在这样做之后 php app console cache clear env prod no debug 并添加 h
创建 libcurl http post 表单

我如何创建一个curl form 例如在stackoverflow上发帖如果我查看问题表单页面的来源我会看到
有没有办法获取队列中的最后一个元素？

我知道堆栈是最好也是最简单的方法但是是否有可能获得队列中的最后一个元素而无需将任何内容出列您可以简单地执行以下操作 Assumes T is a reference type if it s a value type then you
删除文本文件中的特定行

我正在研究一个选项如果用户输入确切的标题和作者该选项将能够删除指定的行但是我无法让它发挥作用我的功能内容如下所示 fnRemoveBook echo Title read Title echo Author read Author
如何在java中从tcp流播放声音

还有另一个应用程序在此套接字上写入原始 wav 文件客户端启动并开始收听当前正在播放的歌曲 Socket clientSocket new Socket localhost 9595 AudioInputStream stream Aud
TypeScript 错误 TS2339：“EventTarget”类型上不存在属性“matches”

我收到一个我无法从 TypeScript 中理解的错误我正在使用一段完全有效的 JavaScript 但它在我的 IDE 中以及通过 Gulp 进行预处理期间都标记了错误我已将其剥离回其核心但仍然收到错误即使这是完全有效的 JS d
将段落的每一行包裹在一个跨度中

我有一个 div 元素它将显示一个没有换行符的段落如示例中所示 div Lorem Ipsum is simply dummy text of the printing and typesetting industry Lorem Ip
无法同时满足约束 - 没有适当的约束

我已经检查并删除了每个用户限制但仍然收到以下错误ONLY旋转设备后我完全不知道为什么有人有什么想法吗 2013 01 14 21 30 31 363 myApp 35869 c07 Unable to simultaneously s
声纳添加新项目

我正在尝试添加一个新项目到sonar 运行声纳跑步者时我收到以下错误任何人都可以帮助我解决这个问题 sonar runner Runner configuration file opt lampp htdocs typo3 sonar
如何在不使用 SQLAlchemy 引擎的情况下将数据帧写入 Postgres 表？

我有一个数据框我想写入Postgres数据库此功能需要成为Flask app 现在我通过创建一个单独的脚本来运行此插入部分SQLAlchemy 引擎并将其传递给df to sql 将数据框写入数据库表但是当我将此功能集成到 Flas

如何在不使用 SQLAlchemy 引擎的情况下将数据帧写入 Postgres 表？

如何在不使用 SQLAlchemy 引擎的情况下将数据帧写入 Postgres 表？ 的相关文章

随机推荐

热门标签

如何在不使用 SQLAlchemy 引擎的情况下将数据帧写入 Postgres 表？的相关文章