将数据帧写入 postgres 数据库

2024-02-20

我想将 pandas 数据帧写入 postgres 表。我按如下方式连接到数据库：

import psycopg2
import pandas as pd
import sqlalchemy

def connect(user, password, db, host='localhost', port=5432):
    '''Returns a connection and a metadata object'''
    url  = 'postgresql://{}:{}@{}:{}/{}'
    url = url.format(user, password, host, port, db)

    # The return value of create_engine() is our connection object
    con = sqlalchemy.create_engine(url, client_encoding='utf8')

    # We then bind the connection to MetaData()
    meta = sqlalchemy.MetaData(bind=con, reflect=True)

    return con, meta

con, meta = connect('user_name', 'password', 'db_name', host='host_name')

当我从已经填充的表中读取时，它工作正常：

df = pd.read_sql("SELECT * FROM db.table_name limit 10",con=con)
print df

我希望能够将 df 写入表中。为了测试这一点，我有一个名为“test”的临时表，其中包含两个字段名称和年龄。

# create a temp df
table = [['name', 'age'], ['nameA' , 20], ['nameB', 30]]
headers = table.pop(0)
df = pd.DataFrame(table, columns=headers)
# write to db
df.to_sql('db.test', con, if_exists = 'replace', index=False)

然后我检查临时表是否已填充：

df = pd.read_sql("SELECT * FROM db.test limit 10",con=con)
print df

我得到一个空数据框！当我使用 df.to_sql 时没有出现错误，但没有任何内容写入数据库（？）。我缺少什么以及如何解决这个问题？

版本：

Pandas: 0.19.2
Sqlachemy: 1.1.10
Postgres: 9.4.9

我还没弄清楚为什么df.to_sql没有写入表。使用写入表pd.io.sql.SQLDatabase适用于我的测试用例：

meta = sqlalchemy.MetaData(con, schema='db_name')
meta.reflect()
pdsql = pd.io.sql.SQLDatabase(con, meta=meta)
pdsql.to_sql(df, 'test', if_exists='replace')

我不会认为这是解决方案——我很乐意接受更好的解决方案或答案，以解决 df.to_sql() 行为不符合预期的原因。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

postgresql

pandas

DataFrame

sqlalchemy

将数据帧写入 postgres 数据库的相关文章

在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
嵌套作用域和 Lambda

def funct x 4 action lambda n x n return action x funct print x 2 prints 16 我不太明白为什么2会自动分配给n n是返回的匿名函数的参数funct 完全等价的定义fu
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
如何从pandas中的多列计算多列

我正在尝试使用函数从 pandas 数据框中的多个列计算多个列该函数采用三个参数 a b 和 c 并返回三个计算值 sum prod 和 quot 在我的 pandas 数据框中我有三个列 a b 和 c 我想从中计算列 sum pro
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
pytest找不到模块[重复]

这个问题在这里已经有答案了我正在关注pytest 良好实践 https docs pytest org en latest explanation goodpractices html test discovery或者至少我认为我是但是
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

我可以在 PHP switch 语句中使用逻辑“或”吗？

是否可以在 switch case 中使用 or 或 and 这就是我所追求的 case 4 5 echo Hilo break 不但你可以这样做 case 4 case 5 echo Hilo break See the PHP手册 h
创建可用于所有包的 Symfony2 帮助器类的正确方法

我正在为我的模型实现 ACL 系统并且我想将公共代码提取到公共 Helper 类中我找不到任何如何正确执行此类操作的示例但我不断发现有必要这样做例如假设在我的控制器中我有一段代码直接取自文档 creating the ACL a
如果 str1 的一部分可以重新排列为 str2，如何编写一个返回 true 的函数？

我对以下问题遇到困难我基本上必须编写一个代码函数如果 str1 的一部分可以重新排列为 str2 则返回 true 编写函数 scramble str1 str2 如果 str1 字符的一部分可以重新排列以匹配 str2 则返回 tr
在iPhone应用程序升级上部署sqlite DB

我在 iPhone 应用程序中使用 sqlite 作为数据源我有两个关于应用程序升级的问题 1 数据都是配置非事务性的意思是它是只读的当我更新添加配置数据时我将发布应用程序的升级当用户获得更新的 iPhone 应用程序时原
如何从 TabHost Activity 返回结果 (startActivityForResult)？

我的示例中有 3 个类 A 类主要活动 A类调用startActivityForResult Intent intent new Intent this ClassB class startActivityForResult intent
Git：使用父层次结构克隆存储库

我有一个 git目录我将我正在处理的所有内容克隆到其中为了使事情变得简单和有条理我镜像了远程目录结构所以https gitlab com ajak tuir将被克隆到 git gitlab com ajak tuir 我创建了一个
类构造函数中的堆栈溢出错误

请原谅这可能是一个非常基本的问题但我正在编写一个程序来存储员工信息并且它工作正常直到它尝试在我的员工类中设置信息它给出了一个 stackoverflow 错误我不明白为什么谢谢你的帮助主要类别 import java util
在 root 上提供静态内容并在 /api 上休息

我在用着http路由器 https github com julienschmidt httprouter用于解析 api 调用中路径中的一些参数 router httprouter New router GET api param1 pa
NSManagedObject 子类和 setValuesForKeysWithDictionary：

我正在初始化一个NSManagedObject子类使用 void setValuesForKeysWithDictionary NSDictionary keyedValues 我还故意给它未定义的键这当然should抛出异常所以我已
如何从 url 列表创建 Dask DataFrame？

我有一个 URL 列表我很想将它们读取到 dask 数据框中立刻但看起来像read csv不能使用星号http 有什么办法可以实现这一点吗这是一个例子 link http web mta info developers data d
设计和单元测试跨平台应用程序

我正在开发一个为 Windows 构建的项目当前并将在未来为 darwin 构建以下是一个快速概述文件1 go package management type Manager interface Action1 file2 wind
将 NaN 移至各自行的末尾

我有一个像这样的数据框 0 1 2 0 0 0 1 0 2 0 1 NaN 1 0 2 0 2 NaN NaN 2 0 我想要得到的是 Out 116 0 1 2 0 0 0 1 0 2 0 1 1 0 2 0 NaN 2 2 0 NaN
只有 NSMutableArray 的第一个对象存储在 NSUserDefaults 中

我正在尝试存储 UILocalNotification 队列来解决极限问题 https stackoverflow com questions 14689661 cordova ios limit for local notificatio
Ruby/Rails 中的“Ago”日期/时间函数

我想知道 Rails 中是否有一种方法可以计算时间戳例如半分钟前 2 分钟前 1 天前等类似于 twitter 实时日期戳的东西我想知道 Ruby Rails 是否有用于此类日期时间转换的内置函数您可以使用 10 minutes a
bitbake中SRC_URI和FILESEXTRAPATHS_prepend的区别

为什么我们需要给出文件路径SRC URI即使我们将文件路径包含在FILESEXTRAPATHS prepend多变的例如 SUMMARY Simple Hello application LICENSE MIT LIC FILES CHK
hashmap键集自动排序

HashMap
为什么 -compile(export_all) 是不好的做法？

所有的erlang书籍似乎都说export all是不好的做法但没有给出理由最后大多数模块将大部分时间都花在了compile export all 上因为不断更新模块列表以删除辅助函数是很麻烦的这是不好的做法吗因为我应该关心我向
如何既保存两台相机的数据又不影响其拍照速度？

我正在使用多光谱相机来收集数据一种是近红外光另一种是彩色光不是两台相机而是一台相机可以同时获取两种不同类型的图像我可以使用一些 API 函数例如 J Image OpenStream 两部分核心代码如下所示一个用于打开两个流
PostgresQL SQL：将结果转换为数组

查询如下 SELECT i adgroup id i category id FROM adgroupcategories br WHERE i adgroup id IN SELECT i adgroup id FROM adgroupu
将数据帧写入 postgres 数据库

我想将 pandas 数据帧写入 postgres 表我按如下方式连接到数据库 import psycopg2 import pandas as pd import sqlalchemy def connect user password

将数据帧写入 postgres 数据库

将数据帧写入 postgres 数据库 的相关文章

随机推荐

热门标签

将数据帧写入 postgres 数据库的相关文章