将图像添加到 pandas DataFrame

2024-02-09

假设我有一个 DataFrame 我想导出为 PDF。在数据框中,我有以下列:代码、名称、价格、净值、销售额。每一行都是一个产品。

我想向该 DataFrame 中的每个产品添加一个我可以使用 BeautifulSoup 获得的图像。有什么方法可以将图像添加到 DataFrame 中?不是链接,只是产品的图片。

更具体地说,我想要这样的东西:

Code:

import pandas as pd
df = pd.DataFrame([['A231', 'Book', 5, 3, 150], 
                   ['M441', 'Magic Staff', 10, 7, 200]],
                   columns = ['Code', 'Name', 'Price', 'Net', 'Sales')

#Suppose this are the links that contains the imagen i want to add to the DataFrame
images = ['Link 1','Link 2'] 

您可能需要稍微调整一下宽度和高度属性,但这应该可以帮助您入门。基本上,您只需将图像/链接转换为 html,然后使用 df.to_html 来显示这些标签。请注意,它不会显示您是否在 PyCharm、Spyder 等 IDE 中工作,但正如您在下面的输出中看到的那样,通过 jupyter 笔记本可以正常工作

import pandas as pd
from IPython.core.display import display,HTML

df = pd.DataFrame([['A231', 'Book', 5, 3, 150], 
                   ['M441', 'Magic Staff', 10, 7, 200]],
                   columns = ['Code', 'Name', 'Price', 'Net', 'Sales'])

# your images
images1 = ['https://vignette.wikia.nocookie.net/2007scape/images/7/7a/Mage%27s_book_detail.png/revision/latest?cb=20180310083825',
          'https://i.pinimg.com/originals/d9/5c/9b/d95c9ba809aa9dd4cb519a225af40f2b.png'] 


images2 = ['https://static3.srcdn.com/wordpress/wp-content/uploads/2020/07/Quidditch.jpg?q=50&fit=crop&w=960&h=500&dpr=1.5',
           'https://specials-images.forbesimg.com/imageserve/5e160edc9318b800069388e8/960x0.jpg?fit=scale']

df['imageUrls'] = images1
df['otherImageUrls'] = images2


# convert your links to html tags 
def path_to_image_html(path):
    return '<img src="'+ path + '" width="60" >'

pd.set_option('display.max_colwidth', None)

image_cols = ['imageUrls', 'otherImageUrls']  #<- define which columns will be used to convert to html

# Create the dictionariy to be passed as formatters
format_dict = {}
for image_col in image_cols:
    format_dict[image_col] = path_to_image_html


display(HTML(df.to_html(escape=False ,formatters=format_dict)))

然后您可以选择如何转到 pdf。

你可以另存为html

df.to_html('test_html.html', escape=False, formatters=format_dict)

然后只需使用 html 到 pdf 转换器here https://html2pdf.com/,或使用诸如pdfkit https://pypi.python.org/pypi/pdfkit or 威易印刷 http://weasyprint.org/。我对这些并不完全熟悉(很久以前我只使用过其中一个),但这里有一个很好的link https://stackoverflow.com/questions/23359083/how-to-convert-webpage-into-pdf-by-using-python

祝你好运。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将图像添加到 pandas DataFrame 的相关文章

  • Python - 比较同一字典中的值

    我有一本字典 d Trump MAGA FollowTheMoney Clinton dems Clinton Stein FollowTheMoney Atlanta 我想删除字符串列表中的重复字符串 该字符串是键的值 对于这个例子 期望
  • matplotlib 图中点的标签

    所以这是一个关于已发布的解决方案的问题 我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签 我试图在这里模仿解决方案 是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
  • 多输出堆叠回归器

    一次性问题 我正在尝试构建一个多输入堆叠回归器 添加到 sklearn 0 22 据我了解 我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试 这似乎是正确的顺序 import nu
  • python multiprocessing 设置生成进程等待

    是否可以生成一些进程并将生成进程设置为等待生成的进程完成 下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
  • 在 Django Admin 中调整字段大小

    在管理上添加或编辑条目时 Django 倾向于填充水平空间 但在某些情况下 当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时 这确实是一种空间浪费 字符宽 然后编辑框最多可容纳 15 或 20 个字符 我如何告
  • GUI(输入和输出矩阵)?

    我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据 完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
  • Python 内置的 super() 是否违反了 DRY?

    显然这是有原因的 但我没有足够的经验来认识到这一点 这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
  • 为什么一旦我离开内置的运行服务器,Django 就无法找到我的管理媒体文件?

    当我使用内置的简单服务器时 一切正常 管理界面很漂亮 python manage py runserver 但是 当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
  • python的shutil.move()在linux上是原子的吗?

    我想知道python的shutil move在linux上是否是原子的 如果源文件和目标文件位于两个不同的分区上 行为是否不同 或者与它们存在于同一分区上时的行为相同吗 我更关心的是如果源文件和目标文件位于同一分区上 shutil move
  • 将 Matlab 的 datenum 格式转换为 Python

    我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题 时间信息以 Matlab 的日期数字格式存储 对于那些不熟悉它的人 日期序列号将日历日期表示为自固定基准日期以来已经过去的天数 在 MATLAB
  • Python GTK+ 画布

    我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西 我已经搜索了文档 发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数 如 fillrect 或 drawline
  • 在 Google App Engine 中,如何避免创建具有相同属性的重复实体?

    我正在尝试添加一个事务 以避免创建具有相同属性的两个实体 在我的应用程序中 每次看到新的 Google 用户登录时 我都会创建一个新的播放器 当新的 Google 用户在几毫秒内进行多个 json 调用时 我当前的实现偶尔会创建重复的播放器
  • Spider 必须返回 Request、BaseItem、dict 或 None,已“设置”

    我正在尝试从以下位置下载所有产品的图像 我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
  • 如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档(.doc 和 .docx)文件内容?

    我的场景是 我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容 下面的代码是我使用的 我的问题是我可以获取文件名 但无法读取内容 def lambda hand
  • 每当使用 import cv2 时 OpenCV 都会出错

    我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了 但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时 在 python IDLE 上它都会说 Trac
  • Firebase Firestore:获取文档的生成 ID (Python)

    我可以创建一个新文档 带有自动生成的 ID 并存储对其的引用 如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
  • 如何从pandas中的多列计算多列

    我正在尝试使用函数从 pandas 数据框中的多个列计算多个列 该函数采用三个参数 a b 和 c 并返回三个计算值 sum prod 和 quot 在我的 pandas 数据框中 我有三个列 a b 和 c 我想从中计算列 sum pro
  • 等待子进程使用 os.system

    我用了很多os system在 for 循环内调用创建后台进程 如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
  • 根据 Pandas 中的列表选择数据框行的子集

    我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
  • pytest找不到模块[重复]

    这个问题在这里已经有答案了 我正在关注pytest 良好实践 https docs pytest org en latest explanation goodpractices html test discovery或者至少我认为我是 但是

随机推荐

  • Visual Studio 中 ASP.NET Core 项目的“REST API 客户端”选项?

    我已经在 Azure 中启动并运行了 ASP NET REST API 从 Visual 中较旧的 NET 4 5 项目中 我使用此菜单选项生成了一个客户端 但是当我创建一个新的 ASP NET Core ASP NET 5 项目 并且想要
  • WCF WebService - 有没有办法确定客户端收到响应?

    假设我有一个 WCF 服务 客户端可以使用该服务从某个服务器端消息队列接收消息 举个例子 假设数据表中有一个服务器端电子邮件队列 ID MESSAGE TEXT SENT 1 Hi N 2 A 2nd Msg N 让我们将我们的服务定义为
  • C 中的“CALLBACK”声明有什么作用?

    我正在查看一些代码SDL http www libsdl org库并遇到了这样声明的函数 LRESULT CALLBACK WndProc HWND hwnd UINT msg WPARAM wParam LPARAM lParam 现在
  • Apigee - 配置 API 代理时出现问题

    我正在寻找一种方法将客户的 WCF 服务公开为 REST 服务 并创建所有安全堆栈以支持声明 oauth 身份验证和授权 我正在研究两种不同的方法来做到这一点 创建一个新的 REST 服务 它将充当代理 将我的 WCF 服务公开为 REST
  • 使用 PHP 根据 Schematron 验证 XML

    有很多关于 Schematront 的资源 但是我找不到任何相关内容或有关如何根据 Schematront sch 文件验证 xml 的示例 Anyone 我已经发现 1 或 2 个非常旧的类会返回错误 所以如果有人知道如何做到这一点 请提
  • Google Play 服务过期错误

    我的 google play service 有问题 我正在使用 Google API 进行 oAuth2 身份验证和日历 Gmail 信息 昨天一切正常 但今天他告诉我 我需要更新版本的 Google PLay 服务 Android St
  • 客户我的帐户订单历史记录中不显示自定义订单状态

    在 WooCommerce 中 我制作了 2 个自定义订单状态 第一个是 运输状态 另一个是 批准状态 在我将一些订单状态更改为这两个新状态 分别是shipping or approved 客户无法在其订单历史记录页面查看此订单 这是我的代
  • git merge --strategy 与 --strategy-option

    git merge 选项有什么区别 strategy option short X and strategy short s 有很多关于合并策略 https stackoverflow com questions 366860 when w
  • switch 因被 JSHint 忽略而失败

    我正在运行我的代码JSHint http www jshint com 我遇到了这个错误 预计break之前的声明case 在这段代码中 switch true Renames skill1 abc to section 8 1 body
  • 如何向远程服务器添加 ssh 密钥? [关闭]

    Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案 在我的 VPS 中 运行ssh add l它返回 The agent has no identities 但我已经跑了cat ssh
  • 如何在 Ruby 中删除字符串中的最后一个元音?

    如何定义字符串中的最后一个元音 例如 我有一个词 经典 我想找到单词 class 的最后一个元音ic 是字母 i 并删除最后一个元音 我在想 def vowel str result new str split i new length 1
  • 解决方法:汇总下游测试结果

    据我所知 聚合下游测试结果 功能并没有按预期工作 并且很难找到有用的文档 我想实现非常相似的功能 Job Build触发工作T1 T2并行 其中T1FindBugs T2PMD 场景一 立刻T1 and T2已完成 我可以使用 加入 插件来
  • 如何使用参数传递对函数的引用? [复制]

    这个问题在这里已经有答案了 可能的重复 如何在 JavaScript 函数调用中预先设置参数 部分功能应用 https stackoverflow com questions 321113 how can i pre set argumen
  • 微服务依赖管理 - 治理还是领域驱动设计?

    背景 由于长期的单体式痛苦 一家采用联邦模式的国际公司正在转型为微服务 能够快速部署的自治团队是非常理想的 尽管理论上如此 但服务确实相互依赖以获得更高的功能 但它们是自治的 独立开发和部署 由于这是联邦模式和分散控制 我们不能像联合国那样
  • Java 安全管理器会降低性能吗?

    实施 Java 安全管理器是否会导致性能下降 这完全取决于实现的细节以及应用程序 当然有可能实现一个需要很长时间来检查某些权限的安全管理器 以及一个需要非常频繁地检查这些权限的应用程序 从而导致可怕的性能 但通常情况下 检查权限的频率不足以
  • 在 Firebase 数据库模拟器中模拟更新

    我的问题很简单 我不知道如何在 Firebase Simulator 中模拟多个更新 由于我什至不知道如何开始 所以我无法提供任何代码 任何指导都会非常有帮助 目前无法在 Firebase 数据库安全规则模拟器中执行多位置更新 拥有该功能就
  • OS X 上的 ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] 证书验证失败 (_ssl.c:747)

    我正在尝试这段代码 import pandas as pd fiddy states pd read html https simple wikipedia org wiki List of U S states print fiddy s
  • 所有编译时常量都是内联的吗?

    假设我有一堂这样的课 class ApplicationDefs public static final String configOption1 some option public static final String configO
  • 使用 django 和 xgettext 进行本地化

    我正在翻译我的网站 但是当我尝试运行命令时 manage py makemessages locale bs 我不断收到如下错误 CommandError errors happened while running xgettext on
  • 将图像添加到 pandas DataFrame

    假设我有一个 DataFrame 我想导出为 PDF 在数据框中 我有以下列 代码 名称 价格 净值 销售额 每一行都是一个产品 我想向该 DataFrame 中的每个产品添加一个我可以使用 BeautifulSoup 获得的图像 有什么方