将 Python Selenium 输出写入 Excel

2024-05-14

我编写了一个脚本来从在线网站上抓取产品信息。目标是将这些信息写入 Excel 文件。由于我的Python知识有限，我只知道如何在Powershell中使用Out-file导出。但结果是每个产品的信息都打印在不同的行上。我希望每种产品都有一条生产线。

我想要的输出可以在图片中看到。我希望我的输出看起来像第二个版本，但我可以接受第一个版本。

这是我的代码：

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException    

url = "http://www.strem.com/"
cas = ['16940-92-4','29796-57-4','13569-57-8','15635-87-7']

for i in cas:
    driver = webdriver.Firefox()
    driver.get(url)

    driver.find_element_by_id("selectbox_input").click()
    driver.find_element_by_id("selectbox_input_cas").click()

    inputElement = driver.find_element_by_name("keyword")
    inputElement.send_keys(i)
    inputElement.submit()

    # Check if a particular element exists; returns True/False          
    def check_exists_by_xpath(xpath):
        try:
            driver.find_element_by_xpath(xpath)
        except NoSuchElementException:
            return False
        return True

    xpath1 = ".//div[@class = 'error']" # element containing error message
    xpath2 = ".//table[@class = 'product_list tiles']" # element containing table to select product from
    #xpath3 = ".//div[@class = 'catalog_number']" # when selection is needed, returns the first catalog number

    if check_exists_by_xpath(xpath1):
        print "cas# %s is not found on Strem." %i
        driver.quit() 
    else:
        if check_exists_by_xpath(xpath2):
            catNum = driver.find_element_by_xpath(".//div[@class = 'catalog_number']")
            catNum.click()

            country = driver.find_element_by_name("country")
            for option in country.find_elements_by_tag_name('option'):
                if option.text == "USA":
                    option.click()
            country.submit()

            name = driver.find_element_by_id("header_description").text
            prodNum = driver.find_element_by_class_name("catalog_number").text
            print(i)
            print(name.encode("utf-8"))
            print(prodNum)

            skus_by_xpath = WebDriverWait(driver, 10).until(
                lambda driver : driver.find_elements_by_xpath(".//td[@class='size']")
            )

            for output in skus_by_xpath:
                print(output.text)

            prices_by_xpath = WebDriverWait(driver, 10).until(
                lambda driver : driver.find_elements_by_xpath(".//td[@class='price']")
            )

            for result in prices_by_xpath:
                print(result.text[3:]) #To remove last three characters, use :-3

            driver.quit()
        else:
            country = driver.find_element_by_name("country")
            for option in country.find_elements_by_tag_name('option'):
                if option.text == "USA":
                    option.click()
            country.submit()

            name = driver.find_element_by_id("header_description").text
            prodNum = driver.find_element_by_class_name("catalog_number").text
            print(i)
            print(name.encode("utf-8"))
            print(prodNum)

            skus_by_xpath = WebDriverWait(driver, 10).until(
                lambda driver : driver.find_elements_by_xpath(".//td[@class='size']")
            )

            for output in skus_by_xpath:
                print(output.text)

            prices_by_xpath = WebDriverWait(driver, 10).until(
                lambda driver : driver.find_elements_by_xpath(".//td[@class='price']")
            )

            for result in prices_by_xpath:
                print(result.text[3:]) #To remove last three characters, use :-3

            driver.quit()

https://pythonhosted.org/openpyxl/tutorial.html https://pythonhosted.org/openpyxl/tutorial.html

这是一个Python库的教程，允许对Python进行操作还有其他库，但我喜欢使用这个。

从 openpyxl 导入工作簿 wb = 工作簿()

然后使用给出的方法写入数据进而

wb.保存（文件名）

真的很容易上手。

这是一个使用 xlwt 和 xlrd 的 pdf 教程，但我并不经常使用这些模块。http://www.simplistix.co.uk/presentations/python-excel.pdf http://www.simplistix.co.uk/presentations/python-excel.pdf

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 Python Selenium 输出写入 Excel 的相关文章

从正在运行的 python 脚本检测优化标志是否为 -O 或 -OO

有时我想生成一个子进程其优化标志与启动父进程时使用的优化标志相同我可以使用类似的东西 optimize not debug 但这样我就可以匹配两者 O and OO flags 是否有一些 python 内部状态包含该信息经过一番深
在Python3.6中调用C#代码

由于完全不了解 C 编码我希望在我的 python 代码中调用 C 函数我知道有很多关于同一问题的问答但由于一些奇怪的原因我无法从示例 python 模块导入简单的 c 类库以下是我所做的事情 C 类库设置我使用的是 VS 20
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
on_delete=models.PROTECT 和 on_delete=models.CASCADE 在 Django 模型上有什么作用？

我对 Django 很熟悉但最近注意到有一个on delete models CASCADE and on delete models PROTECT模型的选项 on delete models CASCADE and on delete
从字符串到类型的词法转换

最近我尝试用Python存储和读取文件中的信息遇到了一个小问题我想从文本文件中读取类型信息从 string 到 int 或 float 的类型转换非常有效但从 string 到 type 的类型转换似乎是另一个问题当然我尝试了
使用 Excel 2010 通过存储过程读取/写入 SQL Server 2008 数据库

我们有一个 SQL Server 2008 数据库它有存储过程来处理读写等这些过程由各种应用程序内部使用需要一个人直接更新数据库中名为 Employee 的表更新非常简单更新 VARCHAR 和 INT 外键字段问题是 Sh
在适用于 Windows 和 Mac 的 VBA 中指定用户文件夹的路径

我正在编写一个使用 VBA 从 Excel 生成文件的工具生成的文件将写入用户的 Documents 文件夹中的文件夹如果存在 e g C Users
Python igraph：从图中删除顶点

我正在使用安然电子邮件数据集并尝试删除没有 enron com 的电子邮件地址即我只想拥有安然电子邮件当我尝试删除那些没有 enron com 的地址时一些电子邮件由于某些原因被跳过下面显示了一个小图其中顶点是电子邮件地址这是
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
具有多个元素的数组的真值是二义性错误吗？ Python

from numpy import from pylab import from math import def TentMap a x if x gt 0 and x lt 0 5 return 2 a x elif x gt 0 5 a
在 Selenium WebDriver 上如何从 Span 标签获取文本

在 Selenium Webdriver 上如何从 span 标记检索文本并打印我需要提取文本UPS Overnight Free HTML代码如下 div id customSelect 3 class select wrapper
将输入发送到 python 子进程而不等待结果

我正在尝试为一段代码编写一些基本测试该代码通常通过 stdin 无休止地接受输入直到给出特定的退出命令我想检查程序是否在给出一些输入字符串时崩溃经过一段时间来考虑处理但似乎无法弄清楚如何发送数据而不是陷入等待我不知道的输出关心我
Pandas Dataframe：将包含列表的行扩展到多行，并为所有列提供所需的索引

我在 pandas 数据框中有时间序列数据索引为测量开始时的时间列中包含以固定采样率记录的值列表连续索引列表中元素数量的差异这是它的样子 Time A B Z 0 1 2 3 4 1 2 3 4 2 5 6 7 8 5 6 7 8
如何有效地从 loadmat 函数生成的嵌套 numpy 数组中提取值？

python中是否有更有效的方法从嵌套的python列表中提取数据例如A array array 12000000 dtype object 我一直在使用A 0 0 0 0 当你有很多像 A 这样的数据时这似乎不是一个有效的方法我也用
Flask WTForms 使用变量自动填充 StringField

我有一个表格我想用上一页收到的信息自动填充一些字段但如果他们想调整它它需要是可更改的我正在为我的 SelectField 使用动态创建的列表但添加 StringField 并不成功请参阅下面的我的代码 forms py clas
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
Python 3.2 中 **kwargs 和 dict 有什么区别？

看起来Python的很多方面都只是功能的重复除了我在 Python 中的 kwargs 和 dict 中看到的冗余之外还有什么区别吗参数解包存在差异许多人使用kwargs 并通过dict作为论据之一使用参数解包 Prepare f
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide

随机推荐

在 Shiny 应用程序中过滤数据时，长度为 1 的字符向量除了第一个元素之外的所有元素都将被忽略错误

我有以下闪亮的应用程序 library shiny library rhandsontable library shinydashboard library ggplot2 library dplyr setwd C Users Marc
systemd 的“oneshot”和“simple”服务类型有什么区别？

有什么区别systemd服务Type oneshot and simple This link https jason the graham com 2013 03 06 how to use systemd timers 状态使用simp
创建 html 结构，每个 li 中仅允许 3 个 div 元素。在 React + underscore.js 中

这是以下内容的位副本如何创建每个 li 中仅允许 3 个 div 元素的 html 结构在 React underscore js 中 https stackoverflow com questions 38008023 how to c
从三点求圆心的算法是什么？

我在圆的圆周上有三个点 pt A A x A y pt B B x B y pt C C x C y 如何计算圆心在Processing Java 中实现它我找到了答案并实施了一个可行的解决方案 pt circleCenter pt A
缺失的事件如何重播？

我正在尝试了解有关 CQRS 和事件溯源事件存储的更多信息我的理解是在这种情况下通常不使用消息队列总线消息总线可用于促进微服务之间的通信但它通常不专门用于 CQRS 然而我目前的看法是消息总线将非常有用可以保证读取模型最
symfony2 FOSRestBundle 注释

有人在控制器中使用过 put get post delete 注释 https github com FriendsOfSymfony FOSRestBundle blob master Controller Annotations 吗我
Subversion 和 Visual Studio 项目的最佳实践

我最近开始在 Visual Studio 中处理各种 C 项目作为大型系统计划的一部分该系统将用于替换我们当前的系统该系统是由用 C 和 Perl 编写的各种程序和脚本拼凑而成的我现在正在进行的项目已经达到了颠覆的临界点我想知道什
Amazon S3：静态网站：自定义域或子域

Amazon com 刚刚宣布可以在 S3 存储桶中托管静态网站我访问了他们的设置页面http docs amazonwebservices com AmazonS3 latest dev index html WebsiteHostin
将字节数组转换为托管结构

更新这个问题的答案帮助我编写了开源项目GitHub 上的 AlicanC 现代战争 2 工具 https github com AlicanC AlicanC s Modern Warfare 2 Tool 你可以看到我是如何阅读这些数据
SwiftUI - 从 NSObject 继承的 ObservableObject 在 iOS 13 中不会更新

我知道这是无法在 iOS XX 中工作问题之一但我完全陷入困境所以我有一个ObservableObject继承自的类NSObject 因为我需要听委托方法UISearchResultsUpdating class SearchBa
在 JQuery ui 自动完成中显示图像

我有一个带有 JQuery ui 自动完成功能的脚本可以完美运行有一个显示用户名字和姓氏的搜索过程但在我的数据库中还有用户的图片我想将其显示在带有名字和姓氏的建议中数据库中pic包含图片url 剧本 function searc
按降序排序映射java8 [重复]

这个问题在这里已经有答案了 private static
C 程序从连接到系统的 USB 设备读取数据

我正在尝试从连接到系统 USB 端口的 USB 设备例如随身碟获取数据在这里我可以打开设备文件并读取一些随机原始数据但我想获取像 minicom teraterm 这样的数据请让我知道我可以使用哪些方法和库来成功完成此操作以及如
Qt 文件对话框默认后缀不起作用

我将以下代码用于 QtQuick Dialogs 1 3 和 Qt 5 10 0 下 filedialog 的新属性我使用 Qt Creator 5 10 默认套件构建它 import QtQuick 2 10 import QtQuic
从多线程程序中调用 system()

我们正在开发一个用 C 编写的多线程内存消耗应用程序我们必须执行大量的 shellscript linux 命令并获取返回码读完之后article http www linuxprogrammingblog com threads a
使 Chrome 扩展弹出窗口透明

我正在写一个 chrome 扩展我想知道是否有办法使弹出窗口透明即即使弹出窗口覆盖当前页面用户也可以看到当前页面的内容谢谢你昨天我想到了一个有趣的想法虽然你不能删除白色背景但你仍然可以mimic透明背景这可以通过在打开弹出窗
Browserify：如果需要，使用 module.exports，否则暴露全局

我正在考虑采用浏览器化 http browserify org 对于我的一些项目但想确保其他人如果想使用捆绑的代码就不必使用 browserify 执行此操作的明显方法是通过以下方式公开模块导出module exports以及通过一个
System.IO.IOException：由于意外>数据包格式，握手失败？

有谁知道这意味着什么 System Net WebException 底层连接已关闭发送时发生意外错误 gt System IO IOException 由于意外握手失败数据包格式在 System Net Security SslS
是否可以将一位的位向量转换为 SMTLib2 中的布尔变量？

我想要一个布尔变量来测试例如位向量的第三位是否为 0 位向量的理论允许提取 1 位作为位向量但不是布尔类型我想知道我是否可以出演这个角色谢谢更新如果我的问题不清楚我很抱歉但 Nikolaj Bjorner 的答案是如何测试
将 Python Selenium 输出写入 Excel

我编写了一个脚本来从在线网站上抓取产品信息目标是将这些信息写入 Excel 文件由于我的Python知识有限我只知道如何在Powershell中使用Out file导出但结果是每个产品的信息都打印在不同的行上我希望每种产品都有一条

将 Python Selenium 输出写入 Excel

将 Python Selenium 输出写入 Excel 的相关文章

随机推荐

热门标签