如何使用 pyautogui 检测图像并单击它？

2023-12-15

我想学习如何让机器人点击图像，我尝试观看 yt 教程，但我找不到代码中的错误，因为这实际上是我第一次使用 python，我尝试了以下代码：

from pyautogui import *
import pyautogui
import time
import keyboard
import random
import win32api, win32con

time.sleep(5)

def click():
    win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN,0,0)
    win32api.mouse_event(win32con.MOUSEEVENTF_LEFTUP,0,0)

while keyboard.is_pressed('q') == False:
    flag = 0
    
    if pyautogui.locateOnScreen('benz.png', region=(0,0,1366,768), grayscale=True, confidence=0.5) != None:
                flag = 1
                click()
                time.sleep(0.05)
                break

                
                if flag == 1:
                 break

但我不断得到：

Traceback (most recent call last):
  File "c:\Program Files\Karim\autoclicker\main+stickman.py", line 17, in <module>
    if pyautogui.locateOnScreen('benz.png', region=(0,0,1366,768), grayscale=True, confidence=0.5) != None:
  File "C:\Users\bayan\AppData\Local\Programs\Python\Python310\lib\site-packages\pyautogui\__init__.py", line 175, in wrapper
    return wrappedFunction(*args, **kwargs)
  File "C:\Users\bayan\AppData\Local\Programs\Python\Python310\lib\site-packages\pyautogui\__init__.py", line 213, in locateOnScreen
    return pyscreeze.locateOnScreen(*args, **kwargs)
  File "C:\Users\bayan\AppData\Local\Programs\Python\Python310\lib\site-packages\pyscreeze\__init__.py", line 373, in locateOnScreen
    retVal = locate(image, screenshotIm, **kwargs)
  File "C:\Users\bayan\AppData\Local\Programs\Python\Python310\lib\site-packages\pyscreeze\__init__.py", line 353, in locate
    points = tuple(locateAll(needleImage, haystackImage, **kwargs))
  File "C:\Users\bayan\AppData\Local\Programs\Python\Python310\lib\site-packages\pyscreeze\__init__.py", line 207, in _locateAll_opencv
    needleImage = _load_cv2(needleImage, grayscale)
  File "C:\Users\bayan\AppData\Local\Programs\Python\Python310\lib\site-packages\pyscreeze\__init__.py", line 170, in _load_cv2
    raise IOError("Failed to read %s because file is missing, "
OSError: Failed to read benz.png because file is missing, has improper permissions, or is an unsupported or invalid format

注：benz.png文件与代码位于同一文件夹中，它是 png 格式，实际上是一张照片（意味着当您双击它时它会打开并显示照片）

代码中可能有一个我不知道的愚蠢错误，因为我对 python 几乎一无所知 ????

PyAutoGUI 有一个内置的function called locateOnScreen()如果可以在当前屏幕上找到图像，则返回图像中心的 x、y 坐标（它会截取屏幕截图，然后对其进行分析）。

图像必须匹配exactly为了这个工作；即如果您想单击button.png该按钮图片必须与窗口中的按钮具有相同的精确尺寸/分辨率，以便程序识别它。实现此目的的一种方法是截取屏幕截图，在绘图中将其打开，然后仅剪切出您想要按下的按钮（或者您可以让 PyAutoGUI 为您完成此操作，正如我将在后面的示例中展示的那样）。

import pyautogui

question_list = ['greencircle', 'redcircle', 'bluesquare', 'redtriangle']

user_input = input('Where should I click? ')

while user_input not in question_list:
    print('Incorrect input, available options: greencircle, redcircle, bluesquare, redtriangle')
    user_input = input('Where should I click?')

location = pyautogui.locateOnScreen(user_input + '.png')
pyautogui.click(location)

上面的例子要求你已经有greencircle.png以及目录中的所有其他 .png

PyAutoGUI 还可以截图并且您可以指定在屏幕的哪个区域进行拍摄pyautogui.screenshot(region=(0, 0, 0, 0))前两个值是要选择的区域左上角的 x,y 坐标，第三个值是向右的距离 (x)，第四个值是向下的距离 (y)。

以下示例截取 Windows 10 徽标的屏幕截图，将其保存到文件中，然后使用指定的 .png 文件单击该徽标

import pyautogui

pyautogui.screenshot('win10_logo.png', region=(0, 1041, 50, 39))
location = pyautogui.locateOnScreen('win10_logo.png')
pyautogui.click(location)

您也不必将屏幕截图保存到文件中，只需将其保存为变量即可

import pyautogui

win10 = pyautogui.screenshot(region=(0, 1041, 50, 39))
location = pyautogui.locateOnScreen(win10)
pyautogui.click(location)

让程序检测用户是否单击了某个区域（比方说，Windows 10 徽标）将需要另一个库，例如pynput.

from pynput.mouse import Listener    

def on_click(x, y, button, pressed):
    if 0 < x < 50 and 1080 > y > 1041 and str(button) == 'Button.left' and pressed:
        print('You clicked on Windows 10 Logo')
        return False    # get rid of return statement if you want a continuous loop

with Listener(on_click=on_click) as listener:
    listener.join()

将所有内容放在一起

import pyautogui
from pynput.mouse import Listener

win10 = pyautogui.screenshot(region=(0, 1041, 50, 39))
location = pyautogui.locateOnScreen(win10)

# location[0] is the top left x coord
# location[1] is the top left y coord
# location[2] is the distance from left x coord to right x coord
# location[3] is the distance from top y coord to bottom y coord

x_boundary_left = location[0]
y_boundary_top = location[1]
x_boundary_right = location[0] + location[2]
y_boundary_bottom = location[1] + location[3]


def on_click(x, y, button, pressed):
    if x_boundary_left < x < x_boundary_right and y_boundary_bottom > y > y_boundary_top and str(button) == 'Button.left' and pressed:
        print('You clicked on Windows 10 Logo')
        return False    # get rid of return statement if you want a continuous loop


with Listener(on_click=on_click) as listener:
    listener.join()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pyautogui

如何使用 pyautogui 检测图像并单击它？的相关文章

尽管极其懒惰，但如何在 Python 中模拟 IMAP 服务器？

我很好奇是否有一种简单的方法来模拟 IMAP 服务器例如imaplib模块在Python中 without做很多工作是否有预先存在的解决方案理想情况下我可以连接到现有的 IMAP 服务器进行转储并让模拟服务器在真实的邮箱电子
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

QRunnable 尝试中止任务

是否可以中止 QRunnable 任务即使在文档中我也找不到任何方法多谢不您不能中止 QRunnable 任务在 Qt 中脏中止线程的唯一方法是通过QThread terminate 这是不鼓励的 QThreadPool uses
制作一个函数在返回之前等待事件？

function myFunction wait what I put there return myFunction this is an event when its triggered I want function to resum
如何使用python从内网站点抓取URL数据？

我需要一个 Python Warrior 来帮助我我是个菜鸟我正在尝试使用模块 urllib 从内部网站点抓取某些数据但是由于这是我公司的网站仅供员工查看而不可供公众查看我认为这就是我得到此代码的原因 IOError http
WPF 绑定到样式中另一个属性的绑定

我不确定提出这个问题的最佳方式抱歉问题标题含糊不清但本质上我想使用从数据上下文传递属性的值转换器在 TextBox 上设置 MaxLength 属性以及传入属性上的属性作为转换器参数我想以一种风格来完成这一切而不是在逐个控制的基础
在撰写中获取可见性画布绘制

我有一个画布可以在其中绘制两个相同大小的图像并且我已经实现了一个触摸侦听器可以在其中擦除其中一个图像我想知道是否有可能知道该图像的可见性百分比我正在擦除 val overlayImageLoaded rememberAsync
如何在phonegap中播放swf文件？

我正在 android 的phonegap 中开发一个Flash 应用程序我尝试过将 flash 嵌入到 html 中但没有成功它显示空白什么也没有出现然后我尝试使用 childBrowser childbrowser 打开但仍
在使用 Jersey 使用 jaxb 注释将 json 解组到 java bean 时如何使用一些间接寻址

我正在尝试解组一些收到的 json 来自 Jira Restful Web 服务问题是问题具有摘要属性和字段列表摘要不作为接收到的 json 中的属性出现而是作为 fields 属性的值出现我坚持解组到这个结构 XmlRoo
如何从一个类中调用另一个类中的函数？

更新修改标题以更好地反映我的问题大家好我今天的问题围绕着我试图从一个子类发送到另一个子类的 CustomEvent 我已经使用我的 CustomEvent 类将事件从子类传递到我的主类但我不确定由谁在子类之间执行此操作我的自定义事
将日期转换为时间戳 UTC

我是 Java 新手想知道如何将日期转换为时间戳如果我向它传递一个日期反之亦然我在 StackOverflow 上搜索过但没有一个问题能解决我的问题我需要在 JSON 中使用此时间戳作为 highcharts API 上的参数来
sql中如何求中位数

我有以下 sql 查询它给出了按月周和日分组的总 h time 相反我想要月周和日的 h time 中位数如何在 Oracle SQL 中执行此操作 SELECT DAY MEDIAN H TIME AS HANDLE TIME
创建一个函子作为可调用类或嵌套函数[关闭]

Closed 这个问题是基于意见的目前不接受答案在 Python 3 中你可以创建这样的类 class foo def init self x self x x def call self y self x self x 1 retur
如何确保MySQL数据库在增加字段时不存在竞争条件？

当两个连接想要更新同一条记录时如何防止 MySQL 数据库中的竞争条件例如连接 1 想要增加尝试计数器第二个连接也想做同样的事情两个连接SELECT 尝试计数增加值两者UPDATE 尝试增加的值突然间 tries 只
为什么 XPath 选择上下文节点之外的节点？

我将 XPath 与 Node js 结合使用并且有以下 HTML 文档我想在其中选择所有文章节点然后在第二步中选择所有带有类的 div abc
Javascript/XML - 获取节点名称

我需要获取标签 myChild 的名称和内容这很简单但我被困住了困了这是我通过测试得到的结果 XML
如何强制章节在 ODD 页面（html 和 epub）上开始

Chapter padding bottom 30vh break before right important 好消息章节从自己的页面开始坏消息预期的行为在主框之前强制一两个分页符哪个将使下一页成为正确的页面被浏览器和任何 e
在 Android 中跨活动播放 BG 音乐

你好第一次在 stackoverflow 上提问令人兴奋哈哈我们正在开发一个 Android 游戏我们为我们的介绍播放一些背景音乐我们有一个介绍活动但我们希望它继续播放到下一个活动并且也许能够从游戏内的任何地方停止或再次播放
pip install mysql-python 失败并出现环境错误：找不到 mysql_config

这是我得到的错误 mysite zjm1126 zjm1126 G41MT S2 zjm test mysite pip install mysql python Downloading unpacking mysql python Dow
在 JAVA 中获取给定日期范围（DateX 和 DateY）之间的所有星期一和星期四日期将是一个很好的实现

我想在给定的日期范围内获取一些天数对此的最佳解决方案是什么例如我想获取从今天到两个月的所有星期一星期三和星期四的日期使用java time 现代方法使用 java time 类实例化List对象来收集您的结果 List
不同分辨率下的 Windows 窗体大小问题

我是窗口表单开发的新手在开发了一些表单后我注意到表单在不同的分辨率下无法正确显示表单在某些分辨率下超出了屏幕我想知道是否有任何设置可以根据分辨率自动调整表单或者是否有任何黑客或一些技术可以用来设计表单请详细说明您的答案因为我对
如何使用 pyautogui 检测图像并单击它？

我想学习如何让机器人点击图像我尝试观看 yt 教程但我找不到代码中的错误因为这实际上是我第一次使用 python 我尝试了以下代码 from pyautogui import import pyautogui import time

如何使用 pyautogui 检测图像并单击它？

如何使用 pyautogui 检测图像并单击它？ 的相关文章

随机推荐

热门标签

如何使用 pyautogui 检测图像并单击它？的相关文章