TypeError：无法在 re.findall() 中的类似字节的对象上使用字符串模式

2024-05-26

我正在尝试学习如何自动从页面获取网址。在下面的代码中，我试图获取网页的标题：

import urllib.request
import re

url = "http://www.google.com"
regex = r'<title>(,+?)</title>'
pattern  = re.compile(regex)

with urllib.request.urlopen(url) as response:
   html = response.read()

title = re.findall(pattern, html)
print(title)

我收到这个意外错误：

Traceback (most recent call last):
  File "path\to\file\Crawler.py", line 11, in <module>
    title = re.findall(pattern, html)
  File "C:\Python33\lib\re.py", line 201, in findall
    return _compile(pattern, flags).findall(string)
TypeError: can't use a string pattern on a bytes-like object

我究竟做错了什么？

您想使用以下命令将 html （类似字节的对象）转换为字符串.decode, e.g. html = response.read().decode('utf-8').

See 将字节转换为 Python 字符串 https://stackoverflow.com/questions/606191/convert-bytes-to-a-python-string

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

webcrawler

TypeError：无法在 re.findall() 中的类似字节的对象上使用字符串模式的相关文章

没有名为 crypto.cipher 的模块

我现在正在尝试加密一段时间我最近得到了这个基于 python 的密码器名为PythonCrypter https github com jbertman PythonCrypter 我对 Python 相当陌生当我尝试通过终端打开 C
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di

随机推荐

WatchOS 应用程序未检测到配套的 iOS 应用程序

我正在制作一个独立的Apple Watch应用程序但有一个配套的iPhone应用程序这对于手表应用程序的运行来说不是必需的该应用程序使用手表连接如果安装了 iPhone 配套应用程序则可以在设备之间同步数据我可以打电话sessio
正则表达式查找两个字符之间的内部匹配

环境 Java 我想匹配两个字符串之间的字符这是一个例子 foo
如何从 Perl 中的文本文件中提取/解析表格数据？

我正在寻找类似的东西HTML 表格提取 http search cpan org dist HTML TableExtract 只是不适用于 HTML 输入而是适用于包含采用缩进和间距格式化的表格的纯文本输入数据可能如下所示 Her
Android 上下文不在活动中？还有其他无活动编程吗？

我会非常努力地将其变成一个综合问题我正在编写一个方法来获取一个包含 Android 设备城市名称的字符串该名称由LocationManager and getLastKnownLocation 等等然后我意识到我需要在另一个活动中再次
Gradle中的build-by-convention深度解释是什么？

The 摇篮用户指南 http www gradle org docs current userguide userguide html经常提到 Gradle 是陈述性的和用途按惯例构建这是什么意思据我了解这意味着例如在java插
清理 php 中的句子

标题可能听起来很奇怪但我有点尝试设置这个 preg replace 来处理文本区域的混乱写入者它必须如果有感叹号则不应连续出现另一个感叹号如果有则逗号胜出并且必须是当昏迷前有一个空格时应将其减少到零该句子不能以逗号开头
移动相邻选项卡以进行拆分？

有没有一种简单的方法可以将 Vim 中的相邻选项卡作为拆分移动到当前窗口 While looking around I reached a mailing list discussion where someone said it s th
C++ 中的前向声明是什么？

At this http www learncpp com cpp tutorial 19 header files 链接提到了以下内容 add cpp int add int x int y return x y 主要 cpp incl
Swift 中的 titleLabel.text 与 currentTitle

我正在尝试用 Swift 制作一个简单的计算器我想获取我创建的按钮上的文本本教程中的讲师正在使用一个属性 IBAction func appendDigit sender UIButton let digit sender curre
Ruby on Rails：如何检查复数形式和单一形式的名称

我用命令创建了一个匿名模型 rails g model Anonymous section id integer aid string fake bool active bool 但迁移中的表名称为匿名 class CreateAnonym
如何使用 PowerShell 捕获全局击键？

Powershell 可以监听并捕获按键吗是否可以编写一个 PowerShell 脚本例如自动热键 https www autohotkey com 位于托盘中并等待您按下预定义的键盘键才开始执行并且每次按下所述键时可能不会返回而是触
在 Spring Security 中创建自定义 PostAuthorize 方法

我正在尝试创建一个自定义方法用于预后授权调用如下所示 public class CustomLSecurityExpressionHandler extends DefaultMethodSecurityExpressionHandl
如何使用社交框架呈现 SKscene 中的 UIViewController？

我正在制作一款类似 Flappy Bird 的游戏如何从 SKScene 呈现 UIViewController 首先我告诉我的环境 Mac OS X 10 9 Xcode 5 0 2 Sprite Kit framework soci
如何用c语言运行可执行文件？

我试图使用 C 语言编译器 3 0 执行这个程序一切正常但是当我运行这个程序时它永远不会打开 Firefox 当我运行这个程序的可执行文件时它显示兼容性问题错误请帮助我 include
填充占位符文本 ios

我想让占位符文本显示在文本字段的中间填充占位符文本占位符文本的大小也需要增加我的代码如下我该如何解决这个问题 UITextField textField UITextField alloc initWithFrame CGRectM
内联函数与预处理器宏

内联函数与预处理器宏有何不同预处理器宏只是应用于代码的替换模式它们几乎可以在代码中的任何地方使用因为在任何编译开始之前它们都会被替换为扩展内联函数是实际函数其主体直接注入到其调用站点中它们只能在适合函数调用的地方使用现在就在
DrawBitmapMesh 如何在 Android Canvas 中工作

我想在矩形上绘制位图我使用以下值 this meshWidth 1 this meshHeight 1 this verts new float 8 this points 0 x float this getWidth 4 this p
正则表达式删除带有数字的单词

我想删除产品名称中带有数字参考或小单词 2 个或更少字符的单词但我找不到好的正则表达式一些例子链式防回弹ECS 2035 应成为链式防反弹指南 35 厘米俄勒冈 Intenz 应该成为俄勒冈州 Intenz 指南 Tron
git apply 不对文件进行任何更改

我必须对我的存储库应用补丁并正在运行 git apply directory PWD xxxxx patch 由于我不会详细讨论的原因我无法使用git am在这种情况下我需要使用目录标志吉特告诉我 gt git apply direc
TypeError：无法在 re.findall() 中的类似字节的对象上使用字符串模式

我正在尝试学习如何自动从页面获取网址在下面的代码中我试图获取网页的标题 import urllib request import re url http www google com regex r pattern re compile

TypeError：无法在 re.findall() 中的类似字节的对象上使用字符串模式

TypeError：无法在 re.findall() 中的类似字节的对象上使用字符串模式 的相关文章

随机推荐

热门标签

TypeError：无法在 re.findall() 中的类似字节的对象上使用字符串模式的相关文章