通过 preg_match_all PHP 函数从 html 代码字符串中提取 img 标签

2024-05-26

我有一些 html 代码并提取了img src来自它的属性。 html 字符串中有一些像这样的 img：

<img src="http://www.pecso.it/wp-content/uploads/2016/12/10_WRAS.png">

我尝试使用以下 PHP 代码来做到这一点：

$description = wpautop($this->data->description);
$description = preg_replace("/\[[^\]]+\]/", '', $description);
     if (preg_match_all("<img src=(.*?)>", $description, $match)) {
          echo match;
            };

结果为NULL。

你能帮我吗？

不要在 html 上使用正则表达式！

使用 dom 解析器代替，因为它更省事。

$html = file_get_contents("you_file.html");

$dom  = new \DOMDocument();
$dom->loadHTML($html);

$dom->preserveWhiteSpace = false;

$images = [];
foreach ($dom->getElementsByTagName('img') as $image) {
    $images[] = $image->getAttribute('src');
}

Edit:

您正在使用wpautop清理描述的功能。根据文档，它需要The text to be formatted.作为第一个参数。因此，首先确保它确实保留了参数内的图像标签。

我假设标签被保留。看看正则表达式本身，我发现它的匹配太少了。

你正在匹配.*?在捕获组内。这?表示使用惰性匹配，即根据需要匹配尽可能少的字符。所以.*将匹配任何字符，零个或多个。和?将根据需要匹配尽可能少的数量。

在我的输出中var_dump for $match我看到它找到了匹配项。

array (size=2)   0 => 
    array (size=1)
      0 => string 'img src=' (length=8)   1 => 
    array (size=1)
      0 => string '' (length=0)

然而，由于惰性匹配，第一个匹配组的大小为 0。我假设有内部 php 错误。它应该匹配所有内容>因为这也是正则表达式的一部分。但 php 似乎忽略了这部分。

如果将捕获组更改为.+?，第一组将包含一个"特点。因为+这意味着“一个或多个”字符。

解决方案是更改代码，使其包含引号。

if (preg_match_all("<img src=\"(.*?)\">", $description, $match)) {

这与所需的图像链接匹配：

http://www.pecso.it/wp-content/uploads/2016/12/10_WRAS.png

我建议尝试使用 DOMDocument 方法，因为此代码更有可能更加稳定和可扩展。如果你想学习正则表达式，解析 html 可能不是最好的开始。

所有这些代码都是使用 php 5.4 进行测试的，对于较新的版本可能会有所不同！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

html

pregmatchall

通过 preg_match_all PHP 函数从 html 代码字符串中提取 img 标签的相关文章

PDO PHP 连接，致命错误

我的连接类 firstcode php class DB functions public db function construct try db new PDO mysql localhost dbname xxx charset ut
在哪里可以学习网络编程从入门到精通？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我尝试做教程但它是无组织且无结构的我在哪里可以学习 PHP 从初学者到大师我正在寻找类似的网站w
在 React 中切换 css 类

如何使用布尔值切换 React 中元素上 css 类的存在在 Angular 2 中我可以这样做 class red isRed 如何在 React 中做熟悉的事情在 React 中元素使用如下语法获取它们的类 div div 但请注
使用 PHP glob 列出 FTP 服务器上的文件不起作用

我使用此代码来访问目录 location files pictures glob location png 我想使用 FTP 访问远程路径 location opendir ftp user password host name files
jQuery - 如何从 div > p 获取文本

如何从 div 类中获取主题名称 div class subject img src image eng jpg p English p div div class subject img src image bio jpg p Biolo
暂停除了已激活的玩家之外的所有其他玩家。

我有这个插件它可以将不同的样式应用于 html5
PHP 中标头的使用

非常简单的问题这两个 PHP 版本 5 标头调用中哪一个是最好的 header Not Modified true 304 header HTTP 1 1 304 Not Modified 我很确定第一个是最多价的但只是好奇如果在 H
在 foreach 中使用 QueryPath 的多个查找

我正在使用 QueryPath 和 PHP 这发现 eventdate 没问题但不会为 dtstart 返回任何内容 qp htmlqp url foreach qp gt find table schedule gt find tr a
是否可以用 PHP 编写电子邮件解析器？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Facebook API sdk 4.0 - 将照片发布到 Facebook

我正在尝试创建一个应用程序用户可以在其中浏览照片并将其从计算机提交到 Facebook 为此他们首先必须将照片上传到服务器然后使用 Facebook 请求将此图像发布到 Facebook 我正在使用多部分表单数据这就是我到目前为止
Nginx 502 网关错误。通过增加buffer来解决。为什么？

我正在设置 LEMP 堆栈来运行 Drupal 我安装了 Nginx 和 PHP FastCGI Nginx 工作正常但任何运行 PHP 的尝试都会出现错误 502 Bad Gateway 谷歌很快发现 nginx 502 错误网关 ht
HTML5 MediaSource 适用于某些 mp4 文件，但不适用于其他文件（相同的编解码器）

我正在玩 MediaSource API 代码直接取自 Mozilla 的示例页面 https developer mozilla org en US docs Web API MediaSource endOfStream https d
Jquery 数据表列总和

我只是参考一下这个链接 https datatables net examples advanced init footer callback html了解如何获取 jquery 数据表中的列总计但我已经完成了一半的项目我在html页面
php - 解析html页面

div divbox div p para1 p p para2 p p para3 p table class table tr td td tr table p para4 p p para5 p 有人可以告诉我如何解析这个 html
在 HTML5 画布中，如何用我选择的背景遮盖图像？

我试图用画布来实现这一点 globalCompositeOperation 但没有运气所以我在这里问这里有类似的问题但我没有在其中找到我的案例我的画布区域中有图层从下到上的绘制顺序画布底座填充纯白色 fff 用fillRect
PHP 中的 -> 和 :: 有什么区别？

这个东西困扰我好久了一直找不到在 php 中使用和 gt 之间的类有什么区别让我举个例子想象一个名为 MyClass 的类该类中有一个函数 myFunction 使用有什么区别 MyClass myclass new MyCla
PHP session_regenerate_id 和黑莓浏览器

问候我正在开发一个登录系统并陷入了黑莓浏览器身份验证的困境他们似乎对 PHP 的 session regenerate id 有问题有人可以建议替代方案吗以下是身份验证和登录脚本 UPDATE看来会话一般都不起作用拿出 sess
session_start()：无法解码会话对象

我有时在使用 CodeIgniter 时遇到以下问题错误 2019 03 05 19 57 26 gt 严重性警告 gt session start 无法解码会话对象会话已被销毁 system libraries Session Se
使用css bootstrap时如何仅向一列添加右边框？

我正在尝试使用CSS引导框架 http getbootstrap com css tables在我的项目中我正在使用带有以下类的表table table bordered table striped 我想删除除第一列之外的所有列的边框这
表格行未扩展到全宽

我有一个表格当我将表格的宽度设置为 100 并将表格行的宽度设置为 100 时没有任何反应或宽度发生变化 Table Normal position relative display block margin 10px auto pad

随机推荐

导致“RuntimeException：二进制 XML 文件第 #20 行：您必须提供layout_height 属性”的原因。（怀疑是ActionBarScherlock）？

我有 ActionBarScherlock 的应用程序我使用 ACRA 我收到一些用户的崩溃报告其中包含以下错误 java lang RuntimeException Binary XML file line 20 You must s
onchange 下拉列表

我的问题是我所问问题的延续请参阅链接加载国家州城市 https stackoverflow com questions 2640001 load country state city 我已经展开以从数据库加载我的下拉列表我只需要一
具有重复值的两个向量之间的“设置差异”

我有 3 个向量 x lt c 1 3 5 7 3 8 y lt c 3 5 7 z lt c 3 3 8 我想找到以下元素x那些不在y并且不在z 有没有一个功能f这会给我以下输出 gt f x y 1 3 8 gt f x z 1 5 7
在 IF 语句内部创建的变量是否也可以在 IF 语句外部使用？

如果你有这样的 if 语句您是否能够在 if 语句之外访问 c 变量如下所示 In PHP if没有自己的范围所以是的如果你在里面定义了一些东西if语句或块内那么它将可用就像您在外部定义它一样当然假设块内或块内的代码if语句
Ember：error.messages 在保存时不显示服务器错误

当尝试创建新记录时 errors messages不渲染为文档中描述 http emberjs com api data classes DS Errors html 也就是说控制台确实呈现了错误Error The backend rej
如何在 Windows 10 PRO 上的 Visual Studio 2019 中添加对 Windows.ApplicationModel.DataTransfer 命名空间的引用

Windows 10 Pro Visual Studio 2019 Net 版本 4 8 03752 几天前全新安装了所有内容我正在尝试将 Windows ApplicationModel DataTransfer 命名空间添加到 Vis
在 Chrome 18 中检测 SwiftShader WebGL 渲染器

我有一个 2D HTML5 游戏引擎 www scirra com http www scirra com 并且确实想检测 WebGL 是否将使用 Chrome 18 的 Swiftshader 软件渲染器进行渲染如果是这样我们会much
Android-如何在简历中检测我的应用程序被虚拟机杀死？

在我的应用程序中当用户按 HOME 键并在一段时间后返回到应用程序时我的应用程序会在各个位置和活动上给出 NullPointerExceptions 我知道我的应用程序正在被操作系统杀死以释放一些资源现在我希望当用户再次返回应用程序并
在 PhantomJS/CasperJS 中设置屏幕尺寸

我正在自动访问网站以从中收集数据不幸的是该页面会检测屏幕尺寸如果屏幕太小则不会给我所需的页面从非交互式上下文 IIS Web 应用程序运行脚本时 Screen 对象似乎返回 1024x768 像素的大小即使我将视口大小设置为
generate_series() 方法在 Redshift 中失败

当我运行 SQL 查询时 select generate series 0 g from select date date1 date date2 as g from mytable 它返回一个错误 INFO Function genera
分配给 SQLite 内存数据库的内存大小

如果使用下面的语法创建一个内存中的sqlite数据库那么分配给它的最大内存大小是多少 my dbh DBI gt connect dbi SQLite dbname memory 如果内存数据库的大小大于最大可用内存将会发生什么情况假
appengine 新应用程序部署失败并出现“版本未就绪”异常

我正在尝试在应用程序引擎上部署一个应用程序它是一个新应用程序我尝试更改版本名称并再次部署我什至创建了一个新的应用程序 ID 并使用了相同的应用程序但没有成功 2013 06 10 19 47 41 615 WARNING appcf
Win32 错误代码的大写文本标识符是什么，以及如何在给定错误代码的情况下以编程方式确定它们？

In Win32 错误代码列表 https msdn microsoft com en us library windows desktop ms681382 28v vs 85 29 aspx 每个错误都包含三个组成部分数字错误代码描
如何从代码后面的 Blazor WebAssembly 项目打开浏览器窗口/选项卡：

我正在将 UWP 应用程序转换为托管 ASP NET Core 的 Blazor WebAssembly 我的标记代码位于 Index razor 中后面的代码位于 Index razor cs 中在 UWP 项目中我通过 oncli
如何使用服务器端vbscript获取图像宽度？ ASP经典

几天来我一直在尝试找到一种方法来获取驻留在我们服务器上的 png 文件的图像宽度我正在尝试读取文件的前 24 个字节并解析出字节 17 20 的宽度我在网上找到了几种例程但都没有成功奇怪的是我似乎得到了从十六进制解码到十进制的字节
C++：函数左值或右值

我刚刚开始通过阅读来了解 c 11 中的右值引用这一页 http thbecker net articles rvalue references section 01 html 但我卡在了第一页这是我从该页面获取的代码 int foo f
熊猫直方图 df.hist() 分组依据

如何使用 group by 用 pandas DataFrame hist 绘制直方图我有一个包含 5 列的数据框 A B C D 和 Group 有两个组类别是和否 Using df hist 我获取了 4 列中每一列的历史记录
如何部署经典的asp网站？

我想知道如何部署或在 IIS 6 7 中部署经典的 asp 网站涉及哪些步骤我们可以为现有项目创建一个安装程序吗您应该考虑使用 Web 部署http www iis net download WebDeploy http www iis
如何使用 python apply/lambda/shift 函数根据 2 列的值获取该特定列的前一行值？

我有 2 列 FN1 和 FN2 基于这些我必须再创建一列最终 FN1 FN2 Final False False 1 True True 1 False False 1 True False 2 True True 2 False Fa
通过 preg_match_all PHP 函数从 html 代码字符串中提取 img 标签

我有一些 html 代码并提取了img src来自它的属性 html 字符串中有一些像这样的 img img src http www pecso it wp content uploads 2016 12 10 WRAS png 我尝试使

通过 preg_match_all PHP 函数从 html 代码字符串中提取 img 标签

通过 preg_match_all PHP 函数从 html 代码字符串中提取 img 标签 的相关文章

随机推荐

热门标签

通过 preg_match_all PHP 函数从 html 代码字符串中提取 img 标签的相关文章