读取外部网页的内容并获取特定元素[重复]

2024-02-19

可能的重复：
如何用PHP解析和处理HTML？ https://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-with-php

我已经尝试解决这个问题有一段时间了。我不仅尝试使用以下方式获取网页的内容file_get_contents($url)还能够得出具体的数据。

我有兴趣抓取其内容的网页是克雷格列表 http://www.craigslist.org/about/sites。这只是一个例子。我想形成一系列带有区域和随附网站的状态，但我似乎找不到获取页面特定元素的方法。任何帮助将非常感激！

尝试使用 domdocument

$html = 'Assume this is html that you get';
$dom = new DOMDocument;
$dom->loadHTML($html);
$dom->preserveWhiteSpace = false;
$tables = $dom->getElementsByTagName('table');  // Sample to get table element
$rows = $tables->item(0)->getElementsByTagName('tr'); // sample to get rows of the table element

这是描述 http://php.net/manual/en/class.domdocument.php

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

读取外部网页的内容并获取特定元素[重复] 的相关文章

PHP - 如何将图像资源写入文件

我用了函数imagecopyresampled到裁剪图像我尝试使用file put contents和 fwrite 将 resized image 写入硬盘上的文件但所有尝试都失败了我可以将调整大小的图像写入磁盘而不是使用image
不带 GROUP BY 的聚合查询

这个查询似乎在我的旧机器上完美运行但是在我的 MySQL 5 7 14 和 PHP 5 6 25 的新机器上它会抛出错误致命错误未捕获异常 PDOException 并带有消息 SQLSTATE 42000 语法错误或访问冲突 1
PHP-将字符串转换为unicode

我在做这个工作 source mb convert encoding test unicode utf 8 source unpack C source var dump source return array size 8 1 gt in
正则表达式将从文本文件中提取句子

我需要一个正则表达式来从文本文件中提取句子示例文本以 2004 年底发生的亚洲海啸灾难为例对 Google 新闻 http news google com 的查询在一个月内 1 月 17 日返回了超过 80 000 篇有关该事件的在
在 Laravel 中将自定义/新类文件放在哪里？

我有关于如何使用 Yelp Fusion API 的 PHP 示例它用OAuth php file https github com Yelp yelp api blob master v2 php lib OAuth php有几个班级
PHP 的同义词库类或 API [编辑]

TL DR 摘要我需要一个命令行应用程序我可以用它来获取同义词和其他相关单词它需要是多语言的并且跨平台工作任何人都可以为我推荐一个合适的程序或者帮助我使用我已经找到的程序吗谢谢更长的版本我的任务是用 PHP 编写一个系统该
PHP—array_merge_recursive() - 相同键没有数组

php a php gt data1 tag gt div classes gt 1 2 3 php gt data2 tag gt section classes gt 2 3 4 5 6 php gt result array merg
自动检测内部/外部开发环境

我们使用以下函数来自动检测我们是在内部机器上还是在实时服务器上然后为各种组件选择适当的配置 function devIsLocal res false http host SERVER HTTP HOST if http host loc
使用 OpenSSL 在 PHP 中进行 AES 加密/在 Node.js 中进行解密

我正在使用 PHP 和 Nodejs 使用 OpenSSL 进行对称加密 PHP 使用 OpenSSL 库 Node js 解密基于实现的加密问题是 Node js 中的解密文本只是部分正确 PHP 加密函数 function encry
为什么将 Ubuntu 升级到 22.04 后 phpMyAdmin 停止工作？

刚刚升级到 Ubuntu 22 04 现在我的 phpmyadmin 无法加载我收到以下错误解析错误语法错误 usr share php Symfony Component DependencyInjection ContainerB
自动生成PHP代码的策略？

我正在开发一个框架在后端创建 ER 图后该框架可以动态地对自身的各个部分进行编程作为一名 PHP 新手我想知道是否还有比打开一个纯 xyz php 文本文件然后将动态生成的代码添加到该文件更奇特的事情是的尝试一下Zend Cod
NetBeans 代码模板 ${date}？

我在 Eclipse 中有这个代码模板自日期起当输入时我得到这样的东西自2009年8月4日起但是当我添加相同的模板时自日期起到 NetBeans 它输出自日期以来有人可以帮忙吗还没有答案吗这在 Netbeans
Laravel 计划命令一旦启动就停止？

我已经为 laravel 5 1 项目设置了预定命令它有效命令已经启动但愚蠢的是我没有考虑如何停止它通常您不想停止它但该命令正在向数据库表中插入近 50 万行而我只是想确保我可以在不登录服务器的情况下启动它显然我需要在某个时候
在生产服务器上使用 Subversion 使文件生效的最佳方法是什么？

目前我已经设置了 subversion 这样当我在 Eclipse PDT 中进行更改时我可以提交更改它们将保存在 home administrator 中项目文件该文件具有 subversion 推荐的 branches tags
array_merge 更改键

我得到以下数组 arr array 6 gt Somedata 7 gt Somedata1 8 gt Somedata2 问题是当我使用array merge array Select the data arr 它确实将数组键更改为 A
如何使用 PHP 正确添加跨站请求伪造 (CSRF) 令牌

我正在尝试为我网站上的表单添加一些安全性其中一个表单使用 AJAX 另一个表单是简单的联系我们表单我正在尝试添加 CSRF 令牌我遇到的问题是令牌有时只显示在 HTML 值中其余时间该值为空这是我在 AJAX 表单上使用的
让登录更安全

我已使用此代码进行管理员登录仅当用户输入正确的用户名和密码时才应打开loginhome php 但后来我意识到这根本不安全任何人都可以直接访问 mywebsite loginhome php 而无需登录注销后可以使用后退按钮打开 l
ORDER BY 字段内的 MySQL 子查询。（没有内连接）

有很多与此相关的问题但都具有使用内部联接的相同答案这我认为在这里是不可能的如果我错了请告诉我我现在正在做的是调用两个不同的 mysql 查询来获取结果它工作完美 db gt query SELECT FROM meta WHE
PHP MySql 百分比

我的问题是关于百分比我不是专家所以我会尽力以更好的方式进行解释我的 mysql 服务器中有一个表假设有 700 条记录如下所示 Name country language Birth Lucy UK EN 1980 Mari Ca
PHP 如何判断用户是否按下了 Enter 键或 Submit 按钮？

我遇到的问题是我在一个表单中有多个提交输入每个提交输入都有不同的值我更愿意将它们保留为提交 Whenever the user presses Enter it is as though the topmost submit input

随机推荐

在 C++11 中实现递归代理模式

假设我们有一些Foo允许的对象 cout lt lt myFoo 3 myFoo 5 bar 这需要代理设计模式斯科特迈耶斯 Scott Meyers 详细介绍如下 https stackoverflow com questions 2
将 MongoDB 集合移动到另一个集合的更好方法

在我的网络抓取项目中我需要将前一天抓取的数据从mongo collection to mongo his collection 我正在使用此查询来移动数据 for record in collection find his collect
我可以在 .gitignore 文件中包含其他 .gitignore 文件吗？（就像类 C 语言中的 #include 一样）

我有一些文件例如vim gitignore SVN gitignore and CVS gitignore 散布在我的硬盘上我可以简单地将这些 gitignore 文件包含在 gitignore文件在新的 Git 项目中吗 Edit 我
空指针的取消引用

该错误消息到底意味着什么以及如何修复它空指针的取消引用这意味着 self 可以通过 initWithStyle reuseIdentifier 的返回值设为 nil 并且后续对默认值的访问将尝试在 nil 地址处读取因此取消引用这肯
如何避免包含类实现文件？

而不是做 include MyClass cpp 我想要做 include MyClass h 我在网上读到过not这样做被认为是不好的做法简而言之单独编译首先让我们举一些简单的例子 struct ClassDeclaration c
Flink时间特性和AutoWatermarkInterval

在 Apache Flink 中 setAutoWatermarkInterval interval 向下游操作员生成水印以便他们提前事件时间如果水印在指定的时间间隔内没有更改没有事件到达运行时将不会发出任何水印另一方面如果在下
如何将列表附加到 pandas 列、系列？

假设我有以下数据框 d col1 1 2 col2 3 4 df pd DataFrame data d 我想延长col1带数组xtra 然而这会出错 xtra 3 4 df col1 append xtra 我怎样才能追加xtra to
如何从 Swift 中的 valueChanged 事件获取触摸坐标

背景 I ve 以前学过的 https stackoverflow com a 34764356 3681880如何使用手势识别器或continueTrackingWithTouch获取当前触摸位置的持续更新然后使用它们执行如下操作然而
如何获取CodeAttribute中的属性值

我写了一个方法来按属性获取属性值 public string GetAttributeValueByNameAttributeAndProperty CodeClass cc string nameAttribute string name
如何在 Jenkins 的 url 中传递 credentialID

我正在使用这个命令 sh git push https userid passwd innersource com scm raghu demo git 但我想使用 credentialsId f0079d43 9522 4133 9601
在 Ruby 中冻结变量不起作用 [重复]

这个问题在这里已经有答案了我正在学习 Ruby 并且在使用时发现了有趣的行为Object freeze带变量的方法在我冻结一个变量之后或者Fixnum or Array 我还是可以修改的这很奇怪因为就我而言这不应该发生而且Ty
Pandas 通过正则表达式读取带有字符串分隔符的 CSV

我正在尝试将格式奇怪的文本文件导入到 pandas DataFrame 中下面是两个示例行 LOADED LANE 1 MAT TYPE 2 LEFFECT 1 SPAN 200 SPACE 10 BETA 3 474 LOADEFFEC
Javascript：用另一个函数重新分配一个函数

假设我有这两个功能 function fnChanger fn fn function sys print Changed function foo sys print Unchanged 现在如果我打电话foo I see Unchan
PHP“未选择数据库”

我最近开始用 PHP 创建一个网站我的大部分代码都可以工作但是我发现了一个无法纠正的问题我有一个页面其中有很多对数据库的调用在我的页面顶部我正在连接并使用 SELECT 来获取有关相关产品的一些信息在页面底部我再次连接以获取
如何使用 Zend Framework 2 中的插件渲染自定义视图

我正在开发一个应用程序需要在流程完成后发送电子邮件由于电子邮件需要是 HTML 我有一个好主意将视图渲染为电子邮件消息正文以便我可以实现单击此处在浏览器上查看此内容功能这一切都在实现 AbstractRestfulContro
如何用 Maven 属性替换 web.xml 中的值？

我有一个 Maven 项目它将一些测试文件下载到其构建目录中 target files 然后这些文件应该可供 servlet 使用我可以通过将完整路径硬编码为
如何跳过HTTP请求的AngularJS拦截器？

我有一个 angularjs 应用程序其中有一个拦截器它将授权令牌添加到每个请求的标头中然而在应用程序的某个地方我需要使用外部 API 拦截器会破坏它因为它添加了这个外部 API 提供者不接受的授权标头如何让 angularj
VS2013 Windows服务-如何制作安装程序？

我写了一个Windows服务我现在想将其打包到安装程序中我使用了 VS2013 x86 Native Tools 命令提示符然后使用了以下命令要安装它 installutil httpapiservice exe 要卸载它 inst
启动Spring Boot应用程序时liquibase的问题

我有一个Spring Boot申请与liquibase 第一次我创建表格没有问题但当我再次启动时我遇到了无法解决的问题这是error Error starting ApplicationContext To display the c
读取外部网页的内容并获取特定元素[重复]

这个问题在这里已经有答案了可能的重复如何用PHP解析和处理HTML https stackoverflow com questions 3577641 how to parse and process html with php 我已经

读取外部网页的内容并获取特定元素[重复]

读取外部网页的内容并获取特定元素[重复] 的相关文章

随机推荐

热门标签