使用 PHP DOMDocument 区分 XHTML 和 HTML

2024-03-10

我想使用 PHP DOM 实现来操作 HTML 和 XHTML 文档。我使用 DOMDocument->loadHTML() 方法来加载内容。

想知道加载的内容是 XHTML 还是 HTML。 DOMDocument 有一个 doctype 对象,其中包含文档本身的 DOCTYPE 声明。到目前为止,我考虑比较 $dom->doctype->publicId 其中包含类似“-//W3C//DTD HTML 4.01//ENtext/html”的字符串

大家能想到更好的办法吗?

Edit:

抱歉,如果我的问题有点不清楚。我更新了这个问题,因为它可能令人困惑。但现在要澄清的是:这个问题并不是关于一般使用 PHP DOM 处理 HTML 或 XHTML 是好是坏。


如果您从外部源加载,您可以检查文件的 MIME 类型并查看它是否是application/xhtml+xml;如果是,那么它绝对是 XHTML(当然它可以使用该类型,但带有严重畸形的标记)。否则如果是text/html然后它会被解析为 HTML 标签汤。实际标记的有效性aside,doctype 声明是判断内容是(或声称是)HTML 还是 XHTML 的下一个最佳方式。

正如您所说,您可以检查公共标识符和/或 URI 并从中确定类型。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 PHP DOMDocument 区分 XHTML 和 HTML 的相关文章

  • 如何重定向到 instagram://user?username={username}

    我的 html 页面上有这个链接 可以在特定用户上打开 Instagram 应用程序 a href Link to Instagram Profile a 我一直在寻找自动运行 url instagram user username USE
  • 如何指定网站的语言? (HTML?)

    如何指定页面采用某种语言以便搜索引擎可以理解 这是我放在顶部的元标记吗 如果是 您知道大多数搜索引擎是否使用它来确定语言吗 我已将一页英文内容转换为几种不同的语言 并希望将该信息包含在 html 中 让搜索引擎知道他们正在处理哪种语言 快速
  • PHP 脚本可以在终端中运行,但不能在浏览器中运行

    我正在尝试执行exec命令 但我遇到了问题 当我运行以下代码时 当我通过浏览器运行它时它不起作用 但如果我把输出 str将其复制并粘贴到终端中 它工作得很好 造成这种情况的原因是什么 我该如何解决 目前我正在运行localhost php
  • PHP preg_filter 返回意外的长值

    尝试在 Woocommerce 中删除标签并过滤值 但无法以正确的格式获取它 有东西有腥味 我正在使用WC gt cart gt get cart subtotal 来检索该值 在此示例中 我的值是 2 429kr 原始返回值是 span
  • 标签获取 href 值

    我有以下 html div class threeimages a img alt Australia src Images Services 20button tcm7 9688 gif a div class text h2 a hre
  • 覆盖控制器 Symfony 3.4/4.0

    我目前正在尝试覆盖 FOSUserBundle 中的控制器 在新的文档中 https symfony com doc 3 4 bundles override html https symfony com doc 3 4 bundles o
  • 通过 $_SESSION 从一个脚本发送到另一个脚本期间数据丢失

    我正在尝试将一个充满属性的对象从一个 PHP 发送到另一个 PHP SESSION object obj where obj是一个用 foreach 循环指定的对象 foreach array of objects as obj SESSI
  • Woocommerce 结账自定义选择字段

    我有以下功能 将选择列表添加到 woo commerce 结账表单中 woocommerce form field airport pickup array type gt select class gt array airport pic
  • 在 apache docker 容器中运行虚拟主机

    我在同一个 apache 容器中有两个 php 应用程序 我试图在端口上运行其中一个应用程序 因为它需要通过根域而不是子文件夹进行访问 我想在端口 8060 上运行应用程序 我尝试使用 apache 虚拟主机执行此操作 但它不会加载页面 h
  • 使用 Ajax.Request 将 JSON 从浏览器传递到 PHP 的最佳方法

    您好 我有一个 JSON 对象 它是一个二维数组 我需要使用 Ajax Request 将其传递给 PHP 我知道的唯一方法 现在我使用js函数手动序列化我的数组 并获取以下格式的数据 s 1 d 3 4等 我的问题是 有没有办法更直接 有
  • 如果循环中内存超出,我可以在 for 循环中抛出异常吗?

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 如何处理 foreach 循环中发生
  • HTML 中部分着色的阿拉伯语单词

    我不会说阿拉伯语 但我需要我们网站上对阿拉伯语的具体支持 我需要将部分阿拉伯语单词放在 span 与单词其他部分的风格不同 当我输入两个字符时 and 它们被组合成word 但是当我使用 HTML 标记时 span span 这些字母在输出
  • 我可以使用 jQuery 打开下拉列表吗

    对于 HTML 中的下拉列表
  • FireFox 中的自动滚动

    我的应用程序是实时聊天 我有一个 Div 来包装消息 每条消息都是一个 div 所以 在几条消息之后 我的 DOM 看起来像这样 div div Message number two div div div div
  • php,统计字符并删除超过140个字符的内容

    我需要一个 PHP 函数来计算短语的字符数 如果短语长度超过 140 个字符 则此函数应删除所有其他字符并在短语末尾添加三个点 例如我们有 message I am what I am and you are what you are et
  • 如何在 Laravel 中使用 PUT http 动词提交表单

    我知道这个问题可能已经提出 但我就是无法让它发挥作用 如果有人可以帮助我 我将非常感激 我安装了 colletive form 但答案也可以是 html 表单标签 现在列出我的表格 我的路线和我的例外情况 Form model array
  • 为什么元素上的负底部边距会降低该元素父元素的高度?

    这可能是由于边距折叠造成的 我知道边距折叠 至少知道它如何影响相邻元素 但我不明白当涉及负边距时它如何在嵌套元素上工作 例如 在此标记和随附的 CSS 中 Markup div class parent div class child Ch
  • Magento - 自定义支付模块

    这是一个非常普遍的问题 但这里是 我正在尝试在 Magento 中创建一个自定义支付模块 我创建了一个 常规 模块 可以连接到 Magento 事件 观察者模型 但是我如何告诉 Magento 将模块视为支付模块 以便它显示在管理后端和结账
  • 如何使用 PHPExcel 库从 Excel 获取日期

    我正在尝试使用 PHPExcel 从 Excel 获取日期 但我没有得到日期 我得到的字符串值不是 1970 以来的秒数 我尝试过的代码是 InvDate trim excel gt getActiveSheet gt getCell B
  • 无效字符错误:“fred”

    我确信他一定是一个新手问题 简单来说 我想定义我的第一个 Polymer dart 组件 只是我一直在同一个减速带上踢脚趾 为了使事情变得非常简单 我将其简化为一个非常简单的示例 我做了一个简单的rename示例 跑表 来自 Dart 组件

随机推荐

  • Python:从图像中删除 Exif 信息

    为了减小网站中使用的图像大小 我将质量降低到 80 85 这在一定程度上大大减小了图像尺寸 为了在不影响质量的情况下进一步减小尺寸 我的朋友指出 来自相机的原始图像有很多称为 Exif 信息的元数据 由于网站中的图像不需要保留此 Exif
  • iOS Geofence CLCircularRegion 监控。 locationManager:didExitRegion 似乎没有按预期工作

    我目前正在尝试让我的应用程序使用以下方式监视特定区域CoreLocation然而我发现它似乎没有按预期工作 在我看来 它不能在每个位置设置较小的小半径 即 10m 的情况下工作 我还制作了一个小测试应用程序 它绘制了圆半径在地图上 这样我就
  • 包含文件存储在哪里 - Ubuntu Linux、GCC

    因此 当我们执行以下操作时 include
  • 如何检查 numpy 数组是否已经存在?

    我想知道数组是否已经在代码中的某个位置定义过 就像是a exist 如果存在则给出 True 如果不存在则给出 False I tried a size 但是如果该数组尚不存在 它会给出一条错误消息 这是我想避免的 如果您想知道的话 要求这
  • 如何更改ionic 2本地推送通知图标?

    我使用创建了一个混合应用程序ionic2因为我正在使用科尔多瓦本地推送通知 一切都工作正常 唯一的问题是无法更改图标 在下面我将我的代码粘贴到这里 LocalNotifications schedule id 1 title Test Ti
  • 删除等值线图上的边缘线

    我用Matlab创建了一个极坐标并将其转换为笛卡尔坐标 th r meshgrid 0 0 5 360 pi 180 0 02 1 X Y pol2cart th r 我获取该网格上的数据并生成contourf绘制它 我的问题是我在轮廓图中
  • 从 NSDictionary 转换为 [String:Any?]

    我正在使用 xmartlabs Eureka 构建一个具有动态表单的应用程序 为了填写表格 我必须使用setValues values String Any 但我有表单值NSDictionary变量 我无法将其转换为 String Any
  • 在 Windows 中获取另一个进程命令行

    我正在尝试获取另一个进程的命令行参数 在 WinXP 32 位上 我执行以下操作 hProcess OpenProcess PROCESS QUERY INFORMATION PROCESS VM READ PROCESS TERMINAT
  • 处理大位图

    我只想从我的应用程序打开本机相机应用程序来捕获照片并将其设置为屏幕的背景图像 然后单击按钮旋转它 如果使用 3MP 相机拍摄 照片会旋转 n 次 如果我将相机分辨率设置为 5MP 或更高 应用程序将在第五次单击按钮时强制关闭 照片旋转 4
  • C# 中两个数组的关联

    有两个双精度值数组 我想计算相关系数 单个双精度值 就像 MS Excel 中的 CORREL 函数 C 中有一些简单的单行解决方案吗 我已经发现了名为 Meta Numerics 的数学库 根据这个问题 https stackoverfl
  • Python 调用函数的字符串格式

    有没有办法使用新的格式语法格式化函数调用中的字符串 例如 my request url was 0 get full path format request 所以它调用了该函数get full path 功能inside字符串而不是作为格式
  • 是否有一个很好的 emacs 模式来显示和编辑巨大的分隔符分隔的文件?

    我一直在寻找一段时间 但没有找到一种可以轻松编辑大型制表符 逗号 冒号分隔文件的模式 我一直想要一种确保列始终对齐的模式 就像组织模式表一样 我知道我可以轻松地将整个文件转换为组织模式表 然后在完成后将其返回 但是对于大文件来说 这会变得非
  • 如何在java中创建方法的监听器

    我在实现方法的侦听器时遇到了非常糟糕的时间 在我当前的工作中 我必须每 5 秒请求一个方法 以便验证新信息 因此我想实现一种方法 每次有新信息到来时通知我 每 5 秒丢弃请求方法 我已经阅读过有关观察者模式的内容 但没有成功实施 此致 更多
  • 正则表达式从电子邮件地址中提取顶级域名

    来自电子邮件地址 例如 email protected cdn cgi l email protection email protected cdn cgi l email protection email protected cdn cg
  • 将 os.system() 的输出存储在变量中

    我正在为我的 Hangman 游戏生成一个随机单词 因此想要生成一个随机单词 我正在使用 usr share dict words文件并执行以下操作 def word select import os word os system head
  • 即使登录成功,Yii::app()->user->isGuest 也始终返回 true

    我开始对已通过身份验证的用户和未通过身份验证的用户进行一些区分 为此 我正在使用 Yii app gt user gt id 但是 在确定的视图中 我输入了以下代码 无论我是否登录 成功 我总是收到
  • 监控所有 JavaScript 对象属性(神奇的 getter 和 setter)

    如何在 JavaScript 中模拟 PHP 风格的 get 和 set 魔术 getter setter 很多人说 目前这是不可能的 我几乎可以肯定这是可能的 因为像 nowjs 这样的项目 http nowjs com http now
  • 是否有 R 函数用于检查指定的 GeoJSON 对象(多边形或多多边形)是否包含指定点?

    我有一系列点 Sheet1 CoM ID 1040614 Genus Washingtonia Year Planted 1998 Latitude 37 81387927 Longitude 144 9817733 CoM ID 1663
  • Javascript,跟踪 iframe 重定向顶部窗口

    由于除了沙箱之外 没有办法阻止 iframe 重定向顶部框架 沙箱会阻止可见性跟踪所需的其他功能 因此我想跟踪重定向 由于一个站点可以有多个 iframe 因此它可以是其中任何一个 有没有办法跟踪 找出哪个 特定的 iframe 导致顶部框
  • 使用 PHP DOMDocument 区分 XHTML 和 HTML

    我想使用 PHP DOM 实现来操作 HTML 和 XHTML 文档 我使用 DOMDocument gt loadHTML 方法来加载内容 想知道加载的内容是 XHTML 还是 HTML DOMDocument 有一个 doctype 对