PHP DOMDocument - 为什么破折号“–”转换为 –

2023-12-28

我正在使用 DOMDocument 来提取一些段落。

这是我导入的初始 htm 文件的样子：

<html>
    <head>
        <title>Toxins</title>
    </head>

    <body>
        <p class=8reference><span>1.</span><span>Sivonen, K.; Jones, G. Cyanobacterial Toxins. In <i>Toxic Cyanobacteria in Water. A Guide to Their Public Health Consequences, Monitoring and Management</i>; Chorus, I., Bartram, J., Eds.; E. and F.N. Spon: London, UK, 1999; pp. 41–111.</span></p>
    </body>
</html>

当我做的时候：

$dom_input = new \DOMDocument("1.0","UTF-8");
$dom_input->encoding = "UTF-8";
$dom_input->formatOutput = true;
$dom_input->loadHTMLFile($manuscript->getUploadRootDir().$manuscript->getFileName());

$paragraphs = $dom_input->getElementsByTagName('p');

foreach ($paragraphs as $paragraph) {
    if($paragraph->getAttribute('class') == "8reference") {
        var_dump($paragraph->nodeValue);
    }
}

“第 41–111 页”中的破折号转换为

pp. 41â€“111

知道为什么以及如何修复它以获得 utf8 unicode 值吗？

先感谢您。

在我看来，数据是正确的，你只是显示不正确。

你是用UTF-8输出的吗？

à + 是一个经典的“将 UTF-8 编码的数据显示为非 UTF-8 编码的数据”。

例如。如果您要输出到网络浏览器，请尝试使用元标记设置字符集。例如。

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

如果您需要以 UTF-8 以外的方式输出，则需要先转换为替代字符集。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

xml

UTF8

domdocument

PHP DOMDocument - 为什么破折号“–”转换为 – 的相关文章

简单的 PHP 条件帮助： if($Var1 = in list($List) and $Cond2) - 这可能吗？

这是一个可能的功能吗我需要检查一个变量是否存在于我需要检查的变量列表中并且 cond2 是否为 true 例如 if row name 1 2 3 Cond2 doThis 它对我不起作用我在复制粘贴中更改的只是我的列表和变量名称 i
单词之间没有空格的语言（例如亚洲语言）中的断词？

我想让 MySQL 全文搜索适用于日语和中文文本以及任何其他语言问题在于这些语言以及可能其他语言通常在单词之间没有空格当您必须键入与文本中相同的句子时搜索没有用我不能只在每个字符之间添加空格因为英语也必须有效我想用 PHP 或
如何使用 phpunit 运行单个测试方法？

我正在努力运行一个名为testSaveAndDrop在文件中escalation EscalationGroupTest php with phpunit 我尝试了以下组合 phpunit EscalationGroupTest escal
在 System.Xml.XPath 中启用 XPath2 查询（XPathException：无效令牌）

Microsoft 的 System Xml XPath nuget package 可用于 NET 4 6 声称支持 XPath 1 0 和 2 0 德文档 https msdn microsoft com en us library s
从
```
 
```
标记内删除
我制作了简单的 BBCode 脚本一切正常但后来我使用了一个 javascript 库来美化我的代码 pre pre 现在我面临的唯一问题是 br 每行代码后面的标签 pre pre tags 所以问题是我怎样才能删除 br 标记哪些在
PHP MySQL 使用选项/选择 HTML 表单标签进行多重搜索查询

我正在尝试使用两个搜索字段设置基本的 MySQL LIKE 搜索我不想拥有它所以它有多个可选搜索字段例如if isset POST city isset POST name 我不知道如何用 HTML 来做到这一点
检查 PHP 中“@”字符后面的单词

我现在正在制作一个新闻和评论系统但是我已经在一个部分上停留了一段时间了我希望用户能够在 Twitter 上引用其他玩家的风格例如用户名该脚本看起来像这样不是真正的 PHP 只是想象脚本 3 string I loved the
Apache 访问 Linux 中的 NTFS 链接文件夹

在 Debian jessie 中使用 Apache2 PHP 当我想在 Apache 的文档文件夹 var www 中创建一个新的小节时我只需创建一个指向我的 php 文件所在的外部文件夹的链接然后只需更改该文件夹的所有者和权限文件夹
将“php”作为 shell 脚本执行时的自定义 php.ini 文件

我在跑php作为 shell 脚本我不确定 shell脚本是否正确该文件以 usr bin php 这很好用但 MongoDB 类没有正确加载php ini文件具有extension mongo so 未使用我该如何使用它tha
从 smarty 访问 PHP 文件的变量（本地或全局）

我有一个 php 文件其中包含一些本地和全局变量例如 foo 从此文件中调用 smarty 对象如何在不更改 PHP 文件的情况下从 smarty 脚本访问 foo Thanks 如果你有一个名为 BASE 的常量变量并且定义如下
XSLT：如何在“匹配”属性中表示 OR？

我想对与名称 A 或 B 匹配的元素执行一系列操作我在想下面类似的事情但它不起作用
PHP 在输入流中使用 fwrite 和 fread

我正在寻找将 PHP 输入流的内容写入磁盘的最有效方法而不使用授予 PHP 脚本的大量内存例如如果可以上传的最大文件大小为 1 GB 但 PHP 只有 32 MB 内存 define MAX FILE LEN 1073741824 1
在 PHP 中撤销 Google 访问令牌

正如标题所示我想以编程方式撤销授予的访问令牌即在 PHP 中我发现这个他们的网站 https developers google com identity protocols OAuth2WebServer tokenrevoke 但
随机组合 MySQL 数据库中的两个单词

我有一个包含名词和形容词的数据库例如 id type word 1 noun apple 2 noun ball 3 adj clammy 4 noun keyboard 5 adj bloody ect 我想创建一个查询它将抓取 10
如果循环中内存超出，我可以在 for 循环中抛出异常吗？

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 如何处理 foreach 循环中发生
PHP HEREDoc (EOF) 语法在 Sublime Text 3 上突出显示与正斜杠的差异

我不熟悉 Sublime Text 3 如何使用语法突出显示例如如果它纯粹依赖于主题或者它内置于主题运行的标准中但就我而言使用 PHP 的 HERE 文档和转发存在一些语法突出显示差异斜线一旦出现正斜杠 ST3 就会认为以下所有
CURL 中的 data-urlencode 是什么意思？

我搜索了很多个小时试图弄清楚 php curl 中的 data urlencode 是什么我尝试过这个但我认为这是不对的 xmlpost object1 file https www lob com goblue pdf 在文档中是 d
一次播种多行 laravel 5

我目前正在尝试为我的用户表播种如果我像这样尝试 2 行就会失败如果我只使用单个数组而不是 users 数组内的 2 个数组来创建一些假数据那么效果很好我做错了什么正确的方法是什么 class UserTableSeeder ex
Magento - 自定义支付模块

这是一个非常普遍的问题但这里是我正在尝试在 Magento 中创建一个自定义支付模块我创建了一个常规模块可以连接到 Magento 事件观察者模型但是我如何告诉 Magento 将模块视为支付模块以便它显示在管理后端和结账
使用 powershell 将 XML 转换为特定的 JSON 结构

需要有关将 xml 转换为特定 json 结构的帮助 XML 看起来像这样

随机推荐

在 Unix 中的邮件中附加 2 个以上文件

我有很多文件需要附加并通过电子邮件发送我正在运行脚本来执行此操作你能帮我写代码吗您可以使用选项 a of mailx多次例如 mailx s Few files attached a file1 txt a file2 txt em
IE 中的 window.location 问题

我有这个简单的代码可以在每个浏览器中正常工作但不能在 IE 每个版本中工作 window setTimeout window location http www domain modules yobilab copyright cla
在 iOS 应用程序中使用现有的系统声音 [swift|

是否可以在我自己的应用程序中使用现有的Apple系统声音我想用 Swift 编写一个示例应用程序执行以下步骤读取获取设备上所有可用系统声音的列表我认为它们位于 System Library Audio UISounds 在屏幕上显
宏定义冲突

我遇到了这个问题这与宏函数无关只是简单的字符串值宏替换我有两个头文件 test1 h define TEST 123 test2 h define TEST 456 现在我有一个程序包含这两个标头但我希望我的实际 TEST 为 12
将雪（和降雪）与 AWS 结合使用，在 R 中进行并行处理

相对于我之前的类似的问题 https stackoverflow com questions 7241244 using aws for parallel processing with r 我尝试在AWS上使用snow snowfall进
.NET 4.5 中的序列化中断

我们遇到了一个仅在 NET 4 5 中发生的序列化问题相同的代码在 NET 4 中工作正常我们正在尝试使用一些字段序列化继承类型基类和继承类都标记为可序列化属性我们在 Web 服务的客户端收到一个异常说有一个方法访问异常在服务器端
用于模糊字符串比较的好 Python 模块？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动
Wagtail：如何将模型实例传递给小部件并在模板中访问它

我有一个基于 Wagtails 的模型Page模型我正在将自定义小部件分配给模型字段之一渲染管理视图时是否可以在小部件 HTML 模板中访问模型实例我需要管理视图中的小部件来知道哪个 IDSimplePage该小部件所属即获取值 p
OSX Mavericks - 不再安装 BIND...如何使本地 DNS 服务器正常工作？

我一直在 OSX 上使用 BIND 为我的本地开发机器提供本地 DNS 解析器特别是为了方便虚拟机访问我的本地开发环境愚蠢的是我决定连夜升级到 OSX Mavericks 但似乎不再安装 BIND 即使添加了命令行开发人员工具有人建
clang 尝试捕获失败

这是我所说的代码部分 try std cerr lt lt first try lt lt std endl po store po parse config file ifs configFileOptions false vm catc
从两个向量创建新的 ID（双向）

我在一个由因子组成的数据框中有两个向量每个向量中有约 10000 个唯一因子这是我的数据的简化示例 tg lt data frame A sample letters 1 5 30 replace TRUE B sample lette
Pandas 数据框 to_csv - 分成多个输出文件

将非常大的数据帧 50GB 分割成多个输出水平的最佳最简单方法是什么我想过做类似的事情 stepsize int 1e8 for id i in enumerate range 0 df size stepsize start i
如何在 JasperReports Server 4.0.0 中配置邮件服务器设置

我在用着JasperReports服务器4 0 0我想如何配置邮件服务器设置以通过报告计划邮寄报告我怎样才能做到这一点有人知道这个吗您应该编辑
由于“完美分离错误”，无法运行逻辑回归

我是 Python 数据分析的初学者并且在完成这项特定任务时遇到了麻烦我进行了广泛的搜索但无法找出问题所在我导入了一个文件并将其设置为数据框清理了文件中的数据然而当我尝试将我的模型拟合到数据时我得到了检测到完美分离结果不
为 mat-select 预选多个值 - Angular 6

我正在尝试在垫选择中预选多个选项到目前为止我还无法实现这一目标这是 HTML 文件
如何增加 Cassandra 的数据流读取并行性

我正在尝试将大量数据 2 TB 30kkk 行从 Cassandra 导出到 BigQuery 我所有的基础设施都在 GCP 上我的 Cassandra 集群有 4 个节点每个节点 4 个 vCPU 26 GB 内存 2000 GB
转置一维数组

所以我有一个包含 N 个值的一维数组其中 N 是一个完全平方数我将这个一维数组可视化为二维数组尽管事实并非如此例如具有值的数组int Array 0 1 2 3 4 5 6 7 8 That is int Array new in
Javascript父窗口如何向弹出窗口发送数据？

我一直在使用 HTML 和 Javascript 编写基于浏览器的应用程序或者更确切地说快速构建应用程序原型我希望主窗口能够显示带有动态数据的弹出窗口但是我不知道如何在 Javascript 中将数据从父窗口推送到弹出窗口请注意
对列表中的字典元素进行排序

对于这份清单 u status u Active u name u X u orgID u 109175 u type u Created Section class addbold u status u Active u name u A
PHP DOMDocument - 为什么破折号“–”转换为 –

我正在使用 DOMDocument 来提取一些段落这是我导入的初始 htm 文件的样子 p class 8reference span 1 span span Sivonen K Jones G Cyanobacterial Toxins

PHP DOMDocument - 为什么破折号“–”转换为 –

PHP DOMDocument - 为什么破折号“–”转换为 – 的相关文章

随机推荐

热门标签