如何使用 Javascript 在 html 文件中搜索字符串？

2024-05-23

我有 5 个 html 文件，并且有一个搜索表单，我想用它来搜索这些 html 文件中的文本。

<form>
   <input type ='text' />
   <input type ='submit' />
</form>

我有一个使用 xmlhttprequest 来获取文件的想法

var xhr = new XMLHttpRequest();
xhr.open("GET", "file1.html", false);
xhr.send();
var guid = xhr.responseText;

var xhr = new XMLHttpRequest();
xhr.open("GET", "file2.html", false);
xhr.send();
var guid = xhr.responseText;

...

然后在这些文件中搜索文本，但我不知道如何使用 javascript 在文件中搜索。

使用 xmlhttprequest 获取文件后如何搜索文件？或者是否有另一种方法可以使用 javascript 进行搜索？

我会用DOMParser确保我们正在进行一些“智能”搜索。假设您正在寻找有关“viewport”一词的文本；您不需要任何具有以下内容的 HTML 文件<meta>标记“viewport”以作为有效结果返回，可以吗？

第一步是将字符串解析为 Document 实例：

const parseHTMLString = (() => {
  const parser = new DOMParser();
  return str => parser.parseFromString(str, "text/html");
})();

在这里输入一个有效的 HTML 字符串，您将得到一个返回的文档，其行为类似于window.document！这意味着我们可以做各种很酷的事情，比如使用querySelector和类似的属性innerText.

下一步是定义我们要搜索的内容。下面是一个连接文档标题和正文的示例：

const getSearchStringForDoc = doc => {
  return [ doc.title, doc.body.innerText ]
   .map(str => str.toLowerCase().trim())
   .join(" ");
};

将解析后的文档传递给此函数，您将得到一个纯字符串作为回报，其中仅包含内容，没有属性、标签名称和元数据。

现在，问题是定义正确的搜索方法。可能是基于正则表达式的匹配，或者只是（速度较慢）split & includes:

const stringMatchesQuery = (str, query) => {
  return query
    .toLowerCase()
    .split(/\W+/)
    .some(q => str.includes(q))
};

将这些方法链接在一起，您将得到如下转换：

String -> Document -> String -> Boolean

如果您想在搜索内容中包含更多信息，只需更新getSearchStringForDoc使用标准化 API 的功能。

一个正在运行的示例（有点混乱，可以进行一些重构，但希望能明白要点）：

const htmlString =  (
`<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>The title</title>
</head>
<body>
  Some text about an interesting thing.
</body>
</html>`);

const parseHTMLString = (() => {
  const parser = new DOMParser();
  return str => parser.parseFromString(str, "text/html");
})();

const getSearchStringForDoc = doc => {
  return [
    doc.title,
    doc.body.innerText
  ].map(str => str.trim())
   .join(" ");
};

const stringMatchesQuery = (str, query) => {
  str = str.toLowerCase();
  query = query.toLowerCase();
  
  return query
    .split(/\W+/)
    .some(q => str.includes(q))
};

const htmlStringMatchesQuery = (str, query) => {
  const htmlDoc = parseHTMLString(str);
  const htmlSearchString = getSearchStringForDoc(htmlDoc);
  
  return stringMatchesQuery(htmlSearchString, query);
};

console.log("Match 'viewport':", htmlStringMatchesQuery(htmlString, "viewport"));
console.log("Match 'Interesting':", htmlStringMatchesQuery(htmlString, "Interesting"));

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

javascript

html

DOM

XMLHttpRequest

如何使用 Javascript 在 html 文件中搜索字符串？的相关文章

在 TypeScript 中迭代对象的键和值

在纯 JavaScript 中我们可以迭代对象属性和值如下所示 const values Object keys obj map key gt obj key 在 TypeScript 中此语法是错误的因为 TS 编译器显示以下消息
在 PHP 中合并文件块

出于教育目的我想创建文件块上传你们怎么知道所有块何时上传我试图从temp并重命名它们使它们按正确的顺序排列然后与最后一个块将它们合并在一起然而我猜最后发送的并不是最后收到的所以fopen on chunks 失败因为它们尚
如何在 React 组件中使用 CDN

我正在尝试使用基于 D3 构建的库称为 Greuler 来动态渲染图形它的 npm 包似乎已损坏当我改用 Greuler CDN 时 index html 中的测试图终于起作用了但是我正在开发一个 React 应用程序并且我希望
d3js v5 + Topojson v3 关于加入 csv 和 json 的优化

为了制作地图我需要将一些值从 csv 导入到 json直接在代码中为了加载 json 和 csv 文件我使用 Promise 对象的异步操作并使用两个循环和一个公共键在 json 文件上添加新属性 for var i 0 i lt
在 Graal.js 中使用 java 类

使用 Graal js 如何将 java 类导入到 JS 脚本中以下代码适用于 Nashorn JJS 但不适用于 Graal js 因为没有Java type 在graal中我需要在某个时候调用truffle吗 var ArrayLi
将焦点和光标设置到文本输入字段/字符串 w 的末尾。 Jquery [重复]

这个问题在这里已经有答案了我有以下函数将选择器添加到搜索输入作为高级选项就像堆栈溢出高级搜索一样当您单击要搜索的内容时它会添加一个前缀请参阅下面的 Jquery
React：在哪里扩展对象原型

我使用创建了一个纯 React 应用程序创建反应应用程序 https github com facebookincubator create react app 我想延长String类并在一个或多个组件中使用它例如 String prot
PHP 在数组内循环

我怎样才能在一个内部循环array在我的代码中这是我的脚本的静态版本 val array array value gt Male label gt Male array value gt Female label gt Femal my
避免滚轮被嵌入的 youtube / flash 视频劫持

我正在对主页中嵌入 YouTube 视频的网站进行一些改进我自己没有添加此代码但它看起来像
显示仅允许数字和小数点的输入？

有什么方法可以定义一个
如何减少 jQuery 函数中使用的子级数量？

我觉得我必须使用太多 children 在我的一些 jQuery 函数中这是我的 HTML div class goal small container div class goal content div class goal row
以编程方式打开网页并以字符串形式检索其 html 包含内容

我有一个 Facebook 帐户我想提取我朋友的照片及其个人详细信息例如出生日期就读学校等我能够提取我每个朋友帐户的 Facebook 首页的地址但我不知道如何以编程方式打开我每个朋友首页的网页并将 html 包含保存为字符串
React：设置 State 或设置 Prop 而无需重新渲染

Problem 目前我有一个LoginForm具有成功处理函数的组件handleOnSuccess 然后将其链接到父组件onTokenUpdate由令牌更新处理函数定义的属性handleUpdateToken 问题是setStat
Angular CDK Overlay，更改默认覆盖容器

有没有办法改变OverlayContainer 我创建了一个工具提示组件但有时我想将叠加层附加到特定元素默认情况下叠加层附加到文档正文以下是我创建叠加层的方法 private initOverlay void const posit
通过 Javascript 填充 ReactJS HTML 表单

我正在开发一个应用程序在打开第 3 方网站后我可以在浏览器上下文中运行我自己的 Javascript 作为一个基于reactjs构建并具有登录表单的示例网站您可以参考此链接我正在尝试在reactjs生成的表单中填写用户名和密码但是
嵌套对象的 setState

我有一个嵌套对象作为状态并且在组件中有一个表单我正在考虑每次用户在表单中输入某些内容时更新状态并且为了避免为每个输入创建许多函数我正在考虑使用 switch 创建单个函数使用 switch 创建单一函数是个好主意吗如何更新对象的
使用 Jsoup 选择没有类的 HTML 元素

考虑一个像这样的 html 文档 div p p p p p class random class name p div 我们怎样才能选择所有p元素但不包括p元素与random class name class Elements ps b
如何从 fetch API 返回 json 响应

我有一个像这样的函数 check auth fetch Urls check auth credentials include method GET then response gt if response ok return respon
为什么 JDOM 的 getChild() 方法返回 null？

我正在做一个关于 html 文档操作的项目我想要现有 html 文档中的正文内容将其修改为新的 html 现在我正在使用 JDOM 我想在我的编码中使用 body 元素为此我在编码中使用了 getChild body 但它向我的程序返
localStorage 获取 NULL？

我不知道为什么因为我之前已经这样做过并且工作正常我认为这可能是因为浏览器问题错误 localStorage setItem foo bar alert localStorage getItem foo 我使用的是 Firefox 3

随机推荐

根据用户名获取广告详细信息

我有一个代码可以从 AD 检索用户的详细信息例如电子邮件地址电话号码等我当前使用的代码是 Set objSysInfo CreateObject ADSystemInfo strUser objSysInfo UserName msg
Java - 从 XML 文件读取注释

我必须从 XML 文件中提取注释我找不到使用 JDOM 或其他东西来让它们使用的方法目前我使用 Regex 和 FileReader 但我不认为这是正确的方法您可以使用 JDOM 之类的东西从 XML 文件中获取注释吗或者它仅限于元
无法使用 findViewById() 找到视图

我找不到TextView通过致电findViewById 即使 ID 确实存在 OtherActivity public class OtherActivity extends Activity Override protected voi
2 使用我的代码在数组中查询

我使用滑块来显示我的 WordPress 精选文章它选择一个自定义类别并返回一定数量的帖子如何将显示的第一篇帖子设为自定义帖子我可以直接在滑块代码中添加特定帖子的 ID吗使该帖子首先出现然后是原始查询返回的其他内容例如在页面上
Android模拟器中的网络访问

我试图通过我的 Android 应用程序访问互联网但我既成功又失败我在构建应用程序时启动模拟器并且应用程序安装得很好我可以使用浏览器访问互联网但是当我尝试这个小代码片段时 InetAddress inet try inet In
collect_list() 是否保持行的相对顺序？

想象一下我有以下 DataFrame df id featureName featureValue id1 a 3 id1 b 4 id2 a 2 id2 c 5 id3 d 9 想象一下我运行 df groupBy id agg coll
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
Karaf / Maven - 无法解决：缺少需求 osgi.wiring.package

我无法在 Karaf 版本 3 0 1 中启动捆绑包该包是使用 Maven 构建的并导入gson http mvnrepository com artifact com google code gson gson 2 3 1 我按照要求将
打字稿和布尔过滤器

考虑以下code https www typescriptlang org play src var 20a 3A 20 number 20 7C 20null 5B 5D 20 3D 20 5B0 2C 201 2C 202 2C 203
FirebaseAnimatedList 实时更改内容

我想知道如何使用新查询更改路径的新内容来重建 FirebaseAnimatedList new Flexible child new FirebaseAnimatedList query query sort DataSnapshot a
索引在 NOT IN 或 <> 子句中起作用吗？

我读过至少 Oracle 数据库中的普通索引基本上是 B 树结构因此存储处理适当根节点的记录小于根的记录被迭代地存储在树的左侧部分而大于根的记录被存储在右侧部分正是这种存储方法有助于通过树遍历实现更快的扫描因为深度和广度都
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
由于 UTFDataFormatException 导致 Spark 中的任务无法序列化：编码字符串太长

我在 Yarn 上运行 Spark 应用程序时遇到一些问题我有非常广泛的集成测试运行时没有任何问题但是当我在 YARN 上运行应用程序时它将抛出以下错误 17 01 06 11 22 23 ERROR yarn Applicatio
Excel：COUNTIF 函数将“小于”字符视为运算符

预读说明我使用的是 LibreOffice 而不是 Excel 但大多数功能应该适用于两者我正在制作一个电子表格其中有大量数据对于每个属性例如员工数量或姓名我需要一个函数来计算包含每个不同值的行数我已经提取了不同的值现在我使
保证复制省略是否适用于函数参数？

如果我理解正确的话从 C 17 开始这段代码现在要求不进行任何复制 Foo myfunc void return Foo auto foo myfunc no copy 函数参数也是如此吗下面的代码中的副本会被优化掉吗 Foo myf
“google cloud run”将 HOME 更改为 CMD 的 /home，其中 RUN 使用 /root

我正在做的是在 Dockerfile 中的 RUN 命令中设置 sbcl 和 Quicklisp 然后使用 CMD 加载我的自定义代码当我在本地计算机上使用 Docker 运行它时一切都很好但是当我将其推送到 google run 时
JOGL 异常 - 在 java.library.path 中找不到gluegen-rt

线程 main java lang UnsatisfiedLinkError中出现异常 java library path中没有gluegen rt 在 java lang ClassLoader loadLibrary ClassLoad
使用 Play Integrity API 时，Firebase 电话身份验证会出现缺少客户端标识符错误

使用 Firebase 电话身份验证注册登录时身份验证流程始终会启动 reCAPTCHA 流程并在返回应用程序后发出missing client identifier error 我的设置之前适用于设备验证安全网络 API 除了我的
使用按钮添加自定义折扣订单总计

我的模块带有自定义折扣没问题配置 xml
如何使用 Javascript 在 html 文件中搜索字符串？

我有 5 个 html 文件并且有一个搜索表单我想用它来搜索这些 html 文件中的文本

如何使用 Javascript 在 html 文件中搜索字符串？

如何使用 Javascript 在 html 文件中搜索字符串？ 的相关文章

随机推荐

热门标签

如何使用 Javascript 在 html 文件中搜索字符串？的相关文章