如何获取页面上使用的所有单词的数组

2024-05-27

所以我试图获取网页中使用的所有单词的数组。

应该很容易吧？

我遇到的问题是$("body").text().split(" ")返回一个数组，其中一个元素开头的单词和另一个元素结尾的单词连接为一个。

i.e:

<div id="1">Hello
    <div id="2">World</div>
</div>

returns ["HelloWorld"]当我想要它返回时["Hello", "World"].

我也尝试过：

wordArr = [];

function getText(target)
{    
    if($(this).children())
    {
        $(this).children(function(){getText(this)});
    }
    else
    {
        var testArr = $(this).text().split(" ");
        for(var i =0; i < testArr.length; i++)
            wordArr.push(testArr[i]);
    }

}

getText("body");

but $(node).children()对于 DOM 中存在的任何节点都是 true，所以这不起作用。

我确信我错过了一些明显的东西，所以我希望有一双额外的眼睛。

就其价值而言，我不需要唯一的单词，只需将文档正文中的每个单词作为数组中的元素即可。我试图用它来生成与另一组单词的上下文和词汇共现，因此重复了给定单词的上下文重要性。

预先感谢您的任何想法。

See Fiddle http://jsfiddle.net/wc9QN/

像这样的事情怎么样？

 var res = $('body  *').contents().map(function () {
    if (this.nodeType == 3 && this.nodeValue.trim() != "") 
        return this.nodeValue.trim();
}).get().join(" ");
console.log(res);

Demo http://jsfiddle.net/n3zB5/

获取单词数组：

var res = $('body  *').contents().map(function () {
    if (this.nodeType == 3 && this.nodeValue.trim() != "") //check for nodetype text and ignore empty text nodes
        return this.nodeValue.trim().split(/\W+/);  //split the nodevalue to get words.
}).get(); //get the array of words.

console.log(res);

Demo http://jsfiddle.net/FeP2q/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

javascript

jQuery

如何获取页面上使用的所有单词的数组的相关文章

如何使用javascript将大图像转换为十六进制？

如果我尝试将图像转换为十六进制无论我使用哪个函数我都会收到此错误消息该图像的大小为 7 MB 19812 毫秒清理 1401 2 1455 0 gt 1401 2 1455 0 MB 9 9 0 ms 自上次 GC 以来 8 3 m
如何在codeigniter中将上传图片比例限制为16:9？

这是我用来上传图像的代码 this gt load gt library upload ext pathinfo file name PATHINFO EXTENSION img name now ext imgConfig upload
如何将内联 JavaScript 与 Express/Node.js 中动态生成的内容分开？

对于具有几年 Web 开发经验但没有找到答案的人来说这是一个有点菜鸟的问题程序员堆栈交换 or Google 我决定在这里问一下我在用Express网络框架Node js 但这个问题并不特定于任何 Web 框架或编程语言以下是从数据库
带有淘汰赛js的隐形recaptcha

我正在完成隐形验证码但我在实现它时遇到问题谷歌开发人员页面中的代码显示它应该是这样的
使用 dc.js 按条形值对条形图中的条形进行排序（排序）

如何通过维度的计算值而不是维度本身的名称对 dc js 示例中的 x 轴维度进行排序例如请考虑序数条形图的 dc js 示例 https github com dc js dc js blob master web examples
React-Redux：state.setIn() 和 state.set() 有什么区别？

我见过使用setIn and set 在一些react redux代码中 state setIn state set 我在这里找到了一些文档https facebook github io immutable js https facebo
有没有办法使用 Rspec/Capybara/Selenium 将 javascript console.errors 打印到终端？

当我运行 rspec 时是否可以让 capybara selenium 向 rspec 报告任何 javascript console errors 和其他异常我有一大堆测试失败但当我手动测试它时我的应用程序正在运行如果不知道仅在
设置 cookie 时中断 JavaScript 执行

当设置 cookie 时是否可以始终中断浏览器开发人员工具中的 javascript 执行无需显式设置 JS 断点 document cookie 在 html head 块的开头添加此代码片段效果很好
jQuery：处理 getJSON() 中的错误？

使用 jQuery 时如何处理 500 错误getJSON http api jquery com jQuery getJSON 有几个关于错误处理的问题getJSON and https stackoverflow com questio
使用 CSS 或 Javascript 填充动画

我只是想知道是否可以使用 CSS 或 javascript 创建填充动画基本上我想创建一个填充动画如下图所示 http i40 tinypic com eit6ia png http i40 tinypic com eit6ia png
如何解决 Typescript 构建中的错误“找不到模块 'jquery'”

我目前在 ts 文件的顶部有这个import require jquery 我这样做是因为我试图在我的打字稿文件中使用 jquery 但我似乎无法编译它因为它返回标题中所述的错误我正在使用 ASP NET CORE 脚本文件夹 tsco
window.location 和 location.href 之间的区别

我对之间的区别感到困惑window location and location href 两者似乎都以相同的方式行事有什么不同 window location是一个对象它保存有关当前文档位置的所有信息主机 href 端口协议等 lo
刷新页面时保存用户的选择

我目前有一个页面显示不同团队的数据我有一些数据用户可以单击使其处于打开或关闭状态并为每个数据显示不同的图标它基本上就像一个清单只是没有物理复选框我想记住哪些复选框已被选中即使在用户刷新页面或关闭浏览器并稍后返回之后
页面上使用 HTML Editor Extender 进行回发会导致 IE11 中出现 JavaScript 错误

我已将 HTML 编辑器扩展程序添加到我正在处理的页面中现在每当我在页面上发回帖子时都会收到以下 Javascript 错误 JavaScript 运行时错误参数无效之后什么也没有发生这在 IE10 或更低版本以及我所知道的所有其
Vuejs 2：去抖动不适用于手表选项

当我在 VueJs 中反跳此函数时如果我提供毫秒数作为原语它就可以正常工作但是如果我将其提供为对 prop 的引用它会忽略它这是道具的缩写版本 props debounce type Number default 500 这是不
Firebase 函数 onWrite 未被调用

我正在尝试使用 Firebase 函数实现一个触发器该触发器会复制数据库中的一些数据我想观看所有添加的内容votes user vote 结构为我尝试的代码是 const functions require firebase func
使用 Vue 的多模式组件

我在 Vue 中实现动态模式组件时遇到问题 A common approach I follow to display a set of data fetched from the db is I dump each of the rows
Javascript - 水波纹效果

我需要 JS 上的脚本它将以水波纹样式更改 images html 抱歉 6MB GIF 文件 http fcuunited ru temp listening2 gif http fcunited ru temp listening
Javascript Replace() 和 $1 问题

我正在尝试创建一个脚本来搜索文本中的模式并在它找到的字符串周围包裹一个标签 shop attributes td each function this html function i html return html replace E 0
使用 MongoDB 和 Nodejs 插入和查询日期

我需要一些帮助在 mongodb 和 nodejs 中按日期查找记录我将日期添加到抓取脚本中的 json 对象如下所示 jsonObj last updated new Date 该对象被插入到 mongodb 中我可以看到如下 la

随机推荐

Git 会删除空文件夹吗？ [复制]

这个问题在这里已经有答案了我已提交一个项目并将其推送到我的 GitHub 帐户该项目包含以下部分文件结构 server conf some files java lib java 和 lib 文件夹为空从 GitHub 下载我的项目时
在 C++ 中返回对象的最佳方法？

我对 C 很菜鸟返回对象的更好方法是什么我来自脚本世界其中对象始终是引用并且正在尝试实现相同的概念我的基础是C 中什么时候通过引用传递什么时候通过指针传递 https stackoverflow com questions 36
Git Push 远程：致命：包超出允许的最大大小

我接到了一个大项目客户想将其添加到github 我是一点一点添加的然后发生的事情是我太贪心了一次添加了太多文件现在无论我尝试什么我都会不断收到此错误我怎样才能解决这个问题我试图回滚但也许我做错了 git push Ente
为一个对象上的每个元组元素调用函数，无需递归

我有一个类对象A可以用不同的类型调用并在每次调用时返回更改后的 self 为了这个问题的目的A will do struct A A call const int A call const string s a 所以我有一个未知类型的元组
可以让 ReSharper 在 Intellisense 中显示异常吗？

我很喜欢 ReSharper 提供的重写智能感知行为但是我似乎无法让它显示异常任何带有
ubuntu 的 CSS 更少（并且自动编译）？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我尝试过 simples 但现在 l
在 C 中使用 lapack 计算矩阵的逆

我希望能够计算一般的逆NxN使用 lapack 在 C C 中编写矩阵我的理解是在 lapack 中进行反转的方法是使用dgetri函数但是我无法弄清楚它的所有参数应该是什么这是我的代码 void dgetri int N dou
createElement variable2

我需要在 SharePoint 2010 中创建导航 Web 部件我使用表格来显示 SharePoint 列表中的项目该表格的结构如下 Column1 要显示的文本标题第 2 列 URL 标题链接我似乎无法弄清楚如何实现创建 a
我可以在 Orchard CMS 中使用我的 Ninject .NET 项目吗？

我正在使用 Orchard CMS 创建一个网站并且有一个用 Ninject 编写的外部 NET 项目用于依赖注入我想将其与 Orchard CMS 中的模块一起使用我知道 Orchard 使用 Autofac 进行依赖注入这给我
Nodejs 上使用 DNS 进行 Consul 服务发现

TL DR 大家好我试图从用 Express 编写的 NodeJS 前端调用 NodeJS 后端微服务通过Consul https www consul io DNS接口 https www consul io intro gettin
将 StringBuilder 写入 Stream

将 StringBuilder 写入 System IO Stream 的最佳方法是什么我目前正在做 StringBuilder message new StringBuilder All your base message Append
如何在 X 秒后更改 NSTimer 的 NSTimeInterval？

我正在 swift 2 中制作一个应用程序其中有两个计时器 10 秒后我希望另一个计时器走得更快我尝试过这样做但它不起作用我正在尝试更改 vartime to 1 IBOutlet var displayTimeLabel UILa
如何在Shiny中默认选择verbatimTextOutput中的文本？

这是与我之前的问题相关的问题是否可以有固定宽度的 verbatimTextOutput 并让文本在 Shiny 中换行 https stackoverflow com q 58516071 7669809 我有以下闪亮的应用程序 http
navigator.geolocation.getCurrentPosition 在 Android 浏览器上失败

我试图在 Android 浏览器上获取地理位置但没有任何反应我使用的是 Samsung Galaxy S3 但我不确定浏览器的版本安卓版本是4 1 2 这是我的代码 if navigator geolocation var timeo
Xcode Instruments：模拟器中运行的 iPhone 应用程序的峰值 RAM？

活动监视器又名内存监视器是 Xcode Instruments 中唯一可以测量在模拟器中运行的 iPhone 应用程序的总应用程序 RAM 使用情况的工具吗只是显示瞬时有线 RAM 的那条线与 iPhone 硬件相比尤其是 OSX
此应用程序的包标识符与其代码签名标识符不匹配

当我尝试在设备上构建并运行应用程序时出现以下错误App installation failed This application s bundle identifier does not match its code signing id
PHP facebook SDK 4.0登录错误

我正在官方页面上寻找文档但没有任何帮助所以我构建了此代码但它不起作用 FacebookSession setDefaultApplication app id app secret helper new Facebook Facebo
无法在 Office365 REST Api 中检索附件的“ContentId”属性

我正在尝试检索 Office365 Rest api 中的附件由于我想避免下载整个附件因此我使用 select 子句来避免下载 ContentBytes 属性中的内容 select ContentId ContentType Id Is
如何异步构建我的测试套件？

我正在尝试使用必须异步加载的配置为我的控制器创建摩卡测试下面是我的代码但是当运行摩卡测试时它不会运行任何测试显示0 passing The console logs 甚至从未被调用过我尝试做before next gt conf
如何获取页面上使用的所有单词的数组

所以我试图获取网页中使用的所有单词的数组应该很容易吧我遇到的问题是 body text split 返回一个数组其中一个元素开头的单词和另一个元素结尾的单词连接为一个 i e div Hello div World div div r

如何获取页面上使用的所有单词的数组

Demo http://jsfiddle.net/n3zB5/

Demo http://jsfiddle.net/FeP2q/

如何获取页面上使用的所有单词的数组 的相关文章

随机推荐

热门标签

如何获取页面上使用的所有单词的数组的相关文章