本地/离线网站“站点”的全文搜索[重复]

2024-04-28

可能的重复:
通过 javascript 对 CD-Rom 上的静态 HTML 文件进行全文搜索 https://stackoverflow.com/questions/1357173/full-text-search-for-static-html-files-on-cd-rom-via-javascript

我正在开始开发一个应用程序,该应用程序在本地创建一堆 HTML 文件,然后可以在复制到的系统(包括移动设备)上的任何 Web 浏览器中浏览这些文件。 HTML 文件具有许多交互功能,因此它本质上是一个离线网络应用程序。我的问题是,对这些 HTML 文件实现全文搜索的最佳方法是什么?基本上,应用程序应该索引它生成的 HTML 文件,但我们希望能够使 HTML 文件和生成的索引可下载并可供用户离线浏览和搜索。在不编写实际应用程序来管理它的情况下执行此操作的最佳方法是什么?例如,我使用 Solr 来实现它以进行演示/概念验证,效果很好……但是当然,这需要向服务器发出 HTTP POST 和 GET 请求以进行索引和查询。因此,由于索引实际上只是文件,我想知道是否有一种方法可以仅使用 HTML 文件中的 Javascript(也许使用 Lucene 而不是 Solr)来离线查询它们(并且无需为 Solr 启动本地 Web 服务器)?


感谢您向我介绍了一些完全用 Javascript 编写的文本搜索解决方案!我想查看文本搜索的代码。

  • http://karussell.wordpress.com/2010/11/01/full-text-search-in-100-javascript-the-future-of-javascript-is-bright/ http://karussell.wordpress.com/2010/11/01/full-text-search-in-100-javascript-the-future-of-javascript-is-bright/

  • http://dev.theladders.com/archives/2006/11/introducing_javascript_fulltex_1.html http://dev.theladders.com/archives/2006/11/introducing_javascript_fulltex_1.html


Lucene是用Java编写的,需要Java(技术上是JVM)进程来访问。

PS1:如果您正在进行自己的简单文本搜索,JS 中的词干分析器 http://qaa.ath.cx/porter_js_demo.html会让它更有用。

original: run running cat cats love loving crap crapping
stemmed: run run cat cat love love crap crap 

PS2:您也可以运行另一个“Ngram-ized”索引来进行拼写检查。


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

本地/离线网站“站点”的全文搜索[重复] 的相关文章

随机推荐

  • Unity3D 中 android 切换速度太慢

    我的游戏有 1000 多个帧 并且精灵的格式是 Crunch 因为这个项目中的精灵太多 当我想从Windows切换到Android时 我花了将近1天的时间来切换 实际上我不允许它完全切换 但切换到Windows并没有那么多 也许只有15分钟
  • ShareLinkContent .setContentTitle()、.setContentDescription()、.setImageUrl() 已弃用

    Facebook 开发者网站表示 自 2017 年 4 月 18 日起 Graph API 2 9 及更高版本不再支持以下参数 对于 2 8 及更低版本 这些参数将持续有效到 2017 年 7 月 17 日 1 一个contentTitle
  • 如何在 Linux 上使用 Python 导出

    我需要在 Python 中进行这样的导出 export MY DATA my export 我尝试过这样做 python mode coding utf 8 import os os system export MY DATA my exp
  • 删除两个元素将数组平均分成三部分,时间复杂度为 O(n)

    我遇到一个问题 让您删除数组中的两个元素以使三部分的总和相等 Ex 1 2 4 3 5 2 1 After I drop the 4 and 5 it becomes 1 2 3 2 1 限制条件 1 Numbers are all int
  • 如何在 MS Access 中填充字段描述

    当通过 ODBC 尤其是 AS 400 链接到外部数据源时 我经常会在另一端遇到神秘的字段名称 而数据字典不可用 在极少数情况下 我能够从其他数据库获取字段描述 我希望能够一次导入它们 而不是一次将每个描述复制 粘贴到表设计表单中 我无法在
  • 如何从 Twitter 按钮获取“仅推文计数”

    我一直在看http dev twitter com pages tweet button build your own example http dev twitter com pages tweet button build your o
  • 我什么时候应该使用 UdpClient.BeginReceive?我什么时候应该在后台线程上使用 UdpClient.Receive?

    从本质上讲 除了明显的区别之外 它们之间还有哪些区别 我什么时候应该使用哪种形式 class What public Go Thread thread new Thread new ThreadStart Go2 thread Backgr
  • scala:用重载来修饰我的库

    有什么想法为什么以下不起作用 implicit def listExtensions A xs List A new ListExtensions xs class ListExtensions A xs List A def foreac
  • 如何从代理类中检索代理类?

    我将 Hibernate 与代理一起使用 并且获得属于以下类的对象test DBUser EnhancerByCGLIB 40e99a2d 是否有 Hibernate 方法来检索基类 test DBUser在这种情况下 来自代理class
  • 具有更多注入 EJB 实例的无状态 EJB

    我知道无状态 EJB 存储在池中并根据需要进行实例化 我的问题是 当存在更多 EJB 依赖项时会发生什么 例如如下所示 Remote Stateless public class Master EJB EJB private EJB A e
  • Ruby 中 shell 命令的颜色输出

    这是一个简单的 Ruby 脚本 puts ls laG 在 OS X 的 ls 中 G 代表颜色 当在 bash 下运行时 我得到颜色输出 当从 Ruby 脚本运行上述代码时 我在结果输出中看不到颜色或 ANSI 转义序列 根据我所读到的内
  • awk 排序多维数组[重复]

    这个问题在这里已经有答案了 GNU awk 支持多维数组 gnu org software gawk manual gawk Arrays of Arrays q 1 1 dog q 1 2 999 q 2 1 mouse q 2 2 77
  • C# 中如何实现引用返回?

    既然 C GC 可以移动内存 那么如何实现引用返回呢 下面的代码会导致 未定义的行为 吗 public struct Record public int Hash public VeryLargeStruct Data public cla
  • 在 hasRole 中使用 spring:eval

    我在 JSP 中显示属性文件中的某些属性 如下所示
  • 无法在 Struts 中加载配置

    我正在尝试在在线考试中实现 STRUTS Spring 和 HIBERNATE 集成 使用 apache tomcat 7 0 42 在 Eclipse Kepler 中运行项目时 它会抛出以下错误 HTTP Status 404 Onli
  • Typescript深度替换多种类型

    我将 mongodb 与 types mongodb 一起使用 这为我提供了一个很好的 FilterQuery 接口 用于我的 mogodb 查询形状文档集合 在我的域对象类中 我有一些额外的逻辑 例如将日期转换为时刻对象或将浮点数转换为
  • 需要澄清应用程序域

    我需要对这个主题进行一些澄清 因为我刚刚遇到将 swf 加载到重用加载器对象中的问题 假设我有 3 个 SWF 主文件 swfchildA swfchildB swf Main swf 中有一个可重用的加载程序对象 myloader loa
  • 选择项目后 jQuery UI 自动完成触发新事件

    我正在使用 jQuery UI 自动完成 并且尝试实现一些代码 一旦用户从自动完成下拉列表中选择了一个项目 它就会调用另一个函数 我查看了 API 文档 但进展甚微 Call LookUpGroupName ActionResult in
  • 如何从 ext2/ext3 文件系统上的稀疏文件中删除一些块

    当您写入稀疏文件时 ext2 ext3 文件系统会自动分配块 但是当我不再需要其中的某些块时 我发现没有办法做到这一点 感觉就像使用 malloc 而不使用 free 是否可以 释放 稀疏文件的某些块 如果是的话 怎么样 不要告诉我将其复制
  • 本地/离线网站“站点”的全文搜索[重复]

    这个问题在这里已经有答案了 可能的重复 通过 javascript 对 CD Rom 上的静态 HTML 文件进行全文搜索 https stackoverflow com questions 1357173 full text search