C++ 搜索性能

2023-12-12

我有两个文本文件。其中包含大约 70,000 个姓名的列表 (~1.5MB)。另一个包含将从各种来源获得的文本。也就是说，每次执行程序时，该文件的内容都会发生变化（~0.5MB）。本质上，我希望能够将一些文本粘贴到文本文件中，并查看在我的列表中找到了哪些名称。有点像查找功能 (CTR + F)，但有 70,000 个关键字。

无论如何，到目前为止我所拥有的是：

int main()
{
     ifstream namesfile("names.txt");   //names list
     ifstream miscfile("misc.txt");     //misc text
     vector<string> vecnames;           //vector to hold names
     vector<string> vecmisc;            //vector to hold misc text
     size_t found;

     string s;
     string t;

     while (getline(namesfile,s))       
         veccomp.push_back(s);  

     while (getline(miscfile,t))        
         vectenk.push_back(t);

     //outer loop iterates through names list
     for (vector<string>::size_type i = 0; i != vecnames.size(); ++i) {
         //inner loop iterates through the lines of the mist text file
         for (vector<string>::size_type j = 0;j != vecmisc.size(); ++j) {
             found=vecmisc[j].find(vecnames[i]);
             if (found!=string::npos) {
                 cout << vecnames[i] << endl;
                 break;
             }
         }
     }

     cout << "SEARCH COMPLETE";

     //to keep console application from exiting
     getchar();

     return 0;
 }

现在，就提取我需要的数据而言，这非常有效，但是，它非常慢并且显然效率低下，因为每个名称都要求我可能再次搜索整个文件，这会给出（75000 x 杂项文本文件中的行数）迭代。如果有人可以提供帮助，我一定会很感激。一些示例代码是最受欢迎的。此外，如果这有什么区别的话，我正在使用 Dev C++。谢谢。

Use a std::hash_set。将所有关键字插入集合中，然后遍历大型文档，每次遇到一个单词时，测试集合中是否包含该单词。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++ 搜索性能的相关文章

是否可以使用“git gc”来打包引用日志对象？

正如答案所暗示的https stackoverflow com a 32025729 https stackoverflow com a 32025729我已经配置了远程裸仓库 git config gc pruneExpire never
如何让 Swagger 插件在自托管服务堆栈中工作

我已经用 github 上提供的示例重新提出了这个问题并为任何想要自己运行代码的人提供了一个下拉框下载链接 Swagger 无法在自托管 ServiceStack 服务上工作 https stackoverflow com questio
计算 Richtextbox 中所有单词的最有效方法是什么？

我正在编写一个文本编辑器需要提供实时字数统计现在我正在使用这个扩展方法 public static int WordCount this string s s s TrimEnd if String IsNullOrEmpty s re
C中的malloc内存分配方案

我在 C 中尝试使用 malloc 发现 malloc 在分配了一些内存后浪费了一些空间下面是我用来测试 malloc 的一段代码 include
在 LINQ 中按 Id 连接多表和分组

我想按categoryId显示列表产品的名称组这是我的代码我想要我的视图显示结果 Desktop PC HP Red PC Dell Yellow PC Asus Red SmartPhone Lumia 720 Blue 我的组模型
转义 to_tsquery 中的特殊字符

如何转义传递给的字符串中的特殊字符to tsquery 例如这种查询 select to tsquery AT T 生产 NOTICE text search query contains only stop words or doesn
当我们想要返回对象的引用时，为什么我们在赋值运算符中返回 *this 而通常（而不是 this）？

我正在学习 C 和指针我以为我理解了指针直到我看到这个一方面 asterix 运算符是解引用的这意味着它返回值所指向的地址中的值而与号运算符则相反它返回值存储的地址记忆现在阅读有关赋值重载的内容它说我们返回 this因
复制目录内容

我想将目录 tmp1 的内容复制到另一个目录 tmp2 tmp1 可能包含文件和其他目录我想使用C C 复制tmp1的内容包括模式如果 tmp1 包含目录树我想递归复制它们最简单的解决方案是什么我找到了一个解决方案来打开目录并读
使用 Newtonsoft 和 C# 反序列化嵌套 JSON

我正在尝试解析来自 Rest API 的 Json 响应我可以获得很好的响应并创建了一些类模型我正在使用 Newtonsoft 的 Json Net 我的响应中不断收到空值并且不确定我的模型设置是否正确或缺少某些内容例如我想要获取
如何区分用户点击链接和页面自动重定向？

拥有 C WebBrowser control http msdn microsoft com en us library system windows forms webbrowser aspx在我的 WinForms 应用程序中并意识
回发后刷新时提示确认表单重新提交。我做错了什么？

我有一个以空白默认状态启动的仪表板我让用户能够将保存的状态加载到仪表板中当他们单击应用按钮时我运行以下代码 function CloseAndSave var radUpload find radUpload1ID var in
将 Word 文档另存为图像

我正在使用下面的代码将 Word 文档转换为图像文件但是图片显得太大内容不适合有没有办法渲染图片或将图片保存到合适的尺寸 private void btnConvert Click object sender EventArgs e
是否有实用的理由使用“if (0 == p)”而不是“if (!p)”？

我倾向于使用逻辑非运算符来编写 if 语句 if p some code 我周围的一些人倾向于使用显式比较因此代码如下所示 if FOO p some code 其中 FOO 是其中之一false FALSE 0 0 0 NULL etc
具有交替类型的可变参数模板参数包

我想知道是否可以使用参数包捕获交替参数模式例如 template
等待进程释放文件

我如何等待文件空闲以便ss Save 可以用新的覆盖它吗如果我紧密地运行两次左右我会得到一个generic GDI error
动态添加 ASP.Net 控件

我有一个存储过程它根据数据库中存储的记录数返回多行现在我想有一种方法来创建 div 带有包含该行值的控件的标记如果从数据库返回 10 行则 10 div 必须创建标签我有下面的代码来从数据库中获取结果但我不知道如何从这里继续 S
使用 %d 打印 unsigned long long

为什么我打印以下内容时得到 1 unsigned long long int largestIntegerInC 18446744073709551615LL printf largestIntegerInC d n largestInte
使用 C# 读取 Soap 消息
如何部署“SQL Server Express + EF”应用程序

这是我第一次部署使用 SQL Server Express 数据库的应用程序我首先使用实体框架模型来联系数据库我使用 Install Shield 创建了一个安装向导来安装应用程序这些是我在目标计算机中安装应用程序所执行的步骤安装
如何将 PostgreSql 与 EntityFramework 6.0.2 集成？ [复制]

这个问题在这里已经有答案了我收到以下错误实体框架提供程序类型的实例成员 Npgsql NpgsqlServices Npgsql 版本 2 0 14 2 文化中性 PublicKeyToken 5d8b90d52f46fda7 没

随机推荐

如何将 Node docker 容器与 postgres docker 容器连接

我有一个 CRUD 应用程序在我的本地计算机上的节点上运行它运行在节点上以 postgres 作为数据库使用 knex js 作为查询构建器等我创建了一个 docker 文件和一个 docker compose 文件并且容器启动
使用 Html Agility Pack 从 html 中抓取所有文本

Input p foo a href http www example com bar a baz p Output foo bar baz 我知道htmldoc DocumentNode InnerText 但它会给foobarbaz 我
Outlook ItemAdd 事件未一致触发

我正在尝试确定收到的邮件是否是垃圾邮件 Itemadd 事件仅有效一次它不会持续触发我该如何解决这个问题我做以下事情 public partial class ThisAddIn private void ThisAddIn Star
使解决方案中的每个 csproj 面向不同的 C# 版本

我有一个包含五个 C 控制台应用程序项目的解决方案我希望每个项目都针对不同版本的 C MyLearningSolution sln CSharp01 csproj CSharp02 csproj CSharp03 csproj CShar
字符串文字和字符串对象相加的区别

字符串文字和字符串对象相加有什么区别例如 String s1 hello String s2 hello1 String s3 hello hello1 String s4 hellohello1 String s5 s1 s2 Syst
java.io.StreamCorruptedException：读取超过 1 个对象时格式错误[重复]

这个问题在这里已经有答案了我正在尝试添加一个对象 OneChatMessage每次单击按钮时都会将其保存到一个文件中然后我尝试从文件中读取所有对象并将其加载到ArrayList 但我得到一个StreamCorruptedExceptio
建议设计：应用程序中几乎每个对象都有记录器

我正在写一个应用程序我使用 NLog 进行日志记录在这个应用程序中几乎每个对象都可以写入日志我为此定义了受保护的成员 protected Logger logger protected virtual Logger Logger g
VSTS Rest API - 创建版本

我想利用此处定义的 VSTS Rest API 开始发布 https www visualstudio com en us docs integrate api rm releases create a release 但我需要在创建版本时
框架 CFBundleIdentifier 碰撞

我使用 Cocoa Touch Framework 制作了一个自定义 SDK 按照这些说明进行制作https kodmunki wordpress com 2015 03 04 cocoa touch frameworks for ios8
如何在 for...循环中使用 setTimeout

我想要的是这个新闻行情类型功能从 ul 标签获取 li 列表循环遍历所有li并获取文本通过 firefox console log 在控制台中显示文本获取下一个 li 并重复直到显示所有 li 这就是目标但是 setTimeo
找到大小为 k 的子集，使得值之间的最小距离最大

假设我有一个数组其中包含n整数如何找到尺寸的子集k使得minimum子集中所有整数对之间的距离为maximized 我的意思是他们距离最远示例数组a 1 2 6 7 10 and k 3 subset 1 6 10 最小距离为410
v8 术语中 merge、phi、effectphi 和 dead 的含义

我正在尝试阅读 v8 源代码特别是其中的编译器部分以更好地理解优化和缩减过程以便查找错误我遇到了评论中使用的一些术语但似乎无法解释评论是这样的 Check if this is a merge that belongs to a
更改工具栏中的图标颜色

我正在使用 Android 组件navigation for a DrawerLayout with NavigationView public class MainActivity extends AppCompatActivity pr
解析推送通知在 Android 上不起作用

我正在为我的 Android 应用程序使用解析推送通知我按照教程下载 jar 文件然后将其导入到我的项目中并将此代码添加到我的清单中
我的路由如何使用 ASP MVC3 在 URL 中间使用可选参数？

我希望我的 URL 使用以下约定 controller id action 而不是 controller action id 我尝试按如下方式设置路线 routes MapRoute Campaign controller action i
kotlin协程使用withContext获取非阻塞代码时withTimeout不会取消

我正在使用 withContext 将函数转换为不会阻塞调用线程的挂起函数为此我使用了https medium com elizarov blocking threads suspending coroutines d33e11bf476
如何将https重定向到新域？

我重新开发了公司网站但在重定向 SSL 方面遇到了一些问题键入或单击http olddomain org重定向到https newdomain com 但是输入或单击链接https olddomain org不重定向到https ne
JComponent JPanel 缩放、平移和坐标问题

我有一个JPanel带有用户可以缩放和平移的矢量图像覆盖此图像的是透明 JComponent 我允许用户注释底层图像这在全尺寸下效果很好但是如果我放大使用AffineTransform 重叠坐标也会受到影响因此如果用户在图像上
Ember 没有获得某些属性

当从以下位置运行以下命令时UserController在 Google Chrome 上 ember couchdb kit 0 9 余烬数据v1 0 0 beta 3 56 g8367aa5 Ember v1 0 0 and 这个 cou
C++ 搜索性能

我有两个文本文件其中包含大约 70 000 个姓名的列表 1 5MB 另一个包含将从各种来源获得的文本也就是说每次执行程序时该文件的内容都会发生变化 0 5MB 本质上我希望能够将一些文本粘贴到文本文件中并查看在我的列表中找到了

C++ 搜索性能

C++ 搜索性能 的相关文章

随机推荐

热门标签

C++ 搜索性能的相关文章