统计C语言中每个单词出现的次数

2023-12-20

我想统计一下“一颗破碎的心，一颗破碎的心灵”这个小文本中每个单词的出现次数。

这篇文章的每个单词都是二维的array[100][20]其中 100 是max_words20 是max_word_length。我有一个指点array[100]其中每个指针都指向单词。我找不到一个聪明的方法来计算相同的单词，例如

a: 2 times
broken: 2 times
heart: 1 time
mind: 1 time
. : 1 time

这些将是指针和单词数组：

POINTERS ARRAY                      WORDS ARRAY
point0(points "a")                  a
point1(points "broken")             broken
point2(points "heart")              heart
point3(points "of")                 of
point4 (points "a")                 mind
point5(points "broken")             .
point6(points "mind")               \0\0\0\0\0
point7(points ".")                  \0\0\0\0\0
NULL                                ..
NULL
..
NULL                                \0\0\0\0\0

旁注：每个单词都是小写的。

void frequence_word(char *pointers[], int frequence_array[]) {
  int word = 0;
  int i;
  int count = 1;
  int check[MAX_WORDS];

  for (word = 0; word < MAX_WORDS; word++) {
    check[word] = -1;
  }

  for (word = 0; word < MAX_WORDS; word++) {
    count = 1;

    for (i = word + 1; i < MAX_WORDS; i++) {

      if (pointers[word + 1] != NULL
          && strcmp(pointers[word], pointers[i]) == 0) {
        count++;
        check[i] = 0;
      }

    }
    if (check[word] != 0) {
      check[word] = count;
    }

  }
}

有什么想法吗？

这似乎是一个用例strstr https://www.cplusplus.com/reference/cstring/strstr/。您可以致电strstr，然后迭代地重新分配给原始字符串，直到达到 NULL。

const char substring[] = "A broken heart of a broken mind";
const char* total = ...;

const char* result;
long count = 0;
while (result = strstr(total, substring)) {
    count++;
    total += (sizeof(substring) - 1);
}

我认为这基本上是不言自明的，但我将解释这一行：

total += (sizeof(substring) - 1);

它利用了这样一个事实：sizeofon 数组返回数组长度。因此，字符数组上的 sizeof 返回其中的字符数。我们减一以忽略空终止符。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Counting

wordprocessor

统计C语言中每个单词出现的次数的相关文章

InvalidOperationException - 对象当前正在其他地方使用 - 红十字

我有一个 C 桌面应用程序其中我连续创建的一个线程从源实际上是一台数码相机获取图像并将其放在 GUI 中的面板 panel Image img 上这必须是另一个线程如它是控件的代码隐藏该应用程序可以工作但在某些机器上我会在随
用于代数简化和求解的 C# 库 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案网络上有很多代数求解器和简化器例如 algebra com 上不错的代数求解器和简化器然而我正在
使用 std::packaged_task/std::exception_ptr 时，线程清理程序报告数据争用

我遇到了线程清理程序 TSan 的一些问题抱怨某些生产代码中的数据争用其中 std packaged task 通过将它们包装在 std function 中而移交给调度程序线程对于这个问题我简化了它在生产中的作用同时触发 TSa
在 C++ 中使用 matlab 结构（matlab 函数调用的返回值）（由 matlab 编译器生成的库）

你好我有一个相当简单的 matlab 函数例如 function MYSTRUCT myfunc MYSTRUCT prop1 test MYSTRUCT prop2 foo MYSTRUCT prop3 42 end 我用 matla
如何在c++中读取pcap文件来获取数据包信息？

我想用 C 编写一个程序来读取 pcap 文件并获取数据包的信息例如 len sourc ip flags 等现在我找到了如下代码我认为它会帮助我获取信息但是我有一些疑问首先我想知道应该将哪个库添加到我的程序中然后什么是 pca
如何让 Swagger 插件在自托管服务堆栈中工作

我已经用 github 上提供的示例重新提出了这个问题并为任何想要自己运行代码的人提供了一个下拉框下载链接 Swagger 无法在自托管 ServiceStack 服务上工作 https stackoverflow com questio
在 DataView 的 RowFilter 中选择 DISTINCT

我试图根据与另一个表的关系缩小 DataView 中的行范围我使用的 RowFilter 如下 dv new DataView myDS myTable id IN SELECT DISTINCT parentID FROM myOthe
在 C 中初始化变量

我知道有时如果你不初始化int 如果打印整数您将得到一个随机数但将所有内容初始化为零似乎有点愚蠢我问这个问题是因为我正在评论我的 C 项目而且我对缩进非常直接并且它可以完全编译 90 90 谢谢 Stackoverflow 但我想
具有交替类型的可变参数模板参数包

我想知道是否可以使用参数包捕获交替参数模式例如 template
我可以使用 moq Mock 来模拟类而不是接口吗？

正在经历https github com Moq moq4 wiki Quickstart https github com Moq moq4 wiki Quickstart 我看到它 Mock 一个接口我的遗留代码中有一个没有接口的类
如何在 Xaml 文本中添加电子邮件链接？

我在 Windows Phone 8 应用程序中有一些大文本我希望其中有电子邮件链接例如 mailto 功能这是代码的一部分
C#：帮助理解 UML 类图中的 <>

我目前正在做一个项目我们必须从 UML 图编写代码我了解 UML 类图的剖析但我无法理解什么 lt
C# 中的合并运算符？

我想我记得看到过类似的东西三元运算符 http msdn microsoft com en us library ty67wk28 28VS 80 29 aspx在 C 中它只有两部分如果变量值不为空则返回变量值如果为空则返回默
为什么 std::strstream 被弃用？

我最近发现std strstream已被弃用取而代之的是std stringstream 我已经有一段时间没有使用它了但它做了我当时需要做的事情所以很惊讶听到它的弃用我的问题是为什么做出这个决定有什么好处std stringstr
外键与独立关系 - Entity Framework 5 有改进吗？

我读过了several http www ladislavmrnka com 2011 05 foreign key vs independent associations in ef 4 文章和问题 https stackoverflow
“接口”类似于 boost::bind 的语义

我希望能够将 Java 的接口语义与 C 结合起来起初我用过boost signal为给定事件回调显式注册的成员函数这非常有效但后来我发现一些函数回调池是相关的因此将它们抽象出来并立即注册所有实例的相关回调是有意义的但我了解到的
WebSocket安全连接自签名证书

目标是一个与用户电脑上安装的 C 应用程序交换信息的 Web 应用程序客户端应用程序是 websocket 服务器浏览器是 websocket 客户端最后用户浏览器中的 websocket 客户端通过 Angular 持久创建并且
我的班级应该订阅自己的公共活动吗？

我正在使用 C 3 0 遵循标准事件模式我有 public event EventHandler
Oracle Data Provider for .NET 不支持 Oracle 19.0.48.0.0

我们刚刚升级到 Oracle 19c 19 3 0 所有应用程序都停止工作并出现以下错误消息 Oracle Data Provider for NET 不支持 Oracle 19 0 48 0 0 我将 Oracle ManagedData
当从finally中抛出异常时，Catch块不会被评估

出现这个问题的原因是之前在 NET 4 0 中运行的代码在 NET 4 5 中因未处理的异常而失败部分原因是 try finallys 如果您想了解详细信息请阅读更多内容微软连接 https connect microsoft com

随机推荐

OSX 中的 tiff() 分辨率和压缩设置不可靠

分辨率和压缩选项tiff 在我的系统上似乎被忽略请参阅下面的信息这似乎与中讨论的问题相同这个问题 https stackoverflow com questions 12609816 r tiff wont compress or se
Laravel + Image Intervention：强制下载未保存的文件

我想简单地上传文件调整它们的大小然后强制下载每个上传的文件我不想保存文件调整大小等工作正常但是我无法强制下载新文件 content image gt stream jpg return response gt download c
Quickblox 会话在后台过期。怎么处理呢？

当用户进入后台时我从聊天中注销该用户当用户从后台返回时我会在聊天中再次记录使用情况这很有效但并非每次都有效有时当用户将应用程序保持在后台超过 2 小时时会话就会过期并且当用户从后台返回时会话似乎不会自动重新验证即使使用
编译 Java 类并从命令控制台运行 Java 文件时，如何包含 Java jar 文件？

我有一个与 postgresql 数据库交互的小 Java 文件所以我已经下载了驱动程序并在我的文件中导入org postgresql Driver 在命令控制台中我输入javac Myfilename java 然后它编译我运行java
JavaScript 异步/等待

我正在尝试理解 JavaScript 异步等待如何重写以下内容使输出为 Hi 然后 Bye 而不是 Bye 然后 Hi JSFiddle https jsfiddle net tp7tjhvL 1 sayHi then sayBye
设置nginx支持自定义域名

我有一个 Django Web 应用程序托管在一个虚拟机上该虚拟机以基于 Debian 的 Ubuntu 作为操作系统以 nginx 反向代理 Gunicorn 作为 Web 服务器此 Web 应用程序的 DNS 是myapp clo
如何以编程方式在 WordPress 中创建帖子 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想知道如何在 WordPress
我需要向父 div 添加一个像素

我有一个教室的 div 其中包含每个学生的 div 每个学生 div 都包含一个图像这是 HTML div class classroom div class student img class student image sr
需要 JQuery 弹出窗口/警报

我有一个元素列表每个元素需要有一个相应的弹出窗口这不是背景变黑的弹出窗口这更像是一个 JavaScript 警报尽管我需要在弹出窗口中创建自己的样式按钮并为其分配我们自己的定制事件我需要每个弹出窗口将自己适当地放置在用户界面中相
解析接受标头

有人对解析 HTTP Accept 标头有任何建议或正则表达式吗我正在尝试在 ASP NET MVC 中进行一些内容类型协商似乎没有内置的方式这很好因为这里有很多思想流派但是解析并不完全微不足道如果有人已经完成了我宁愿不重
如何将字符串渲染为html链接

我向电子邮件发送一些消息如下所示 string link http localhost 1900 ResetPassword username user UserName reset HashResetParams user UserNa
IntelliJ IDEA v12 中的警告

给出的答案为如何让Intellij Idea显示编译警告 https stackoverflow com questions 4745415 how to get intellij idea to display compilation w
为什么将“extern puts”转换为函数指针“(void(*)(char*))&puts”？

我正在看例子abo3 c http community corest com gera InsecureProgramming abo3 html from 不安全编程 http community corest com gera Inse
当我使用 Python 的调试版本时，如何使用 gdb？

我的 gdb 版本与我的系统 python 链接但我目前正在使用 python 的特殊调试版本因此 gdb 无法正确启动并出现如下错误 gdb gdb Symbol Py ZeroStruct has different size i
为什么我的数组在 AJAX 函数之外的行为不同？（填充 jsTree）[重复]

这个问题在这里已经有答案了长话短说我正在为 jsTree 创建一个类似 JSON 的数组我不明白的是为什么数组非常适合我在 AJAX 成功函数中的需求但又损坏了outside该功能的查看我的控制台转储的屏幕截图您可以看到差异为
在 Google 地图中绘制一个点周围的半径

我正在使用 Google Maps API 并添加了标记现在我想在每个标记周围添加 10 英里的半径这意味着在缩放时会出现适当的圆形我不知道该怎么做而且这似乎不常见我发现一个看起来不错的例子 http www freemaptoo
如何在不给单元格区域命名的情况下选择单元格区域？

我想使用应用程序脚本选择单元格 C29 Z50 作为变量我不想创建命名范围但如果需要的话我可以我的目标是创建一些超越颜色的自定义格式可以使用内置功能因此如果单元格 B27 交易则将 C29 Z50 格式化为数字否则将 Z29
MVC4 Bundle 中的 {version} 通配符

在 MVC 4 中我们有捆绑包在定义捆绑包时我们可以对文件夹中的所有文件使用等通配符在下面的例子中什么是 version mean public static void RegisterBundles BundleCollect
实体框架不信任投票 - 与 .NET 4 相关吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动
统计C语言中每个单词出现的次数

我想统计一下一颗破碎的心一颗破碎的心灵这个小文本中每个单词的出现次数这篇文章的每个单词都是二维的array 100 20 其中 100 是max words20 是max word length 我有一个指点array 100 其中

统计C语言中每个单词出现的次数

统计C语言中每个单词出现的次数 的相关文章

随机推荐

热门标签

统计C语言中每个单词出现的次数的相关文章