使用 SQL 查询统计单词出现次数

2024-01-08

我有两张桌子。

Table1:

ID   SENTENCE
1    The shoes are good shoes.
2    There is a tree.
3    This is nice, nice, nice!

Table2:

ID   WORD
1    The
1    shoes
1    are
1    good
1    shoes
2    There
2    is
2    a
2    tree
3    This
3    is
3    nice
3    nice
3    nice

我需要统计表1中每个句子中每个单词的出现次数。如果任何单词出现多次 (>1),则计算它,否则跳过它。最后生成的表应如下所示:

ID   SENTENCE                   CNT
1    The shoes are good shoes.  2
2    There is a tree.
3    This is nice, nice, nice!  3

您可以使用count() over():

select distinct t1.id,
  t1.sentence,
  coalesce(t2.cnt, 0) cnt
from table1 t1
left join 
(
  select t1.id, 
    t1.sentence,
    t2.word,
    count(t2.word) over(partition by t1.id, t2.word) cnt
  from table1 t1
  left join table2 t2
    on t1.id = t2.id
) t2
  on t1.id = t2.id
  and t2.cnt > 1
order by t1.id

See SQL 摆弄演示 http://www.sqlfiddle.com/#!4/9a949/16.

或者你可以只使用count():

select t1.id,
  t1.sentence,
  coalesce(t2.cnt, 0) cnt
from table1 t1
left join 
(
  select t1.id, 
    t1.sentence,
    t2.word,
    count(t2.word) cnt
  from table1 t1
  left join table2 t2
    on t1.id = t2.id
  group by t1.id, t1.sentence, t2.word
  having count(t2.word) > 1
) t2
  on t1.id = t2.id
order by t1.id 

See SQL 摆弄演示 http://www.sqlfiddle.com/#!4/9a949/22

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 SQL 查询统计单词出现次数 的相关文章

随机推荐

  • R中将长列表分成指定长度的短列表

    这与之前的一个问题密切相关here https stackoverflow com questions 45663125 divide long list into shorter lists in r 然而我需要一些稍微不同的东西 我有一
  • ASP.NET MVC - 将 JSON DateTime 传递到控制器而不映射到控制器参数

    我正在使用 jQuery 日历来显示事件 该日历旨在从服务器提取数据 在初始化时 日历会触发 AJAX 请求以获取事件对象数组 json 编码 到目前为止一切都很好 但是 此请求包含 JSON 编码的日期和时间 至少我的实现是这样 代码如下
  • 反应式形式不接收默认输入值

    我正在使用 Angular 并且有一个用于编辑项目的反应形式 当我打开组件进行编辑时 输入会正确加载对象的值 但如果我不单击输入并更改值 则反应形式的值将为空 我的代码在这里
  • Go 支持易失性/非易失性变量吗?

    我是这门语言的新手 所以请耐心等待 我很好奇 GO 如何处理线程可用的数据存储 从某种意义上说 非局部变量也可以是非易失性的 例如在 Java 中 GO 有通道的概念 从本质上讲 线程间通信意味着它绕过处理器缓存 直接读 写堆 另外 在 g
  • Python 中有“multimap”实现吗?

    我是 Python 新手 并且熟悉以下的实现多重地图 http en wikipedia org wiki Multimap in other http www sgi com tech stl Multimap html 语言 http
  • 无法在 PHP 中注销[重复]

    这个问题在这里已经有答案了 我正在尝试用 PHP 制作注册 登录表单 但无法注销 我不断收到以下错误 致命错误 未捕获的 ArgumentCountError 函数 USER construct 的参数太少 第 4 行在 C xampp h
  • 防止 CSS 工具提示超出页面/窗口

    我有一个仅 CSS 的工具提示 它加载span作为工具提示 当您hover链接 然而 这是使用 CSS 定位的 但如果链接靠近页面顶部或侧面 则工具提示会离开页面的侧面 顶部 有没有办法使用 css 来进行此更改 或者我必须依赖 JS 我已
  • 从 X 值获取 .NET 图表系列中的 Y 值

    使用 C 和 NET 图表 我正在尝试绘制多个波形图 并且希望将鼠标移过图表区域 并让工具提示在该 X 值位置处显示图表中每个系列的 Y 值 at xValue 12 3 2
  • 在 R 中将 UTM 转换为纬度/经度

    我有一个包含 9 000 多个 UTM 坐标的 csv 文件 我想将其转换为十进制 但遇到了一些麻烦 我搜索了此处和其他地方发布的几篇帖子 但似乎找不到将我的 UTM 集转换为可用且准确的纬度 经度的解决方案 我基本上有两个问题 1 有人看
  • 为什么 R CMD BATCH 中选项的行为不同(error = utils::dump.frames)?

    这是这个问题的后续 R CMD BATCH 或 Rscript 错误停止 https stackoverflow com questions 23327746 r cmd batch or rscript with stop on erro
  • 在 Ubuntu 中不使用 sudo 安装 NodeJS

    我已经关注了节点和 npm in 30 seconds sh https gist github com isaacs 579814 早些时候 我曾经使用 Yeoman 和 Bower 以及 NodeJS 创建 AngularJS 应用程序
  • Meteor:如何判断数据库何时准备就绪?

    我想在页面加载后尽快执行 Meteor 集合查询 我尝试的第一件事是这样的 Games new Meteor Collection games if Meteor isClient Meteor startup function conso
  • 如何修改 ASP.NET 中 div 的代码隐藏文件中的 CSS 样式?

    我正在尝试根据从 aspx 页面代码后面的数据库表中获取的信息来修改 div 的 CSS 样式属性 以下基本上是我想要做的 但我遇到了错误 Aspx div Test div 背后代码 testSpace Style display non
  • WPF 中的动画背景控件?

    在我的 WPF 应用程序中 我想要一个类似于以下的环境动画背景媒体中心 http en wikipedia org wiki Windows Media Center的背景 有没有免费的控件可以提供此功能 使背景动画化的一种方法是 还可以将
  • 在数据框列中查找字典的值并修改它

    我现在处理数据帧和字典 我有一个问题 我有一本字典 Fruits BN Banana LM Lemon AP Apple etc 还有一个数据框 Stock Fruit Price 0 Sweet Mango 1 1 Green Apple
  • Python/请求:requests.exceptions.SSLError:[SSL:SSLV3_ALERT_HANDSHAKE_FAILURE]

    在使用 MacOS X 的 Python 中 尝试向网站发出 POST 请求 但出现以下错误post response session post post url data post payload headers post headers
  • 文本超出 JTextArea

    我正在尝试用 Java 做一些事情 这需要我在 ScrollPane 中有一个 JTextArea 我是这样定义它们的 private JTextArea longestparagraph new JTextArea JScrollPane
  • 我正在为我的团队编写编程思维规则:你的是什么? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话 但却具有历史意义 目前不接受新的答案或互动
  • 用jQuery实现文件上传进度条

    我正在尝试在我的项目中实现 AJAX 文件上传功能 我为此使用 jQuery 我的代码使用 AJAX 提交数据 我还想实现一个文件上传进度条 我怎样才能做到这一点 有什么方法可以计算已上传的数量 以便我可以计算上传的百分比并创建进度条 我只
  • 使用 SQL 查询统计单词出现次数

    我有两张桌子 Table1 ID SENTENCE 1 The shoes are good shoes 2 There is a tree 3 This is nice nice nice Table2 ID WORD 1 The 1 s