如何在字符串中查找专有名词?

2024-02-01

我正在尝试识别用户提交的 3-4 句话段落中的专有名词。我同意该功能存在一些缺陷,因为我有一个审核团队来验证几乎所有内容。

下面是传入段落的示例。

尼克·斯威舍 (Nick Swisher) 击出詹姆斯·希尔兹 (James Shields) 击出全垒打,在第一局打出五分,周二晚上,纽约洋基队 (New York Yankees) 以 8-3 击败坦帕湾队 (Tampa Bay),在美联东区领先光芒队 (Rays) 2 1/2 场。

我希望该函数取出以下关键字/专有名词。

尼克·斯威舍、詹姆斯·希尔兹、纽约洋基队、坦帕湾队、光芒队、美联东区

我想我可以分解字符串并用空格分隔单词。然后我会检查每个单词,看看第一个字母是否大写。如果是,请将其退回。如果没有,请继续下一个单词。

但是多词关键字/专有名词呢?如何获得在已找到的第一个字母上限单词之后检查单词的功能?

所以该函数会找到 Nick,但我如何告诉它也检查下一个单词呢?因此,请检查 next 是否有上限,如果有,则返回 Nick Swisher。如果没有,就返回尼克。

更进一步,如果它是一个 3 个词的短语怎么办?找到了新的,找到了约克,我怎样才能找到洋基队呢?


尝试像这样的正则表达式:

[A-Z]{1,1}[a-z]*([\s][A-Z]{1,1}[a-z]*)*

但请务必检查区分大小写

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在字符串中查找专有名词? 的相关文章

  • 如何按日期对包含通过合并 get_posts 结果创建的 WP po​​st 对象的数组进行排序?

    我想通过合并 2 个单独的帖子的结果来创建单个帖子数组get posts查询 并按发布日期对数组进行排序 在我下面的代码中 get posts 为 args b and args a已合并为一个数组 但它们是分开的 的 9 个标题 args
  • $.load 内的表单未正确发布

    这就是我得到的 基本上单击一个按钮并执行以下代码 Readthis MonsterRequest php id Mon TestVar TestVar replace s g Readthis Readthis htmlencode Tes
  • 通过链接导航多个对象而不重复

    我正在尝试浏览一堆带有其他对象链接的对象 我想从 id 1 开始并浏览每个对象 有些对象会循环回到之前的对象 所以我想确保每个对象只查看一次 否则我会陷入无限循环 我还希望能够通过链接导航来判断哪些对象无法访问 我认为导航顺序并不重要 这是
  • 带数据透视表的 Laravel 查询生成器

    我有两个带有数据透视表的表 Table tours id name country id featured Table countries id name 数据透视表country tour id country id tour id 我想
  • 将具有子目录的域转发到具有子目录的其他域

    我有一个热爱域名的客户 更喜欢转发域名 其中许多域没有与其关联的网站 它们仅用于营销和转发 我知道如何轻松地将一个域转发到另一个域 但我好奇的是如何将这些域的特定 url 转发到其他特定 url 例如 www site1 com 目录 gt
  • 使用 PHP 将 class="active" 添加到活动页面

    动态标头 CSS 类更改为活动使用 PHP 目录 我想要的班级 li 在活动目录下更改标签 现在 每个指南都向我展示了当您的页面等于它时如何执行此操作 但我想更改 这 li li 取决于我所在的目录 例如 如果说我在 http exampl
  • 在 CodeIgniter 中将数组与 Calendar 类一起使用

    我正在尝试为我的日历应用程序创建一个相当复杂的数组 它应该包含日期 日期名称 类型 和事件 如果有 我已经创建了这个 dates 22 day gt Friday type gt weekday 23 day gt Saturday typ
  • PHP 中的 Europe/London 和 UTC 有区别吗? [关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我知道 UTC 和 GMT 实际上是
  • PHP PDO 使用 bindParam 第一个参数(不带冒号)[重复]

    这个问题在这里已经有答案了 请检查这个 user id int GET user id sql DELETE FROM users WHERE user id user id query db gt prepare sql query gt
  • 在 woocommerce 管理订单页面中单击自定义按钮运行函数

    基于 在 woocommerce 中的管理订单列表顶部添加一个按钮 https stackoverflow com questions 49437781 add a button on top of admin orders list in
  • PHP 的同义词库类或 API [编辑]

    TL DR 摘要 我需要一个命令行应用程序 我可以用它来获取同义词和其他相关单词 它需要是多语言的并且跨平台工作 任何人都可以为我推荐一个合适的程序 或者帮助我使用我已经找到的程序吗 谢谢 更长的版本 我的任务是用 PHP 编写一个系统 该
  • PHP比较两个字符串的随机位置

    PHP比较两个字符串 示例我得到了一串数字 1 2 2 1 and another is 2 1 2 1 结果是 true 因为它只是 1 2 2 1 和 2 2 1 1 的位置洗牌 但如果该值为 1 2 2 2 and another i
  • Laravel 验证规则仅针对字母

    我正在尝试添加验证规则以仅接受信件 我正在使用regex规则 但它仍然不起作用 下面是我的代码 Validate request input this gt validate request name gt required regex p
  • 如何将 WordPress 类别选择限制为只有一个?

    我有一个自定义帖子类型和一个自定义分类设置 非常标准的东西 但是 我想知道如何限制我的客户在每个帖子中选择多个分类类别 我不介意他们能够创建和删除分类类型 但我不希望他们选择多个分类类型 因为这些是复选框 所以它们可以 也许单选按钮可以工作
  • 获取特定月份/年份的第一天

    有没有比以下更好的方法返回特定月份 年份的第一天的日期 month date m year date Y from date Y m d mktime 0 0 0 month 1 year 这在计算上并不完全优雅 但我喜欢它 因为它非常可读
  • PhpPresentation imagecreatefromstring():数据不是可识别的格式 - PHP7.2

    我正在尝试使用 PhpPresentation 来阅读sample pptx使用文档中为读者提供的简单说明进行文件处理 我得到 imagecreatefromstring Data is not in a recognized format
  • 在 php、ajax 或 javascript 中加载进度?

    任何人都知道如何在系统仍在服务器端获取数据的同时在客户端显示加载进度以及完成的百分比 例如 当我在客户端按下 确定 按钮时 它会调用服务器端从数据库收集数据 整个过程可能需要2到3分钟 如何在客户端显示加载进度 大约加载完成了多少 我怎样才
  • Laravel 计划命令一旦启动就停止?

    我已经为 laravel 5 1 项目设置了预定命令 它有效 命令已经启动 但愚蠢的是我没有考虑如何停止它 通常您不想停止它 但该命令正在向数据库表中插入近 50 万行 而我只是想确保我可以在不登录服务器的情况下启动它 显然我需要在某个时候
  • Zend Framework 生成唯一的字符串

    我想生成一个唯一的 4 6 个字符长的字母数字字符串 以便与每个记录 用户 一起保存在数据库中 db 字段具有唯一索引 因此尝试保存预先存在的字符串会生成错误 现在我正在生成一个随机字符串并使用 try catch 因此在添加新记录时如果抛
  • 检查php中位字段是否打开的正确方法是什么

    检查位字段是否打开的正确方法是什么 在 php 中 我想检查来自 db mysql 的位字段是否打开 这是正确的方法吗 if bit 1 还有其他方法吗 我看到有人使用代码ord http jameslow com 2008 08 12 m

随机推荐

  • 水晶报表 - 如果包含图表,则数据重复

    我们使用 Crystal Reports XI R3 来实现报告目的 我们创建了类型化数据集作为报告的数据源 我面临的问题包括其中一份报告上的条形图和网格 默认情况下 图表嵌入到标题部分 网格是从详细信息部分生成的 如果我设计没有图表的报告
  • Heroku“进程已退出,状态为 137”node.js 应用程序

    我最近发布了有关类似主题的问题 我对 URL 上的所有内容进行了重大修改 并且发生了与上次相同的事情 我可以部署所有内容并使用以下命令运行它heroku local web 当我访问网络测功机时 它说我遇到了应用程序错误 然后我检查了日志
  • 当参数有时可以为NULL时如何参数化SQL查询?

    With pyodbc我可以像这样参数化查询 value testval query SELECT FROM TestTable WHERE Column cursor execute query value 但问题是 如果value为 N
  • 当 Perl 中发生警报时,我应该如何清理挂起的孙进程?

    我有一个并行自动化脚本 需要调用许多其他脚本 其中一些脚本挂起 因为它们 错误地 等待标准输入或等待各种其他不会发生的事情 这没什么大不了的 因为我抓住那些alarm http perldoc perl org functions alar
  • VisualSVN 预提交规则

    将此挂钩与 VisualSVN Server 结合使用 作为 pre commit bat 添加到 Repository hooks 文件夹中 我的问题是如何添加注释必须始终以数值开头的规则 我希望评论的第一部分始终是错误跟踪器的问题号 例
  • 从 PDF 中搜索文本的脚本

    Problem 在 Mac OS X 平台上 我想用 Python 或 Tcl 编写一个脚本来搜索 PDF 文件中的文本并提取相关部分 我很感激任何帮助 背景 我正在编写脚本来查看 PDF 中的内容 以确定它是否是账单 来自哪家公司以及持续
  • 如何更改 IPython Notebook 中显示方程的对齐方式?

    我希望我的 MathJax 在 IPython Notebook 中显示的方程在左侧对齐而不是居中对齐 这是由核心配置选项控制的显示对齐在 MathJax 中 如所述here http docs mathjax org en latest
  • 使用 thymeleaf 请求参数

    在 Spring Boot Web 应用程序中 User想要重置密码 所以他输入Reset password页 现在我想让他输入他的电子邮件地址 pushReset我想重定向到myapp resetPassword email HIS EM
  • UILabel 与 -[sizeWithFont:constrainedToSize:lineBreakMode] 正在切断单词

    UILabel里面的一个UITableViewCell 在手机点击时 高度会扩大 第二个UILabel与不同数量的数据一起出现 问题是 如果换行 sizeWithFont constrainedToSize lineBreakMode 不能
  • 简单形式的 Wiki 或类似 Markdown 的语法?

    有没有类似的简单语言Markdown http en wikipedia org wiki Markdown或其中之一维基标记 http en wikipedia org wiki Wiki markup被转换成 HTML 表单元素 例如
  • 比较 R 中的字符向量以查找唯一值和/或缺失值

    我有两个字符向量 x 和 y x lt c a b c d e f g y lt c a c d e g x 内的值不会重复 即它们都是唯一的 向量 y 也是如此 我的问题是 如何让 R 比较两个向量 然后告诉我 y 相对于 x 缺少哪些元
  • 如何在 Vaadin ComboBox 中添加搜索图标?

    我有一个ComboBox允许选择给定的项目 以及接受选择的图标 功能都很好 我正在寻找将搜索图标放入组合框中的效果 像瓦丁图标 https vaadin com icons 这是怎么做到的 I tried comboBox setIcon
  • 为什么返回未初始化的值被视为未定义行为?

    在读的时候this http en cppreference com w c language behavior UB and optimization我看到一个UB不太明白 希望你能解释一下 size t f int x size t a
  • 如何计算第 n 个排列(或告诉给定排列的字典顺序)? [复制]

    这个问题在这里已经有答案了 这个问题有两个部分 但由于我正在尝试与 Prolog 实现进行比较 解决一个问题可能会立即导致另一个问题的解决方案 给定整数列表的排列 1 2 N 我如何知道字典顺序中该排列的索引是什么 给定一个数字k 我该如何
  • 有什么方法可以避免 vue-test-utils 中的shallowMount内存泄漏吗?

    我们有一个适用于 Node Mocha 和 jsdom 包的 vue 自定义单元测试设置 可模拟浏览器环境 无 webpack karma 我们已经编写了大约 3k 规范 具有数百个组件的大型应用程序 现在当 mocha 运行时 它变得越来
  • 如何读取不完整的表单字段 ncurses C++

    我有一个使用 ncurses C 读取表单字段的代码 但是当表单字段未完全键入时我无法显示值 include
  • 计算列帮助 - TSQL

    CREATE TABLE dbo tblLocations latitude float NOT NULL longitude float NOT NULL location varchar 500 NOT NULL timestamp d
  • Devise登录时如何传递参数

    Devise登录过程中如何传递参数 我有一组用户 每个用户都有自己的个人资料页面 我希望他们能够查看自己的个人资料页面 但不能查看其他用户的个人资料页面 除非他们是管理员 在这种情况下他们可以访问应用程序中的所有内容 我创建了一个 User
  • ZedGraph MajorGrid 和 MinorGrid LineStyle

    我只是想知道是否有人知道如何更改 ZedGraph 的主要和次要网格的线条样式 例如我有 graphPane XAxis MinorGrid IsVisible true 我想要这样的东西 graphPane XAxis MinorGrid
  • 如何在字符串中查找专有名词?

    我正在尝试识别用户提交的 3 4 句话段落中的专有名词 我同意该功能存在一些缺陷 因为我有一个审核团队来验证几乎所有内容 下面是传入段落的示例 尼克 斯威舍 Nick Swisher 击出詹姆斯 希尔兹 James Shields 击出全垒