如何在斯坦福 CoreNLP 服务器上使用自定义 TokensRegex 规则注释器？

2024-01-10

TokensRegex 规则颜色注释器 (stanford-corenlp-full-2016-10-31/tokensregex/color.rules.txt）通过命令行使用 CoreNLP 时加载成功，但对于 Web 服务器则失败java.lang.IllegalArgumentException: Unknown annotator: color.

Setup

# custom.properties
annotators=tokenize,ssplit,pos,lemma,ner,regexner,color
customAnnotatorClass.color = edu.stanford.nlp.pipeline.TokensRegexAnnotator
color.rules = tokensregex/color.rules.txt

命令行

$ java -cp "*" -Xmx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -props custom.properties -file ./tokensregex/color.input.txt -outputFormat text
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Registering annotator color with class edu.stanford.nlp.pipeline.TokensRegexAnnotator
...
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator color
[main] INFO edu.stanford.nlp.ling.tokensregex.CoreMapExpressionExtractor - Reading TokensRegex rules from tokensregex/color.rules.txt
[main] INFO edu.stanford.nlp.ling.tokensregex.CoreMapExpressionExtractor - Read 7 rules

# color.input.txt.output
Sentence #1 (9 tokens):
Both blue and light blue are nice colors.
[Text=Both CharacterOffsetBegin=0 CharacterOffsetEnd=4 PartOfSpeech=CC Lemma=both NamedEntityTag=O]
[Text=blue CharacterOffsetBegin=5 CharacterOffsetEnd=9 PartOfSpeech=JJ Lemma=blue NamedEntityTag=COLOR NormalizedNamedEntityTag=#0000FF]
...

Server

java -mx2g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -c custom.properties

wget --post-data 'Both blue and light blue are nice colors.' 'localhost:9000/?properties={"annotators":"tokenize,ssplit,pos,lemma,ner,regexner,color","outputFormat":"json"}' -O -

HTTP request sent, awaiting response... 500 Internal Server Error
    2016-11-05 14:41:27 ERROR 500: Internal Server Error.

java.lang.IllegalArgumentException: Unknown annotator: color
    at edu.stanford.nlp.pipeline.StanfordCoreNLP.ensurePrerequisiteAnnotators(StanfordCoreNLP.java:304)
    at edu.stanford.nlp.pipeline.StanfordCoreNLPServer$CoreNLPHandler.getProperties(StanfordCoreNLPServer.java:713)
    at edu.stanford.nlp.pipeline.StanfordCoreNLPServer$CoreNLPHandler.handle(StanfordCoreNLPServer.java:540)
    at com.sun.net.httpserver.Filter$Chain.doFilter(Filter.java:79)
    at sun.net.httpserver.AuthFilter.doFilter(AuthFilter.java:83)
    at com.sun.net.httpserver.Filter$Chain.doFilter(Filter.java:82)
    at sun.net.httpserver.ServerImpl$Exchange$LinkHandler.handle(ServerImpl.java:675)
    at com.sun.net.httpserver.Filter$Chain.doFilter(Filter.java:79)
    at sun.net.httpserver.ServerImpl$Exchange.run(ServerImpl.java:647)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
    at java.lang.Thread.run(Thread.java:745)

Solution

在请求中包含自定义注释器属性：wget --post-data 'Both blue and light blue are nice colors.' 'localhost:9000/?properties={"color.rules":"tokensregex/color.rules.txt","customAnnotatorClass.color":"edu.stanford.nlp.pipeline.TokensRegexAnnotator","annotators":"tokenize,ssplit,pos,lemma,ner,regexner,color","enforceRequirements":"false","outputFormat":"json"}' -O -

Add

"enforceRequirements":"false"

根据您的要求，这应该会阻止此错误！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在斯坦福 CoreNLP 服务器上使用自定义 TokensRegex 规则注释器？的相关文章

Nltk stanford pos tagger 错误：Java 命令失败

我正在尝试使用nltk tag stanford module用于标记一个句子首先像维基的示例但我不断收到以下错误 Traceback most recent call last File test py line 28 in
我的公报上的实体无法识别

我想创建一个自定义 NER 模型这就是我所做的训练数据斯坦福 ner tsv Hello O O My O name O is O Damiano PERSON O 特性 stanford ner prop trainFile sta
解析短语动词

有人尝试过用斯坦福 NLP 解析短语动词吗问题出在可分离短语动词上例如 climb up do over 我们爬上了那座山我必须把这项工作重新做一遍第一个短语在解析树中看起来像这样 VP VBD climbed ADVP IN th
格式化斯坦福 Corenlp 的 NER 输出

我正在与斯坦福 CoreNLP 合作并将其用于 NER 但是当我提取组织名称时我看到每个单词都标有注释因此如果实体是 NEW YORK TIMES 那么它会被记录为三个不同的实体 NEW YORK 和 TIMES 我们是否可以在斯坦福
nltk 无法解释斯坦福解析器输出的语法类别 PRP$

我想从斯坦福解析器检索的语法生成句子但 NLTK 无法解释 PRP from nltk parse stanford import StanfordParser from nltk grammar import CFG from nltk
使用 TokenRegex 以所需格式获取输出

我正在使用 TokensRegex 进行基于规则的实体提取它运行良好但我无法以所需的格式获得输出以下代码片段为我提供了以下句子的输出本月早些时候特朗普针对丰田威胁要对其实施制裁如果世界上最大的汽车制造商生产卡罗拉它将收取高额
斯坦福-NER定制对软件编程关键字进行分类

我是 NLP 新手我使用斯坦福 NER 工具对一些随机文本进行分类以提取软件编程中使用的特殊关键字问题是我不知道如何更改斯坦福 NER 中的分类器和文本注释器来识别软件编程关键字例如 today Java used in diff
从解析树中获取某些节点

我正在研究一个涉及通过霍布斯算法进行照应解析的项目我已经使用斯坦福解析器解析了我的文本现在我想操作节点以实现我的算法目前我不明白如何根据 POS 标签访问节点例如我需要以代词开头如何获取所有代词使用访客我对 Java 有
使用 Stanza 和 CoreNLPClient 提取名词短语

我正在尝试使用 Stanza 使用斯坦福 CoreNLP 从句子中提取名词短语这只能通过 Stanza 中的 CoreNLPClient 模块来完成 Import client module from stanza server impo
为什么 stanford corenlp 性别识别是不确定的？

我有以下结果正如您所看到的名字 edward 有不同的结果空和男性好几个名字都发生过这种情况 edward Gender null james Gender MALE karla Gender null edward Gender
用户评论 - R 中的主题建模或意图检测

我正在 R 中进行社交媒体分析类似于查看特定业务的用户反馈并尝试将用户评论区分为类别主题例如查找用户评论是否谈论邻里或犯罪等如何找到给定文本的意图为了训练模型我没有任何预先确定的主题和标题我正在进行一个未知的主题分析主题建
如何使用斯坦福 CoreNLP 对预标记文本进行 NER 和 POS 标记？

我在我的应用程序中使用斯坦福大学的 CoreNLP 命名实体识别器 NER 和词性 POS 标记器问题是我的代码预先标记了文本然后我需要对每个标记进行 NER 和 POS 标记但是我只能找到如何使用命令行选项来执行此操作而不能以编
使用Python在NLP中的命名实体识别中提取人名

我有一个句子需要单独识别人名例如 sentence Larry Page is an American business magnate and computer scientist who is the co founder of Go
使用斯坦福核心 NLP 的自定义关系提取模型未找到任何关系

我使用斯坦福核心 NLP 训练了一个用于关系提取的自定义模型example http nlp stanford edu software relationExtractor html 但是当我运行模型时它没有找到任何关系即使我直接使用训
斯坦福 CoreNLP - 未知变量：工作日

我使用斯坦福 CoreNLP 处理英语 Gigaword 语料库的 NYT 部分当它仍在进行时以下消息会被记录多次 Unknown variable WEEKDAY 每次记录此消息时内存消耗都会增加现在大约是23 8GB 有人知道这
将中文文档拆分成句子[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我必须将中文文本分成多个句子我尝试了斯坦福文档预处理器它对于英语来说效果很好但对于中文则不然请
如何使用斯坦福NER（命名实体识别器）的python接口？

我想使用 pyner 库在 python 中使用斯坦福 NER 这是一个基本的代码片段 import ner tagger ner HttpNER host localhost port 80 tagger get entities Uni
NLTK CoreNLPDependencyParser：无法建立连接

我正在尝试通过 NLTK 使用斯坦福解析器按照示例here http www nltk org api nltk parse html nltk parse corenlp CoreNLPDependencyParser 20tutori
创建 .conll 文件作为斯坦福解析器的输出

我想使用斯坦福解析器创建一个 conll 文件以进行进一步处理到目前为止我设法使用以下命令解析测试句子 stanford parser full 2013 06 20 lexparser sh stanford parser full
使用 NLP 进行句子压缩 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案使用机器翻译我可以获得一个句子的非常压缩的版本例如我真的很想喝一杯美味可口的咖啡将被翻译为我想喝咖

随机推荐

注销清除 SharedPreferences

我有一个可以保存的登录页面username and password to SharedPreferences 我还有一个Activity包含注销按钮的类我想清除SharedPreferences当我单击注销按钮时问题是我不明白Shar
从 iOS/Xcode 项目中卸载/删除 Carthage？

这是一个链接Carthage https github com Carthage Carthage https github com Carthage Carthage 它还在项目文件中添加了一些更改因此我可以简单地删除额外的文件文件夹
获取二维数组中高于特定值的局部最大值的坐标

from PIL import Image import numpy as np from scipy ndimage filters import maximum filter import pylab the picture 256 2
如何在 Facebook Graph API 中获取 Instagram 照片帖子的点赞？

我正在开发一个应用程序来处理
使用 bitbake 进行分布式编译

您知道如何使用分布式 bitbake 编译构建 oe 项目吗我考虑过 distcc export PATH distcc bin PATH make jn CC linux gcc make 将从我的路径调用 linux gcc 该路径指
Matplotlib：--如何显示刻度上的所有数字？ [复制]

这个问题在这里已经有答案了可能的重复如何消除 matplotlib 轴的相对偏移 https stackoverflow com questions 11855363 how to remove relative shift in ma
在 xyplot 下方绘制具有相同 x 轴的条形图？

我试图在彼此下方绘制不同类型的图线图和条形图它们都具有相同的轴 c1 lt ggplot data aes date TotalMutObs stat smooth se FALSE geom point opts axis title
如何在静态谷歌地图上添加高分辨率自定义标记

我正在使用 Google 静态地图文档在这里 http code google com apis maps documentation staticmaps 来显示商店的位置我使用自定义标记而不是默认标记然而此标记图像在 iPhon
环回 - 包括关系的计算属性

我有一个环回应用程序我希望能够在 API 调用中包含关系的计算属性例如假设我有一个apartment模型和一个address模型这address有属性city and state 我想向公寓模型打一个电话并将城市和州作为相关信息中
Materialize.css 从输入元素中删除样式

我想让 Materialize css 卡在双击时可编辑为此我将输入放在卡片 div 中而不是 p 中 div row each cards div col m4 s12 div card teal div card content
用于打印 1-99 奇数的最有效代码 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案任务是将 1 到 99 的奇数打印在不同的行上 Codeeval 认为此代码部分正确 100 中的 98 已编辑 liszt i
修改Http状态代码文本

Question 如何修改状态代码文本描述标题 Example 例如我想改变200 Ok to 200 My Custom Text 描述我想创建一个带有自定义状态代码未保留 431 的 HTTP 响应我想修改它的文本 200
从输入标签获取名称和值

在你说哦不不再这样之前我先陈述一下我的情况我正在解析 HTML 输出的一部分我唯一感兴趣的是name and value每个的属性
删除 androidx 首选项上的空白图标空间

我刚刚将我的项目迁移到使用androidx图书馆新的首选项设置屏幕现在显示空的图标空间如图所示here https developer android com guide topics ui settings organize you
根据用户输入动态创建表

我目前正在尝试使用 JS 和 HTML 动态创建一个表但目前它似乎无法从用户输入中检索值我做错了什么提前致谢
如何根据 XSD 文件验证 XML 文件？

我正在生成一些 xml 文件这些文件需要符合给我的 xsd 文件我应该如何验证它们是否符合要求 Java 运行时库支持验证上次我检查的是 Apache Xerces 解析器你可能应该使用javax xml validation Va
Swift 将数组作为参数传递错误

我刚刚开始使用 Swift 有人可以向我解释一下为什么我可以将数组作为参数传递 byRoundingCorners UIBezierPath roundedRect self bounds byRoundingCorners topLeft
Delphi在全局异常中的屏幕截图

我正在开发一个组件使用德尔福2006 该组件检索系统信息并写入文件要求是我必须在组件中合并一个全局异常处理程序因此当异常发生时它将被捕获并向用户显示我的自定义消息 procedure Tmy GlobalExceptionHandle
在 C# 中通过节点名称和属性名称比较 XML

我想通过标签名称和属性名称来比较两个或更多 XML 文件我对属性或节点的值不感兴趣在 google 上搜索我发现 XMLDiff Patch http msdn microsoft com en us library aa302294
如何在斯坦福 CoreNLP 服务器上使用自定义 TokensRegex 规则注释器？

TokensRegex 规则颜色注释器 stanford corenlp full 2016 10 31 tokensregex color rules txt 通过命令行使用 CoreNLP 时加载成功但对于 Web 服务器则失败jav

如何在斯坦福 CoreNLP 服务器上使用自定义 TokensRegex 规则注释器？

如何在斯坦福 CoreNLP 服务器上使用自定义 TokensRegex 规则注释器？ 的相关文章

随机推荐

热门标签

如何在斯坦福 CoreNLP 服务器上使用自定义 TokensRegex 规则注释器？的相关文章