NLP

NLP（五）命名实体识别（NER）

本文将会简单介绍自然语言处理 NLP 中的命名实体识别 NER 一什么是命名实体识别 1 命名实体识别简介命名实体识别 Named Entity Recognition 简称NER 是信息提取问答系统句法分析机器翻译等应用领域的重

算法 NLP python

03-NLP关键技术

自然语言处理技术四个维度 Semantic 语义机器学习情感分析 Syntax 句子结构句法分析依存分析 Morphology 单词单词层面的技术分词词性标注 NER命名实体识别 Phonetics 声音 Word Segme

NLP自然语言处理 自然语言处理 NLP

2022/1/22记录网页

65条消息 102 bert词向量进行文本分类和命名实体识别 u012416045的博客 CSDN博客 bert文本识别https blog csdn net u012416045 article details 88373965 Bert

NLP自然语言处理 自然语言处理 人工智能 NLP

NLP task2 _ 自然语言处理中N-Gram模型的Smoothing算法

使用N Gram模型时的数据平滑算法背景为什么要做平滑处理零概率问题就是在计算实例的概率时如果某个量x 在观察样本库训练集中没有出现过会导致整个实例的概率结果是0 在文本分类的问题中当一个词语没有在训练样本中出现该词语调

NLP NGram 平滑

云孚科技受邀参加第二十二届中国计算语言学大会（CCL 2023）

云孚科技 CCL 2023 中国计算语言学大会 2023年8月3日 8月6日第二十二届中国计算语言学大会 CCL 2023 在哈尔滨市成功举行本次大会由中国中文信息学会主办哈尔滨工业大学承办涵盖计算语言学领域最新技术和动向为与会专

人工智能 NLP

[论文解读]Attention is all you need

论文地址 http papers nips cc paper 7181 attention is all you need pdf 发表会议 NIPS2017 文章目录动机背景思考细节网络结构总结参考最早提出self att

NLP attention

T5的整体介绍【代码实战】

T5的整体介绍代码实战 0 前言 1 Header 2 summary 3 T5 model 3 1 forward 3 2 预训练任务 3 2 1 multi sentence pairs 3 3 完成 tasks 0 前言本文是对T

pytorch深度学习实战 python 开发语言 NLP 深度学习

NLP（四）词形还原（Lemmatization）

词形还原 Lemmatization 是文本预处理中的重要部分与词干提取 stemming 很相似一什么是词形还原词形还原作用为英语分词后根据其词性将单词还原为字典中原型词汇简单说来词形还原就是去掉单词的词缀提取单词的主干部

NLP 算法 python 自然语言处理

（三）Python3 NLTK（Natural Language Toolkit）安装和下载的常见问题

NLTK Python自然语言工具包用于诸如标记化词形还原词干化解析 POS标注等任务该库具有几乎所有NLP任务的工具 1 安装nltk pip install nltk 不要像一开始我一样傻傻的以为pip完就结束啦 2 进入py

自然语言处理 python3 人工智能 NLP NLTK

一个Hierarchical Attention神经网络的实现

最近我突然有了一些富余的整块时间于是我实现了一些有意思的论文的idea 其中印象最深的还是 Hierarchical Attention Networks for Document Classification 我把相关代码放到这里了 h

深度学习，人工智能 自然语言处理，注意力模型 神经网络 NLP attention

Keras LSTM层return_sequences参数的坑

具体用法我就不赘述了可以参考中文文档https keras io zh layers recurrent lstm 我主要记录一下坑网络结构如下 model Sequential model add Embedding 257 150

NLP 深度学习 tensorflow

【speech&nlp】如何实现总体数据按照长短排序，同样长度数据随机排序

在做speech nlp任务时经常有这样一个需求假设有一个数据集有1000条数据但是只有100种长度所以必然存在某些数据是一样长的我们想要让总体按照长短排序但是同样长的数据要随机排序经过了这个操作再分batch 这样的效果

深度学习 NLP speech

bert入门之分词源码解析

bert编码方法概括起来就分词和id映射我们先看一下分词的两个方法一 BasicTokenizer 大致流程转成 unicode gt 去除各种奇怪字符 gt 处理中文 gt 空格分词 gt 去除多余字符和标点分词 gt 再次空格

NLP Bert python 人工智能

使用Python实现公司地址的（3-4级）标准化

这个博客的目的是实现公司地址的模糊匹配与3 4级标准化也可以迁移到房产信息电话号码之类的字段上本来的应用场景是反团伙欺诈以及失联客户的修复大概的意思就是说多个相同公司的同事都在我公司借贷的欺诈可能性要高于其他客户以及造假的房产信息

NLP 地址标准化

ChatGPT模型大战：讯飞星火认知大模型、百度文心一言能否击败GPT-4（含个人内测体验测试邀请码获取方法，2小时申请成功，亲测有效）

目录前言讯飞星火内测申请申请方式内测体验登录界面百度内测申请内测对比基本问答事实性问答科普文写作小红书文案项目计划撰写古文理解模型的常识能力和反事实推理代码理解法律相关广告话术数字排序数值计算推理解题

ChatGPT商业应用 ChatGPT 文心一言 NLP

【深度学习】【NLP】NLP课件整理第四章：RNN,LSTM,GRU,注意力机制,Attention

文档 4 1 认识RNN模型 note 了解什么是RNN模型了解RNN模型的作用了解RNN模型的分类文档 4 2 传统RNN模型 note 了解传统RNN的内部结构及计算公式掌握Pytorch中传统RNN工具的使用了解传统RNN的

自然语言处理NLP NLP

nlp-生成任务-语言模型

如果您正在google的colab中打开这个notebook 您可能需要安装Transformers和 Datasets库将以下命令取消注释即可安装 pip install datasets transformers i https py

NLP 自然语言处理 python 深度学习

【通览一百个大模型】FLAN（Google）

通览一百个大模型 FLAN Google 作者王嘉宁本文章内容为原创仓库链接 https github com wjn1996 LLMs NLP Algo 订阅专栏大模型 NLP 算法可获得博主多年积累的全部NLP 大模型和算法干

K-means聚类算法的应用以及实现

K means 聚类算法属于无监督学习它会将相似的对象归到同一个簇中该算法原理简单执行效率高并且容易实现是解决聚类问题的经典算法尽管如此任何一款算法都不可能做到完美无瑕 K measn 算法也有自身的不足之处比如 K mea

NLP 聚类算法 kmeans