使用LSTM进行文本情感分析实例（2）

2023-05-16

数据集下载https://github.com/renjunxiang/Text-Classification

其他文本分析数据及数据处理代码https://github.com/renjunxiang/Text-Classification

一.流程分析

1、创建train reader 和 test_reader

2、创建lstm模型

3、定义 words、label 张量

4、优化函数、损失函数

5、训练 & 保存模型

6、使用模型进行预测

import os
from multiprocessing import cpu_count
import numpy as np
import paddle
import paddle.fluid as fluid
class classify():
    data_root_path = ""
    dict_path = "data/data9045/dict.txt"
    model_save_dir = "work/model_baseline/"
    test_data_path = "data/data9045/Test_IDs.txt"
    save_path = 'work/result.txt'
    # 获取字典长度
    def get_dict_len(d_path):
        with open(d_path, 'r', encoding='utf-8') as f:
            line = eval(f.readlines()[0])

        return len(line.keys())

    # 1、创建train reader 和 test_reader

    def data_mapper(sample):
        data, label = sample
        data = [int(data) for data in data.split(',')]
        return data, int(label)

    # 创建数据读取器train_reader
    def train_reader(train_data_path):
        def reader():
            with open(train_data_path, 'r') as f:
                lines = f.readlines()
                np.random.shuffle(lines)
                for line in lines:
                    # print (line)
                    data, label = line.split('\t')
                    yield data, label

        return paddle.reader.xmap_readers(classify.data_mapper, reader, cpu_count(), 1024)

    #  创建数据读取器val_reader
    def val_reader(val_data_path):
        def reader():
            with open(val_data_path, 'r') as f:
                lines = f.readlines()
                np.random.shuffle(lines)
                for line in lines:
                    data, label = line.split('\t')
                    yield data, label

        return paddle.reader.xmap_readers(classify.data_mapper, reader, cpu_count(), 1024)
    def test_reader(test_data_path):
        def reader():
            with open(test_data_path, 'r') as f:
                lines = f.readlines()
                # 打乱
                np.random.shuffle(lines)
                for line in lines:
                    data = line
                    yield data.strip(), -1
    # 创建lstm网络
    def lstm_net(data,
                   dict_dim,
                   class_dim=14,
                   emb_dim=128,
                   hid_dim=128,
                   hid_dim2=96,
                   ):
        """
        Lstm net
        """
        # embedding layer
        emb = fluid.layers.embedding(
            input=data,
            size=[dict_dim, emb_dim])
        fc0 = fluid.layers.fc(input=emb, size=hid_dim * 4)
        lstm_h, c = fluid.layers.dynamic_lstm(
            input=fc0, size=hid_dim * 4, is_reverse=False)
        # extract last layer
        lstm_last = fluid.layers.sequence_last_step(input=lstm_h)
        # full connect layer
        fc1 = fluid.layers.fc(input=lstm_last, size=hid_dim2, act='tanh')
        # softmax layer
        prediction = fluid.layers.fc(input=fc1, size=class_dim, act='softmax')
        return prediction

    def train(self):
        # 获取训练数据读取器和测试数据读取器
        train_reader = paddle.batch(reader=self.train_reader(os.path.join(self.data_root_path, "data/data9045/shuffle_Train_IDs.txt")),
            batch_size=128)
        val_reader = paddle.batch(reader=self.val_reader(os.path.join(self.data_root_path, "data/data9045/Val_IDs.txt")),
                                  batch_size=128)
        # 定义输入数据， lod_level不为0指定输入数据为序列数据
        words = fluid.layers.data(name='words', shape=[1], dtype='int64', lod_level=1)
        label = fluid.layers.data(name='label', shape=[1], dtype='int64')

        dict_dim = self.get_dict_len(self.dict_path)

        # 获取分类器
        model = self.lstm_net(words, dict_dim)

        # 获取损失函数和准确率
        cost = fluid.layers.cross_entropy(input=model, label=label)
        avg_cost = fluid.layers.mean(cost)
        acc = fluid.layers.accuracy(input=model, label=label)
        # 获取预测程序
        val_program = fluid.default_main_program().clone(for_test=True)
        # 定义优化方法
        optimizer = fluid.optimizer.AdagradOptimizer(learning_rate=0.0001)
        opt = optimizer.minimize(avg_cost)

        # 创建一个执行器，CPU训练速度比较慢,此处选择gpu还是cpu
        #place = fluid.CPUPlace()
        place = fluid.CUDAPlace(0)
        exe = fluid.Executor(place)
        # 进行参数初始化
        exe.run(fluid.default_startup_program())

        # 定义数据映射器
        feeder = fluid.DataFeeder(place=place, feed_list=[words, label])

        EPOCH_NUM = 1

        # 开始训练

        for pass_id in range(EPOCH_NUM):
            # 进行训练
            for batch_id, data in enumerate(train_reader()):
                # print(batch_id,len(data))
                train_cost, train_acc = exe.run(program=fluid.default_main_program(),
                                                feed=feeder.feed(data),
                                                fetch_list=[avg_cost, acc])
                if batch_id % 100 == 0:
                    print('Pass:%d, Batch:%d, Cost:%0.5f, Acc:%0.5f' % (pass_id, batch_id, train_cost[0], train_acc[0]))
                    # 进行测试
                    val_costs = []
                    val_accs = []
                    for batch_id, data in enumerate(val_reader()):
                        val_cost, val_acc = exe.run(program=val_program,
                                                    feed=feeder.feed(data),
                                                    fetch_list=[avg_cost, acc])
                        val_costs.append(val_cost[0])
                        val_accs.append(val_acc[0])
            # 计算每个epoch平均预测损失在和准确率
            val_cost = (sum(val_costs) / len(val_costs))
            val_acc = (sum(val_accs) / len(val_accs))
            print('Test:%d, Cost:%0.5f, ACC:%0.5f' % (pass_id, val_cost, val_acc))
            # 保存预测模型
            if not os.path.exists(self.model_save_dir):
                os.makedirs(self.model_save_dir)
            fluid.io.save_inference_model(self.model_save_dir,
                                          feeded_var_names=[words.name],
                                          target_vars=[model],
                                          executor=exe)
        print('训练模型保存完成！')
        self.test(self)
        print('测试输出已生成！')
    

    # 获取数据
    def get_data(self, sentence):
        # 读取数据字典
        with open(self.dict_path, 'r', encoding='utf-8') as f_data:
            dict_txt = eval(f_data.readlines()[0])
        dict_txt = dict(dict_txt)
        # 把字符串数据转换成列表数据
        keys = dict_txt.keys()
        data = []
        for s in sentence:
            # 判断是否存在未知字符
            if not s in keys:
                s = '<unk>'
            data.append(int(dict_txt[s]))
        return data

    def test(self):
        data = []
        # 获取预测数据
        with open(self.test_data_path, 'r', encoding='utf-8') as test_data:
            lines = test_data.readlines()
        print('test start')
        for line in lines:
            tmp_sents = []
            for word in line.strip().split(','):
                tmp_sents.append(int(word))
            data.append(tmp_sents)
        '''
        a=self.get_data(self, 'w我是共产主义接班人！')
        data=[a]
        '''
        print(len(data))
        def load_tensor(data):
            # 获取每句话的单词数量
            base_shape = [[len(c) for c in data]]
            # 创建一个执行器，CPU训练速度比较慢
            #place = fluid.CPUPlace()
            #GPU
            place = fluid.CUDAPlace(0)
            print('loading tensor')
            # 生成预测数据
            tensor_words = fluid.create_lod_tensor(data, base_shape, place)
            #infer_place = fluid.CPUPlace()
            infer_place = fluid.CUDAPlace(0)
            # 执行预测
            infer_exe = fluid.Executor(infer_place)
            # 进行参数初始化
            infer_exe.run(fluid.default_startup_program())
            # 从模型中获取预测程序、输入数据名称列表、分类器
            print('load_model')
            [infer_program, feeded_var_names, target_var] = fluid.io.load_inference_model(dirname=self.model_save_dir,
                                                                                          executor=infer_exe)
            print('getting_ans')
            result = infer_exe.run(program=infer_program,
                                   feed={feeded_var_names[0]: tensor_words},
                                   fetch_list=target_var)
    
            names = ["财经", "彩票", "房产", "股票", "家居", "教育", "科技",
                     "社会", "时尚", "时政", "体育", "星座", "游戏", "娱乐"]
            print('output')
            # 输出结果
            for i in range(len(data)):
                lab = np.argsort(result)[0][i][-1]
                # print('预测结果标签为：%d， 名称为：%s， 概率为：%f' % (lab, names[lab], result[0][i][lab]))
                with open(self.save_path, 'a', encoding='utf-8') as ans:
                    ans.write(names[lab] + "\n")
            ans.close()
        print('loading 1/4 data')
        load_tensor(data[:int(len(data)/4)])
        print('loading 2/4 data')
        load_tensor(data[int(len(data)/4):2*int(len(data)/4)])
        print('loading 3/4 data')
        load_tensor(data[2*int(len(data)/4):3*int(len(data)/4)])
        print('loading 4/4 data')
        load_tensor(data[3*int(len(data)/4):])
        print('测试输出已生成！')
    
if __name__ == "__main__":
    classify.train(classify)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LSTM

进行文本情感分析实例

使用LSTM进行文本情感分析实例（2）的相关文章

如何从张量流中的RNN模型中提取细胞状态和隐藏状态？

我是 TensorFlow 新手很难理解 RNN 模块我正在尝试从 LSTM 中提取隐藏单元状态对于我的代码我使用的实现https github com aymericdamien TensorFlow Examples http
张量流/tflearn 输入形状

我正在尝试创建一个 lstm rnn 来生成音乐序列训练数据是大小为 4 的向量序列表示一些要训练的歌曲中每个音符的各种特征包括 MIDI 音符从我的阅读来看我想要做的是对于每个输入样本输出样本是下一个大小为 4 的向量即它
如何将 Shap 与 LSTM 神经网络结合使用？

我正在与 keras 合作生成 LSTM 神经网络模型我想使用 shap 包查找模型每个特征的 Shapley 值当然问题在于模型的 LSTM 层需要三维输入样本时间步长特征但 shap 包需要二维输入无论如何这个问题有解
堆叠 LSTM 网络中每个 LSTM 层的输入是什么？

我在理解堆叠 LSTM 网络中各层的输入输出流时遇到一些困难假设我创建了一个如下所示的堆叠 LSTM 网络 parameters time steps 10 features 2 input shape time steps featur
Seq2Seq 模型在几次迭代后学会仅输出 EOS 令牌 (<\s>)

我正在创建一个接受过训练的聊天机器人康奈尔电影对话语料库 https www cs cornell edu cristian Cornell Movie Dialogs Corpus html using NMT https github
尝试使用屏蔽输入对 LSTM Seq2Seq 执行推理时出现 CUDNN_STATUS_BAD_PARAM

我正在使用 keras 层tensorflow 2 0建立一个简单的基于 LSTM 的 Seq2Seq 文本生成模型 versions我正在使用 Python 3 6 9 Tensorflow 2 0 0 CUDA 10 0 CUDNN 7
TfLite LSTM 模型

我还没有找到任何可以使用的预训练 lstm 模型 tfLite 是否提供了任何预训练的 lstm 模型我尝试创建 tflite 模型但在转换时遇到问题您能提供创建 tfLite 模型的确切脚本吗 tfLite 是否有任何用于创建最新版
对可变长度序列进行训练和预测

传感器同类型的分散在我的网站上不定期地手动向我的后端报告在报告之间传感器聚合事件并批量报告它们以下数据集是批量收集的序列事件数据的集合例如传感器 1 报告了 2 次在第一批 2 个事件和第二批 3 个事件中传感器 2 报告
检查目标时出错：预期 time_distributed_5 有 3 个维度，但得到形状为 (14724, 1) 的数组

尝试建立单输出回归模型但最后一层似乎有问题 inputs Input shape 48 1 lstm CuDNNLSTM 256 return sequences True inputs lstm Dropout dropouts 0 l
张量流中 LSTM 的正则化

Tensorflow 提供了一个很好的 LSTM 包装器 rnn cell BasicLSTM num units forget bias 1 0 input size None state is tuple False activatio
了解 Tensorflow LSTM 模型输入？

我在理解 TensorFlow 中的 LSTM 模型时遇到一些困难我用tflearn http tflearn org 作为包装器因为它自动完成所有初始化和其他更高级别的工作为了简单起见我们考虑这个示例程序 https github
为什么 import cntk as C 在 google colab 中不起作用

我安装了opencv版本3 4 4 安装了cntk 导入到google collab给出了以下结果 import cntk as C usr local lib python3 6 dist packages cntk cntk py in
InvalidArgumentError：索引[0,0] = -1 不在 [0, 10) 中

它与 MLP 一起进行二元分类效果很好然而在 LSTM 和卷积中它给出了InvalidArgumentError 我发现 y 需要重塑我就这么做了我尝试了 x 的所有正值并且模型运行良好那么负值有什么问题呢数据在代码中给出
在 Keras 中，LSTM 状态何时在 model.predict 调用中重置？

该模型将 LSTM 作为第一层当调用 model predict 时假设您传递了几个样本 gt sam np array 5 6 3 6 6 3 5 6 3 gt model predict sam array 0 23589483 0
如何使用有状态 LSTM 和 batch_size > 1 布置训练数据

背景我想在 Keras 中对有状态 LSTM 进行小批量训练我的输入训练数据位于一个大矩阵 X 中其维度为 m x n 其中 m number of subsequences n number of time steps per s
.fit() 层的 shuffle = 'batch' 参数如何在后台工作？

当我使用以下方法训练模型时 fit 层的参数 shuffle 预设为 True 假设我的数据集有 100 个样本批量大小为 10 当我设置shuffle True然后 keras 首先随机选择样本现在 100 个样本具有不同的顺序根据
张量流 LSTM 模型中的 NaN 损失

以下网络代码应该是经典的简单 LSTM 语言模型一段时间后开始输出 nan 损失在我的训练集上这需要几个小时而且我无法在较小的数据集上轻松复制它但在认真的训练中这种情况总是会发生 Sparse softmax with cros
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
如何在带有 LSTM 层的 TensorFlow Hub 中使用嵌入模型？

我正在学习 TensorFlow 2 通过 TF Hub 教程进行文本分类它使用了 TF hub 的嵌入模块我想知道是否可以修改模型以包含 LSTM 层这是我尝试过的 train data validation data test d

随机推荐

数据结构之串和数组基本知识和问题

串 1 串 xff08 又称字符串 xff09 是一种特殊的线性表 xff0c 它的每个结点仅由一个字符组成从数据结构的观点来说 xff0c 串是一种特殊的线性表但就数据类型而言 xff0c 串不是线性表串 xff08 String
计算机考研复试之C语言简答题开放题目

为考研准备整理 xff0c 参考网络资料课本资料 xff0c 主要是c的简答开放题目有用的话可以点个赞 xff0c 可以看着目录尝试自己回答后在进行往下看目录特点 c 语言的主要用途 xff1a c语言为什么要规定 xff0c 对所有使
复试数据结构之排序知识点+简答题

排序方法的选用一般考虑的原则有 xff1a xff08 1 xff09 待排序的记录个数n xff0c xff08 2 xff09 记录的大小 xff08 3 xff09 关键字的分布情况 xff1b 4 对排序稳定性的要求等平均时间性能
数据结构之图和问答题

数据结构之图和问答题目录数据结构之图和问答题图的定义和术语图的存储结构图的遍历连通网的最小生成树单源最短路径拓扑排序关键路径广义表图的定义和术语邻接点度入度出度路径路径长度简单路径简单回路连通图
复试口语常见话题整理以及华师18 19年topic

报考华师已经上岸整理往年英语topic和一些常考话题以及2020复试口语 xff0c 今年问题比较常规问了家乡 xff0c 喜欢的书电影规划报考学校等辛苦整理 xff0c 有用记得点赞目录针对于自己不熟悉的话题的时候 xff1a
Vim配置

1 比较全的Vim配置 34 Vim通用配置 set nocompatible 34 be iMproved required syntax on set confirm 34 在处理未保存或只读文件的时候 xff0c 弹出确认 set a
知识追踪理论入门

what 知识追踪 xff08 Knowledge Tracing xff09 是根据学生过去的答题情况对学生的知识掌握情况进行建模 xff0c 从而得到学生当前知识状态表示的一种技术便我们能准确地预测学生对于各个知识概念的掌握程度 xf
多媒体集成课程设计要求

学院数计学院出卷教师 XX 系主任签名制卷份数专业计算机科学与技术班级编号 B14082021 41 51 XX大学2018 2019学年第 2 学期考核要求课程编号 xff1a 400802003 课程名称 xf
多媒体课程设计详细文档+

目录一目的与要求 2 二作品简介 2 三素材的收集与制作 10 四设计步骤 11 4 1整体的流程图 11 4 2导入声音文件 12 4 3首页的设计 12 4 4密码输入和用户登录页面 13 4 5按钮交互相应设计 16 4 6
编译原理期末考点

题型单选5个 10分填空10个 20分简答2个 10分解答9个 60分最后3题 xff0c 每个10分目录第一章第二章第三章第四章第五章第六章第一章什么是编译程序把某一种高级语言程序等价的转换成另一种低级语言的
数据挖掘之航空公司客户价值分析

课程设计选题 xff1a 详细文档项目见https download csdn net download sereasuesue 12050550 题目 xff1a 航空公司客户价值分析目录一任务背景 2 二数据挖掘目标 2 三数
RNN 循环/递归神经网络入门

目录 RNN 循环递归神经网络 RNN概述 RNN模型 LSTM长短记忆网络 LSTM结构细胞状态 xff1a 决定丢弃信息确定更新的信息更新细胞状态输出信息 GRU算法值得学习的博客记录 RNN 循环递归神经网络 RNN概述
神经网络、图像分类、卷积网络等，论文推荐附论文地址

喜欢收集资源 xff0c 一起分享交流具体见https www tinymind cn articles 4265 循环神经网络部分 No33 QRNN模型论文 xff1a 在RNN模型的cell里 xff0c 如果还只知道LSTM和GR
jupyter notebook使用教程初学者必备

目录安装与打开 jupyter notebook常见命令更改工作路径亲测成功方法一方法2 方法3 快捷键 Jupyter Notebook如何导入代码安装与打开安装Anaconda会一起打包安装或者pip然后打开jupyter
《面向对象程序设计》课程设计

一课程设计题目结合实际 xff0c 用面向对象程序设计的思想设计一个应用实例 xff0c 要求用到下面设计要求中提到的知识点5个以上二设计要求通过此次课程设计 xff0c 更好地掌握面向对象程序设计的基本概念及编程方法 xff0c
深度知识追踪（Deep Knowledge Tracing）论文学习（简要归纳）

深度知识追踪 xff08 Deep Knowledge Tracing xff09 Chris Piech Jonathan Spencer Jonathan Huang Surya Ganguli Mehran Sahami Leonid
Build tools for Visual Studio 2015 / 2017 / 2019 cannot be found ，Windows10环境 OpenVINO 运行demo例子

1 问题描述 xff1a 在windows10 环境下配置安装完成OpenVINO xff0c 在进入demo目录 xff0c 验证环境是否配置成功时在下载完各项依赖 xff0c 出现如下问题 xff1a vswhere 不是内部或外部
机器学习&深度学习资料计算机视觉等汇总的链接（1）

机器学习 amp 深度学习资料汇总的链接记录 xff0c 方便以后查询 https bbs cvmart net articles 1316 https bbs cvmart net Github page 61 1 计算机视觉知识点总结
使用LSTM进行情感分析学习实例一含数据和代码分析

使用LSTM进行情感分析原理见https mp csdn net console editor html 108697113 数据集见下文https pan baidu com s 1SctPmfFlq6ilY2bxcXHIFA 使用ke
使用LSTM进行文本情感分析实例（2）

数据集下载https github com renjunxiang Text Classification 其他文本分析数据及数据处理代码https github com renjunxiang Text Classification 一

使用LSTM进行文本情感分析实例（2）

使用LSTM进行文本情感分析实例（2） 的相关文章

随机推荐

热门标签

使用LSTM进行文本情感分析实例（2）的相关文章