BiLSTM官方示例（Tensorflow版）

2023-10-27

'''
A Bidirectional Recurrent Neural Network (LSTM) implementation example using TensorFlow library.
This example is using the MNIST database of handwritten digits (http://yann.lecun.com/exdb/mnist/)
Long Short Term Memory paper: http://deeplearning.cs.cmu.edu/pdfs/Hochreiter97_lstm.pdf

Author: Aymeric Damien
Project: https://github.com/aymericdamien/TensorFlow-Examples/
'''

from __future__ import print_function

import tensorflow as tf
from tensorflow.contrib import rnn
import numpy as np

# Import MNIST data
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

'''
To classify images using a bidirectional recurrent neural network, we consider
every image row as a sequence of pixels. Because MNIST image shape is 28*28px,
we will then handle 28 sequences of 28 steps for every sample.
'''

# Parameters
learning_rate = 0.001

# 可以理解为，训练时总共用的样本数
training_iters = 100000

# 每次训练的样本大小
batch_size = 128

# 这个是用来显示的。
display_step = 10

# Network Parameters
# n_steps*n_input其实就是那张图 把每一行拆到每个time step上。
n_input = 28 # MNIST data input (img shape: 28*28)
n_steps = 28 # timesteps

# 隐藏层大小
n_hidden = 128 # hidden layer num of features
n_classes = 10 # MNIST total classes (0-9 digits)

# tf Graph input
# [None, n_steps, n_input]这个None表示这一维不确定大小
x = tf.placeholder("float", [None, n_steps, n_input])
y = tf.placeholder("float", [None, n_classes])

# Define weights
weights = {
    # Hidden layer weights => 2*n_hidden because of forward + backward cells
    'out': tf.Variable(tf.random_normal([2*n_hidden, n_classes]))
}
biases = {
    'out': tf.Variable(tf.random_normal([n_classes]))
}


def BiRNN(x, weights, biases):

    # Prepare data shape to match `bidirectional_rnn` function requirements
    # Current data input shape: (batch_size, n_steps, n_input)
    # Required shape: 'n_steps' tensors list of shape (batch_size, n_input)

    # Unstack to get a list of 'n_steps' tensors of shape (batch_size, n_input)
    # 变成了n_steps*(batch_size, n_input)
    x = tf.unstack(x, n_steps, 1)

    # Define lstm cells with tensorflow
    # Forward direction cell
    lstm_fw_cell = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)
    # Backward direction cell
    lstm_bw_cell = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)

    # Get lstm cell output
    try:
        outputs, _, _ = rnn.static_bidirectional_rnn(lstm_fw_cell, lstm_bw_cell, x,
                                              dtype=tf.float32)
    except Exception: # Old TensorFlow version only returns outputs not states
        outputs = rnn.static_bidirectional_rnn(lstm_fw_cell, lstm_bw_cell, x,
                                        dtype=tf.float32)

    # Linear activation, using rnn inner loop last output
    return tf.matmul(outputs[-1], weights['out']) + biases['out']

pred = BiRNN(x, weights, biases)

# Define loss and optimizer
# softmax_cross_entropy_with_logits：Measures the probability error in discrete classification tasks in which the classes are mutually exclusive
# return a 1-D Tensor of length batch_size of the same type as logits with the softmax cross entropy loss.
# reduce_mean就是对所有数值（这里没有指定哪一维）求均值。
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred, labels=y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)

# Evaluate model
correct_pred = tf.equal(tf.argmax(pred,1), tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# Initializing the variables
init = tf.global_variables_initializer()

# Launch the graph
with tf.Session() as sess:
    sess.run(init)
    step = 1
    # Keep training until reach max iterations
    while step * batch_size < training_iters:
        batch_x, batch_y = mnist.train.next_batch(batch_size)
        # Reshape data to get 28 seq of 28 elements
        batch_x = batch_x.reshape((batch_size, n_steps, n_input))
        # Run optimization op (backprop)
        sess.run(optimizer, feed_dict={x: batch_x, y: batch_y})
        if step % display_step == 0:
            # Calculate batch accuracy
            acc = sess.run(accuracy, feed_dict={x: batch_x, y: batch_y})
            # Calculate batch loss
            loss = sess.run(cost, feed_dict={x: batch_x, y: batch_y})
            print("Iter " + str(step*batch_size) + ", Minibatch Loss= " + \
                  "{:.6f}".format(loss) + ", Training Accuracy= " + \
                  "{:.5f}".format(acc))
        step += 1
    print("Optimization Finished!")

    # Calculate accuracy for 128 mnist test images
    test_len = 128
    test_data = mnist.test.images[:test_len].reshape((-1, n_steps, n_input))
    test_label = mnist.test.labels[:test_len]
    print("Testing Accuracy:", \
        sess.run(accuracy, feed_dict={x: test_data, y: test_label}))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

机器学习 amp 深度学习

BiLSTM官方示例（Tensorflow版）的相关文章

为什么 tf.matmul() 给出看似不一致的结果？

sess tf InteractiveSession num elements 10 output 0 76158798 num elements softmax w 0 1 0 1 0 1 0 1 0 1 0 1 0 1 num elem
ValueError：在 R 中使用 keras 模型时在用户代码中

我正在尝试使用 R 在 R 中运行一维 CNNkeras包裹我正在使用以下代码 library MASS library keras Create some data data Boston data lt Boston create a
Tensorflow ctc_loss_calculator：找不到有效路径

当运行我的神经网络双向 LSTM 进行音频识别时我使用连接主义时间分类 CTC 但在某些时候训练网络时我几乎每批都会收到来自 Tensorflow 的警告 W tensorflow core util ctc ctc loss cal
每次运行神经网络代码时结果都会改变

我通过运行此链接中提供的代码得到了结果神经网络预测多个变量的值 https stackoverflow com questions 58071836 neural network predicting values of multiple
“Dense”对象没有属性“op”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在尝试使用tensorflow keras制作一个完全连接的模型这是我的代码 from tensorflow keras m
Keras，如何获取每一层的输出？

我已经用 CNN 训练了一个二元分类模型这是我的代码 model Sequential model add Convolution2D nb filters kernel size 0 kernel size 1 border mode
如何正确将 tflite_graph.pb 转换为 detector.tflite

我正在使用tensorflow对象检测API使用tensorflow中的ssdlite mobilenet v2 coco 2018 05 09来训练自定义模型模型动物园 https github com tensorflow models
Keras 中的条件批量归一化

我正在尝试在 Keras 中实现条件批量标准化我假设我必须创建一个自定义层因此我从正常化 https github com keras team keras blob master keras layers normalization
如何清除 tf.flags？

如果我运行此代码两次 tf flags DEFINE integer batch size 2 batch size for training 我会得到这个错误 DuplicateFlagError The flag batch size
在 GPU 上训练时如何处理非确定性？

在调整超参数以使模型性能更好时我注意到每次运行代码时获得的分数以及创建的模型都是不同的尽管修复了随机操作的所有种子如果我在CPU上运行就不会出现这个问题我搜索了一下发现这是使用 GPU 训练时的常见问题这是一个非常好的详细
Keras Predict_classes 方法返回“列表索引超出范围”错误

我对 CNN 和机器学习总体来说是新手并且一直在尝试遵循 TensorFlow 的图像分类教程现在可以找到Google Colabhere https colab research google com drive 1gwZp7 t
在 Android 上保持 TensorFlow 模型加密

我搜索了解是否有一种技术可以在 Android 应用程序中保持经过训练的张量流模型 pb 文件的安全但没有找到任何有用的东西我正在发布一个包含我在训练集上构建的张量流模型的应用程序当我发布该应用程序时任何人都可以访问该模型并将其用
Tensorflow图像读取空

这个问题是基于 Tensorflow图像读取与显示 https stackoverflow com questions 33648322 tensorflow image reading display 根据他们的代码我们得到以下内容 s
用于测试张量流安装的速度基准

我怀疑我的 GPU 机器上是否正确配置了张量流因为在我精美的 GPU 机器上训练一个简单的线性回归模型批量大小 32 1500 个输入特征 150 个输出变量的每次迭代速度比在笔记本电脑上慢 100 倍我使用的是 Titan X 配
使用 Keras Tuner 调整模型时如何跳过有问题的超参数组合？

使用 Keras Tuner 时似乎没有办法允许跳过有问题的超参数组合例如 Conv1D 层中的过滤器数量可能与后续 MaxPooling1D 层中的池大小的所有值不兼容从而导致模型构建错误然而在运行调谐器之前可能不知道这一点一
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
如何在 Tensorflow 中使用预训练的 Word2Vec 模型

我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入有人可以告诉我如何用一些示例代码来做到这一点吗假设您有一个字典
Tensorflow：尽管数据中没有字符串，但使用 tflearn 时不支持将字符串转换为浮点数错误

我似乎无法在我的代码中找到错误其中有任何字符串被错误地转换为浮点数但它却给了我这个错误 W tensorflow core framework op kernel cc 958 Unimplemented Cast string to
AttributeError：模块“tensorflow.python.framework.ops”没有属性“RegisterShape”

我正在使用 TensorFlow 2 1 0 dev20191125 不幸的是我无法编译一个带有错误的简单示例 AttributeError 模块 tensorflow python framework ops 没有属性 Registe
在tensorflow.js中对张量进行分区、屏蔽或过滤

我有 2 个相同长度的张量 data and groupIds 我想分开data通过相应的值分成几组groupId 例如 const data tf tensor 1 2 3 4 5 const groupIds tf tensor 0 1

随机推荐

【数论】矩阵快速幂，递推优化，模板

目录一矩阵快速幂用于优化递推二矩阵快速幂的推导一矩阵快速幂用于优化递推矩阵快速幂用于优化递推公式例如斐波那契的递推公式为 f 1 1 f 2 1 f n f n 1 f n 2 n gt 3 当我们想要求第1e8项时直接
QT Android wifi自动重连开发

QT Android wifi自动重连开发配置安卓wifi操作权限通过监听QNetworkConfigurationManager信号判断WiFi是否失去连接 Java代码 QT代码小米平板连接无公网的路由器时断开后不会自动连接原
[Oracle] 修改字符串最大长度解决 ORA-12899: value too large for column

问题分析出现这个问题的原因是某列中包含的数据长度超出了建表时对该列的限制一般情况下修改出错列的长度设置然后重新建表即可不过有时问题会更复杂一些存储字符串常用的 VARCHAR2 类型的默认长度上限是 4000 bytes 如果要
LTE学习笔记：频带、信道带宽和频点号EARFCN

转自 https blog csdn net m 052148 article details 51322260 1 频带 Band 所谓频带指代的是一个频率的范围或者频谱的宽度即无线解码器的最低工作频率至最高工作频率之间的范围单位是
C++二进制转换

include
..\HAREWARE\LED.H(4): warning: #1295-D: Deprecated declaration led_init - give arg types

MDK头文件定义空函数中无参数要加 void eg void led init 要写成 void led init void 转载于 https www cnblogs com 520sbc p 7756859 html
sql for循环_循环查询数据的性能问题及优化

大数据技术与架构点击右侧关注大数据开发领域最强公众号暴走大数据点击右侧关注暴走大数据糟糕的代码对代码维护性能团队协作都会造成负面影响所以先设计再实现谋而后动这里的循环查询指的是在一个for循环中不断访问数据库来
c#发送简单的post、get请求

POST发送请求及接受响应流程根据目标地址址创建HttpWebRequest对象设置响应的请求参数 Method ContentType 等使用HttpWebRequest对象获取请求流并且写入消息体使用HttpWebRequest
Spring Boot 接入支付宝完整流程实战

1 将支付宝开放平台里下载的3个证书放在resources下面 2 写支付宝支付的配置文件 alipay properties alipay appId 你的应用id alipay serverUrl https openapi alipa
javascript开发web计算器实例教程

计算器的主要作用是进行数字运算开发一个计算器功能的web实例有助于更好的掌握js基础的数字运算能力本实例详细分析一个js计算器的开发步骤学习本教程时最好先具备一些基础的js知识计算器包括显示数字区域和按键区域两大部分先把计算器的
Derby数据库如何返回指定行数

在国内搜索网站竟然没搜到使用Derby数据库时如何像Mysql的limit Oracle的rownum一样的限制条件查询查了下官网我直接放下面了做一名合格的搬运工 Sometimes it is useful to limit th
python输入学号姓名性别联系电话按指定格式输出_学生信息管理系统---信息包括学号，姓名，年龄，性别，出生年月，地址，电话，E-mail。功能：信息录入（信息用文件保存），信息浏览，查询，排序，删...

首先是对整体函数所需要的功能进行子函数的分类让信息的输入处理输出都可以进行模块化的设计需要全局代码的可直接下拉至文章末尾文件名 main c 版本号初稿作者飘小叶生成日期 2020年7月14日最近修改功能描
element-ui 只能选择3个月

月份选择限制只能选择3个月 Vue prototype disabledDateTime time gt let timeOptionRange this timeOptionRange let secondNum 3 if timeOp
C语言和图形界面编程打造——浪漫的表白程序

include include include include include include pragma comment lib Winmm lib 宏定义区 define NUM13 烟花种类数量宏定义结构定义区烟花结构 stru
基于Labview与单片机的多通道温度采集系统设计

Labview编程跟以往传统的软件编程有很大的不同最明显的差别就是它是图形化编程用过Labview的童鞋都知道整个编程都是拖控件的过程而不是像传统的软件一样码代码萝卜青菜各有所爱 Labview也有自己小众Fans 但是小众归小众
C++STL之unordered_map的简单使用

目录简介常用函数代码运行截图参考简介 unordered map 容器和 map 容器仅有一点不同即 map 容器中存储的数据是有序的而 unordered map 容器中是无序的以键值对 pair类型的形式存储数据存
pycharm控制台如何设置自动换行

没有设置换行的时候信息太长的话不方便查看 pycharm控制台自动换行设置方法如下点击 File Setting Console 勾选 Use soft wraps in console 并保存换行后效果如下
在IOS手机safari浏览器的无痕模式下，localStorage不起作用

无痕模式是黑色风格正常模式是白色风格在无痕模式中使用localStorage setItem 会报错但在window对象下确实有localStorage setItem方法 if typeof localStorage object
记lombok插件builder模式的一个坑

使用lombok的builder模式时如果属性有指定的默认值不能使用静态的builder build 创建对象正解见下文一个坑最近接手了一套代码代码中的数据库表id用了UUID 有如下一个实体 import java util
BiLSTM官方示例（Tensorflow版）

A Bidirectional Recurrent Neural Network LSTM implementation example using TensorFlow library This example is using the

BiLSTM官方示例（Tensorflow版）

BiLSTM官方示例（Tensorflow版） 的相关文章

随机推荐

热门标签

BiLSTM官方示例（Tensorflow版）的相关文章