Tensorflow高级API

2023-11-15

本文个人博客地址：点击查看

一、Estimator

1、介绍

编程堆栈

编程堆栈

Estimator：代表一个完整的模型。Estimator API 提供一些方法来训练模型、判断模型的准确率并生成预测。
数据集：构建数据输入管道。Dataset API 提供一些方法来加载和操作数据，并将数据馈送到您的模型中。Dataset API 与 Estimator API 合作无间

2、鸢尾花进行分类

数据集介绍：4个属性，分为3类：

花萼长度	花萼宽度	花瓣长度	花瓣宽度	品种（标签）
5.1	3.3	1.7	0.5	0（山鸢尾）
5.0	2.3	3.3	1.0	1（变色鸢尾）
6.4	2.8	5.6	2.2	2（维吉尼亚鸢尾）

网络模型

网络模型

3、实现

Estimator 是 TensorFlow 对完整模型的高级表示。它会处理初始化、日志记录、保存和恢复等细节部分，并具有很多其他功能，以便您可以专注于模型。

3.1 预创建模型

完整代码：点击查看
导入包和参数配置

import tensorflow as tf
import argparse
import iris_data


# 超参数
parser = argparse.ArgumentParser()
parser.add_argument('--batch_size', default=100, type=int, help="batch size")
parser.add_argument('--train_steps', default=1000, type=int, help="number of training steps")

构建模型
- 特征列：feature_column:特征列是一个对象，用于说明模型应该如何使用特征字典中的原始输入数据。在构建 Estimator 模型时，您会向其传递一个特征列的列表，其中包含您希望模型使用的每个特征。tf.feature_column 模块提供很多用于向模型表示数据的选项。
  - 对于鸢尾花问题，4 个原始特征是数值，因此我们会构建一个特征列的列表，以告知 Estimator 模型将这 4 个特征都表示为 32 位浮点值。
- 实例化 Estimator: 使用的是预创建模型 cls = tf.estimator.DNNClassifier()模型
- 训练模型 cls.train(input_fn, hooks=None, steps=None, max_steps=None, saving_listeners=None)：
  - input_fn指定输入的函数，包含 (features, labels) 的 tf.data.Dataset 类型的数据
  - steps 参数告知方法在训练多少步后停止训练。
- 评估经过训练的模型：eval_res = cls.evaluate(input_fn, steps=None, hooks=None, checkpoint_path=None, name=None)
  - 输入和训练数据一致
  - 返回的有{'accuracy': 1.0, 'loss': 3.936471, 'average_loss': 0.1312157, 'global_step': 100}
- 预测: predictions = cls.predict(input_fn, predict_keys=None, hooks=None, checkpoint_path=None, yield_single_examples=True)
  - 输入数据为 batch_size 的测试数据，不包含 label，返回生成器结果

def main(argv):
    args = parser.parse_args(argv[1:])
    # 加载数据， pandas类型
    (train_x, train_y), (test_x, test_y) = iris_data.load_data()
    # feature columns描述如何使用输入数据
    my_feature_columns = []
    for key in train_x.keys():
        my_feature_columns.append(tf.feature_column.numeric_column(key = key))
    # 建立模型
    cls = tf.estimator.DNNClassifier(hidden_units=[10,10], feature_columns=my_feature_columns, 
                                    n_classes=3)
    # 训练模型
    cls.train(input_fn=lambda:iris_data.train_input_fn(train_x, train_y, args.batch_size),
              steps=args.train_steps)
    # 评价模型
    eval_res = cls.evaluate(input_fn=lambda:iris_data.eval_input_fn(test_x, test_y, args.batch_size))
    print("\n Test Set accuracy: {:0.3f}\n".format(eval_res['accuracy']))
    
    # 预测
    expected = ['Setosa', 'Versicolor', 'Virginica']
    predict_x = {
        'SepalLength': [5.1, 5.9, 6.9],
        'SepalWidth':  [3.3, 3.0, 3.1],
        'PetalLength': [1.7, 4.2, 5.4],
        'PetalWidth':  [0.5, 1.5, 2.1],        
    }
    
    predictions = cls.predict(input_fn=lambda:iris_data.eval_input_fn(predict_x, 
                                                                      labels=None,
                                                                      batch_size=args.batch_size))
    template = ('\n Prediction is "{}" ({:.1f}%), expected "{}"' )
    for pred_dict, expec in zip(predictions, expected):
        class_id = pred_dict['class_ids'][0]
        prob = pred_dict['probabilities'][class_id]
        print(template.format(iris_data.SPECIES[class_id], 100*prob, expec))

运行函数
- tf.app.run(main=main)会先解析命令行参数,然后执行main函数

if __name__ == "__main__":
    tf.logging.set_verbosity(tf.logging.INFO)
    tf.app.run(main=main)

保存和加载模型
- 指定模型地址即可：model_dir,在第一次训练时会保存模型
  - 如果未在 Estimator 的构造函数中指定 model_dir，则 Estimator 会将检查点文件写入由 Python 的 tempfile.mkdtemp 函数选择的临时目录中,可以print(classifier.model_dir)查看
- 检查点频率：
  - 默认
    - 每 10 分钟（600 秒）写入一个检查点。
    - 在 train 方法开始（第一次迭代）和完成（最后一次迭代）时写入一个检查点。
    - 只在目录中保留 5 个最近写入的检查点。
  - 自己配置：

    my_checkpoint_config = tf.estimator.RunConfig(save_checkpoints_secs = 20*60,   # 每20分钟保存一次
                                                  keep_checkpoint_max = 10)        # 保存10个最近的检查点
    cls = tf.estimator.DNNClassifier(hidden_units=[10,10], feature_columns=my_feature_columns, 
                                    n_classes=3,
                                    model_dir='model/',
                                    config=my_checkpoint_config)

- 加载模型
  - 不需要改动，一旦存在检查点，TensorFlow 就会在您每次调用 train()、evaluate() 或 predict() 时重建模型。

3.2 自定义模型

完整代码：点击查看
预创建的 Estimator 是 tf.estimator.Estimator 基类的子类，而自定义 Estimator 是 tf.estimator.Estimator 的实例
创建模型
- 模型函数（即 model_fn）会实现机器学习算法
- params 参数会传递给自己实现的模型

    cls = tf.estimator.Estimator(model_fn=my_model, 
                                 params={
                                    'feature_columns': my_feature_columns,
                                    'hidden_units': [10, 10],
                                    'num_classes': 3
                                    })

自定义my_model函数：
- 输入层指定输入的数据和对应的feature columns
- 隐藏层通过tf.layers.dense()创建
- 通过mode来判断是训练、评价还是预测操作，返回必须是tf.estimator.EstimatorSpec 对象

def my_model(features, labels, mode, params):
    '''自定义模型
       ---------------------------------------------
       features: 输入数据
       labels  : 标签数据
       mode    : 指示是训练、评价还是预测
       params  : 构建模型的参数
    
    '''
    net = tf.feature_column.input_layer(features=features, 
                                        feature_columns=params['feature_columns'])   # 输入层
    for units in params['hidden_units']:                                             # 隐藏层，遍历参数配置
        net = tf.layers.dense(inputs=net, units=units, activation=tf.nn.relu)
    
    logits = tf.layers.dense(net, params['num_classes'], activation=None)
    pred = tf.argmax(logits, 1)    # 预测结果
    if mode == tf.estimator.ModeKeys.PREDICT:
        predictions = {
            'class_ids': pred[:, tf.newaxis],
            'probabilities': tf.nn.softmax(logits),
            'logits': logits,
        }
        return tf.estimator.EstimatorSpec(mode, predictions=predictions)

    # 计算loss
    loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)
    # 计算评价信息
    accuracy = tf.metrics.accuracy(labels=labels, predictions=pred, 
                                  name='acc_op')
    metrics = {'accuracy': accuracy}
    tf.summary.scalar(name='accuracy', tensor=accuracy[1])
    if mode == tf.estimator.ModeKeys.EVAL:
        return tf.estimator.EstimatorSpec(mode, loss=loss, eval_metric_ops=metrics)
    
    # 训练操作
    assert mode == tf.estimator.ModeKeys.TRAIN
    
    optimizer = tf.train.AdagradOptimizer(learning_rate=0.1)
    train_op = optimizer.minimize(loss=loss, global_step=tf.train.get_global_step())
    return tf.estimator.EstimatorSpec(mode, loss=loss, train_op=train_op)

在 TensorBoard 中查看自定义 Estimator 的训练结果。（预定义的模型结果展示更丰富一些）
- tensorboard --logdir=PATH
- global_step/sec：这是一个性能指标，显示我们在进行模型训练时每秒处理的批次数（梯度更新）。
- loss：所报告的损失。
- accuracy：准确率由下列两行记录：
  - eval_metric_ops={‘my_accuracy’: accuracy})（评估期间）。
  - tf.summary.scalar(‘accuracy’, accuracy1)（训练期间）。

二、Dataset

tf.data 模块包含一系列类，可让轻松地加载数据、操作数据并通过管道将数据传送到模型中。

1、基本输入

从数组中提取接片，上面用到的代码
- feature：特征数据，为feature-name: array的字典或者DataFrame
- labels: 标签数组
- from_tensor_slices 会按第一个维度进行切片，比如输入为[6000, 28, 28]维度的数据，切片后返回6000个28， 28的Dataset 对象
- shuffle 方法使用一个固定大小的缓冲区，在条目经过时随机化处理条目。在这种情况下，buffer_size 大于 Dataset 中样本的数量，确保数据完全被随机化处理。
- repeat 方法会在结束时重启 Dataset。要限制周期数量，请设置 count 参数。
- batch 方法会收集大量样本并将它们堆叠起来以创建批次。这为批次的形状增加了一个维度。新的维度将添加为第一个维度。

def train_input_fn(features, labels, batch_size):
    """训练集输入函数"""
    dataset = tf.data.Dataset.from_tensor_slices((dict(features,), labels))   # 转化为Dataset
    
    dataset = dataset.shuffle(buffer_size=1000).repeat().batch(batch_size)    # Shuffle, batch
    
    return dataset

2、读取CSV文件

代码
处理一行数据，line: tf.string类型

CSV_TYPES = [[0.0], [0.0], [0.0], [0.0], [0]]
def _parse_line(line):
    '''解析一行数据'''
    field = tf.decode_csv(line, record_defaults=CSV_TYPES)
    features = dict(zip(CSV_COLUMN_NAMES, field))
    labels = features.pop("Species")
    return features, labels

处理text 文件，得到dataset
- 读取文本类型为：<SkipDataset shapes: (), types: tf.string>
- 然后使用map 函数，每个对象处理

def csv_input_fn(csv_path, batch_size):
    '''csv文件输入函数'''
    dataset = tf.data.TextLineDataset(csv_path).skip(1)   # 跳过第一行
    dataset = dataset.map(_parse_line)        # 应用map函数处理dataset中的每一个元素
    dataset = dataset.shuffle(1000).repeat().batch(batch_size)
    return dataset

Reference

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Tensorflow高级API 的相关文章

Tensorflow 初始化给出所有 1

张量流1 12 0 在下面的代码片段中 wrapped rv val和seq rv val似乎应该是等效的但事实并非如此相反 seq rv val 被正确初始化为随机生成的 init val 数组但wrapped rv val 设置为
每次运行神经网络代码时结果都会改变

我通过运行此链接中提供的代码得到了结果神经网络预测多个变量的值 https stackoverflow com questions 58071836 neural network predicting values of multiple
Keras 显示 GPU 训练速度没有任何改进（部分 GPU 使用？！）

我正在尝试在我的 Jupyter Notebook 的 AWS p2 xlarge 实例上的 GPU 而不是 CPU 上训练我的模型我正在使用tensorflow gpu后端仅tensorflow gpu已安装并在中提到requirem
如何将张量推送到 TensorFlow 队列并从另一个进程中提取它们？

我有一个 TensorFlow 集群已启动并正在运行我正在尝试使用一个客户端进程将数据入队并将其从另一进程中出队我无法让它工作我做错了什么这是我的推送数据的程序 queue push py import tensorflow as
什么是tensorflow.python.data.ops.dataset_ops._OptionsDataset？

我正在使用来自tensorflow的Transformer代码 https www tensorflow org beta tutorials text transformer https www tensorflow org beta t
TensorFlow.js 调整 3D 张量大小

我有一个具有以下尺寸的 3D 张量宽度 x 高度 x 深度我需要将可变大小的体积调整为特定形状例如 256 x 256 x 256 不幸的是在 TensorFlow js 中他们有一组用于调整大小的方法例如tf image re
张量流如何处理复杂的梯度？

Let z是一个复变量 C z 是它的共轭在复分析理论中导数C z w r t z不存在但在张量流中我们可以计算dC z dz结果就是1 这是一个例子 x tf placeholder complex64 2 2 y tf redu
如何正确将 tflite_graph.pb 转换为 detector.tflite

我正在使用tensorflow对象检测API使用tensorflow中的ssdlite mobilenet v2 coco 2018 05 09来训练自定义模型模型动物园 https github com tensorflow models
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
TensorFlow 中的 global_step 是什么意思？

在这就是教程代码 https github com tensorflow tensorflow blob master tensorflow examples tutorials mnist mnist py来自 TensorFlow 网站
在 GPU 上训练时如何处理非确定性？

在调整超参数以使模型性能更好时我注意到每次运行代码时获得的分数以及创建的模型都是不同的尽管修复了随机操作的所有种子如果我在CPU上运行就不会出现这个问题我搜索了一下发现这是使用 GPU 训练时的常见问题这是一个非常好的详细
Keras Predict_classes 方法返回“列表索引超出范围”错误

我对 CNN 和机器学习总体来说是新手并且一直在尝试遵循 TensorFlow 的图像分类教程现在可以找到Google Colabhere https colab research google com drive 1gwZp7 t
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
ValueError：形状（无，50）和（无，1）在 Tensorflow 和 Colab 中不兼容

我正在使用 LSTM 训练 Tensorflow 模型以进行预测维护对于每个实例我创建一个矩阵 50 4 其中 50 是历史序列的长度 4 是每个记录的特征数量因此为了训练模型我使用例如 55048 50 4 张量和 55048 1
导入tensorflow时，出现以下错误：没有名为“numpy.core._multiarray_umath”的模块

我已经安装了 Ancaconda3 和 Tensorflow 当我尝试在 python shell 中导入 Tensorflow 时收到以下错误 ModuleNotFoundError 没有名为 numpy core multiarray
用于测试张量流安装的速度基准

我怀疑我的 GPU 机器上是否正确配置了张量流因为在我精美的 GPU 机器上训练一个简单的线性回归模型批量大小 32 1500 个输入特征 150 个输出变量的每次迭代速度比在笔记本电脑上慢 100 倍我使用的是 Titan X 配
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
Keras：binary_crossentropy 和 categorical_crossentropy 混淆

使用 TensorFlow 一段时间后我阅读了一些 Keras 教程并实现了一些示例我找到了几个使用卷积自动编码器的教程keras losses binary crossentropy作为损失函数我想binary crossentro
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp

随机推荐

python pymysql emoji表情插入mysql数据库异常记录报错 pymysql.err.InternalError

在数据库存储微信小程序用户昵称时候发现用户昵称使用emoji表情时候就存不了数据库中间报错 pymysql err InternalError 1366 Incorrect string value xF0 x9F x98 x81 xF0
STM32F429串口1配置

static void ConfigUART u32 bound GPIO InitTypeDef GPIO InitStructure GPIO InitStructure用于存放GPIO的参数 USART InitTypeDef USA
gethostbyname() -- 用域名或主机名获取IP地址

http hi baidu com zengzhaonong item 87d9d296d0824cbb82d29570 include
leetcode236—二叉树的最近公共祖先（递归/深搜/理解）

给定一个二叉树找到该树中两个指定节点的最近公共祖先百度百科中最近公共祖先的定义为对于有根树 T 的两个节点 p q 最近公共祖先表示为一个节点 x 满足 x 是 p q 的祖先且 x 的深度尽可能大一个节点也可以是它自己的祖先深
解决CSS引用字体跨域问题

最近一个需求客户要求换字体需要引入字体开始没有注意后来发现会出现跨越现象特别是在手机上很明显通过解决尝试终于解决希望可以帮到大家 1 解决方案就是将文字设置为 base64 编码字体转base64编码网址点击进去下载文件解压
oracle wait class user i/o,[ORACLE]管理方面的脚本收集

1 查询AWR相关的视图名称 SELECT table name FROM dba tables t WHERE table name LIKE WRH AND NOT EXISTS SELECT x FROM dba tab column
英文键盘盲打最快速练习口诀和方法

下面我提供几种在新建的文档如用于处理文字的word 里进行英文盲打的练习参考资料以一天练习四个字母计算最多7天你的盲打就基本练习成功了下面的口诀能帮助你快速记住键盘字母的排列顺序爱上一个不爱回家的人七 q 碗 w n 鹅肉
Map遍历取值的五种方式

方法1 Set set map keySet for Object o set System out println o map get o 方法2 Set set map keySet Iterator iterator set iter
准备WebUI自动化测试面试？这30个问题你必须掌握（二）

本文共有11000字包含了后十五个问题如需要前十五个问题可查看文末链接 16 在WebUI自动化测试中你如何处理验证码或图像识别的问题 1 人工识别一种简单但费时费力的方法是使用人工手动识别验证码测试人员可以手动输入验证码将其
IntelliJ IDEA中谷歌打开页面，出现windows 找不到文件chrome

1 右击桌面上的chrome浏览器图标找到属性 gt 快捷方式 gt 目标复制路径即chrome浏览器 exe文件的路径 2 打开IntelliJ IDEA软件找到file gt settings gt 找到Web Browsers
Java实现国密算法SM2,SM3,SM4,并且实现ECB和CBC模式

代码中实现了电码本ECB模式和密文分组连接CBC模式 SM3 java和SM4 java为算法实现类 utils的都是根据实现类写的工具可以根据需要调用杂凑算法SM3的杂凑功能获得杂凑值 SM4 java中 sm4 crypt ecb S
iOS objc_msgSend iOS too many arguments in function call 报错解决方案

Build Settings gt 搜索 objc gt 设置 Enable Strict Checking of objc msgSend Calls 为 NO
[django项目] 利用elasticsearch实现搜索功能

新闻搜索 I 搜索功能分析本节我们来完成新闻搜索功能首先让我们来思考一下要做一个通过关键词搜索文章的功能需要搜索哪些字段以及使用什么技术方案呢既然我们是准备做新闻博客网站那我们就可以拿同类型网站的做一下对比例如CSDN 简书
docker系列-搭建本地私有仓库-registry容器的各种坑

总结的坑 a 关注daemon json的书写格式一句话可以错好几个点 b tag要清楚的表示registry服务器的信息才能push上传成功不是可有可无的信息 c tag中有版本号要清楚的写上系统自动补全的是用latest 搭建过
RPC

RPC 远程过程调用是什么简单的说 RPC就是从一台机器客户端上通过参数传递的方式调用另一台机器服务器上的一个函数或方法可以统称为服务并得到返回的结果 RPC 会隐藏底层的通讯细节不需要直接处理Socket通讯或Http通
安卓pwn - De1taCTF(BroadcastTest)

BroadcastTest 背景逆向APK可知程序中仅有MainActivity Message和三个Receiver类前者实现了一个Parcelable类后三个则是广播其中Receiver1是exported的接收并向Recei
jsts 学习

性能问题一直困扰了我很长的时间今天听同事介绍了一个网站感觉视角开阔了许多一直做GIS开发原来不只是java有jts包原来javascript也有这样的一个包叫做jsts 这个包的功能跟java里面的jts包差不多前段提供空间关
Linux--信号

文章目录信号入门生活角度的信号技术应用角度的信号注意信号概念使用kill l命令可以查看系统定义的信号列表信号处理常见的方式产生信号 1 通过终端按键产生信号 Core Dump 使用core dump进行事后调试 2 系统
How far away ？【HDU - 2586】【在线LCA算法讲解】

题目链接做些LCA的算法还是很提高代码能力的这道题就是典型的LCA模板所以用它来练一下我的LCA算法还是很好的我们要求的是在一棵树上的任意两点的相互距离既然在一棵树上就可以直接调用LCA来解了我们先任取一根节点我取的是1
Tensorflow高级API

本文个人博客地址点击查看一 Estimator 1 介绍编程堆栈 Estimator 代表一个完整的模型 Estimator API 提供一些方法来训练模型判断模型的准确率并生成预测数据集构建数据输入管道 Dataset API

Tensorflow高级API

一、Estimator

1、介绍

2、鸢尾花进行分类

3、实现

3.1 预创建模型

3.2 自定义模型

二、Dataset

1、基本输入

2、读取CSV文件

Reference

Tensorflow高级API 的相关文章

随机推荐

热门标签