Tensorflow和OpenCV实时分类

2023-12-03

我正在测试机器学习水域并使用TS成立模型来重新训练网络以对我想要的对象进行分类。

最初，我的预测是在本地存储的图像上运行的，我意识到从文件中取消持久化图形需要 2-5 秒的时间，并且大约在同一时间运行实际的预测。

此后，我调整了我的代码以合并来自 OpenCV 的摄像头输入，但在上述情况下，视频延迟是不可避免的。

初始图形加载期间预计会出现时间问题；这就是为什么initialSetup()是预先运行的，但是 2-5 秒是荒谬的。我觉得我目前的申请；实时分类，这不是最好的加载方式。还有另一种方法可以做到这一点吗？我知道对于移动版本，TS 建议缩小图表。减肥是这里的出路吗？以防万一，我的图表当前为 87.4MB

除此之外，有没有办法加快预测过程？

import os
import cv2
import timeit
import numpy as np
import tensorflow as tf

camera = cv2.VideoCapture(0)

# Loads label file, strips off carriage return
label_lines = [line.rstrip() for line
               in tf.gfile.GFile('retrained_labels.txt')]

def grabVideoFeed():
    grabbed, frame = camera.read()
    return frame if grabbed else None

def initialSetup():
    os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
    start_time = timeit.default_timer()

    # This takes 2-5 seconds to run
    # Unpersists graph from file
    with tf.gfile.FastGFile('retrained_graph.pb', 'rb') as f:
        graph_def = tf.GraphDef()
        graph_def.ParseFromString(f.read())
        tf.import_graph_def(graph_def, name='')

    print 'Took {} seconds to unpersist the graph'.format(timeit.default_timer() - start_time)

def classify(image_data):
    print '********* Session Start *********'

    with tf.Session() as sess:
        start_time = timeit.default_timer()

        # Feed the image_data as input to the graph and get first prediction
        softmax_tensor = sess.graph.get_tensor_by_name('final_result:0')

        print 'Tensor', softmax_tensor

        print 'Took {} seconds to feed data to graph'.format(timeit.default_timer() - start_time)

        start_time = timeit.default_timer()

        # This takes 2-5 seconds as well
        predictions = sess.run(softmax_tensor, {'Mul:0': image_data})

        print 'Took {} seconds to perform prediction'.format(timeit.default_timer() - start_time)

        start_time = timeit.default_timer()

        # Sort to show labels of first prediction in order of confidence
        top_k = predictions[0].argsort()[-len(predictions[0]):][::-1]

        print 'Took {} seconds to sort the predictions'.format(timeit.default_timer() - start_time)

        for node_id in top_k:
            human_string = label_lines[node_id]
            score = predictions[0][node_id]
            print('%s (score = %.5f)' % (human_string, score))

        print '********* Session Ended *********'

initialSetup()

while True:
    frame = grabVideoFeed()

    if frame is None:
        raise SystemError('Issue grabbing the frame')

    frame = cv2.resize(frame, (299, 299), interpolation=cv2.INTER_CUBIC)

    # adhere to TS graph input structure
    numpy_frame = np.asarray(frame)
    numpy_frame = cv2.normalize(numpy_frame.astype('float'), None, -0.5, .5, cv2.NORM_MINMAX)
    numpy_final = np.expand_dims(numpy_frame, axis=0)

    classify(numpy_final)

    cv2.imshow('Main', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

camera.release()
cv2.destroyAllWindows()

EDIT 1

调试代码后，我意识到会话创建是一项既消耗资源又消耗时间的操作。

在之前的代码中，除了运行预测之外，还为每个 OpenCV 源创建了一个新会话。将 OpenCV 操作封装在单个会话中可以节省大量时间，但这仍然会增加初始运行的大量开销；预测需要 2-3 秒。此后，预测需要大约 0.5 秒，这使得相机输入仍然滞后。

import os
import cv2
import timeit
import numpy as np
import tensorflow as tf

camera = cv2.VideoCapture(0)

# Loads label file, strips off carriage return
label_lines = [line.rstrip() for line
               in tf.gfile.GFile('retrained_labels.txt')]

def grabVideoFeed():
    grabbed, frame = camera.read()
    return frame if grabbed else None

def initialSetup():
    os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
    start_time = timeit.default_timer()

    # This takes 2-5 seconds to run
    # Unpersists graph from file
    with tf.gfile.FastGFile('retrained_graph.pb', 'rb') as f:
        graph_def = tf.GraphDef()
        graph_def.ParseFromString(f.read())
        tf.import_graph_def(graph_def, name='')

    print 'Took {} seconds to unpersist the graph'.format(timeit.default_timer() - start_time)

initialSetup()

with tf.Session() as sess:
    start_time = timeit.default_timer()

    # Feed the image_data as input to the graph and get first prediction
    softmax_tensor = sess.graph.get_tensor_by_name('final_result:0')

    print 'Took {} seconds to feed data to graph'.format(timeit.default_timer() - start_time)

    while True:
        frame = grabVideoFeed()

        if frame is None:
            raise SystemError('Issue grabbing the frame')

        frame = cv2.resize(frame, (299, 299), interpolation=cv2.INTER_CUBIC)

        cv2.imshow('Main', frame)

        # adhere to TS graph input structure
        numpy_frame = np.asarray(frame)
        numpy_frame = cv2.normalize(numpy_frame.astype('float'), None, -0.5, .5, cv2.NORM_MINMAX)
        numpy_final = np.expand_dims(numpy_frame, axis=0)

        start_time = timeit.default_timer()

        # This takes 2-5 seconds as well
        predictions = sess.run(softmax_tensor, {'Mul:0': numpy_final})

        print 'Took {} seconds to perform prediction'.format(timeit.default_timer() - start_time)

        start_time = timeit.default_timer()

        # Sort to show labels of first prediction in order of confidence
        top_k = predictions[0].argsort()[-len(predictions[0]):][::-1]

        print 'Took {} seconds to sort the predictions'.format(timeit.default_timer() - start_time)

        for node_id in top_k:
            human_string = label_lines[node_id]
            score = predictions[0][node_id]
            print('%s (score = %.5f)' % (human_string, score))

        print '********* Session Ended *********'

        if cv2.waitKey(1) & 0xFF == ord('q'):
            sess.close()
            break

camera.release()
cv2.destroyAllWindows()

EDIT 2

经过一番摆弄后，我偶然发现图量化 and 图变换这些就是所取得的成果。

原图：87.4MB

量化图：87.5MB

转换后的图：87.1MB

八位计算：22MB但遇到this使用时。

我最近添加了使用 TensorFlow for Poets 训练较小 Mobilenet 模型的选项：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/docs_src/tutorials/image_retraining.md#other-model-architectures

这可能有助于加快分类速度，但会牺牲一定的准确性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow和OpenCV实时分类的相关文章

使用 openCV 对图像中的子图像进行通用检测

免责声明我是计算机视觉菜鸟我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子我的用例有点不同因为我不希望它是具体的而且我不确定如何做到这一点如果可能的话但我感觉应该如此我有大量图像数据集有时其中一些图像是数据集的
如何使用Android opencv使图像的白色部分透明

我无法链接超过 2 个网址因此我将我的照片发布到此博客请在这里查看我的问题 http blog naver com mail1001 220650041897 http blog naver com mail1001 220650041
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

如何从csv文件中读取自定义格式的日期？

我正在解析一个 csv 文件其数据为 03 10 2016 18 00 00 2 6 当我阅读文件创建架构时如下所示 StructType schema DataTypes createStructType Arrays asList
如何在 rglplot3d 中绘制曲面

所以我有这段代码可以产生精确的表面 f function x y z x 2 3 y 2 exp x 2 y 2 plot3d f col colorRampPalette c blue white xlab X ylab Y zlab Z
C# 将日期时间转换为特定格式

我想将日期时间转换为指定格式 Wed Aug 01 2012 14 37 50 GMT 0530 India Standard Time 实际上我想在网页上使用 Jquery 显示计时器所以我尝试了一些我知道的格式并找到了一些来自htt
稀疏向量之和：缺陷还是特征？

我最近在 MATLAB R2022a 中偶然发现了以下行为 gt gt a sparse 1 2 1 a 1 2 1 gt gt b sparse 2 1 18 b 2 1 18 gt gt a b ans 2 1 18 1 2 1 2 2
如何将额外意图传递给两项活动

我有一个应用程序在第一个活动中询问第二页上的人名它在句子中显示该名称我想在第三个第四或第九个活动中使用该名称我如何正确声明它公开并调用它我何时何地需要它这是我发送的代码 Main public class MainActivity
Android 中的线程处理长时间运行的进程

好吧这是我的问题我想学习 AsyncTask Threading 和 Handler 来处理长时间运行的任务我使用了 Android Cook Book 和 New Boston Android 教程但我无法使其工作我需要更改进度
使用动态 ID 选择 Multiple SelectManyCheckBox 中的所有项目

我想使用 JSF 顶部的 PrimeFaces 组件来选择某些复选框组中的所有复选框我的代码是这样的
获取 RecyclerView 中的可见项

我需要知道哪些元素当前显示在我的 RecyclerView 中没有相当于OnScrollListener onScroll ListView 上的方法我尝试与View getGlobalVisibleRect 但是这个 hack 太丑陋
以编程方式登录站点

这可能听起来很愚蠢但是我们可以通过传递用户凭据用户 ID 和密码以编程方式登录 Linkedin 等网站吗我不是在谈论使用 OAuth 或其他机制 Edit 您可以使用脚本以这种方式登录许多站点我通常更喜欢使用 Beautiful
UITextView - 设置字体不适用于 XCode 5 上的 iOS 6

我正在为我的用户界面使用故事板我之前使用的是 XCode 4 6 并在 iOS 6 上发布此后我使用 XCode 5 更新到 iOS 7 并更新了 Storyboard 以与 XCode 5 很好地配合但我有一个问题 UITextVi
在 React 的 useEffect() 中获取数据返回“未定义”

我正在尝试从数据库中获取数据这是一个获取请求只要我在异步函数中使用获取的数据一切都可以正常工作但除此之外它只是返回未定义我究竟做错了什么感谢您的帮助 const accountInfos setAccountInfos us
创建一个新文件，文件名包含循环变量，python [重复]

这个问题在这里已经有答案了我想在循环上运行一个函数并且想将输出存储在不同的文件中以便文件名包含循环变量这是一个例子 for i in xrange 10 f open file i dat w f write str func i
Chrome 和 CSS 属性选择器

我有以下 HTML 代码我想用 css 格式化无法更改的数据格式来自 xml 我必须为具有不同属性值的元素赋予不同的样式我想使用 CSS 属性选择器 body background color black s text decorat
如何在 Grails 脚本中访问服务？

关于 create script run script 的文档很少所以我想知道是否可以在 grails 脚本中注入使用域类在普通的 Grails 类中我可以注入如下服务定义我的服务但我不确定 grails 脚本中的位置要在脚本
jQuery，如何在 .load() 之后重新绑定 html 元素

我有一个 html 组件单击按钮后将重新加载该组件组件的某些元素绑定到单击和悬停处理程序一切工作正常直到 load 调用函数来重新加载组件加载组件的元素未绑定到相应的处理程序此时我将 js 脚本放在组件的末尾以便它绑定元素
Flask 中的一对一关系

我正在尝试使用 SqlAlchemy 在 Flask 中创建一对一关系我按照之前的post我创建了如下类 class Image db Model tablename image image id db Column db Integer
使用 writeAttribute() 方法使用 XMLWriter 进行 php XML 导出问题

我正在将表数据导出到 xml 中其中在内容列中包含多语言内容并混合了 html 例如 xmlWriter gt writeAttribute value contents record name testing contents Just
JsFiddle 上的鼠标事件不起作用？

我的小提琴在这里但我不明白为什么它没有在 onmouseout 事件上调用我的函数 http jsfiddle net foreyez Xf6LW 有任何想法吗工作正常您只需将函数放在文档的头部或元素位于 DOM 中之后的主体中即
如何使用 Telethon bot API 获取频道实体？

我无法使用 Telethon Bot 获取对话框因为该方法仅适用于客户端因此当我尝试使用其 id 访问实体时我收到错误如果我无法解析所有通道并且无法通过 id 访问它们我该如何访问实体通道我想解析来自私人群组的消息并使用 T
Tensorflow和OpenCV实时分类

我正在测试机器学习水域并使用TS成立模型来重新训练网络以对我想要的对象进行分类最初我的预测是在本地存储的图像上运行的我意识到从文件中取消持久化图形需要 2 5 秒的时间并且大约在同一时间运行实际的预测此后我调整了我的代码以合并来

Tensorflow和OpenCV实时分类

Tensorflow和OpenCV实时分类 的相关文章

随机推荐

热门标签

Tensorflow和OpenCV实时分类的相关文章