算法选择建议

2023-12-28

我必须做一个项目,尝试扫描车辆的形状并检测它是什么类型的车辆,扫描将使用称为“车辆扫描仪”的传感器进行,它们只有 50 束光,每束都有接收器和发射器如图所示:

我从传感器获得每个光束的原始状态(阻挡或解锁),通过连续扫描,我们可以创建可能非常低分辨率的车辆图像。

我的问题是我可以使用什么算法/技术来检测和识别车辆的形状,我们想要计算车轮的数量,如果可以的话,尝试识别该形状是汽车、卡车还是皮卡等,在至少我们想数一下轮子。

我正在考虑训练一个神经网络,但也许是一种我可以使用但我不知道的模式检测的更简单的方法。 任何其他建议/建议将不胜感激


标准神经网络将是一个合理的选择并且可以工作,但是卷积神经网络(CNN)可能是最好的选择(请参阅此快速解释 http://deeplearning.net/tutorial/lenet.html)。 CNN 非常适合图像识别,因为它们的稀疏连接允许空间局部相关性(即它们考虑了彼此非常接近的输入之间的关系)这意味着它们比标准神经网络更有效地推广到新的数据集,并且训练速度也更快。

为了检测车轮的数量,可以将低分辨率输入分成许多重叠的“车轮大小”的补丁,然后使用每个补丁作为已被训练来检测车轮的 CNN 的输入。由于 CNN 有可能对同一个轮子周围的多个补丁返回 true,因此需要实现邻近检查器,以便每个本地“真实”补丁仅导致总计数器的一次增量。这可以通过识别具有最高输出节点激活的本地补丁,并防止该补丁周围的任何其他补丁影响总计数器来完成。

事实上,识别汽车或卡车的形状是一项更简单的任务,因为整个图像可以输入到 CNN 中,并在一系列预先分类的车辆图像上进行训练。可以通过以下方式解决速度的挤压/拉伸效应扩充训练数据集具有随机挤压/拉伸变形。有关如何在 CNN 中设置参数的建议,请参阅如何确定用于图像分类的卷积神经网络的参数。 https://stackoverflow.com/questions/24509921/how-do-you-decide-the-parameters-of-a-convolutional-neural-network-for-image-cla/25421946#25421946

作为 CNN 有效性的证明,请查看以下结果:2012 年大规模视觉识别挑战赛 (LSVRC) http://www.image-net.org/challenges/LSVRC/2012/results.html。 LSVRC 是一项图像分类竞赛,参赛者竞相在任意选择的 256x256 图像上实现最低的分类错误。获胜的网络名为 Supervision,通过使用 CNN 模型,其误差几乎是其最接近的竞争对手的一半。 CNN 还保持着许多文本识别任务的最高精度记录,例如MNIST数字识别任务 http://yann.lecun.com/exdb/mnist/该模型的准确率达到 99.8%,这一准确率可与人类识别率相媲美。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

算法选择建议 的相关文章

  • 在 RESTful Web 服务中实现注销

    我正在开发一个需要注销服务的移动应用程序 登录服务是通过数据库验证来完成的 现在我陷入了注销状态 退一步 您没有提供有关如何在应用程序中执行身份验证的详细信息 并且很难猜测您在做什么 但是 需要注意的是 在 REST 应用程序中 不能有会话
  • 测量窗口偏移

    有没有一种方法可以测量 jQuery 中窗口的偏移量 以便我可以比较 固定 元素和相对定位元素的位置 我需要能够知道窗口滚动了多远 以便我可以使用该图来计算固定元素的高度 相对于视口顶部 和相对对象的高度 相对于顶部 之间的差异文件的内容
  • MySQL 查询计算上个月

    我想计算上个月的订单总额 我收到了从当前日期获取当月数据的查询 SELECT SUM goods total AS Total Amount FROM orders WHERE order placed date gt date sub c
  • 没有输入的 jQuery 日期选择器

    我有一个相当复杂的网络应用程序 我想向其中添加一些日期选择 UI 我遇到的问题是我无法从文档中弄清楚如何真正控制日期选择器的出现方式和时间 不涉及任何表单元素 不 我不会添加秘密表单字段 因此简单的开箱即用方法根本行不通 我希望有人可以提供
  • PrimeFaces 对话框参考父级

    我有一个 xhtml 页面 显示带有条目的数据表 我还有一个用于插入新条目的按钮 该按钮显示一个包含表单的对话框 插入表格用作
  • 类型或命名空间“MyNamespace”不存在等

    我有通常的类型或命名空间名称不存在错误 除了我引用了程序集 using 语句没有显示为不正确 并且我引用的类是公共的 事实上 我在不同的解决方案中引用并使用相同的程序集来执行相同的操作 并且效果很好 顺便说一句 这是VS2010 有人有什么
  • php 数组中出现意外的 json 输出结构

    我正在尝试转换动态数据 如何从 PHP 获取此 JSON JSON 122240cb 253c 4046 adcd ae81266709a6 item 0 3 这就是我所做的 但它不起作用 PHP json array 122240cb 2
  • 现代编译器是否优化乘以 1 和 -1

    如果我写 template
  • 将第三个表链接到多对多关联中的桥接表

    设计这个数据库的正确方法是什么 这是我设置表格的方式 我在名为 教师 的表和名为 仪器 的表之间存在多对多关系 然后我有一个连接两者的桥接表 我想将另一个表与 BRIDGE 表关联起来 意思是乐器 老师的组合 该表有 3 行 指定老师可以教
  • Amazon RDS for SQL Server 是否支持 SSIS?

    从谷歌搜索中读到一些相互矛盾的答案 不确定答案是是 否还是可能 我觉得读的时候已经很清楚了this http docs aws amazon com AmazonRDS latest UserGuide CHAP SQLServer htm
  • NSArrayController 无需将大型数据集加载到数组中

    我想使用 NSArrayController 向 NSTableView 提供数据 我面临的问题是我不想将所有数据预先加载到数组中 然后使用数组控制器setContent 方法 我的数据模型是一个管理数百万条记录的大型现有代码库 它包含有效
  • 如何在 Angular 4 中翻译 mat-paginator?

    你知道如何在 Angular 中翻译 每页项目 吗mat paginator标签 这mat paginator是材料设计中的一个元素 您可以使用MatPaginatorIntl为了这 威尔 豪厄尔制作 https github com an
  • 使用velocity.js制作可拖动元素的动画

    我正在使用velocity js 为用户拖动的可拖动 SVG 元素设置动画 然而 velocity js 将先前的 mousemove 坐标排队并通过所有后续的 mousemove 坐标进行动画处理 我想要的是velocity js 不要对
  • 如何修复:“无法解析类型 java.lang.CharSequence。它是从所需的 .class 文件间接引用的”消息? [复制]

    这个问题在这里已经有答案了 我正在尝试使用这个字符串 amountStr amountStr replace replace replace 但我收到一条错误消息 我知道我收到的错误消息是因为我刚刚发布的字符串已过时 所以我想知道该字符串的
  • 如何在 JFreeChart 中设置多个系列的线条粗细?

    我创建了很多图表 在他们每个人中我都需要打电话 renderer setSeriesStroke i new BasicStroke 2 0f 对于每个系列 renderer is chart getXYPlot getRenderer 我
  • 如何在 OSX 上安装 LaTeX .sty 文件?

    我设置了一个 LaTeX 项目 tex documents some file tex support todonotes sty where some file tex uses todonotes usepackage colorinl
  • 使用 WGL 创建现代 OpenGL 上下文?

    我正在尝试使用 Windows 函数创建 OpenGL 上下文 现代版本 基本上代码就是 创建窗口类 注册班级 创建一个窗口 choose PIXELFORMATDESCRIPTOR并设置它 创建旧版 OpenGL 上下文 使上下文成为当前
  • 禁用允许文本选择的

    残疾人可以吗
  • PyAudio ErrNo 输入溢出 -9981

    我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording
  • 探查器模板可以迁移到较新版本的 SQL Profiler 吗?

    是否可以将 Profiler 模板迁移到较新版本的 SQL Server 就我而言 我想将 SQL 2008 模板带到 2012 年 我尝试过 1 直接文件复制和 2 导出 导入 在这两种情况下 旧模板都会运行 但无法修改 修改后会出现以下

随机推荐

  • 减少 Swing 应用程序中耦合的设计模式

    大家好 我目前正在开发 Java Swing 应用程序 并且正在寻找一些指导 该应用程序相当小 但我注意到 随着代码库变得越来越大 我的对象图中存在大量耦合 我对 Swing 比较陌生 但我已经编程了足够长的时间 知道它的发展方向 我遇到的
  • Django 中间件并获取视图名称?

    我正在尝试用 Django 编写我的第一个中间件 class RefreshBalance def process view self request view func view args view kwargs pass 我想检测视图是
  • volatile int 比 AtomicInteger 快吗

    我目前正在做一个示例练习 我发现一个奇怪的观察结果 如果我用易失性程序替换 AutomicInteger 则运行速度会更快 注意 我只进行读操作 code import java util ArrayList import java uti
  • 如何访问 Backbone 视图中的父元素?

    在 Backbone 模型视图中 似乎 this el parent 不起作用 从视图中选择父元素的最佳方法是什么 我正在使用设置 eltagName li 为了景观 默认情况下 Backbone 分配一个空的div到你的视图中 你无法访问
  • 如何使用opencv python解决theta迷宫?

    I have to find shortest path from the center of the maze to the outermost circle I have to solve this problem using open
  • 检查 WHERE 子句中参数是否为 NULL

    我在执行一个存储过程时遇到了麻烦 该过程需要永远执行 它相当大 我可以理解我需要一些时间 但这个持续了将近 20 分钟 经过一些调试和研究后 我注意到替换这部分WHERE clause p DrumNo IS NULL OR T ORDER
  • 获取不同项目及其数量的列表

    我有一个对象 它有很多属性 但唯一需要担心的两个是 myobject ID这是一个int myobject Names这是一个HashSet 然后我有一个List这些对象看起来与此类似 List
  • 如何从 Jupyter Notebook 中的 .py 文件调用函数?

    我不想在每个 Jupyter Notebook 文件中编写相同的函数 如果我只需要编辑一次函数而不需要在每个 ipynb 文件中进行编辑 那就更容易了 问题是 如果我编辑 py 文件 我必须重新启动内核 这将重新启动一切 有什么方法可以简单
  • 在 XML 中保留原始换行符类型(\r 与 \r\n)

    我有一个应用程序 我想在其中使用 XML 文件来存储 1 文档的原始文本 以及 2 使用字符偏移量 指向 原始文本的多个实体 例如
  • 从代码中取消 Apache Flink 作业

    我现在的情况是想从代码中停止 取消 flink 作业 这是在我的集成测试中 我正在向我的 flink 作业提交任务并检查结果 当作业异步运行时 即使测试失败 通过 它也不会停止 我想在考试结束后在车站工作 我尝试了一些事情 我在下面列出 获
  • 集合已修改;枚举操作可能无法执行。当更新哈希表的值时

    当我尝试更新值时 此代码抛出异常 第一个值仅更新 然后抛出异常 集合已修改 枚举操作可能无法执行 Hashtable hh new Hashtable hh Add val 1 null hh Add val 2 null foreach
  • 如何将不规则张量与 tf.data 和 TFRecords 一起使用?

    Tensorflow 最近发布了 Ragged Tensors https www tensorflow org guide ragged tensors https www tensorflow org guide ragged tens
  • 在 Canvas WPF 上绘制一条线后在 A 点和 B 点上显示文本框

    在我的项目中 我使用此代码在画布上绘制线条 List
  • 在react jsx中显示html标记

    想要在我的模板中直接显示 html 标记 这是我正在编写要显示的 html 代码的文件 我想显示所有的 html 元素 import React from react const html div ul li 1 li li 2 li li
  • (a*+b*) 生成的字符串是什么类型

    除了任意数量的 a 和 b 的字符串 如 aa 或 bb 之外 正则表达式 a b 是否会包含类似的字符串 ab 或任何以 b 结尾的字符串 a b 与 a b 相同吗 我对正则表达式 a b 生成的字符串有点困惑 如果有人可以提供帮助 我
  • 处理程序与线程

    我想知道一次 我读过很多地方 当我想做一些 长时间操作 时 我应该使用Handler 但我不明白为什么 我所有的 长时间操作 都用常规线程包围 并且工作正常 我为什么要使用Handler为了这 我唯一需要使用的时间Handler是 当我必须
  • 非静态数据成员类推导

    我正在尝试解决类型推导问题 这是演示代码 使用函数重载来定义传递的变量是 int 还是 double std string tcast const double x return Floating Point std string tcas
  • 单击按钮时显示/隐藏元素

    我有两个按钮 显示 和 隐藏 我有一个图像 所以我想知道当我单击 隐藏 按钮时 该图像会消失 当我单击 显示 按钮时 它会再次出现 我不想只使用 CSS 或 JQUERY Javascript 来完成此操作 如果有人可以提供帮助 非常感谢
  • Thrift HBase 客户端 - 支持过滤器和协处理器

    遗憾的是 我的 hbase 客户端语言是 Python 我现在使用 happybase 它基于 thrift AFAIK 我知道到目前为止 thrift 仍然不支持过滤器 协处理器 如果我错了 请纠正我 有人可以给我指出任何可以跟踪计划 进
  • 算法选择建议

    我必须做一个项目 尝试扫描车辆的形状并检测它是什么类型的车辆 扫描将使用称为 车辆扫描仪 的传感器进行 它们只有 50 束光 每束都有接收器和发射器如图所示 我从传感器获得每个光束的原始状态 阻挡或解锁 通过连续扫描 我们可以创建可能非常低