确定隐马尔可夫模型中隐藏状态的数量

2024-02-08

我正在学习隐马尔可夫模型,用于对 t 个图像帧序列中的运动进行分类。

假设每个帧有 m 个维度的特征。然后我将它聚集成一个符号(用于可观察的符号)。我为 k 类创建 k 个不同的 HMM 模型。

那么,如何确定每个模型的隐藏状态数量以优化预测?

顺便说一句,我的方法正确吗?如果我误解了如何使用它,请纠正我:)

谢谢 :)


“我的做法已经正确了吗?”

你现在的做法是正确的。几周前我也做了同样的事情并问了同样的问题。我已经构建了一个手势识别工具。

你说你有 k 个类想要识别,所以是的,你将训练 k 个 HMM。对于每个 HMM,您运行前向算法并接收P(HMM|observation)对于每个隐马尔可夫模型(或者维特比解码也是可能的)。然后你选择概率最高的那个。

将 m 维特征向量视为单个观察符号也是正确的。根据向量的外观,您可能需要使用连续隐马尔可夫模型或离散隐马尔可夫模型。使用离散数据进行训练通常会越来越容易,只需很少的训练数据。因此,如果您的特征向量空间是连续的,您可能需要考虑离散化以使所有值离散(例如通过统一类)。 关于离散性的问题是:您将有多少类观察?

“如何确定每个模型的隐藏状态数量以获得最佳预测?”

但是,我无法完全回答您有关隐藏状态数量的实际问题。从我在其他领域学到的知识来看,似乎需要进行大量的基准测试和测试。例如。在语音识别中,我们对每个音素(人声)使用 3 个 HMM 状态,因为声音在开头、中间和结尾听起来不同。然后每个不同的音素得到一个三元组。但这当然是工程。

在我自己的应用程序中,我是这样想的:我想定义手势并将它们与方向相关联。喜欢open_firefox = [UP, RIGHT]。所以我决定对所有四个方向使用四个隐藏状态。 我想找出最佳的状态数量很大程度上取决于工程和尝试不同的事情。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

确定隐马尔可夫模型中隐藏状态的数量 的相关文章

  • 使用 sklearn 进行稀疏主成分分析

    我正在尝试从中复制一个应用程序paper https people eecs berkeley edu elghaoui Pubs SPCAhandbookSV pdf 作者下载的地方20个新闻组 http scikit learn org
  • 将 RGB 转换为灰度/强度

    当从 RGB 转换为灰度时 据说应该对 R G 和 B 通道应用特定的权重 这些权重是 0 2989 0 5870 0 1140 据说这是因为人类对这三种颜色的感知 感受不同 有时也有人说这些是用于计算 NTSC 信号的值 但是 我在网上没
  • 为什么我的精确率-召回率和 ROC 曲线不平滑?

    我有一些标记为 0 或 1 的数据 我正在尝试使用随机森林来预测这些类别 每个实例都标有 20 个用于训练随机森林的特征 约 30 000 个训练实例和约 6000 个测试实例 我使用以下代码绘制精确召回率和 ROC 曲线 precisio
  • 稀疏光流和密集光流有什么区别?

    很多资源都说光流算法有两种类型 而Lucas Kanade是一种稀疏技术 但我找不到稀疏和稠密的含义 有人可以告诉我密集光流和稀疏光流有什么区别吗 简而言之 稀疏技术只需要处理整个图像中的一些像素 密集技术则处理所有像素 密集技术速度较慢
  • 机器学习的周期性数据(例如度角 -> 179 与 -179 相差 2)

    我使用 Python 进行核密度估计 并使用高斯混合模型对多维数据样本的可能性进行排名 每一条数据都是一个角度 我不确定如何处理机器学习的角度数据的周期性 首先 我通过添加 360 来删除所有负角 因此所有负角都变成了正角 179 变成了
  • 期望最大化抛硬币的例子

    我最近一直在自学期望最大化 并在这个过程中给自己举了一些简单的例子 http cs dartmouth edu cs104 CS104 11 04 22 pdf http cs dartmouth edu cs104 CS104 11 04
  • 神经网络的激活函数选择[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我们可以对神经网络的隐藏层和输出层使用不同的激活函数吗 使用这种方案有什么明显的优势吗 对于网络的最后一层 激活单元也取决于任务 分类
  • 使用 scikit-learn 在朴素贝叶斯分类器中混合类别数据和连续数据

    我正在使用 Python 中的 scikit learn 开发分类算法来预测某些客户的性别 除此之外 我想使用朴素贝叶斯分类器 但我的问题是我混合了分类数据 例如 在线注册 接受电子邮件通知 等 和连续数据 例如 年龄 长度 会员资格 等
  • 如何使用WordNet或与wordnet相关的类别来实现基于类别的文本标记?

    如何使用wordnet按单词类别标记文本 java作为接口 Example 考虑以下句子 1 计算机需要键盘 显示器 CPU才能工作 2 汽车使用齿轮和离合器 现在我的目标是 例句必须标记为 第 1 句话 电脑 电子键盘 电子中央处理器 电
  • sklearn:如何在 sknn 中重置回归器或分类器对象

    我定义了一个回归器 如下所示 nn1 Regressor layers Layer Rectifier units 150 Layer Rectifier units 100 Layer Linear regularize L2 dropo
  • 在Python中表示语料库句子的一种热门编码

    我是 Python 和 Scikit learn 库的初学者 我目前需要从事一个 NLP 项目 该项目首先需要通过 One Hot Encoding 来表示一个大型语料库 我已经阅读了 Scikit learn 关于 preprocessi
  • 为什么 scikit learn 的平均精度分数返回 nan?

    我的 Keras 模型旨在接收两个输入时间序列 将它们连接起来 通过 LSTM 提供它们 并在下一个时间步骤中进行多标签预测 有 50 个训练样本 每个样本有 24 个时间步 每个样本有 5625 个标签 有 12 个验证样本 每个样本有
  • Pytorch RuntimeError:张量 a (4) 的大小必须与非单维 0 处张量 b (3) 的大小匹配

    我使用的代码来自here https www learnopencv com image classification using transfer learning in pytorch 训练模型来预测印刷样式编号0 to 9 idx t
  • PyTorch 中的标签平滑

    我正在建造一个ResNet 18分类模型为斯坦福汽车使用迁移学习的数据集 我想实施标签平滑 https arxiv org pdf 1701 06548 pdf惩罚过度自信的预测并提高泛化能力 TensorFlow有一个简单的关键字参数Cr
  • 使用 to_categorical 转换 np.array 时出现内存问题

    我有一个像这样的 numpy 数组 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 我这样改造它以减少内存需求 x val x val asty
  • 计算边界框重叠的百分比,用于图像检测器评估

    在测试大图像中的对象检测算法时 我们根据地面实况矩形给出的坐标检查检测到的边界框 根据 Pascal VOC 挑战 有这样的 如果预测的边界框重叠更多 则认为它是正确的 超过 50 带有真实边界框 否则边界框 被认为是误报检测 多次检测是
  • 图像处理:什么是遮挡?

    我正在开发一个图像处理项目 我遇到了这个词闭塞在许多科学论文中 遮挡在图像处理中意味着什么 字典只是给出了一般的定义 谁能使用图像作为上下文来描述它们 遮挡意味着您想看到某些内容 但由于传感器设置的某些属性或某些事件而无法看到 它到底如何表
  • PyTorch 中的后向函数

    我对 pytorch 的后向功能有一些疑问 我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch
  • 如何在 Detectron2 中计算并集交集?

    我正在使用 Detectron2 进行对象检测 我已经注册了 pascalvoc 数据集并训练了一个检测模型 如何计算测试数据集的平均 IOU 我知道 detector2 有一个用于计算 IOU 的预定义函数 即 detectorron2
  • scikit-learn 适合大数据任务吗?

    我正在研究一项涉及使用机器学习技术的 TREC 任务 其中数据集由超过 5 TB 的 Web 文档组成 计划从中提取词袋向量 scikit learn有一组不错的功能似乎可以满足我的需求 但我不知道它是否能够很好地扩展以处理大数据 例如 是

随机推荐

  • brew 安装失败:curl(77) 设置证书验证时出错

    好的 我正在运行带有自制软件的旧 Mac 10 6 8 brew doctor 报告没有错误 我已经尝试过brew prune update 等 每次我尝试安装软件包时 都会收到此错误 curl 77 error setting certi
  • Web Essentials LESS 编译器没有给出错误消息

    使用 Visual Studio 2012 Update 2 Web Essentials 2 7 假设LESS有错误 保存文件时 预览窗格中会显示一条消息 上面写着 Compile Error See error list for det
  • 为 ggplot2 中的每个方面设置不同的轴限制,不使用刻度=“自由”

    我想要的一般解决方案是能够独立地为每个面指定任意轴限制 通过将秤设置为自由来获得基本功能 例如 ggplot diamonds aes x carat y price geom point facet wrap clarity nrow 4
  • Application.kt:未解析的参考:firebasemessaging

    我正在尝试更新firebase messaging到新版本8 0 0 dev 10 但是 我收到这些错误 Running Gradle task assembleDebug Application kt 5 27 Unresolved re
  • 在 MySQL 和 CodeIgniter 中使用 Match 和 Against

    我正在尝试在我的 codeIgniter 项目中实现搜索功能 我有一个名为 Product search 的表 使用以下命令在其中设置全文索引 ALTER TABLE product search ADD FULLTEXT prod tit
  • React循环通过json对象并显示数据

    我有一个演示here https stackblitz com edit react ts read json file index tsx 我有一个正在导入的简单 json 文件 我想循环遍历并在 div 中输出 json 数据 我可能想
  • 在支持多租户的 Django 中正确加载 Keras 模型

    我尝试在 django 中编写一个 REST api 它使用 Keras 模型返回预测 但是 那load model 函数需要一些时间来加载模型 我不希望我的用户必须等待这么长时间 每次初始化模型时 初始化模型的正确方法是什么 以便加载一次
  • 链接到 libcuda.so 时出现问题

    我被一个似乎很容易诊断和解决的问题所困扰 我有一个使用 CUDA 驱动程序 API 的 C 源文件 当我使用它编译时nvcc 可执行文件已生成并且可以正常运行 但是 当我尝试使用它来编译它时g 链接器抱怨对符号的未定义引用 usr lib
  • JSF 和 Spring 性能与较差的 JSP 性能

    我看到我的同事开发了一些 JSF 项目 这些项目在我看来速度非常慢 有人有同样的看法吗 我目前正在使用 jsp jstl 和 jQuery 作为 富 客户端 我想知道现代框架 jsf wicket tapestry 相对于旧的普通 jsp
  • 使用 XPATH 子字符串函数

    我需要帮助弄清楚这个 XPATH 子字符串函数 但我无法使用它 我尝试过这种方法的各种变体 a contains text Home href substring jsessionid 12 尝试从此标签获取 jsessionid 值 a
  • Web 服务与 WCF

    我正在从事 ASP NET 应用程序 NET 4 框架 设计 想了解使用 Web 服务与 WCF 技术的优缺点和最佳实践是什么 该应用程序最终将被外部客户端用来消费数据 您什么时候会使用 WebServices 什么时候会使用 WCF 其中
  • 如何以高质量保存绘图?

    我用情节制作的每张图表在保存之前看起来都很棒 所以图像看起来有点哑光 如果有意义的话 质量真的很差 有谁知道如何高质量保存它 您可以使用此基本图表作为示例 library plotly x lt c 1 100 random y lt rn
  • 使用 Apache 的 .htaccess 使子目录不受密码保护

    目前在我的服务器上 我的 Web 目录的根目录中有一个 htaccess 文件 AuthUserFile path to root www htpasswd AuthType Basic AuthName Economic Complexi
  • 架构问题:使用依赖注入导致垃圾 API

    我正在尝试创建一个类 它执行各种与数据库相关的低级操作 但为 UI 层提供了一个非常简单的界面 此类表示全部位于特定聚合根内的一堆数据 由单个 ID int 检索 构造函数有四个参数 public AssetRegister int cas
  • App_Data 文件夹中的图像未显示在浏览器中

    当我将图像 URL 属性设置为 App Data 文件夹中的 asp 图像控件时 图像显示在页面设计视图中 但不显示在浏览器中
  • JPA/Hibernate 中键“PRIMARY”的重复条目

    我有一个many to manymysql 数据库中的关系 Module
  • 变量前的美元符号

    我有这个示例代码 用于从现有数据框 my data 创建新数据框 new data new data NULL n 10 this number correspond to the number of rows in my data con
  • 我怎样才能在我的桌子上有一个圆形边框和边框折叠:折叠? [复制]

    这个问题在这里已经有答案了 我有以下内容 table style border 1px solid 999 thead tr style background color red th Weekday th th Date th th Ma
  • 如何将struct从合约A传递到合约B?最佳实践

    我发现这样 当创建一个具有结构的通用接口时 然后合约A和B继承该具有结构的接口 但我想知道是否还有其他方法 是否存在可以更新具有结构的合约的情况 pragma experimental ABIEncoderV2 pragma solidit
  • 确定隐马尔可夫模型中隐藏状态的数量

    我正在学习隐马尔可夫模型 用于对 t 个图像帧序列中的运动进行分类 假设每个帧有 m 个维度的特征 然后我将它聚集成一个符号 用于可观察的符号 我为 k 类创建 k 个不同的 HMM 模型 那么 如何确定每个模型的隐藏状态数量以优化预测 顺