MatLab 分类数据中的缺失数据处理

2023-12-29

我正在尝试将我的数据集放入 MATLAB[ranked,weights] = relieff(X,Ylogical,10, 'categoricalx', 'on')函数对我的预测特征的重要性进行排名。这dataset<double n*m> has n观察和m离散（即分类）特征。碰巧我的数据集中的每个观察值（行）都至少有一个 NaN 值。这些 NaN 表示数据集中未观察到的预测变量值，即缺失或为空的预测变量值。（数据集没有损坏，只是不完整。）

救济（）使用下面的此函数删除任何包含 NaN 的行：

function [X,Y] = removeNaNs(X,Y)
% Remove observations with missing data
NaNidx = bsxfun(@or,isnan(Y),any(isnan(X),2));
X(NaNidx,:) = [];
Y(NaNidx,:) = [];

这并不理想，尤其是对于我的情况，因为它让我X=[] and Y=[]（即没有观察结果！）

在这种情况下：

1)将用随机值替换所有 NaN，例如99999，帮忙吗？通过这样做，我为所有预测器特征引入了新的特征状态，所以我认为它并不理想。

2)或者用相应特征列向量的模式（如下）替换 NaN 在统计上更合理？（为了清楚起见，我没有进行矢量化）

function [matrixdata] = replaceNaNswithModes(matrixdata)

for i=1: size(matrixdata,2)
cv= matrixdata(:,i);
modevalue= mode(cv);
cv(find(isnan(cv))) = modevalue;
matrixdata(:,i) = cv;
end

3)或者任何其他对“分类”数据有意义的合理方式？

P.S: 这个链接 http://www.dtreg.com/MissingValues.htm给出了处理缺失数据的可能方法。

我建议使用表格而不是矩阵。然后，您可以使用 ismissing（针对整个表）和 isundefined 等函数来处理分类变量的缺失值。

T = array2table(matrix);
T = standardizeMissing(T);  % NaN is standard for double but this 
                            % can be useful for other data type
var1 = categorical(T.var1);
missing = isundefined(var1);
T = T(missing,:);           % removes lines with NaN
matrix = table2array(T);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MATLAB

NaN

MatLab 分类数据中的缺失数据处理的相关文章

以间隔对包含 np.nan 的值进行分组

我有一个包含零一和 np nan 的 pandas 系列 import pandas as pd import numpy as np df1 pd Series 0 0 0 0 0 1 1 1 0 0 0 np nan np nan 1
MATLAB 中时间戳过滤器的优化 - 处理非常大的数据集

我正在 MATLAB 中编写一个程序必须使用 MATLAB 并且不能真正使用 MEX 来过滤大量数据我需要实现的过滤器之一要求我将时间戳向量与其他时间戳不会出现的已知不良时间列表进行比较一个典型的时间戳向量有大约 2 000 00
两个 y 轴与相同的 x 轴[重复]

这个问题在这里已经有答案了可能的重复在单个图中绘制 4 条曲线具有 3 个 y 轴 https stackoverflow com questions 1719048 plotting 4 curves in a single plo
Matlab - 如果值包含xxx，则删除元胞数组中的行

在 Matlab 中如何删除包含变量字符串的元胞数组中的元胞假设我的元胞数组是 C svnTrunk RadarLib radarlb utilities scatteredInterpolant m C svnTrunk RadarL
如何使用matlab生成不同频率的正弦波？

对于我的项目我需要使用 matlab 生成一个正弦波它有 100 000 个样本并且频率在每 10 000 个样本后随机变化采样率和频率可以根据方便而定 matlab中有没有函数可以生成这个好的另一个例子生成 5 个随机频率 r
在另一列中添加具有特定条件的一列，如 excel 的 sumif

我有一个像这样的矩阵 A 1 2 2 3 3 4 4 5 5 6 6 8 7 9 8 5 9 4 现在我想添加第二列条件是如果 limit 0 interval 3 且 limit limit interval 或者换句话说当第 1 列
如何在 Matlab 中使用谷歌翻译？

我正在编写一个程序使用 Matlab 列出电影字幕文件中的所有唯一单词现在我有一个独特的单词列表我想将其翻译成我的语言并在观看电影之前了解其含义有谁知道如何在 Matlab 中使用 Google Translate 以便完成我的脚本
Python 函数句柄 ala Matlab

在 MATLAB 中可以创建function handles http www mathworks co uk help techdoc ref function handle html与类似的东西 myfun arglist body 这
MATLAB 中的多个捕获组

我有一个包含数字或字母的字符串a 可能紧随其后的是r or l 在 MATLAB 中以下正则表达式返回为 gt gt regexp 10r 0 9 a l r match ans 10r 我希望10 and r分开因为我有两个捕获组有
计算 Dataframe 中具有 1 个或多个 NaN 的行数

我有以下内容 print df isna sum 这给了我 city 2 country 0 testid 0 house 1807 house number 248 po box 1845 zipcode 260 road 132 sta
使用 MATLAB 进行线路跟踪

我有一个图像我想将其转换为逻辑图像包括线条为黑色背景为白色当然可以使用阈值方法来实现这一点但我不想使用这种方式来做到这一点我想通过使用线路跟踪方法或类似的方法来检测它这是关于视网膜血管检测的我找到了一个article ht
MATLAB 特征函数

我很好奇哪里可以找到完整的描述FEATURE功能它接受哪些论点没有找到文档我只听说过memstats and getpid 还要别的吗 gt gt which feature built in undocumented 注意更完整的
括号中的波形符字符

在 MATLAB 中以下代码执行什么操作 m func returning matrix 波浪号运算符的作用是什么在 Matlab 中这意味着不要将函数中相应的输出参数分配到赋值的右侧因此如果func returning mat
matlab中的排列函数是如何工作的

这是一个有点愚蠢的问题但我似乎无法弄清楚排列在 matlab 中是如何工作的以文档为例 A 1 2 3 4 permute A 2 1 ans 1 3 2 4 到底是怎么回事这如何告诉 matlab 3 和 2 需要交换哇这是我迄
matlab中的正则逻辑回归代码

我正在尝试正则化 LR 在 matlab 中使用以下公式很简单成本函数 J theta 1 m sum y i log h x i 1 y i log 1 h x i lambda 2 m sum theta j 梯度 J theta t
如何在放置颜色条后保持子图大小不变

假设我们有一个 1 2 子图我们在其中绘制了一些图形如下所示 subplot 1 2 1 surf peaks 20 subplot 1 2 2 surf peaks 20 然后我们要添加一个颜色条 colorbar 我不希望结果中的正
如何在 matlab 中创建由多个 3d 图像数据数组组成的数组

我正在阅读 15 张图片imagedata imread imagename jpg 它的大小总是320 by 320 by 3 如何将数据放入数组中使用 for for 循环以便在访问新数组的第一个元素时获得输入的第一个图像的 RGB
如何在文本集中创建所有字符组合？

例如我有这样的文本集第 1 栏 a b 第 2 栏 l m n 第 3 栏 v w x y 我想将它们组合起来以获得如下输出 alv alw alx aly amv amw amx amy 这将输出 24 种文本组合如果我只使用前两列
在matlab中绘制给定区域内（两个圆之间）的向量场

我想在 Matlab 中绘制下面的向量场 u cos x x 0 y y 0 v sin x x 0 y y 0 我可以在网格中轻松完成例如 x 和 y 方向从 2 到 2 x 0 2 y 0 1 x y meshgrid 2 0 2 2
正确使用 fft2 和 fftshift 进行着色形状

我正在尝试从 Trucco Verri 文本 3d 计算机视觉入门技术中看到的着色算法重新创建经典形状但我很难理解 matlab 中的 fft 函数本质上我需要使用可积性约束来获取图像的深度 Z 我不确定在这种情况下何时使用 fft

随机推荐

无法使用 SSMS 通过 Windows 身份验证连接到本地 SQL Server

我正在尝试使用 SSMS 使用 Windows 身份验证登录到安装在 Windows 7 上的本地 SQL Server 2005 我尝试使用各种服务器名称例如 localhost SQL ANANTH PC etc 当我尝试时出现此错误
Wordpress ACF - 日期格式

我使用日期字段将日期呈现为 11 15 2014 但我还想在页面的其他位置显示日期例如 2014 年 11 月 15 日是否可以以两种不同的格式呈现日期您可以使用get field然后您可以将日期格式更改为您想要的任何格式 date
ES6 Promise 中的数据只有在我点击它之后才会呈现在页面上？

我在我的应用程序中使用 Ionic 并连接到 Firebase 来提取数据我在工厂中创建了一个承诺将数据拉下来并认为一旦完成它应该在屏幕上呈现数据但在触摸屏幕之前我什么也得不到我没有收到任何错误数据确实出现了 Factory
jpa 实体 bean 的默认范围是什么？它有什么帮助？

我的项目中的所有实体 bean 看起来都是这样的我想知道对实体使用 scope prototype 的意义是什么 Component Scope prototype Entity Table name SOME BEAN SOME CON
如何在iPhone锁屏状态下开始播放音乐

我在用UILocalNotification如果应用程序未运行则提醒用户MPMusicPlayerController播放 iPod 音乐和MPMoviePlayerController播放广播流 url 根据苹果文档如果 iPhone
以编程方式使用尺寸类别

我希望观看了所有相关的 WWDC2014 会议视频并阅读了文档所以这个问题主要是为了证实我的怀疑但请赐教我想做的是使用自动布局为视图添加动画效果这本身并不是问题但这些动画的端点随着不同的方向而变化我想我也许可以使用尺寸类来自
无法配置 Firebase InstanceID

您好我正在尝试在我的应用程序中包含 firebase 并遵循文档当我尝试进行 google 登录时出现无法配置 Firebase InstanceID 错误请建议如何克服此错误有两件事需要检查希望其中一项能为您解决确保您的捆绑
无法从 Xcode 运行 Instruments

我最近升级到 Snow Leopard 从那以后我很难运行 Instrument 来从 Xcode 检测我的应用程序录制按钮将变灰并且什么也不会发生 Xcode 的控制台中也没有消息告诉我出了什么问题我曾经能够将其附加到进程或从仪器
如何使用 jQuery 在 IE 中附加样式表？

大家好我只是想创建一个插件我需要它对用户友好所以我想append the 标签上的head加载我的插件时用户页面的一部分它适用于所有其他浏览器不确定 IE9 IE7 和 IE6 但不适用于 IE8 我不知道我的插件出了什么问题所
在 CakePHP 中重写 php 应用程序

因此我很想使用 php 框架重写我的应用程序因为我认为这会让人们更容易参与并改进应用程序的设计 CakePHP 看起来是最好的 PHP Web 框架有人有这方面的经验吗从手动编写 PHP 到使用框架我应该考虑哪些注意事项不取决
写入 Mac OS X 10.7 中的“~/Library/Application Support”文件夹

我可以使用 NSFileManager 在 Mac OS X 10 5 和 10 6 中的 Library Application Support 中创建 XYZ 文件夹然而在 10 7 中它显示您无权将 XYZ 保存在文件夹应用
Enterprise Library 5.0 - 将自定义标记添加到 TextFormatter

我创建了一个自定义异常其中包含与我们的应用程序相关的数据我想确保在引发异常时记录这些数据并将其记录到事件日志中我尝试创建一个正在调用的自定义 TextFormatter 但不确定如何访问当前异常以便我可以将自定义信息添加到日志条目中
Google Vision ocr：垂直和水平线文本识别

我们正在使用 google Vision ocr 来收集收据中的文本在某些情况下收据上有一些垂直书写的文本例如增值税信息等问题是谷歌视觉仅有效地读取主方向例如水平方向的文本并丢弃在同一收据中以垂直方向而不是水平方向写入的所有
向下滚动并双击最后一个展开/折叠箭头时，TreeTableView 项目消失

在与一个TreeTableView我意识到当您向下滚动表格并双击最后一个展开折叠箭头时所有项目都会消失但是当您再次滚动时所有项目都会重新出现当然当你有足够的物品时就会发生这种情况因此垂直ScrollBar活跃以前有人遇到
为什么结构类型的编译时生成技术会阻止单独编译？

我正在读好吧略读杜博切特和奥德斯基的在 JVM 上编译结构类型 http infoscience epfl ch record 138931 files 2009 structural pdf并对以下说法感到困惑 Generative
Scala 隐式转换陷阱

EDIT好的 Drexin 提出了一个很好的观点使用隐式转换器时类型安全性的损失令人惊讶的结果一个不太常见的转换怎么样不会与 PreDef 隐式发生冲突例如我正在 Scala 中使用 JodaTime 很棒的项目在定义隐式的同
如果某些数据包含空格，如何读取逗号分隔的数据文件

我正在尝试读取使用逗号作为分隔符的数据文件如下所示 IPE 80 764 80 14 8 49 IPE 100 1030 171 15 92 但是如果我阅读使用 READ 1 var1 var2 var3 var4 它将 IPE 和 80
如何为 ASP.NET Core Web API 应用程序的程序和启动 cs 文件编写单元测试

有没有办法编写单元测试ProgramASP NET Core Web API 的 cs 文件以及类似的startup类只是为了显示整个应用程序的更多代码覆盖率目前显示覆盖率为 0 您可以在单独的调用中提取配置并将它们公开到 func 中
当我使用requirements.txt时，pip没有从virtualenv中安装到site-packages目录

我对使用 virtualenv 运行 Python 还比较陌生所以这可能是一个简单的解决方案但我一生都无法弄清楚发生了什么我运行的是 Windows 7 professional x64 安装了 Python 2 7 5 我已经安装了
MatLab 分类数据中的缺失数据处理

我正在尝试将我的数据集放入 MATLAB ranked weights relieff X Ylogical 10 categoricalx on 函数对我的预测特征的重要性进行排名这dataset

MatLab 分类数据中的缺失数据处理

MatLab 分类数据中的缺失数据处理 的相关文章

随机推荐

热门标签

MatLab 分类数据中的缺失数据处理的相关文章