R：如何将我的数据格式化为多项式 Logit？

2024-03-20

我正在 R 上复制一些 Stata 代码，我想使用以下命令执行多项式逻辑回归：mlogit函数，来自同名包（我知道有一个multinom函数于nnet但我不想用这个）。

我的问题是，使用mlogit，我需要使用以下方式格式化我的数据mlogit.data我不知道如何正确格式化它。将我的数据与文档和示例中使用的数据进行比较这个问题 https://stackoverflow.com/questions/9355535/how-should-i-format-my-data-for-the-r-mlogit-package，我意识到它不是同一个形式。

事实上，我使用的数据是这样的：

df <- data.frame(ID = seq(1, 10),
                 type = c(2, 3, 4, 2, 1, 1, 4, 1, 3, 2),
                 age = c(28, 31, 12, 1, 49, 80, 36, 53, 22, 10),
                 dum1 = c(1, 0, 0, 0, 0, 1, 0, 1, 1, 0),
                 dum2 = c(1, 0, 1, 1, 0, 0, 1, 0, 1, 0))

   ID type age dum1 dum2
1   1    2  28    1    1
2   2    3  31    0    0
3   3    4  12    0    1
4   4    2   1    0    1
5   5    1  49    0    0
6   6    1  80    1    0
7   7    4  36    0    1
8   8    1  53    1    0
9   9    3  22    1    1
10 10    2  10    0    0

而他们使用的数据如下：

         key altkey    A      B   C D
1  201005131      1  2.6 118.17 117 0
2  201005131      2  1.4 117.11 115 0
3  201005131      3  1.1 117.38 122 1
4  201005131      4 24.6     NA 122 0
5  201005131      5 48.6  91.90 122 0
6  201005131      6 59.8     NA 122 0
7  201005132      1 20.2 118.23 113 0
8  201005132      2  2.5 123.67 120 1
9  201005132      3  7.4 116.30 120 0
10 201005132      4  2.8 118.86 120 0
11 201005132      5  6.9 124.72 120 0
12 201005132      6  2.5 123.81 120 0

正如你所看到的，在他们的例子中，有一列altkey详细说明了每个类别的每个key还有一个专栏D显示该人选择了哪种替代方案。

但是，我只有一栏（type）它显示了个人的选择，但没有显示其他替代方案或每个替代方案的其他变量的值。当我尝试申请时mlogit，我有：

library(mlogit)
mlogit(type ~ age + dum1 + dum2, df)

data.frame(lapply(index, function(x) x[drop = TRUE]), row.names = rownames(mydata)) 中的错误：提供的行名称长度错误

因此，如何格式化我的数据，使其与数据类型相对应mlogit需要？

Edit:按照@edsandorf的建议，我修改了我的数据框并mlogit.data有效，但现在所有其他解释变量对于每个替代方案都具有相同的值。我是否应该在所选替代项为 0 或 FALSE 的行中将这些变量设置为 0 ？（事实上，有人可以告诉我从我所在的位置到结果的过程吗？mlogit因为我不明白我的估计错在哪里？）

我在这里显示的数据（df）不是我的真实数据。然而，它的形式完全相同：一列包含替代项的选择（type）、包含虚拟人和年龄的列等。

这是我到目前为止所做的过程（我没有将替代项设置为 0）：

# create a dataframe with all alternatives for each ID
qqch <- data.frame(ID = rep(df$ID, each = 4),
                   choice = rep(1:4, 10))

# merge both dataframes
df2 <- dplyr::left_join(qqch, df, by = "ID")

# change the values in stype by 1 or 0
for (i in 1:length(df2$ID)){
  df2[i, "type"] <- ifelse(df2[i, "type"] == df2[i, "choice"], 1, 0)
}

# format for mlogit
df3 <- mlogit.data(df2, choice = "type", shape = "long", alt.var = "choice")
head(df3)

    ID choice  type age dum1 dum2
1.1  1      1 FALSE  28    1    1
1.2  1      2  TRUE  28    1    1
1.3  1      3 FALSE  28    1    1
1.4  1      4 FALSE  28    1    1
2.1  2      1 FALSE  31    0    0
2.2  2      2 FALSE  31    0    0

如果我做：

mlogit(type ~ age + dum1 + dum2, df3)

我有错误：

solve.default(H, g[!fixed]) 中的错误：系统在计算上是奇异的：条件数倒数

除非我们做出更多假设，否则您的数据不适合使用 MNL 模型进行估计。一般来说，由于所有变量都是个体特定的，并且不会因替代方案（类型）而异，因此无法识别模型。除非我们将它们视为替代特定特征，否则您的所有个人特定特征都将被删除。听起来，每个专业项目都有其自身的意义。在这种情况下，我们可以仅使用常量来估计 MNL 模型，其中常量捕获了使个人选择它的程序的所有信息。

library(mlogit)
df <- data.frame(ID = seq(1, 10),
                 type = c(2, 3, 4, 2, 1, 1, 4, 1, 3, 2),
                 age = c(28, 31, 12, 1, 49, 80, 36, 53, 22, 10),
                 dum1 = c(1, 0, 0, 0, 0, 1, 0, 1, 1, 0),
                 dum2 = c(1, 0, 1, 1, 0, 0, 1, 0, 1, 0))

现在，为了安全起见，我为每个程序创建虚拟变量。type_1参考方案1，type_2编程 2 等

qqch <- data.frame(ID = rep(df$ID, each = 4),
                   choice = rep(1:4, 10))

# merge both dataframes
df2 <- dplyr::left_join(qqch, df, by = "ID")

# change the values in stype by 1 or 0
for (i in 1:length(df2$ID)){
  df2[i, "type"] <- ifelse(df2[i, "type"] == df2[i, "choice"], 1, 0)
}

# Add alternative specific variables (here only constants)
df2$type_1 <- ifelse(df2$choice == 1, 1, 0)
df2$type_2 <- ifelse(df2$choice == 2, 1, 0)
df2$type_3 <- ifelse(df2$choice == 3, 1, 0)
df2$type_4 <- ifelse(df2$choice == 4, 1, 0)

# format for mlogit
df3 <- mlogit.data(df2, choice = "type", shape = "long", alt.var = "choice")
head(df3)

现在我们可以运行模型了。我包含了每个备选方案的虚拟模型，并保留备选方案 4 作为我的参考水平。仅识别 J-1 个常数，其中 J 是替代方案的数量。在公式的后半部分（在管道运算符之后），我确保删除模型将创建的所有替代特定常量，并添加您的各个特定变量，将它们视为替代特定变量。请注意，只有当您的替代方案（程序）具有意义并且不通用时，这才有意义。

model <- mlogit(type ~ type_1 + type_2 + type_3 | -1 + age + dum1 + dum2,
                reflevel = 4, data = df3)
summary(model)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

mlogit

R：如何将我的数据格式化为多项式 Logit？的相关文章

在shiny中过滤传单地图数据

我在用传单地图设置这个闪亮的东西时遇到了麻烦我的原帖 https stackoverflow com questions 50111566 applying leaflet map bounds to filter data within
R foreach问题（某些进程返回NULL）

我遇到了问题foreach我正在 R 中使用的程序的一部分该程序用于运行不同参数的模拟然后将结果返回到单个列表然后用于生成报告当并非所有分配的模拟运行都在报告上实际可见时就会出现问题从各方面来看似乎只有分配的运行的一个子集实际
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
绘制点之间的所有线

我有以下 R 代码 x lt c 0 01848598 0 08052353 0 06741172 0 11652034 y lt c 0 4177541 0 4042247 0 3964025 0 4074685 d lt data fr
twitterR 和 ROAuth R 软件包安装

我在安装 CRAN 上的 twitteR 和 RAOuth 软件包时遇到一些问题我尝试了几种不同的方法在 Windows 下使用源代码在 Ubuntu 下使用 RStudio 我尝试了以下命令 sudo apt get install
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
以引用透明的方式从函数的省略号参数中提取符号

事情又发生了我正要按下发布答案按钮的问题被删除了我正在寻找一种方法来从函数的省略号参数中提取绑定到符号的对象的值以及符号也就是说我试图以引用透明的方式从省略号中提取符号我尝试过使用替代品和lazy dots 但没有成功 funct
相当于 min() 的 rowMeans()

我在 R 邮件列表上多次看到这个问题但仍然找不到满意的答案假设我有一个矩阵m m lt matrix rnorm 10000000 ncol 10 我可以通过以下方式获得每行的平均值 system time rowMeans m use
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
如何获得所有大于x且有位置的数字？

V lt c 1 3 2 4 2 3 1 X lt 3 pos lt V V X pos is 3 3 我需要的是所有 3 个的位置 I need 2 and 6 哪些职位是3 in V Use which pos lt which V 3
计算 R 中各列的唯一值

我正在尝试创建一个新变量其中包含来自两个不同列的字符串值的唯一计数所以我有这样的东西例如 A tibble 4 x 2 names partners
在 Rcpp 中使用其他包中的 C 函数

我试图从 C 函数中的 cubature 包调用 C 例程来执行多维积分我试图重现的基本 R 示例是 library cubature integrand lt function x sin x adaptIntegrate integr
如何在 R 或 Python 中制作旭日图？

到目前为止我一直无法找到一个可以创建旭日图的 R 库约翰斯塔斯科 http www cc gatech edu gvu ii sunburst 有人知道如何在 R 或 Python 中实现这一点吗在极坐标投影中使用 matplotli
如何从 R 中的 txt 文件读取矩阵？

我有一个带有矩阵的txt文件 Matrix txt 重要数字之间没有空格 0100 1001 1100 我想在 R 中将其作为矩阵读取我该怎么做我尝试使用 as matrix read table Matrix txt sep 但失败
ggplot2：如何标记事件发生的日期

我想从第二个情节中获取第一个情节的信息第二张图表示事件发生的天数它看起来更宽因为它没有图例但它是相同的时间尺度我选择在第一个图中手动分配颜色 I would like to overlay the second plot dots
如何使用 SparkR 1.6.0 写入 JDBC 源？

使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
使用 template.docx 从 Shiny App 编织 Word 文档

我正在尝试使用 template docx 文件从闪亮的应用程序编写一个 Word 文档我收到以下错误消息 pandoc exe template docx openBinaryFile 不存在没有这样的文件或目录以下 3 个文件当前
如何使用 tidymodels 和工作流集在同一数据集上拟合多个不同的线性模型

我想评估同一数据集上多个主要是线性回归模型的性能我想也许使用tidymodels包连同workflowsets workflow set 可能会起作用我按照这个例子here https workflowsets tidymodels
无法更改 RStudio 中的 R 版本

我的 RStudio V 0 99 491 无法更改 R 版本我以平常的方式行事Global Options gt R Version 然后它挂起并且不再工作或反应 R 运行良好的初始版本是R 3 1 0 我以前从未遇到过这样的问题也许
在 Shiny 中的用户会话之间共享反应数据集

我有一个相当大的反应数据集该数据集是通过轮询文件然后按预定义的时间间隔读取该文件而派生的数据更新频繁需要不断重新加载诚然重新加载可以增量完成并附加到 R 中的现有对象但事实并非如此然而目前尽管会话中的数据相同但此操作是针对

随机推荐

将 git lfs ls-files 与 git ls-files ':(attr:filter=lfs)' 进行比较是否是检测不受 lfs 管理的 lfs 文件的可靠方法？

我尝试找到一种方法来确定 git 存储库中的文件是否由 git lfs 正确管理到目前为止我发现比较结果git lfs ls files and git ls files attr filter lfs 似乎给了我我想要的 Add Ty
Ruby 相当于“grep -C 5”来获取匹配周围行的上下文？

我对此进行了一些搜索但我一定使用了错误的术语 ruby 是否有办法 grep 查找字符串正则表达式并返回周围的 5 行上面和下面我知道我可以打电话 grep C 5 或者甚至编写我自己的方法但这似乎是 ruby 拥有的东西而我只
Mac 上的 auctex 和 emacs

我想要的是能够成功使用 emacs 和 auctex 一些系统信息 ProductName Mac OS X ProductVersion 10 8 5 BuildVersion 12F45 Emacs Version 24 3 9 0 A
如何在 iPad 版 Objective C 中解析 PDF

我一直在解析 PDF 文件请指导我如何做到这一点头文件 PDFViewer h interface PDFViewer UIView CGPDFDocumentRef pdf void drawInContext CGContextRe
如何通过 XSLT 在 Java 中合并 2 个 XML 流

我想在 Java 中合并 2 个 XML 流字符串必须通过 XSLT 我可以更改转换但问题是 XML 作为字符串出现有很多例子但是通过文件可以在不将它们保存在文件中的情况下完成此操作吗 Thanks 我只知道一种使用自己的实现的
c++ max_element 每n个元素

有没有办法比较每 N 个元素来找到容器中的最大元素并返回索引使用 STL BOOST 或其他库对于每个 N 我的意思是使用 std max element 但将 for 的增加从 first 更改为 first n based on
该算法的名称是什么？它与其他图像重采样算法相比如何？

这个算法已经在我脑海中存在了很长一段时间但我找不到任何地方描述它虽然它是如此简单但我不可能是唯一一个想到它的人它的工作原理如下你从一张图片开始比如说 7x7px 您需要将其重新采样例如 5x5px 所以你要做的就是取每个新方块
UITextView 和浮动自动更正窗口的位置

我有一个启用自动更正的 UITextView 视图的高度约为 30 像素当自动更正启动时自动更正视图在文本下方几乎不可见有没有办法控制小自动更正窗口的位置或确保它是顶层以便它始终可见并且用户可以轻松查看并与之交互我发现在 UITe
Backbone.js 和 requirejs：如何将模型、视图和集合转换为 requirejs 模块？

我正在使用backbone js开发一个javascript应用程序也就是说为了便于开发我以这种方式构建我的文件 app views L movieRow js L movieDetail js models L movie js L
Java 8 构造函数参考的可怕性能和大堆占用？

我刚刚在我们的生产环境中经历了一次相当不愉快的经历导致OutOfMemoryErrors heapspace 我将问题追溯到我的使用ArrayList new在一个函数中验证这实际上比通过声明的构造函数正常创建执行得更差 t gt ne
等待设备时出错：等待模拟器上线 300 秒后超时

我一直在尝试使用 android studio 2 0 模拟器但我无法在模拟器上运行我的应用程序当我运行我的应用程序时它会显示模拟器其中包含以下详细信息哈克斯已启用 Hax ram size 0x800000000 HAx 正在运
如何设置 UIBarButtonItem 的字体大小？

我找不到自定义标题字体大小的方法UIBarButtonItem 我能想到解决这个问题的唯一方法是将其设置为图像我想避免这种情况还有其他建议吗 Objective C NSUInteger fontSize 20 UIFont font
在 Rails 中的 find 中使用 lambda

我有一个方法可以进行分页查找调用例如 1 coll paginate all lambda conditions gt status AND expires lt a DateTime now select gt Constants PO
在 BeautifulSoup 中替换文本而不转义

我想用 BeautifulSoup 中的锚链接包装一些尚未链接的单词我用这个来实现它 from bs4 import BeautifulSoup import re text replace this string soup Beauti
PHPUnit 在运行第一个测试之前进行设置，并在运行最后一个测试之后进行拆除

我正在尝试使用 PHPUnit 为 php 应用程序实现类似 Django 的测试实用程序类似 Django 我的意思是在运行第一个测试之前从主数据库创建一个单独的测试数据库并在运行最后一个测试后将其删除即使一次运行许多测试用例测试
用dense_rank数填充多维数组的rank列

我的数组结构如下 points gt 10 details gt name gt Team A rank gt points gt 10 details gt name gt Team B rank gt points gt 8 detai
c++ 可以通过引用传递临时 lambda（适用于 msvc/windows，但不适用于 gcc/linux）？

假设我有以下代码片段 global variable std thread worker thread Template function template
ui 中的输入绑定：jsf 中的重复

我正在使用facelets jsf 2 0和primefaces 3 0 M2组件库我正在尝试实现动态行数包括发生数据表选择时填充的输入字段每当进行选择时动态行都会使用输入字段正确生成但在后续选择的第一个选择之后动态行计数会正确
如何将本地MYSQL数据库移动到远程数据库服务器

我有一个在 WAMP 下运行的本地 MYSQL 数据库我需要将其移至生产数据库服务器 MySQL 新手需要了解提升此数据库的最佳方法您可以在当前服务器上运行它 mysqldump u user p database name gt d
R：如何将我的数据格式化为多项式 Logit？

我正在 R 上复制一些 Stata 代码我想使用以下命令执行多项式逻辑回归 mlogit函数来自同名包我知道有一个multinom函数于nnet但我不想用这个我的问题是使用mlogit 我需要使用以下方式格式化我的数据mlogit

R：如何将我的数据格式化为多项式 Logit？

R：如何将我的数据格式化为多项式 Logit？ 的相关文章

随机推荐

热门标签

R：如何将我的数据格式化为多项式 Logit？的相关文章