我对大众汽车简单运行的输出有几个问题。我已经阅读了互联网和维基网站,但仍然不确定一些基本的事情。
我对波士顿住房数据进行了以下分析:
vw -d housing.vm --progress 1
其中 housing.vm 文件设置为(部分):
输出是(部分):
问题一:
1)按以下步骤思考平均损失列是否正确:
a)预测为零,因此第一个平均损失是第一个示例的平方误差(预测为零)
b) 在示例 1 上构建模型并预测示例 2。平均当前 2 平方损失
c) 在示例 1-2 上构建模型并预测示例 3。平均当前 3 平方损失
d) ...
执行此操作,直到到达数据末尾(假设单次传递)
2)当前的功能栏目是什么?它似乎是非零特征的数量+截距。示例中显示的内容表明,如果某个特征为零,则该特征不会被计算在内 - 这是真的吗?例如,第二条记录的“ZN”值为零。大众真的认为这个数字功能缺失了吗?
你的说法基本上是正确的。默认情况下,VW 进行在线学习,因此在步骤 c 中,它采用当前模型(权重)并使用当前示例进行更新(而不是再次从所有先前示例中学习)。
如您所料,当前特色专栏是当前示例的(非零)特征数量。除非您指定,否则自动包含拦截功能--noconstant
.
缺失特征和零值特征之间没有区别。两者都意味着您不会更新相应的权重。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)