Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
在 eclipse 中使用 mahout 而不使用 Maven
我真的不想使用maven 因为它看起来很麻烦 有没有办法只下载 mahout 并在我的 eclipse 项目中使用它 我从使用 Maven 得到的只是构建路径错误和数百万条警告 我一直在寻找一种方法来做到这一点 但人们似乎一直都在使用 Ma
eclipse
mahout
如何使用存储为 CSV 的矢量数据在 mahout 中执行 k 均值聚类?
我有一个包含数据向量的文件 其中每行包含一个以逗号分隔的值列表 我想知道如何使用 mahout 对这些数据执行 k 均值聚类 wiki 中提供的示例提到了创建sequenceFiles 但除此之外 我不确定是否需要进行某种类型的转换才能获取
mahout
kmeans
如何读取 Mahout 聚类输出
我已经对 Mahout 教程中的合成控制数据运行了 k 均值聚类算法 并且想知道是否有人可以解释如何解释输出 我运行 clusterdump 并收到如下所示的输出 被截断以节省空间 CL 592 n 57 c 30 726 29 813 r
mahout
Mahout 的推荐评估器如何工作
谁能告诉我 mahout 的 RecommenderIRStatsEvaluator 是如何工作的 更具体地说 它如何随机分割训练和测试数据以及结果与哪些数据进行比较 根据我的理解 你需要某种理想 预期的结果 你需要将其与推荐算法的实际结果
mahout
mahoutrecommender
Mahout row相似度
我正在尝试计算维基百科文档之间的行相似度 我有 tf idf 向量的格式Key class class org apache hadoop io Text Value Class class org apache mahout math V
Hadoop
mahout
cosinesimilarity
如何使用 Mahout 的sequencefile API 代码?
Mahout 中有一个用于创建序列文件的命令 如下所示bin mahout seqdirectory c UTF 8 i
Hadoop
mahout
sequencefile
具有非常大矩阵的 K 均值
我必须在一个非常大的矩阵 大约 300 000x100 000 个值 超过 100Gb 上执行 k 均值聚类 我想知道我是否可以使用 R 软件或 weka 来执行此操作 我的计算机是一台多处理器 具有 8GB 内存和数百 GB 可用空间 我
r
clusteranalysis
Weka
kmeans
mahout
«
1
2