如何设置Spark Kmeans初始中心

2023-12-05

我正在使用 Spark ML 来运行 Kmeans。我有一堆数据和三个现有中心，例如这三个中心是：[1.0,1.0,1.0],[5.0,5.0,5.0],[9.0,9.0,9.0].那么我如何表明 Kmeans 中心是上述三个向量。我看到 Kmean 对象有种子参数，但种子参数是 long 类型而不是数组。那么我如何告诉 Spark Kmeans 仅使用现有的中心进行聚类。

或者说，我不明白 Spark Kmeans 中种子的含义，我认为种子应该是一个向量数组，在运行聚类之前代表指定的中心。

Indeed, seed并不意味着您的想法，即它不用于“播种”（初始化）聚类中心，而只是用于设置随机种子 - 您可以在文档中确认这一点Scala and Python APIs.

据我所知，目前（Spark 2.1）无法为 Spark ML 中的 k-means 提供初始聚类中心（请参阅这个答案对于 Spark MLlib）。这initMode参数，根据文档：

可以是“随机”以选择随机点作为初始聚类中心，也可以是“k-means||”使用 k-means++ 的并行变体'）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何设置Spark Kmeans初始中心的相关文章

如何在发布期间复制未版本化的测试资源：执行？

我的问题与 Maven 在发布时不会复制未跟踪的资源 https stackoverflow com questions 10378708 maven doesnt copy untracked resources while releas
CFdump cfcomponent cfscript

可以在 cfcomponent 中使用 cfdump 吗可以在 cfscript 中使用 cfdump 吗我知道 anser 不是那么如何发出 insde cfcomponent 函数的值 cf脚本我用的是CF8 可以在 cfcom
如何确定所有角度2分量都已渲染？

当所有 Angular2 组件完成渲染时是否会触发一个角度事件 For jQuery 我们可以用 function 然而对于 Angular2 当domready事件被触发 html 只包含角度组件标签每个组件完成渲染后 domrea
TIFF 元数据的最大大小是多少？

TIFF 文件元数据的单个字段中可以合并的元数据数量是否有最大限制我想在 ImageDescription 字段中存储大文本最多几 MB 没有具体的最大限制ImageDescription但是整个 TIFF 文件存在最大文件大小该最
如何在执行新操作时取消先前操作的执行？

我有一个动作创建器它会进行昂贵的计算并在每次用户输入内容时调度一个动作基本上是实时更新但是如果用户输入多个内容我不希望之前昂贵的计算完全运行理想情况下我希望能够取消执行先前的计算并只执行当前的计算没有内置功能可以取消Pro
如何从日期中查找该月的最后一天？

如何在 PHP 中获取该月的最后一天 Given a date 2009 11 23 我要2009 11 30 并给出 a date 2009 12 23 我要2009年12月31日 t返回给定日期所在月份的天数请参阅的文档date ht
Redis如何存储关联数组？设置、散列还是列表？

我对 Redis 的所有可用存储选项有点困惑我想做一些简单的事情并且不想过度设计它我正在与phpredis and Redis v2 8 6 我有一个需要存储的简单关联数组我还需要能够通过其键检索项目并循环遍历所有项目 a arra
PHPUnit 和 Zend Framework assertRedirectTo() 问题

我在创建的测试中遇到了 assertRedirectTo 问题下面是我使用的代码 public function testLoggedInIndexAction this gt dispatch this gt assertControl
如何使用asm.js进行测试和开发？

最近我读到asm js规范看起来很酷但是是否有任何环境工具来开发和测试这个工具这还只是处于规范阶段吗您可以尝试使用 emscripten 和 ASM JS 1 并从侧分支在 firefox 构建中运行它有关 asm js 的链接
Spring Boot @ConfigurationProperties 不从环境中检索属性

我正在使用 Spring Boot 1 2 1 并尝试创建一个 ConfigurationProperties带有验证的bean 如下所示 package com sampleapp import java net URL import j
用于验证目的的动态查找方法

我正在使用 Ruby on Rails 3 0 7 我想在运行时查找一些记录以进行验证但为该查找方法传递设置一个值也就是说在我的班级中我有以下内容 class Group lt lt ActiveRecord Base valid
neo4j - python 驱动程序，服务不可用

我对 neo4j 非常陌生我正在尝试建立从 python3 6 到 neo4j 的连接我已经安装了驱动程序并且刚刚开始执行第一步导入请求导入操作系统导入时间导入urllib 从 neo4j v1 导入 GraphDatabas
使用 xpath 和 vtd-xml 以字符串形式获取元素的子节点和文本

这是我的 XML 的一部分
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
升级到 Rails 6 时是否有一种编程方法可以检测 Zeitwerk::NameError？

我目前正在将旧的 Rails 应用程序迁移到 Rails 6 好像项目中有些文件和里面定义的类不一致运行应用程序测试时我没有看到此错误但部署后我收到如下错误 Zeitwerk NameError expected file app my
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50
如何在react-highcharts中使用图表工具提示格式化程序？

如何使用图表工具提示格式化程序我正在使用高图表的反应包装器我有这样的配置 const CHART CONFIG tooltip formatter tooltip gt var s b this x b each this points
强制 Listview 不重复使用视图（复选框）

我做了一个定制Listview 没有覆盖getView 方法 Listview 中的每个项目都具有以下布局联系布局 xml

随机推荐

寻找一种更Pythonic的方式来访问数据库

我有很多遵循这种模式的 python 方法 def delete session guid conn get conn cur conn cursor cur execute delete from sessions where guid
Facebook 视频上传 OAuthException 200 错误

我有与此类似的代码位于使用 php sdk graph api 将视频上传到 facebook 在我编写的应用程序中但昨天我开始收到 OAuthException 错误我寻找了一个简单的视频上传示例到 Facebook 页面进行测试
当我添加新数据时，列表项会发生变化...为什么？

我有一种方法可以将文件转换为字节以便稍后可以通过互联网发送它无论如何因为我计划发送大文件所以我发送大块文件而不是发送整个文件每个块由一个字节数组 byte 组成我对这一切都很陌生所以我想在发送之前将每个块保存在块列表 List
如果发生错误，using 语句会回滚数据库事务吗？

我在 using 语句中有一个 IDbTransaction 但我不确定如果在 using 语句中抛出异常它是否会回滚我知道 using 语句将强制调用 Dispose 但是有人知道 Rollback 是否也是如此 Update 另外
如何获取两个日期之间的天数objective-c [重复]

这个问题在这里已经有答案了我正在尝试制作一个标签标明距离活动还剩多少天我想计算今天的日期和事件日期之间的差异我正在使用这段代码它给了我 4600 在我使用今天的日期之前它工作正常 NSDateFormatter f NSDateF
对 Python Dataframe 中的行求和

我刚刚开始学习 Python 所以如果这个问题已经在其他地方得到了回答请原谅我我想创建一个名为 Sum 的新列它只是将前面的列相加 Risk Parity tail VCIT VCLT PCY RWR IJR XLU EWL Date
如何在 MATLAB 中中止程序执行？

如何在不退出 MATLAB 的情况下停止 MATLAB 中的程序执行我正在寻找类似 C 中的 exit 1 的东西我尝试过退出退出但它们也会杀死 MATLAB 这不是我想要的行为理想情况下我会使用 try catch 来冒泡错误
我的碰撞检测无法正常工作

我正在使用 pygame 和 math 模块在 python 中编写游戏我编写了这些代码来进行碰撞检测我制作了 5 个障碍物我希望我的玩家与它们发生碰撞但问题是在玩游戏的过程中有时有效有时无效这些是我定义的碰撞函数 def c
NSDecimalNumber 对长数字进行舍入

我试图让 NSDecimalNumber 打印出大数字 15 位或更多数字在 15 位数字中我看到 111 111 111 111 111 超过 15 位数字时我看到的是 1 111 111 111 111 110 即使格式化的数字是
Angular 2 RC1：从使用的初始 URL 获取参数

有些用户通过邀请进入我的网络应用程序所以他们会有一个看起来像这样的链接 https example com invitaion 12345其中 12345 是他们的唯一邀请号码当用户单击链接时框架在客户端初始化我的 AppCompon
Spring Security oauth2“未找到授权请求”

我将 Spring Security 5 2 1 配置为与 Google 一起使用 Oauth2 该应用程序在本地运行良好当部署在 Azure 应用服务上时每当我尝试 Oauth2 登录流程时都会出现以下异常我被转发到 login
包含相同元素的两个数组可以不相等吗？

今天我遇到了一个令人震惊的问题我试图查找一个对象是否包含在 List 集合中问题是当我已经可以看到该对象时列表找不到该对象并返回索引为 1 然后我创建了一个自定义索引查找器通过比较属性而不是直接相等来查找对象我发现对象的属性之一
在 FORTRAN 中创建名称包含实数的目录

在我的程序中我需要存储不同情况的结果文件我决定创建单独的目录来存储这些结果文件这里用伪代码来解释具体的情况 do i 1 N N cases of my analysis U SPEED i call write files U Cr
Siri 支持无效 - 警告 iTunes Connect

我将 SiriKit 集成到我的应用程序中以骑书但将我的应用程序发送到 TestFlight 后我收到一封邮件回复其中包含下一个警告 Siri 支持无效未提供示例短语 en CO 语言中的 INGGetRideStatusInte
Ivy 似乎只获取 javadoc jar

我在我的项目中使用 Ivy 以及 Ivy Eclipse 插件看起来下载并添加到我的项目中的某些 jar 是 javadoc jar 而不是带有实际代码的 jar 注意并非所有罐子都会发生这种情况例如将其添加到我的 ivy xml
如何使用jquery删除所有cookie[重复]

这个问题在这里已经有答案了可能的重复使用javascript清除所有cookie 我希望分配一个复选框来一次性激活和清除以前存储在我的表单中的所有 cookie 我该如何使用 jquery cookie 插件来做到这一点我似乎无法在克
常量构造函数

在C 中是否可以实现类似于构造函数之类的只允许创建的东西const物体我正在考虑为接口创建一个装饰器类const和非const方法从 a 初始化装饰器const基对象应该只能生成 const 装饰器但从非 const 初始化应该会产生
为什么这段代码会崩溃？

以下代码会导致堆栈溢出但我不明白为什么 int tmain int argc TCHAR argv cout lt lt start char bmp 1024 768 3 for int p 0 p lt 9000 p for int
读取网页内容

你好我想使用java读取包含德语字符的网页内容不幸的是德语字符显示为奇怪的字符请提供任何帮助这是我的代码 String link some german link URL url new URL link BufferedRead
如何设置Spark Kmeans初始中心

我正在使用 Spark ML 来运行 Kmeans 我有一堆数据和三个现有中心例如这三个中心是 1 0 1 0 1 0 5 0 5 0 5 0 9 0 9 0 9 0 那么我如何表明 Kmeans 中心是上述三个向量我看到 Kmean

如何设置Spark Kmeans初始中心

如何设置Spark Kmeans初始中心 的相关文章

随机推荐

热门标签

如何设置Spark Kmeans初始中心的相关文章