使用 K-means 算法进行客户分类

2023-11-03

TB1RKVgdxTpK1RjSZR0XXbEwXXa.jpg

本文为 AI 研习社编译的技术博客,原标题 :

Customer segmentation using Machine Learning K-Means Clustering

翻译 | 吕鑫灿、就2    校对 | 就2    整理 | 志豪

原文链接:

http://www.patterns7tech.com/customer-segmentation-using-machine-learning-k-means-clustering/

Rajshekhar Bodhale | 2017年11月17日 | 机器学习

基于信息技术的大多数平台正在生成大量数据。这些数据称为大数据,它承载了大量的商业智能。这些数据互相交融以满足不同的目标和可能性。应用机器学习技术就很有可能为客户创造价值。

  问题描述

我们在会计学和物联网领域拥有基于大数据的平台,可以持续生成客户行为和设备监控数据。

识别目标客户群或者基于不同维度分析(推导)模式非常关键,并且实在的为平台提供了优势。

  对应想法

假设你有1000个客户使用你的平台并且不断地产生体量庞大的大数据,任何关于这方面的深入见解都将产生新的价值。

作为Patterns7团队不断尝试的机器学习计划和创新事物的一部分,我们对K-Means聚类算法进行了实验,这为客户带来的价值非常惊人。

  解决方案

聚类是将一组数据点划分为少量聚类的过程。在本部分中,你将理解并学习到如何实现K-Means聚类。

  K-Means聚类

K-Means聚类是一种常用于将数据集自动划分为K个组的方法,它属于无监督学习算法。

TB1qlNAdyLaK1RjSZFxXXamPFXa.jpg

  K-Means目标

K均值的目的是使每个点到其对应的聚类质心的距离的平方和最小。给定一组观测值(x1,x2,...,xn)ÿ

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 K-means 算法进行客户分类 的相关文章

  • 使用 openCV 对图像中的子图像进行通用检测

    免责声明 我是计算机视觉菜鸟 我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子 我的用例有点不同 因为我不希望它是具体的 而且我不确定如何做到这一点 如果可能的话 但我感觉应该如此 我有大量图像数据集 有时 其中一些图像是数据集的
  • 更改自动插入 tkinter 小部件的文本颜色

    我有一个文本框小部件 其中插入了三条消息 一条是开始消息 一条是结束消息 一条是在 单位 被摧毁时发出警报的消息 我希望开始和结束消息是黑色的 但被毁坏的消息 参见我在代码中评论的位置 插入小部件时颜色为红色 我不太确定如何去做这件事 我看
  • Python 多处理示例不起作用

    我正在尝试学习如何使用multiprocessing但我无法让它发挥作用 这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
  • 如何使用包含代码的“asyncio.sleep()”进行单元测试?

    我在编写 asyncio sleep 包含的单元测试时遇到问题 我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间 当我尝试使用普通可调用对象运行测试时 这个库非常有用 但我找不到运行包含 asyncio sleep 的测
  • 如何等到 Excel 计算公式后再继续 win32com

    我有一个 win32com Python 脚本 它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的 这可能需要一分钟 如何强制工作簿计算值
  • 打破嵌套循环[重复]

    这个问题在这里已经有答案了 有没有比抛出异常更简单的方法来打破嵌套循环 在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签 并且至少继续一个外循环 for x in range 10 fo
  • Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

    据我了解 distinct 哈希分区 RDD 来识别唯一键 但它是否针对仅移动每个分区的不同元组进行了优化 想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上 所有重复键
  • 安装后 Anaconda 提示损坏

    我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是 安装后当我关闭提示窗口并打开新航站楼弹出
  • 在循环中每次迭代开始时将变量重新分配给原始值(在循环之前定义)

    在Python中 你使用 在每次迭代开始时将变量重新分配给原始值 在循环之前定义 时 也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
  • IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

    我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误 线程 main java lang NoClass
  • Pandas Dataframe 中 bool 值的条件前向填充

    问题 如何转发 fill boolTruepandas 数据框中的值 如果是当天的第一个条目 True 到一天结束时 请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
  • 当玩家触摸屏幕一侧时,如何让 pygame 发出警告?

    我使用 pygame 创建了一个游戏 当玩家触摸屏幕一侧时 我想让 pygame 给出类似 你不能触摸屏幕两侧 的错误 我尝试在互联网上搜索 但没有找到任何好的结果 我想过在屏幕外添加一个方块 当玩家触摸该方块时 它会发出警告 但这花了很长
  • 如何将 numpy.matrix 提高到非整数幂?

    The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
  • ExpectedFailure 被计为错误而不是通过

    我在用着expectedFailure因为有一个我想记录的错误 我现在无法修复 但想将来再回来解决 我的理解expectedFailure是它会将测试计为通过 但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是 当我
  • 如何改变Python中特定打印字母的颜色?

    我正在尝试做一个简短的测验 并且想将错误答案显示为红色 欢迎来到我的测验 您想开始吗 是的 祝你好运 法国的首都是哪里 法国 随机答案不正确的答案 我正在尝试将其显示为红色 我的代码是 print Welcome to my Quiz be
  • 如何从没有结尾的管道中读取 python 中的 stdin

    当管道来自 打开 时 不知道正确的名称 我无法从 python 中的标准输入或管道读取数据 文件 我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
  • 在 Pandas DataFrame Python 中添加新列[重复]

    这个问题在这里已经有答案了 例如 我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在 如果我想再添加一个名为 Col3 的列 并且该值基于 Col2 式中 如果Col2 gt 1 则Col3为0 否则为1 所以
  • glpk.LPX 向后兼容性?

    较新版本的glpk没有LPXapi 旧包需要它 我如何使用旧包 例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
  • Python:元类属性有时会覆盖类属性?

    下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
  • PyAudio ErrNo 输入溢出 -9981

    我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

  • linux 源码包mysql,linux 下 mysql源码包的安装--

    linux 下 mysql源码包的安装 9页 本资源提供全文预览 点击全文预览即可全文预览 如果喜欢文档就下载吧 查找使用更方便哦 9 9 积分 linux 下 MySQL源码包的安装 gt gt linux 下 MySQL源码包的安装 实
  • 电路基础学习笔记2:LRC振荡电路

    LRC振荡电路 1 概述 LRC 振荡电路是一种基本的振荡电路 由电感L 电容C 电阻R组成 可以产生稳定的交流电信号 在LRC振荡电路中 电感和电容通过共振的方式相互作用 导致电荷周期性地从电容器到电感器和反向流动 从而产生周期性的电流和
  • 制作瀑布

    使用的瀑布模型 瀑布模型使用的材质 Demo WaterFall mat Demo WaterFall shadergraph 最终效果
  • python3(七)os模块

    os模块 OS模块简单的来说它是一个Python的系统编程的操作模块 可以处理文件和目录这些我们日常手动需要做的操作 可以查看OS模块的帮助文档 import os 导入os模块 help os 查看os模块帮助文档 里面详细的模块相关函数
  • if判断条件的优化写法

    优化后可读性 可维护性更好了 if分支越多 体现越明显 文章目录 优化前 简单判断 优化 简单判断 优化前 复杂判断 优化 复杂判断 优化前 简单判断 function getUserDescribe name if name 小刘 con
  • 区块链运行机制简介

    区块链简介 区块链技术是构建比特币区块链网路与交易信息加密传输的基础技术 其解决的核心问题是如何在缺少可信任中央节点和可信任通道的情况下 分布在网络中的节点如何达成共识 区块链被定义为一个分布式的账本 即每个区块链的节点都拥有系统所有交易的
  • 信令服务器接收到状态码,在蜂窝通信网络中请求连接的方法和设备专利_专利查询 - 天眼查...

    1 一种包含转换器服务逻辑模块0 的网络部件045 所述转换器服务逻辑模块 255 被安排成在操作上分别 经由第一通信链路075 与通信接入点 270 耦接 经由第二通信链路与自动配置服务器ACS逻辑模块 MO 耦接 以及经由第三通信链路与
  • Pandas 中的 read_excel() 读取 excel 数据详细参数用法

    前言 read excel 参数说明 pandas 中读取 excel 数据的 pd read excel pandas read excel io sheet name 0 header 0 names None index col No
  • jQuery 事件 - mouseover() 方法

  • 【UE4】Replay游戏回放 for UE4.26

    前言 UE4 26的回放教程 最近有用到 So梳理了整个构建流程 希望能帮到你 结尾有视频版教程 时长较长 1 准备工作 创建一个UE4C 项目 添加第一人称和第三人称功能包 关闭引擎 找到项目目录 ContentDir Config De
  • 【windows系统同时安装配置不同版本java环境】,以及双击jar包问题总结

    1 下载jdk 官方网站 Java Downloads Oraclehttps www oracle com java technologies downloads我这边需要运行冰蝎是需要一个java8的环境 以及原有的高版本的java环境
  • JS 函数

    JS 函数 关键字形式的函数
  • Mysql 中级篇-索引

    123
  • C++ 基本的7种数据类型和4种类型转换(C++复习向p3)

    文章目录 基本内置类型 存储范围 typedef 声明新名字 enum 枚举类型 类型转换 基本内置类型 bool char int float double void wchar t short int 存储范围 可以这样 sizeof
  • 全卷积网络(FCN)与图像分割

    从图像分类到图像分割 卷积神经网络 CNN 自2012年以来 在图像分类和图像检测等方面取得了巨大的成就和广泛的应用 CNN的强大之处在于它的多层结构能自动学习特征 并且可以学习到多个层次的特征 较浅的卷积层感知域较小 学习到一些局部区域的
  • CentOs7 修复 引导启动

    一 修复MBR MBR Master Boot Record主引导记录 硬盘的0柱面 0磁头 1扇区称为主引导扇区 其中446Byte是bootloader 64Byte为Partition table 剩下的2Byte为magic num
  • 配置hadoop各个节点之间免密码登录实践笔记

    前言 最近在搭建Hadoop环境需要设置无密码登陆 所谓无密码登陆其实是指通过证书认证的方式登陆 使用一种被称为 公私钥 认证的方式来进行ssh登录 在linux系统中 ssh是远程登录的默认工具 因为该工具的协议使用了RSA DSA的加密
  • 使用Python,OpenCV缩放照片(忽略宽高比,保持宽高比)

    使用Python OpenCV缩放照片 忽略宽高比 保持宽高比 1 效果图 1 1 保持宽高比效果图 1 2 忽略宽高比效果图 1 3 opencv各插值效果图 2 原理 3 源码 参考 这篇博客将介绍如何使用OpenCV调整图像大小 调整
  • EEPROM的学习和使用方法

    EEPROM的学习和使用方法 https blog csdn net bornpride article details 87894400 一 概述 在实际的应用中 保存在单片机RAM中的数据 掉电后就丢失了 保存在单片机的FLASH中的数
  • 使用 K-means 算法进行客户分类

    本文为 AI 研习社编译的技术博客 原标题 Customer segmentation using Machine Learning K Means Clustering 翻译 吕鑫灿 就2 校对 就2 整理 志豪 原文链接 http ww