KNN回归-预测二手车

2023-11-08

'''
KNN是一个典型的分类模型，就时预测类别，例如苹果，香蕉等。预测的结果是
训练集上已经包含的类别，并不会预测出新的类别


二手车价格预测是预测车的价格，是数值。理应按照回归算法来算


怎么用knn来实现回归问题呢？  找到最近的K样本之后，我们直接取了平均作为预测值，很直观


这里给出了对于数据的简单描述。
Ask Price            字段是我们要预测的值，即二手车的估价。
Brand                为车辆的牌子。
Type                 指的是它的发动机类型。
Color                字段为车辆外观颜色。
Construction Year    字段为车子生产年份。
Odometer             为仪表盘已经行驶的里程数。
DaysUntilMOT         指的是自从上一次的保养过了多久
HP                   字段代表的是马力。 "

'''
import  sys ,os
import  pandas as pd
import numpy as np
import seaborn as sns
import matplotlib
import matplotlib.pyplot  as plt
# 读取数据


path=os.getcwd()+"\source\double_car.csv"
df=pd.read_csv(path,engine='python',encoding='gbk')   #  务必加上 engine='python' 不然会报错
'''
         Brand  Type Color  Construction Year  Odometer  Ask Price    Days Until MOT   HP 
0  Peugeot 106   1.0  blue               2002    166879        999      138            60  
1  Peugeot 106   1.0  blue               1998    234484        999      346            60 
'''
#特征处理
#颜色独热编码
df_color=df['Color'].str.get_dummies().add_prefix('color:')
'''
 color:black  color:blue  color:green  color:grey  color:red  color:white
0             0           1            0           0          0            0
1             0           1            0           0          0            0

'''

#类型独热编码
df_type=df['Type'].apply(str).str.get_dummies().add_prefix('Type:')
#添加度热编码列

df=pd.concat([df,df_color,df_type],axis=1)
#去掉原列
df=df.drop(['Brand','Color','Type'],axis=1)
'''
Construction Year  Odometer  Ask Price  Days Until MOT   HP  color:black  color:blue  color:green  color:grey  color:red  color:white  Type:1.0 Type:1.1  Type:1.4 
'''

# s数据转换
'''
看一下数据之间的相关性 使用corr() 函数 来计算特征之间的相关性  之后通过sns进行可视化相关性
'''
matrix=df.corr()
#f,ax=plt.subplots(figsize=(8,6))
#sns.heatmap(matrix,square=True)
#plt.title('变量')
#plt.show()


## KNeighborsClassifier   KNN分类
## KNeighborsRegressor    KNn回归
from sklearn.neighbors import KNeighborsRegressor
from sklearn.model_selection import train_test_split
from sklearn import  preprocessing
from sklearn.preprocessing import StandardScaler
import  numpy as np

#  Brand  Type Color  Construction Year  Odometer  Ask Price    Days Until MOT   HP
X=df[['Construction Year','Days Until MOT','Odometer']]
y=df['Ask Price'].values.reshape(-1,1)
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=41)
X_normanlizer=StandardScaler()
X_train=X_normanlizer.fit_transform(X_train)
X_test=X_normanlizer.transform(X_test)

y_normanlizer=StandardScaler()
y_train =y_normanlizer.fit_transform(y_train)    #特征的归一化标准是来自训练数据，然后应用在测试数据，
y_test=y_normanlizer.transform(y_test)           #因为在实际的情况下，测试数据是看不到的，是算不出来均值和方差的
knn=KNeighborsRegressor(n_neighbors=2)

knn.fit(X_train,y_train.ravel())                  #.ravel() 多维的数组降为1维

y_pred=knn.predict(X_test)
# y_pred=y_pred.astype('float')
y_pred_inv=y_normanlizer.inverse_transform(y_pred)
y_test_inv=y_normanlizer.inverse_transform(y_test)

#from sklearn.metrics import accuracy_score
# acc=accuracy_score(y_test_inv,y_pred_inv)     print('准确率：',acc)   # 0.0  回归的问题算准确率意义不大

plt.scatter(y_pred_inv,y_test_inv)    # 点
plt.xlabel('pred')
plt.ylabel('test')

diag=np.linspace(500,1500,100)      # 准备画 对角线
plt.plot(diag,diag,'-r')
plt.show()


print(y_pred_inv)   # 预测值

print(knn)   #knn的相关属性

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

字符相加

KNN回归-预测二手车的相关文章

只利用 phpstudy 如何运行PHP文件超详细教程

1 先编写好PHP代码我这里用记事本简单写了一个 2 打开phpstudy 检查下有没有下载PHP环境启动Apache 3 把编写好的PHP文件复制到phpstudy目录下的www文件中注 phpstudy可以通过网站管理打开根
Vue常见简写 “:“ , “@“ , “#“ :帮助刚入行的伙伴快速看懂代码

提示本文仅仅是对Vue中比较常见的简写进行总结适合刚入行有时看不懂代码的朋友目录文章目录前言一是什么 1 是什么意思 2 怎么使用二是什么 1 是什么意思 2 怎么使用三是什么 1 是什么意思 2 怎么使用总结前言
JDBC 学习笔记（基础）

示意图目录创建 JDBC 应用例子通过本地协议纯 Java 驱动程序实现JDBC 代码具体步骤 1 注册驱动 2 建立与数据库的连接 3 获取执行SQL语句的对象 Statement 4 定义执行 SQL 语句 5 操作结果集对象
100. Same Tree

Definition for a binary tree node struct TreeNode int val TreeNode left TreeNode right TreeNode int x val x left NULL ri
【Java】SpringBoot使用AOP进行日志解析打印+系统异常全局处理配置

文章目录前言一导入Lombok 二创建日志打印Model 三创建日志切面工具类四需要用到的一些常量类五创建接口请求切面六系统异常全局配置总结前言为了方便项目部署在服务器之后当出现BUG以及某些特殊需求时会因为
Docker 笔记（全）

1 关于Docker 1 1 概念 Docker 是一个开源的应用容器引擎基于Go 语言并遵从 Apache2 0 协议开源 Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级可移植的容器中然后发布到任何流行的 Linu
运算符之算术运算符、关系运算符、逻辑运算符、复合赋值运算符、其他运算符

运算符是一种告诉编译器执行特定的数学或逻辑操作的符号 C 有丰富的内置运算符分类如下算术运算符关系运算符逻辑运算符复合赋值运算符位运算符其他运算符运算符优先级由高到低类别运算符结合性后缀 gt 从左到右一元 ty
python学得好监狱进的早_蟒周刊-403-监狱中学 Python 改变人生

200115 Zoom Quiet 大妈用时 42 分钟完成快译 200115 Zoom Quiet 大妈用时 17 分钟完成格式转抄 Ned was getting reports for a mysterious disk I
铨顺宏RFID：应用超高频RFID技术智能档案管理系统

根据超高频率RFID技术性智能化档案智能管理系统将改变这一现况根据选用先进的超高频率RFID自动检索技术应用和计算机系统技术性以超高频率RFIDrfid标签做为信息储存媒体并黏贴在档案袋上在超高频率RFID集成ic中储存该档案的基本
看完这篇教你玩转渗透测试靶机vulnhub——FunBox2（ROOKIE）

Vulnhub靶机FunBox2 ROOKIE 渗透测试详解 Vulnhub靶机介绍 Vulnhub靶机下载 Vulnhub靶机安装 Vulnhub靶机漏洞详解信息收集 FTP匿名访问暴力破解 SSH私钥登入获取Shell Sudo提权
YOLO V4论文解读

YOLO V4论文解读一 YOLOV3回顾二 YOLOV4中三 Bag of freebies 数据扩充模拟对象遮挡结合多幅图像进行数据扩充解决类别不平衡 label smoothing bbox Yolov4 use 四 Ba
java 字符串示例

概述最近项目上需求需要Android端在一段字符串分包处理在此做个笔录 1 code public class Main public static void main String args System out println
mysql 1786_mysql错误：Statement violates GTID consistency

在MYSQL中执行建表语句时CREATE TABLE aaaa AS SELECT FROM menu 报错误代码 1786 Statement violates GTID consistency CREATE TABLE SELECT
训练loss不下降的原因总结

表现训练过程中loss值一直震荡没有下降趋势原因一梯度消失多因为网络深度过深接近输入层的参数梯度过小解决方法调整网络激活函数relu batch normal 残差网络等原因二训练数据分布不均匀这种情况对训练数据s
力扣：350.两个数组的交集 II

力扣 350 两个数组的交集 II 题目给你两个整数数组 nums1 和 nums2 请你以数组形式返回两数组的交集返回结果中每个元素出现的次数应与元素在两个数组中都出现的次数一致如果出现次数不一致则考虑取较小值可以不考虑输出结
大数据课程I3——Kafka的消息流与索引机制

文章作者邮箱 yugongshiye sina cn 地址广东惠州本章节目的掌握Kafka的消息流处理掌握Kafka的索引机制掌握Kafka的消息系统语义一 Kafka消息流处理 1 Producer 写入消息流程说明 1 p
yolov5转tensorrt c++

目录 yolo tensorrt 下载weights模型 onnx tensorrt project 编译问题解决依赖项自己生成weights模型以及加载报错解决生成引擎报错解决批量预测自动创建引擎解决检测框乱的问题提速 b
对接微信米大师虚拟支付2.0文档

话不多说上代码支付密钥算法 public static String calcPaySig String uri String postBody String appKey String needSignMsg uri postBody
前端框架之Vue学习（一）

1 Vue简介一 vue 是一套用于构建用户界面的渐进式框架二 Vue的核心特点 1 相应的数据变化当数据发生改变 gt 视图自动更新 2 组合的视图组件 UI页面映射为组件树划分组件可维护可复用可测试三 MVC和MVVM M

随机推荐

计算机中丢失ucrtbased.dll

如果在运行某软件或编译程序时提示缺少找不到ucrtbased dll等类似提示在 https cn dll files com ucrtbased dll html 下载解压如果您的系统是64位的请将dll文件复制到C Window
火猴之抽奖大转盘（firemonkey）

活动中往往有抽奖环节如何使用firemonkey制作一个抽奖的程序呢效果思路 1 rectangle line text作为可以转动的转盘和指针以及按钮 2 pie 共 10个作为不同颜色的底每个startangle和endangl
Linux系统离线安装包及其依赖的下载安装

一概述我们在Linux系统下进行项目开发时经常会出现缺少某些依赖库或者开发包的情况这时候一般会通过使用apt命令去联网下载但在某些特殊情况下例如终端硬件不支持网络连接周边缺少有线与无线网络或者需要批量安装程序到很多终端上时
Window平台---IPSEC客户端的安装

1 安装主机证书参见证书的申请与安装一节 2 从http vpn ebootis de 站点下载 ipsec exe 3 下载windwos2000的ipsec资源工具 http download microsoft com downlo
代码保护软件VMProtect用户手册控制面板“项目”部分都有哪些功能？

VMProtect是一种很可靠的工具可以保护应用程序代码免受分析和破解但只有在应用程序内保护机制正确构建且没有可能破坏整个保护的严重错误的情况下才能实现最好的效果下载VMProtect最新试用版接下来为大家介绍关于VMProtec
移动距离（跳出C++向下取整带来的误区）

移动举例问题文章目录移动举例问题问题详情问题分析跳出误区代码问题详情 X星球居民小区的楼房全是一样的并且按矩阵样式排列其楼房的编号为 1 2 3 当排满一行时从下一行相邻的楼往反方向排号比如当小区排号宽度为 6时开
perl进程管理

原文链接 https www jc2182 com perl perl process manager html 进程管理您可以按照各种要求使用 Perl 来创建新流程本教程将列出创建和管理Perl流程的一些重要且最常用的方法您可以使
使用ChatGPT帮助快速读书：《Rise of the Robots: Technology and the Threat of a Jobless Future》

有了ChatGPT的帮助读书也快了英文版的书也可以快速了解其主要内容不知道这样囫囵吞枣的阅读有没有其它副作用先读了几本再说 Rise of the Robots Technology and the Threat of a Jobl
【论文笔记】BEIT V2: Masked Image Modeling with Vector-Quantized Visual Tokenizers

1 介绍 1 1 核心观点当时的所有的重建目标都是关于低级图像元素的低估了高级语义 Q 怎么去定义高级和低级语义 1 2 基本流程 VQ KD编码器首先根据可学习码本将输入图像转换为离散令牌然后解码器学习重建由教师模型编码的语义特征
前后端获取当前日期

js直接获取当天时间标准格式年月日时分秒往后推迟时间则添加 1小时 60 60 1000 new Date new Date 8 3600 1000 toJSON substr 0 19 replace T 后端获取 new Sim
git cherry-pick 解决开发分支选错问题

应用场景正常开发流程创建分支并checkout转换为开发分支进行开发但我在master开发后commit之后意识到了这个问题重新git pull后并checkout新分支发现代码改动遗失因为git pull 会把当前分支覆盖在请
Network 【HDU - 3078】【LCA+暴力查询】

题目链接你要是真暴力这道题还是要T的但是做了剪枝就会过了我们知道对于LCA每个节点有它自己的深度在这里我就将每个节点的深度数组当作了每个节点道最初根节点的距离了然后就是剪枝操作饿了判断是否是可行解的时候用的是dis x d
最新最全的angular4.x、anuglar2、anuglar8入门实战视频教程

angular4 x视频教程强势来袭忙碌的工作不停的充电好久没遇到这么实用的教程了跟同行分享一下写篇文章放松放松有好的技术资源的也希望大家多分享我会关注学习的 angular4 x angular5 x angular8 x
洛谷 P1876 开灯

题目链接 https www luogu com cn problem P1876 include
图像分析技术大比拼：图像分类、图像识别、目标检测的优缺点分析与算法比较

计算机视觉是人工智能领域的一个重要分支它旨在构建能够理解和处理图像视频等视觉信息的计算机系统在计算机视觉领域中图像分类图像识别和目标检测是三个重要的任务一图像分类图像分类是计算机视觉领域最基础的任务之一它的目的是将一张图像
Linux--高级IO

高级IO 1 五种IO模型阻塞IO 在内核将数据准备好之前系统调用会一直等待所有的套接字默认都是阻塞方式阻塞IO是最常见的IO模型非阻塞IO 如果内核还未将数据准备好系统调用仍然会直接返回并且返回EWOULDBLOCK错误码
PyCharm创建virtualenv方法

Python的版本众多在加上适用不同版本的Python Package 这导致在同时进行几个项目时对库的依赖存在很大的问题这个时候就牵涉到对Python以及依赖库的版本管理方便进行开发 virtualenv就是用来解决这个问题的下
Kafka 验证部署（单机版）kafka-producer-perf-test.sh 吞吐量测试工具的基本使用

1 测试topic创建与删除 1 创建一个测试topic 名为test topic 创建3个分区每个分区分配1个副本因为是单机kafka 如果是集群的话可以分配多个副本如果分配的副本数大于broker的数量时会报错 bin kafk
华为内部面试题库---（14）

1 关于虚拟地址空间的说法错误的是 A 进程地址空间是用多少分配多少 4G仅仅是最大限额 B 进程的地址空间并不一定对应实际的物理页 C 不同进程的不同虚拟地址可以映射到相同的物理页 D 不同进程的相同虚拟地址不能映射到相同的物理页解答
KNN回归-预测二手车

KNN是一个典型的分类模型就时预测类别例如苹果香蕉等预测的结果是训练集上已经包含的类别并不会预测出新的类别二手车价格预测是预测车的价格是数值理应按照回归算法来算怎么用knn来实现回归问题呢找到最近的K样本之后我们直接

KNN回归-预测二手车

KNN回归-预测二手车 的相关文章

随机推荐

热门标签

KNN回归-预测二手车的相关文章