基于k近邻（KNN）的手写数字识别

2023-05-16

作者：faaronzheng 转载请注明出处！

最近再看Machine Learning in Action. k近邻算法这一章节提供了不少例子，本着Talk is cheap的原则，我们用手写数字识别来实际测试一下。简单的介绍一下k近邻算法（KNN）：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。如下图所示：

x为测试样本，小黑点是一类样本，小红点是另一类样本。在测试样本x的周围画一个圈，这个圈就是依据某种距离度量画出的，可以看到我们选择的是5近邻。现在我们要做出一个预测，就是这个测试样本x是属于小黑点那一类还是小红点那一类呢？很简单，我们只要看看选中的近邻中哪一类样本多就把这类样本的标签赋给测试样本就可以了。图中自然就是小黑点，所以我们预测x是小黑点。

正文：

第一步：准备实验数据。Machine Learning in Action书中的数据使用的是“手写数字数据集的光学识别”一文中的数据。具体可以参考书中的相关介绍。所有的数据是以Txt形式保存的，由32行32列的0/1元素组成。下图就是一个手写数字0的保存数据。可以看出，数字所在的位置用1表示，空白的用0表示。

除此之外，为了能识别自己手写的数字，我们在原来实验的基础上添加画板的功能，使其能采集自己手写的数字并按照相同的格式保存下来。如下图所示，当点击CustomizeTestData后会出现一个画板，当我们在画板上写上数字后，按下ESC键保存图片并退出，接下来将保存的图片处理成我们想要的格式，就可以用算法对其进行预测了。画板的实现使用了pygame。

下面是画板功能的具体实现：

import pygame
from pygame.locals import *
import math
from sys import exit
#向sys模块借一个exit函数用来退出程序
pygame.init()
#初始化pygame,为使用硬件做准备
 
class Brush():
 def __init__(self, screen):
  self.screen = screen
  self.color = (0, 0, 0)
  self.size = 4
  self.drawing = False
  self.last_pos = None
  self.space = 1
  # if style is True, normal solid brush
  # if style is False, png brush
  self.style = False
  # load brush style png
  self.brush = pygame.image.load("brush.png").convert_alpha()
  # set the current brush depends on size
  self.brush_now = self.brush.subsurface((0,0), (1, 1))
 
 def start_draw(self, pos):
  self.drawing = True
  self.last_pos = pos
 def end_draw(self):
  self.drawing = False
 
 def set_brush_style(self, style):
  print "* set brush style to", style
  self.style = style
 def get_brush_style(self):
  return self.style
 
 def get_current_brush(self):
  return self.brush_now
 
 def set_size(self, size):
  if size < 0.5: size = 0.5
  elif size > 32: size = 32
  print "* set brush size to", size
  self.size = size
  self.brush_now = self.brush.subsurface((0,0), (size*2, size*2))
 def get_size(self):
  return self.size
 
 def set_color(self, color):
  self.color = color
  for i in xrange(self.brush.get_width()):
   for j in xrange(self.brush.get_height()):
    self.brush.set_at((i, j),
      color + (self.brush.get_at((i, j)).a,))
 def get_color(self):
  return self.color
 
 def draw(self, pos):
  if self.drawing:
   for p in self._get_points(pos):
    # draw eveypoint between them
    if self.style == False:
     pygame.draw.circle(self.screen, self.color, p, self.size)
    else:
     self.screen.blit(self.brush_now, p)
 
   self.last_pos = pos
 
 def _get_points(self, pos):
  """ Get all points between last_point ~ now_point. """
  points = [ (self.last_pos[0], self.last_pos[1]) ]
  len_x = pos[0] - self.last_pos[0]
  len_y = pos[1] - self.last_pos[1]
  length = math.sqrt(len_x ** 2 + len_y ** 2)
  step_x = len_x / length
  step_y = len_y / length
  for i in xrange(int(length)):
   points.append(
     (points[-1][0] + step_x, points[-1][1] + step_y))
  points = map(lambda x:(int(0.5+x[0]), int(0.5+x[1])), points)
  # return light-weight, uniq integer point list
  return list(set(points))
 
class Menu():
 def __init__(self, screen):
  self.screen = screen
  self.brush = None

 def set_brush(self, brush):
  self.brush = brush

 
class Painter():
 def __init__(self):
  self.screen = pygame.display.set_mode((100, 100))
 # self.menu = pygame.display.set_mode((80, 600))
  pygame.display.set_caption("Painter")
  self.clock = pygame.time.Clock()
  self.brush = Brush(self.screen)
  self.menu = Menu(self.screen)
  self.menu.set_brush(self.brush)
 
 def run(self):
  self.screen.fill((255, 255, 255))
  while True:
   # max fps limit
   self.clock.tick(30)
   for event in pygame.event.get():
    if event.type == QUIT:
        pygame.quit()
     #   break
    elif event.type == KEYDOWN:
     # press esc to clear screen
     if event.key == K_ESCAPE:
      fname = "test.png"
      pygame.image.save(self.screen, fname)    
      pygame.quit()
      #break
    elif event.type == MOUSEBUTTONDOWN:
     # <= 74, coarse judge here can save much time
     if ((event.pos)[0] <= 74 and
       self.menu.click_button(event.pos)):
      # if not click on a functional button, do drawing
      pass
     else:
      self.brush.start_draw(event.pos)
    elif event.type == MOUSEMOTION:
     self.brush.draw(event.pos)
    elif event.type == MOUSEBUTTONUP:
     self.brush.end_draw()
    self.menu.draw()
    pygame.display.update()

KNN算法--KNN的关键在我看来是距离度量的选择。不同的距离度量会对最终的结果产生比较大的影响。首先将手写数字变化为一个一维的向量，通过计算测试样例（向量）和每个训练样本（向量）之间的距离然后进行排序。最后选最近的k个进行投票产生对测试样例的预测。

import pygame
from numpy import *
import operator
from os import listdir
from Board import *
import Tkinter
import tkFileDialog
import tkMessageBox
import Image  
from KNN import dot
pygame.init()


def classify0(inX, dataSet, labels, k):           #k控制选取最近的k个近邻然后投票
    dataSetSize = dataSet.shape[0]
    #计算欧式距离（其实比较的是两个向量之间的距离）
    diffMat = tile(inX, (dataSetSize,1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()     
    classCount={}          
    #投票
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
    sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]
def classify1(inX,dataSet,labels, k):
 dataSetSize = dataSet.shape[0]
 diffMat = tile(inX, (dataSetSize,1)) - dataSet
 diffMatT=(diffMat.T)
 sqDiffMat = dot(diffMat,diffMat.T)
 distances = sqrt(sqDiffMat)   
 sortedDistIndicies=distances.argsort() 
 classCount={}         
#投票
 for i in range(k):
    voteIlabel = labels[sortedDistIndicies[i]]
    classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
 sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
 return sortedClassCount[0][0]
# 将文件转化为向量
def img2vector(filename):
    returnVect = zeros((1,1024))
    fr = open(filename)
    for i in range(32):
        lineStr = fr.readline()
        for j in range(32):
            returnVect[0,32*i+j] = int(lineStr[j])
    return returnVect

def handwritingClassTest(TrainDataPath):
    hwLabels = []
    trainingFileList = listdir(TrainDataPath)           #load the training set
    m = len(trainingFileList)
    trainingMat = zeros((m,1024))
    for i in range(m):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)
        trainingMat[i,:] = img2vector(TrainDataPath+'/%s' % fileNameStr)
    testFileList = listdir('C:/Users/HP/Desktop/MLiA_SourceCode/machinelearninginaction/Ch02/testDigits')        #iterate through the test set
    errorCount = 0.0
    mTest = len(testFileList)
    for i in range(mTest):
        fileNameStr = testFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        vectorUnderTest = img2vector('C:/Users/HP/Desktop/MLiA_SourceCode/machinelearninginaction/Ch02/testDigits/%s' % fileNameStr)
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 3)
        print "the classifier came back with: %d, the real answer is: %d" % (classifierResult, classNumStr)
        if (classifierResult != classNumStr): errorCount += 1.0
    print "\nthe total number of errors is: %d" % errorCount
    print "\nthe total error rate is: %f" % (errorCount/float(mTest))

top = Tkinter.Tk()

def TrainDataCallBack():
    TrainDataPath=tkFileDialog.askdirectory()
    handwritingClassTest(TrainDataPath)

def CustomizeTestDataCallBack():
    board = Painter()
    board.run()
    
def TestingCustomizeTestDataCallBack():
    ResizePic()
    TransformArray()
TrainDataButton = Tkinter.Button(top, text ="TrainData", command = TrainDataCallBack)
CustomizeTestDataButton = Tkinter.Button(top, text ="CustomizeTestData", command = CustomizeTestDataCallBack)
TestingButton = Tkinter.Button(top, text ="TestingCustomizeTestData", command = TestingCustomizeTestDataCallBack)

def ResizePic():
    im = Image.open("test.png")  
    w,h = im.size  
    im_ss = im.resize((int(32), int(32)))  
    im_ss.save("test.png")  

def TransformArray():
    TestArray = zeros((1,1024))
    im = Image.open("test.png")  
    width,height = im.size  
    for h in range(0, height):  
      for w in range(0, width):  
        pixel = im.getpixel((w, h))      
        if pixel!=(255,255,255):
            TestArray[0,32*h+w]=int(1)
    handwritingTesting(TestArray)


def handwritingTesting(TestArray):
  #  TrainDataPath=tkFileDialog.askdirectory()
    TrainDataPath="C:/Users/HP/Desktop/MLiA_SourceCode/machinelearninginaction/Ch02/trainingDigits"
    hwLabels = []
    trainingFileList = listdir(TrainDataPath)           #load the training set
    m = len(trainingFileList)
    trainingMat = zeros((m,1024))
    for i in range(m):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)
        trainingMat[i,:] = img2vector(TrainDataPath+'/%s' % fileNameStr)      
    classifierResult = classify0(TestArray, trainingMat, hwLabels, 100)
    classifierResult1 = classify1(TestArray, trainingMat, hwLabels, 100)
    print "the classifier came back with: %d"  %  classifierResult
    print "the classifier came back with: %d"  %  classifierResult1
       
TrainDataButton.pack()
CustomizeTestDataButton.pack()
TestingButton.pack()
top.mainloop()

源代码下载：faaron-KNN手写字识别

这里面我们采用了很笨的方法将测试样本与所有训练样本进行比较，更有效的方法是采用KD树。另外k的取值在这里也是固定的，更好的方法是在一个区间内网格搜索~

未完待续。。。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

KNN

手写数字识别

基于k近邻（KNN）的手写数字识别的相关文章

基于numpy的CNN实现，进行MNIST手写数字识别

主要框架来自于这篇文章 xff1a https blog csdn net qq 36393962 article details 99354969 xff0c 下面会以原文来代称这篇文章本文在原文的基础上增加了交叉熵以及mnist数据集
Kmeans聚类（手写数字识别）

Kmeans算法原理 xff1a 在给定K个初始聚类中心点的情况下 xff0c xff08 1 xff09 把数据中的每个样本分到离其最近的聚类中心所代表的类中 xff08 2 xff09 分类完后计算从新每个类的中心点 xff08 取平均
【TensorFlow】使用LeNet-5模型实现mnist手写数字识别

LeNet 5 模型 LeNet 5是卷积神经网络 xff08 CNN xff09 中较简单的一个网络模型 xff0c 在学习LeNet 5之前 xff0c 最好先去了解以下卷积神经网络的基本概念与过程 LeNet 5模型总共有7层 xff
机器学习（二）--- KNN（K-Nearest Neighbors）

KNN K Nearest Neighbors 简单类比 xff08 Simple Analogy xff09 KNN xff1a 通过你周围的人来判断你是哪一类人 Tell me about your friends who your n
实现基于TensorFlow的手写数字识别（1）

一 MNIST数字识别数据集获取及处理通过学习林大贵老师的 TensorFlow Keras深度学习人工智能实践应用对图像处理的过程有了较浅薄的理解在此与大家分享同时由于上书中提供的代码下载页面失效笔者按照书本中的内容手敲代码如
基于Hadoop的Knn算法实现

Knn算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别则该样本也属于这个类别并具有这个类别上样本的特性该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别 Knn方法在类
K-近邻算法之鸢尾花实例使用Spark实现KNN的Demo

1 1 K 近邻算法 KNN 概念 K Nearest Neighbor算法又叫KNN算法这个算法是机器学习里面一个比较经典的算法总体来说KNN算法是相对比较容易理解的算法定义如果一个样本在特征空间中的k个最相似即特征空间中最邻近
机器学习(四)：基于KNN算法对鸢尾花类别进行分类预测

文章目录专栏导读 1 KNN算法原理 2 实战案例对鸢尾花类别分类预测 2 1确定特征和类别 2 2对特征进行处理 2 3对模型调参选择最优参数 2 4使用分类模型进行预测 2 5评估模型检验模型效果 3 完整代码及结果专栏导读
caffe安装以及LeNet实现手写数字体识别

0 引言今天开始正式跳入深度学习的坑希望自己两年半的研究生生涯中能够在深度学习方面取得一点成绩今天开始在服务器上弄caffe的时候遇到了很多问题看了很多博客最终解决了问题现在把遇到的问题以及解决方案总结一下本文是基于服务器已
KNN分类算法原理及其Matlab实现

KNN算法原理 K近邻算法是一种简单的监督学习算法对于给定测试样本直接计算该样本和训练集的距离将距离最近的k个邻居点的类别作为参考作为预测结果返回测试数据测试数据来自林智仁的分类任务数据集链接 https www csie
KNN数据分类算法的matlab仿真

目录 1 算法概述 2 仿真效果 3 MATLAB仿真源码 1 算法概述 KNN的本质是通过距离判断待测样本和已知样本是否相似待测样本找到与已知样本中与其距离最近的K个样本对这k个样本它们大多数属于哪一类别就把待测样本归为哪一类别
基于Python爬虫+KNN数字验证码识别系统——机器学习算法应用（含全部工程源码）+训练数据集

目录前言总体设计系统整体结构图系统流程图运行环境 Python 环境模块实现 1 数据爬取 2 去噪与分割 3 模型训练及保存 4 准确率验证系统测试工程源代码下载其它资料下载前言本项目利用Python爬虫技术通过网
matlab中的KNN算法

我正在研究拇指识别系统我需要实现 KNN 算法来对我的图像进行分类根据this 它只有 2 个测量值通过这些测量值计算找到最近邻居的距离但在我的例子中我有 400 张 25 X 42 的图像其中 200 个用于训练 200 个用
scikit-learn 的 KNN 如何计算概率估计？

scikit learn中KNN算法的实现是如何计算概率估计的predict proba X method 以下示例摘自 sklearn 文档但进行了一些修改以便您可以理解我们在这种情况下做什么有关更多详细信息请参见 https s
如何在 python 中使用 kNN 动态时间扭曲

我有一个带有两个标签的时间序列数据集 0 and 1 我在用动态时间扭曲 DTW 作为使用 k 最近邻 kNN 进行分类的相似性度量如这两篇精彩的博客文章中所述 https nbviewer jupyter org github mark
朴素贝叶斯分类器 - 多重决策

我需要知道朴素贝叶斯分类器是否可用于生成多个决策我不能找到任何有证据支持的例子多项决定我是这个领域的新手所以我有点使困惑实际上我需要开发字符识别软件在那里我需要确定给定的字符是什么看来贝叶斯分类器可以用来识别给定的字
使用 TF-IDF 分数进行文本分类的 KNN

我有一个 CSV 文件 corpus csv 其中包含语料库中以下格式的分级摘要文本 Institute Score Abstract UoM 3 0 Hello this is abstract one UoM 3 2 Hello th
Sklearn KNeighborsRegressor 自定义距离度量

我正在使用 KNeighborsRegressor 但我想将它与自定义距离函数一起使用我的训练集是 pandas DataFrame 如下所示 week day hour minute temp humidity 0 1 9 0 1 1
K 最近邻算法 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案使用 KNN 算法假设 k 5 现在我尝试通过获取 5 个最近的邻居来对未知对象进行分类如果确定 4 个最近邻居后接下来的 2 个
属性错误：“图形”对象没有属性“节点”

我有以下 python 代码来构建 knn 图但出现错误 AttributeError Graph 对象没有属性 node 似乎 nx Graph 没有节点属性但我不知道应该用它替换什么 import networkx as nx de

随机推荐

DS18B20 1-WIRE ROM搜索算法详解

转自 xff1a http blog sina com cn s blog 57ad1bd20102uxxw html 1 WIRE 搜索算法详解 xff08 1 xff09 0 前言美信公司 xff08 http www maximin
关于python tkinter 多线程依然无响应问题

今天解决了一个GUI程序的多线程问题因为GUI程序在执行高IO操作的时候容易出现假死和无响应的状态 xff0c 所以需要用到多线程但我的程序开了线程之后依然是无响应状态几次尝试 xff0c 终于找到问题所在 1 首先 xff0c 我的
Ubuntu内核的查看、更新、卸载、取消及启用自动更新

1 查看当前内核版本 xff1a uname r 2 升级内核 xff1a sudo apt get update sudo apt cache search linux image 查看可用内核在选择合适的内核后 xff0c sudo
孤立森林(Isolation Forest)

背景现有的异常检测方法主要是通过对正常样本的描述 xff0c 给出一个正常样本在特征空间中的区域 xff0c 对于不在这个区域中的样本 xff0c 视为异常这些方法的主要缺点是 xff0c 异常检测器只会对正常样本的描述做优化 xff0
FreeRTOS三种数据结构区别（StreamBuffer，MessageBuffer，Queue）

Queue队列是最基本的数据结构 xff0c 在FreeRTOS v10 0后提供了另外两种高级数据结构为Streambuffer和MessageBuffer xff0c 称为流式缓冲区和消息缓冲区 FreeRTOS 嵌入式系统开源 Fre
ubuntu16安装librealsense 以及在ros上使用 [深度相机sr300]

记录ubuntu16安装librealsense 和ros包的过程 xff0c 还有一些遇到的问题温馨提醒如果按照下面步骤每一步完成 xff08 都没报错 xff09 xff0c 还是不能显示图像 xff0c 换个usb3 0口试试或者
原生安卓苹果APP-java抢单派单系统平台源码

简介 xff1a java源码派单系统平台源码完整版带项目说明网盘下载地址 xff1a http kekewl cc 9qsCp179URb0 图片 xff1a
基于Android和OpenCV的物体跟随系统设计需要留言

本设计为基于Android和OpenCV的物体跟随系统设计本文对基于计算机视觉的物体跟随系统的特点和应用领域国内外的研究现状及其发展分别做出了较详尽介绍并且按照社会科技化进步的要求 xff0c 给出了具有参考意义的智能跟随模块系统根
【Linux C王者归来】【第十一章】【进程控制】

1 程序可以有多个进程 xff0c 一个进程与进程id11 对应 2 PROC中的数字对应id号 xff0c getpid和getppid可以获得进程id父进程id 3 getuid geteuid 获得进程用户id和有效用户id 4 ge
DSP28335使用FIFO的串口中断总结

一串行通信与并行通信 DSP控制器间 xff0c DSP控制器与外部设备间交换信息 xff0c 通信 xff0c 可采取的通信方式主要两大类1 串行通信 2 并行通信并行通信一般包括多条数据线多条控制线和状态线 xff0c 传输速度快
点阵屏上绘图——基于LCD12864 控制详解

本文引用自 xff1a http blog csdn net s3c44b0x article details 7498706 原始地址 xff1a http www amobbs com thread 591361 1 1 html 相关
使用iPad编写C++程序(转载)

使用iPad编写C 43 43 程序一搭建C 43 43 环境 1在cydia内安装 deb 包注 xff1a 在cydia 软件源设置中改为开发者 xff0c 否则有些deb搜索不到 OpenSSH xff0c OpenSSL w
Python多线程学习(三、生产者与消费者)

生产者与消费者问题是典型的同步问题这里简单介绍两种不同的实现方法 1 xff0c 条件变量 view plaincopy to clipboardprint import threading import time class Produ
在~Firmware下面用roslaunch 启动launch 报错 udp0: sendto:Invalid argument

在 Firmware下面用roslaunch 启动launch 报错 xff0c 如下 roslaunch px4 mavros posix sitl launch 报错 ERROR 1658284290 546891096 udp0 se
roslaunch运行px4功能包报错

运行条件ubuntu 16 04 ros kinetic 隔段时间运行roslaunch 会如下错误 mavros posix sitl launch is neither a launch file in package px4 nor
tf2_ros::Buffer::Buffer(ros::Duration, bool)’未定义的引用

新建一个功能包及 cpp文件后报错tf2 ros Buffer Buffer ros Duration bool 未定义的引用 opt ros kinetic include tf2 ros buffer h 51 xff1a 对 vtab
Android Studio 配置 JDK1.8 使用Lambda表达式

Android Studio 配置 JDK1 8 使用Lambda表达式 JDK1 8 添加几项新特性譬如对集合的优化语法的便捷配合Lambda表达式使用可以让代码更加简便美观 xff0c 但对于一些没有接触Lambda表达式的同学们来说就
深入解读四轴飞行器的硬件设计

xfeff xfeff 转载自 xff1a http www openedv com posts list 20892 htm 传感器之一 xff1a 角速度传感器应用科里奥利力原理 xff1a 科里奥利力来自于物体运动所具有的惯性 xff
【GIT】使用Vscode同步git仓库，错误和解决方法记录

这里写目录标题命令行操作仓库常见命令1 报错在签出前 xff0c 请清理存储库工作树 2 报错 fatal unable to access 39 https github com 39 OpenSSL SSL read Connect
基于k近邻（KNN）的手写数字识别

作者 xff1a faaronzheng 转载请注明出处 xff01 最近再看Machine Learning in Action k近邻算法这一章节提供了不少例子 xff0c 本着Talk is cheap的原则 xff0c 我们用手写数

基于k近邻（KNN）的手写数字识别

基于k近邻（KNN）的手写数字识别 的相关文章

随机推荐

热门标签

基于k近邻（KNN）的手写数字识别的相关文章