使用k-近邻算法识别手写数字

2023-05-16

本文摘自《机器学习实战》案例,对其进行了代码更新与注释。

实战介绍

使用k-近邻分类器构造手写识别系统,为了简单起见,系统只识别0-9,需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小:宽高是32像素*32像素的黑白图像。每个图像存于相应的txt文档中,如数字0的图像,存于‘0_x.txt’;数字1的图像,存于‘1_x.txt’中,其中x代表文档在文件夹的位次。
需要资源者请回复!!!

准备数据:将图像转化为测试向量

为了分类器更好处理,我们将把一个3232的二进制图像矩阵转化为11024的向量

def img2vector(filename):
    fr=open(filename)
    totalContent=fr.readlines()
    #size记录每列字符的数量,即行数,为32
    size=len(totalContent)
    #returnVectorLen记录文件中字符的数量,为1024
    returnVectorLen=0
    #horizonSize记录每行字符的数量,即列数,为32
    horizonSize=0
    for line in totalContent:
        line=line.strip()
        horizonSize=len(line)
        returnVectorLen+=horizonSize
    returnVect=np.zeros((1,returnVectorLen))
    for i in range(size):
        linestr=totalContent[i]
        for j in range(horizonSize):
            returnVect[0,horizonSize*i+j]=int(linestr[j])
    return returnVect

k-近邻算法

def classify0(inx,dataset,labels,k):
    datasize=dataset.shape[0]
    diffMat=np.tile(inx,(datasize,1))-dataset
    sqDiffMat=diffMat**2
    #axis=1代表横轴,即列表每行求和
    sqDistance=sqDiffMat.sum(axis=1)
    distance=sqDistance**0.5
    #.argsort()返回列表值从小到大的索引值
    sortedDistIndicies=distance.argsort()
    classCount={}
    for i in range(k):
        voteIlabel=labels[sortedDistIndicies[i]]
        classCount[voteIlabel]=classCount.get(voteIlabel,0)+1
    #items()返回字典的元组列表,逆序=降序;sorted()函数返回的是列表副本,sort()是对自己的操作,无返回值
    sortedClassCount=sorted(classCount.items(),key=lambda x:x[1],reverse=True)
    return sortedClassCount[0][0]

测试算法:使用k-近邻算法识别手写数字

在资源中,我们已经准备好测试文件‘testDigits’

from os import listdir
def handwritingClassTest():
    hwLabels=[]
    #listdir用于列出给定目录其中的文件名
    trainingFileList=listdir('traingDigits')
    m=len(trainingFileList)
    trainingMat=np.zeros((m,1024))
    for i in range(m):
        fileNameStr=trainingFileList[i]
        fileStr=fileNameStr.split('.')[0]
        classNumStr=int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)
        trainingMat[i,:]=img2vector('traingDigits/'+fileNameStr)
    testFileList=listdir('testDigits')
    errorCount=0.0
    mTest=len(testFileList)
    for i in range(mTest):
        fileNamestr=testFileList[i]
        fileStr=fileNameStr.plit('.')[0]
        classNumStr=int(fileStr.split('_')[0])
        vectorUnderTest=img2vector('testDigits/'+fileNameStr)
        classifierResult=classify0(vectorUnderTest,trainingMat,hwLabels,3)
        if classifierResult!=classNumStr:
            errorCount+=1.0
    return errorCount/float(mTest)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用k-近邻算法识别手写数字 的相关文章

  • gazebo save world as 之后卡死问题的解决方法

    最近在学习ROS xff0c 后面在用gazebo做仿真的时候 xff0c 在gazebo中加入任意模型 xff0c 然后点击save world as然后卡死的问题一直无法解决 尝试过的思路比如更换版本 xff0c 下载源代码编译后安装
  • 这才是企业级的oss-spring-boot-starter

    本文主要讲解企业级OSS对象存储服务Spring Boot Starter制作 xff0c 开箱即用 xff0c 为项目进行赋能 基于AmazonS3协议 xff0c 适配市面上的对象存储服务如 xff1a 阿里云OSS 腾讯COS 七牛云
  • 项目管理-项目相关方管理

    识别相关方 相关方分析 会产生相关方清单和关于相关方的各种信息 xff0c 例如 xff0c 在组织内的位置 在项目中的角色 与项目的厉害关系 期望 态度 xff08 对项目的支持程度 xff09 xff0c 以及对项目信息的兴趣 权力 利
  • 分享关于AI的那些事儿

    机器人很厉害 给人治病的ibm 的Watson 沃森 击败世界围棋冠军的AlphaGo阿尔法狗 陪你聊天的机器人 数据标注 木马识别 恶意访问拦截 智能家居 但是17年首次出现了机器人获得国籍 这个机器人叫做索菲亚 这是一个类似人类的机器人
  • 408 知识点笔记——计组(总线、输入/输出系统)

    6 总线 总线的基本概念 分时和共享是总线的两个特点 xff0c 分时是指同一时刻只允许有一个部件向总线发送信息 xff0c 共享可以允许多个部件同时从总线上接收信息 总线特性 物理特性 xff1a 如插头与插座的几何尺寸 形状 引脚个数及
  • Ubuntu18.04安装Kalibr各种问题总结

    近期需要作相机与IMU的联合标定 xff0c 安装Kallibr过程遇到好多问题 xff0c 前前后后折腾了3天 xff0c 终于可以标定了 这里记录一下问题 xff0c 希望可以帮助更多人 1 catkin make过程中下载SuiteS
  • 01-搭建Vue脚手架(vue-cli)

    一 那么我们就从最简单的环境搭建开始 xff1a 安装node js xff0c 从node js官网下载并安装node xff0c 安装过程很简单 xff0c 一路 下一步 就可以了 xff08 傻瓜式安装 xff09 安装完成之后 xf
  • vscode打开终端的快捷键是啥? VScode打开终端的三种方法

    方法1 xff1a 打开终端的快捷方法 打开VScode后 xff0c 鼠标左键单击窗口顶部的 帮助 xff08 如下图红圈标注 xff09 xff0c 在下拉列表中找到 键盘快捷方式参考 xff08 如下图红框标注 xff09 鼠标左键点
  • VS Code保存后自动格式化Vue代码---Vetur

    在VS Code里面编辑Vue代码 xff0c 通常我们会安装插件Vetur xff0c 本次介绍的格式化代码也依赖于Vetur插件 具体见一下步骤 注 xff1a VS Code版本为1 74 3 1 安装插件Vetur 2 配置自动格式
  • vscode中怎样格式化js代码_vscode如何格式化代码

    vs code格式化代码的快捷键如下 xff1a 在Windows上 Shift 43 Alt 43 F 推荐学习 xff1a vscode入门教程 在Mac上 Shift 43 Option 43 F 在Ubuntu上 Ctrl 43 S
  • VsCode使用Ctrl+S保存代码自动格式化Html/Css/JS

    第一步 xff1a 点击文件 首选项 设置 xff08 快捷键 xff1a Ctrl 43 xff09 第二步 xff1a 在搜索框里面输入emmet xff0c 选择工作区 点击 在settings json 中编辑 xff08 红色框的
  • 百度面试基础问题

    上午百度面试 xff0c 我投的测试 xff0c 文三路伊美大酒店 xff0c 面了接近一个小时 xff0c 问了很多基础的东西 xff0c 我有些混淆也有些回答得不全面 xff0c 可能跪了 xff0c 记录一下面试题吧 xff0c 权当
  • vscode使用git

    1 vscode配置git 一 VS code 配置git 1 下载安装git 2 如果要在VS Code里面使用Git则需要在编辑器内配置git path xff08 1 xff09 windows系统 xff0c 打开cmd xff0c
  • 后台管理系统的权限控制与管理

    此文章根据视频教程进行整理前端面试官必问系列 后台系统的权限控制与管理 xff0c 建议搭配视频教程一起食用效果更佳 https www bilibili com video BV15Q4y1K79c 在Web 系统中 xff0c 权限很久
  • 笔试题 11

    1 通过css控制 xff0c 是页面的一个div不可见的方法有哪些 xff1f 1 使用display none来隐藏div 我们可以使用display none属性来隐藏所有的信息 xff0c 包括文本和图片 xff0c 语法为 xff
  • 路由传参的三种方式

    带参数 xff1a 传参方式可划分为 params 传参和 query 传参 xff0c 而 params 传参又可分为在 url 中显示参数和不显示参数两种方式 1 params 传参 xff08 显示参数 xff09 又可分为 声明式

随机推荐

  • 单链表的几类操作介绍(头结点没有数据)

    1 定义一个单链表的结构体 typedef struct Node int data struct Node next node 2 创建一个链表 xff0c 这里分为头插法和尾插法 node CreatNode Head int n in
  • 进程间通信之消息队列和信号量

    消息队列 消息队列是IPC对象的一种 xff0c 由消息队列ID来唯一标识 xff0c 消息队列就是一个消息的列表 用户可以在消息队列中添加消息 读取消息 消息队列可以安装类型来发送 接收消息 消息队列的操作包括 xff1a 创建或者打开消
  • x86架构与ARM架构(AGX、TX2、NX等)下配置带ROS插件的QtCreator(Qt+ROS+ubuntu18)(源码编译安装方式)

    在之前的一篇文章里面提到了Qt 43 ROS 43 ubuntu18环境的搭建 xff0c 但是那种方法不适用于arm架构的电脑 xff0c 原因是x86架构和arm架构的cpu指令集不一样 xff0c 导致下载下来的可执行文件只能在x86
  • 智能医疗辅助诊断——调查与思考

    背景 为什么要做智能医疗 xff1f 优质医疗资源不足且增长缓慢各地方医疗资源分配不均客观条件满足 xff0c 人工智能技术发展 xff0c 算法 算力 数据齐备 目录 指出 xff0c 医用软件按照预期用途分为辅助诊断类和治疗类 诊断功能
  • ThinkServer RD530 服务器更换硬盘背板

    故障描述 所有硬盘告警灯同时闪烁 xff0c 服务器里面硬盘背板貌似也有亮灯 xff0c 很明显的那种 xff0c 但是当前系统能正常使用 xff0c 管理口也没有相关告警信息 xff0c 这款服务器硬盘背板故障没有告警 xff0c 很坑的
  • 常用服务器管理口IP及账号密码(持续更新)

    HP管理口 xff1a ILO 默认用户 密码 xff1a Administrator password HP以前管理口登陆MP卡 通过网线连接MP卡的RJ 45口 xff0c 通过telnet方式登录 xff0c 默认用户 密码 xff1
  • 转载Socket详解

    一切皆Socket xff01 话虽些许夸张 xff0c 但是事实也是 xff0c 现在的网络编程几乎都是用的socket 有感于实际编程和开源项目研究 我们深谙信息交流的价值 xff0c 那网络中进程之间如何通信 xff0c 如我们每天打
  • Google浏览器视频倍速

    Google浏览器视频倍速 1 打开视频网页 xff1b 2 按下F12 xff1b 3 点击console xff1b 4 在框中粘贴代码 xff08 粘贴时 xff0c 鼠标放在箭头水平右侧或者用快捷键ctrl 43 v xff09 x
  • *** ERROR L127: UNRESOLVED EXTERNAL SYMBOL*** ERROR L128: REFERENCE MADE TO UNRESOLVED EXTERNAL

    把 Use extended linker instead of BL51 前面的 去掉就可以了 xff0c 就只有警告了 不知道为啥 xff0c 无意中试出来的 xff0c 编译生成的hex文件用了也没问题
  • 虚拟串口与串口调试助手的使用

    一 用到的软件 xff1a proteusVSPD VSPD是一款本地虚拟串口的软件 可以虚拟2个串口然后连接起来实现自发自收调试 xff0c 让你的程序读一个串口 xff0c 另外一个串口你就用来串口调试工具 二 串口通信步骤 打开VSP
  • keil5软件共用C51和ARM

    第一步 xff1a 创建文件夹keil mdk正常安装并破解MDK5 第二步 xff1a 创建另一个文件夹keil c51安装C51 将该文件夹里面的C51文件夹复制粘贴到keil mdk文件夹里与ARM文件夹保持同一目录 第三步 xff1
  • 【pytorch】Conv2d()里面的参数bias什么时候加,什么时候不加?

    代码中会发现有m 61 nn Conv2d 16 33 3 stride 61 2 bias 61 False bias是False xff0c 而默认的是True 因为一般为False的时候 xff0c nn Conv2d 后面通常接nn
  • Downloading https://ultralytics.com/assets/Arial.ttf to /data/..../.config/Ultralytics/Arial.ttf

    1 报错 xff1a 缺少字体Arial ttf 2 字体链接 xff1a https ultralytics com assets Arial ttf 3 方法 xff1a 下载该链接的字体 xff0c 然后放到 data config
  • 第四章 Opencv图像色彩空间与通道

    文章目录 1 色彩空间1 1 RGB BGR色彩空间1 2 GRAY色彩空间1 3 HSV色彩空间 2 通道2 1 拆分通道 xff1a 96 split 96 方法1 拆BGR色彩空间图像的通道2 拆HSV色彩空间图像的通道 2 2 合并
  • 第五章 Opencv图像的几何变换

    目录 1 缩放图像1 1 resize 方法 2 翻转图像2 1 flip 方法 3 仿射变换图像3 1 warpAffine 方法3 2 平移3 3 旋转3 4 倾斜 4 透视图像4 1 warpPerspective 方法 几何变换是指
  • pip、conda查看镜像源及更换镜像源

    1 查看已经安装过的镜像源 xff1a conda config show channels 查看配置项channels 2 删除镜像源 xff08 清华镜像源 xff09 xff1a conda config remove channel
  • 生成环境下的所有包

    pip freeze span class token operator gt span requirements span class token punctuation span txt 问题 xff1a 将虚拟环境的安装包导出 xff
  • java核心技术卷I

    第三章 xff1a java的基本程序设计结构 文章目录 第三章 xff1a java的基本程序设计结构3 2 注释3 3 数据类型3 4变量3 4 1初始化变量3 4 2常量 3 5运算符3 5 1数学函数与常量3 5 2数值类型之间的转
  • MOT学习笔记 — 行人检测及行人跟踪数据集总结

    1 行人红外数据集总结 xff08 1 xff09 OSU Thermal Pedestrian Database 下载链接 xff1a http vcipl okstate org pbvs bench Data 01 download
  • 使用k-近邻算法识别手写数字

    本文摘自 机器学习实战 案例 xff0c 对其进行了代码更新与注释 实战介绍 使用k 近邻分类器构造手写识别系统 xff0c 为了简单起见 xff0c 系统只识别0 9 xff0c 需要识别的数字已经使用图形处理软件 xff0c 处理成具有