从多个 .csv 文件创建混淆矩阵

2024-05-27

我有很多具有以下格式的 .csv 文件。

从第一列开始，我想读取当前行并将其与前一行的值进行比较。如果它大于或等于，则继续比较，如果当前单元格的值小于前一行 - 然后我将当前值除以前一个值并继续。例如，在上面给出的表中：根据我的要求，我们从第 1 列得到的较小值是 327（因为 327 小于之前的值 340） - 然后我们将 327 除以 340，得到值 0.96。我的 python 脚本应该在打印条件后立即退出（A）如下所示。

from __future__ import division
import csv

def category(val):
    if 0.8 < val <= 0.9:
        return "A"
    if abs(val - 0.7) < 1e-10:
        return "B"
    if 0.5 < val < 0.7:
        return "C"
    if abs(val - 0.5) < 1e-10:
        return "E"
    return "D"

    with open("test.csv", "r") as csvfile:
    ff = csv.reader(csvfile)

    results = []
    previous_value = 0
    for col1, col2 in ff:
        if not col1.isdigit():
            continue
        value = int(col1)
        if value >= previous_value:
            previous_value = value
            continue
        else:
            result =  int(col1)/ int(previous_value)
            results.append(result)
            print category(result)
            previous_value = value
    print (results)
    print (sum(results))
    print (category(sum(results) / len(results)))

最后，我想为当前目录中的所有 .csv 文件运行我的脚本，并构建一个如下所示的混淆矩阵。比方说A1.csv, A2.csv, A3.csv应该（或预测）打印 A，B1.csv, B2.csv, B3.csv应该（或预计）打印B and C1.csv, C2.csv and C3.csv应该（或预测）打印 C，...等。我们如何从多个自动创建混淆矩阵.csv文件例如如下使用Python?

如下所示，矩阵的彩色块（行标签）将向我们展示number of countsA（A 的真实值计数）、B（b 的真实值计数）和 C（C 的真实值计数）等来自我们函数的控制逻辑category()- 上面给出。来自 if-else 语句内的控制逻辑的列标签（A、B、C、D 和 E）。

Add a def get_predict(filename)

def get_predict(filename):
    if 'Alex' in filename:
        return 'Alexander'
    else:
        return filename [0]

读取n个文件，使用计算混淆矩阵pandas crosstab:

import os
import pandas as pd

def get_category(filepath):
    def category(val):
        print('predict({}; abs({})'.format(val, abs(val)))
        if 0.8 < val <= 0.9:
            return "A"
        if abs(val - 0.7) < 1e-10:
            return "B"
        if 0.5 < val < 0.7:
            return "C"
        if abs(val - 0.5) < 1e-10:
            return "E"
        return "D"

    with open(filepath, "r") as csvfile:
        ff = csv.reader(csvfile)

        results = []
        previous_value = 0
        for col1, col2 in ff:
            value = int(col1)
            if value >= previous_value:
                previous_value = value
            else:
                results.append(value / previous_value)
                previous_value = value

    return category(sum(results) / len(results))

matrix = {'actual':[], 'predict':[]}
path = 'test/confusion'
for filename in os.listdir( path ):
    # The first Char in filename is Predict Key
    matrix['predict'].append(filename[0])
    matrix['actual'].append(get_category(os.path.join(path, filename)))

df = pd.crosstab(pd.Series(matrix['actual'], name='Actual'),
                 pd.Series(matrix['predict'], name='Predicted')
                 )
print(df)

Output：（用给定的示例数据读取“A.csv，B.csv，C.csv”三遍）
Predicted  A  B  C
Actual            
A          3  0  0
B          0  3  0
C          0  0  3

使用 Python:3.4.2 进行测试 - pandas:0.19.2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从多个 .csv 文件创建混淆矩阵的相关文章

无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
对 CSV 文件中的列进行分组并连接另一列的值

我刚刚开始使用 PowerShell 在任何地方都找不到这个问题的答案尝试编写一个脚本来导入 CSV 文件并搜索该文件以查看是否有任何名称相同如果名称相同我想将所有这些值写在同一行上并且只显示名称一次例如 Name Number
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P

随机推荐

将 MouseBindings 添加到数据绑定 WPF ListView 中的项目

我试图在用户单击 ListView 中的项目时执行 ViewModel 中的命令当我添加一个ListViewItem在 XAML 中我可以添加一个MouseBinding to its InputBindings
有两个切边的矩形

我不确定这个形状的具体名称是什么但我可以将其称为半平行四边形吗我想纯粹使用这个形状CSS CSS3 有什么帮助吗或教程您可以使用伪元素来完成此操作如下所示做法是从盒子的左下角和右上角剪出一个三角形只要主体背景是纯色此方法
为什么直接访问对象文字上的属性会引发语法错误？

当尝试访问该属性时a物体的 a 我收到错误 SyntaxError Unexpected token 有了括号一切都很好 a 为什么我首先会收到错误有歧义吗花括号被解释为块语句 http es5 github com x12 html
UITableViewHeader 的 UISearchBar 子视图？

我想将 UISearchBar 添加到已有标题视图的 UITableView 中当我尝试将搜索栏添加到现有标题视图时它会一直工作直到我点击它此时我得到The view hierarchy is not prepared for th
Apache“无法初始化模块”，因为更改 PHP 配置后模块和 PHP 的 API 不匹配

php v 给出了这个 PHP Warning PHP Startup memcache Unable to initialize module Module compiled with module API 20060613 PHP co
如何在 Django 管理中的 TabularInline 表单集中设置默认值

如何在 django admin 的内联中设置第一个默认行值 class Employee models Model username models CharField Username max length 150 null False
在 iOS 上使用 OpenGL ES 2.0 进行实例化绘制

简而言之谁能确认是否可以使用内置变量gl InstanceID or gl InstanceIDEXT 在 iOS 上使用 OpenGL ES 2 0 的顶点着色器中GL EXT draw instanced启用 Longer 我想使用绘
检查数组中是否有 3 个连续值高于某个阈值

假设我有一个像这样的 np array a 1 3 4 5 60 43 53 4 46 54 56 78 有没有一种快速方法来获取 3 个连续数字都高于某个阈值的所有位置的索引也就是说对于某个阈值th 得到所有x其中 a x gt th
让 Google 地图在刷新后保留缩放和居中？

如何让 Google 地图保留用户的视图缩放级别和 HTTP 刷新后现在它会在每次刷新后重置视图我可以调整代码吗下面说 zoom 当前缩放级别和 center 当前中心位置以某种方式 function initialize
如何在猫鼬中使用聚合

如何在 mongoose 中定义以下 MongoDB 聚合查询 db contacts aggregate group id code Code name Name 查询的目的是获取不同代码和名称的列表我当前的模型代码是 use stri
域名 foo.bar 指向 127.0.53.53 ——为什么？

我今天刚刚注意到域名 foo bar 解析为 127 0 53 53 http foo bar http foo bar http whois domaintools com foo bar http whois domaintools c
打开我网站上的链接不起作用

在我的网站上我有一个我正在尝试获取工作的链接我有一个遵循正常格式的链接即 href 以 www youtube com 作为目标链接并在末尾添加 target blank 当我单击该链接时托管我的网站的网站会显示一条错误消息当我
Python - 使用 BeautifulSoup 从 URL 列表中抓取文本的最简单方法

使用 BeautifulSoup 从几个网页使用 URL 列表中抓取文本的最简单方法是什么有可能吗最好的乔治娜 import urllib2 import BeautifulSoup import re Newlines re c
MATLAB - 从目录读取文件？

我希望从目录中读取文件并对每个文件迭代执行操作此操作不需要更改文件我知道我应该为此使用 for 循环到目前为止我已经尝试过 FILES ls path to folder for i 1 size FILES 1 STRU pdbre
连接到 Docker Postgres 容器连接超时

所以我所做的是 docker run d e POSTGRES USER user e POSTGRES PASSWORD 456789 name admin service p 5432 5432 postgres 当我检查时docker
pm2 start app.js 在 15 次重启后退出

npm start 会很好地启动我的应用程序但是当我这样做时 pm2 start app js I get PM2 Spawning PM2 daemon PM2 PM2 Successfully daemonized PM2 Proce
JavaFX 中的 MVC 模式与场景生成器

我是 JavaFX 新手根据我当前的设置正在努力创建合适的 MVC 架构我使用 Scene Builder 单击了一个 UI 并指定了一个 Controller 类 Startup public class Portal extend
GitHub Action 工作流程未运行

我有一个 GitHub 操作工作流程文件 myrepo github workflows Build Webpage yml 它包含以下内容 name Webpage Build on push branches webpage jobs
从 pandas 值序列创建 pandas 区间序列

我能找到的最接近的答案似乎太复杂如何在 pandas 中创建间隔列 https stackoverflow com a 47396828 575530 如果我有一个看起来像这样的 pandas 数据框 Value 6 12 56 60 1
从多个 .csv 文件创建混淆矩阵

我有很多具有以下格式的 csv 文件 338 800 338 550 339 670 340 600 327 500 301 430 299 350 284 339 284 338 283 335 283 330 283 310 282 3

从多个 .csv 文件创建混淆矩阵

从多个 .csv 文件创建混淆矩阵 的相关文章

随机推荐

热门标签

从多个 .csv 文件创建混淆矩阵的相关文章