数据分析之训练数据集处理

2023-11-08

在训练dbnet的时候,需要进行数据分析的一些方法来分割数据集. 这里刚好整理一下:

# _*_ coding:utf-8 _*_   #用于解决编码问题

x.strip()

strip()方法删除前导空格和尾随空格。

with open() as 方法

with open('1.txt', 'r', encoding='UTF-8') as file:
print(file.read())

#file.readline() 读一行

#file.readlines() 读所有行. 后续搭配for读单行

#file.close()

#file.write()

note.split('\t') , 返回的是一个数组. 通过索引取前部分和后部分. \t被隐藏

os.path.join(a,b)

img_path.replace('修改前', '修改后')

json.loads(tmp[1])  #将str变为dict,使得取值.

[str(x[0])+', '+str(x[1]) for x in points]  #每一行points的内部连接

', '.join(tmp)  #tmp用', '连接起来

res.append(tmp+', '+str(box['transcription'])+'\n')  
#变量+'字符串'+str(非字符串) 才可以拼接

for root, dirs, files in os.walk(file_dir):#遍历文件夹、根目录、目录文件夹、目录里的文件

res_labels= random.shuffle(res_labels) #打乱一个数组

res_labels[:5] #取不到5行  res_labels[5:] #5行以后的

res_labels[:5] #取不到5行

#通过~取反，选取不包含数字1的行
df1=source_df[~source_df['货币代号'].isin([1])]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数据分析

计算机视觉

python

开发语言

数据分析之训练数据集处理的相关文章

Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
Python - 比较同一字典中的值

我有一本字典 d Trump MAGA FollowTheMoney Clinton dems Clinton Stein FollowTheMoney Atlanta 我想删除字符串列表中的重复字符串该字符串是键的值对于这个例子期望
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
Python 3d 绘图设置固定色阶

我正在尝试绘制两个 3d 数组第一个数组的 z 值在范围内 0 15 0 15 第二个来自 0 001 0 001 当我绘图时色标自动遵循数据范围如何设置自定义比例我不想看到 0 001 的浅色而应该看到 0 15 的浅色如何修
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
如何将 GAE 中一种 Kind 中的所有实体复制到另一种 Kind 中，而无需显式调用每个属性

我们如何使用function clone entity 如中所述在 Python 中复制 Google App Engine 数据存储中的实体而无需在编译时知道属性名称 https stackoverflow com question
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

基于Sqli-Labs靶场的SQL注入-17~22关

目录 Less 17 基于POST请求方式的中级注入爆破数据库名爆破表名爆破列名爆破字段值第十七关代码审计 Less 18 HTTP头部注入 UA注入爆破数据库名爆破表名爆破列名爆破字段值 HTTP头部注入判断方法 Les
mybatis 中 Example 的使用：条件查询、排序、分页（三种分页方式 : RowBounds、PageHelpler 、limit ）

前些天发现了一个巨牛的人工智能学习网站通俗易懂风趣幽默忍不住分享一下给大家点击跳转到教程 import tk mybatis mapper entity Example import com github pagehelper Pa
不要再无头苍蝇般寻找AI工具了--100个AI工具网站请查收

随着ChatGPT的爆火人工智能也成为当今最热门的领域之一它正在改变我们的生活和工作方式想要学习人工智能的基础知识或者利用人工智能来提升业务效率和创新能力都需要找到合适的AI工具来帮助您实现目标然而在海量的AI工具中如何快速
python写闲鱼脚本_自动化篇

1 目标场景前篇文章讲了如何在 iOS 端使用 Airtest 实现自动化的操作本篇将继续带大家做 iOS 端的自动化项目如果你经常用闲鱼应该每天都要进行下面操作 App 签到鱼塘签到擦亮宝贝这一系列操作都是重复且枯燥的
利用opencv进行目标跟踪（python和c++）

参考来自 https www cnblogs com annie22wang p 9366610 html https learnopencv com object tracking using opencv cpp python pyth
win10 pro 使用远程桌面

今天升级到了win10 专业版有了几个家庭版没有的功能比如win10自带的远程桌面功能远程桌面就是可以通过其他设备访问并操作电脑的功能比如说Android手机使用win10家庭版的同学可以参考我的这篇文章升级成为win10专业版
数据列表组件 jqGrid 二次封装

前段时间在jqgrid基础上进行了二次封装应用在公司新的开发平台上相比以前效果更佳开发更方便减少代码50 共享下提供大家参考学习先看效果数据表格树结构表格多级表头最多支持3级用法
c++ set用法入门必看超详细

1 set的作用 set就是集合的意思集合的特点就是不会出现重复的内容一般用来作查重或去重操作举个场景给出一个表姓名爱好小明打篮球小刚画画小明听音乐问该表中出现了多少个人学会了set 就可以很轻松地解决这个问题
python3收邮件_认真对待 Python3 收邮件

前言之前老是用Python发邮件用起来挺方便的但是一直没实现用Python收邮件最近忙着笔试面试但是又不能时刻打开浏览器刷手机看看有没有新邮件尤其是有没有关于面试笔试通知的邮件啊所以写个脚本来做下定时任务一旦有相关的主
黑客爱用的 HOOK 技术大揭秘！

黑客爱用的 HOOK 技术大揭秘什么是 HOOK 技术病毒木马为何惨遭杀软拦截商业软件为何频遭免费破解系统漏洞为何能被补丁修复这一切的背后到底是人性的扭曲还是道德的沦丧敬请收看今天的专题文章什么是 HOOK 技术上面是开个
Ninja简介-Android10.0编译系统（九）

Android取经之路的源码都基于Android Q 10 0 进行分析 Android取经之路系列文章系统启动篇 Android系统架构Android是怎么启动的Android 10 0系统启动之init进程Android10 0系
【深度学习与计算机视觉】3、最优化与梯度下降

三最优化与梯度下降上一节深度学习与计算机视觉系列 3 线性SVM与SoftMax分类器中提到两个对图像识别至关重要的概念用于把原始像素信息映射到不同类别得分的得分函数 score function 用于评估参数W效果评估该参数下每类
超分辨率技术如何发展？这6篇ECCV 18论文带你一次尽览

原作 Tetianka Martyniuk林鳞编译自 Medium量子位出品公众号 QbitAI 还有什么能比国际顶会更能反映图像技术的最前沿进展在这篇文章中亲历了ECCV 2018的机器学习研究员Tetianka Martyni
Mac 修改默认 Python 环境

Mac 环境中既有自带的 Python2 7 也有自己安装的 Python 3 5 1 默认想用 Python3 的环境 1 添加 Python3 的环境变量 vi bash profile Setting PATH for Python
根节点左边POJ 1456 Supermarket根节点左边

今天一直在学习根节点左边之类的问题现在正好有机会和大家共享一下心贪的目题用并查集优化取d左边近来的一点为根节点 include
挂钩(HOOK)

5 5 挂钩 HOOK 5 5 1 为什么引入挂钩在Apache1 3版本中对HTTP 请求的处理包括若干个固定阶段比如地址转换阶段身份确认阶段身份认证阶段权限确认阶段 MIME类型识别阶段等等这也意味着Apache1 3 中
Qt Creator静态成员变量、全局变量、静态成员函数。

静态成员变量是一个全局区域的变量不同 cpp文件间可以相互访问记得包含 cpp对应的头文件 1 在mainwindow h中定义 public MainWindow QWidget parent nullptr MainWindow
解决docker nginx无法查看日志的问题

我们知道 Nginx的日志默认存放在 var log nginx access log var log nginx error log 但在使用nginx镜像构建的容器时出现无法查看日志的问题用cat命令后无反应通过如下命令可以看到
android面试题-ActivityRecord TaskRecord和ProcessRecord之间的关系

转自 http blog csdn net mwq384807683 article details 72529285 源码分析相关面试题 Volley源码分析注解框架实现原理 okhttp3 0源码分析 onSaveInstanceSt
数据分析之训练数据集处理

在训练dbnet的时候需要进行数据分析的一些方法来分割数据集这里刚好整理一下 coding utf 8 用于解决编码问题 x strip strip 方法删除前导空格和尾随空格 with open as 方法 with open 1 t

数据分析之训练数据集处理

with open() as 方法

数据分析之训练数据集处理 的相关文章

随机推荐

热门标签

数据分析之训练数据集处理的相关文章