更改 csv 中的列顺序（python）

2024-02-03

我制作了一个脚本，它读取给定的输入文件（csv），以某种方式操作数据并写入输出文件（csv).

就我而言，我给定的输入文件如下所示：

| sku | article_name |
| 1   | MyArticle    |

对于我的输出文件，我需要重新排列这些列（还有更多，但我认为当有人向我展示方法时我可能能够解决它）

我的输出文件应如下所示：

| article_name | another_column | sku |
| MyArticle    |                | 1   |

请注意，这是一个新列，不在源 csv 文件中，但无论如何都必须打印它（顺序也很重要）

这是我到目前为止所拥有的：

#!/usr/bin/env python
# -*- coding: latin_1 -*-

import csv
import argparse
import sys


header_mappings = {'attr_artikel_bezeichnung1': 'ARTICLE LABEL',
                   'sku': 'ARTICLE NUMBER',
                   'Article label locale': 'Article label locale',
                   'attr_purchaseprice': 'EK-Preis',
                   'attr_salesPrice': 'EuroNettoPreis',
                   'attr_salesunit': 'Einheit',
                   'attr_salesvatcode': 'MwSt.-Satz',
                   'attr_suppliercode': 'Lieferantennummer',
                   'attr_suppliersitemcode': 'Artikelnummer Lieferant',
                   'attr_isbatchitem': 'SNWarenausgang'}

row_mapping = {'Einheit': {'pc': 'St.'},
               'MwSt.-Satz': {'3': '19'}}


def remap_header(header):
    for h_map in header_mappings:
        if h_map in header:
            yield header_mappings.get(h_map), header.get(h_map)


def map_header(header):
    for elem in header:
        yield elem, header.index(elem)


def read_csv(filename):
    with open(filename, 'rb') as incsv:
        csv_reader = csv.reader(incsv, delimiter=';')
        for r in csv_reader:
            yield r


def add_header(header, fields=()):
    for f in fields:
        header.append(f)

    return header


def duplicate(csv_row, header_name, fields):
    csv_row[new_csv_header.index(fields)] = csv_row[new_csv_header.index(header_name)]
    return csv_row


def do_new_row(csv_row):
    for header_name in new_csv_header:
        for r_map in row_mapping:
            row_content = csv_row[mapped_header.get(r_map)]
            if row_content in row_mapping.get(r_map):
                csv_row[mapped_header.get(r_map)] = row_mapping.get(r_map).get(row_content)
        try:
            yield csv_row[mapped_header.get(header_name)]
        except TypeError:
            continue


if __name__ == '__main__':

    parser = argparse.ArgumentParser()
    parser.add_argument('-i', '--infile', metavar='CSV')
    parser.add_argument('-o', '--outfile', metavar='CSV')

    args = parser.parse_args()
    arguments = vars(args)
    if len(sys.argv[1:]) == 0:
        parser.print_usage()
        sys.exit(0)

    # print arguments
    # parse_csv(**arguments)
    """
    """
    csv_reader_iter = read_csv(arguments.get('infile'))

    # neuer csv header
    new_csv_header = list()
    csv_header = next(csv_reader_iter)
    for h in csv_header:
        if h in header_mappings:
            new_csv_header.append(header_mappings.get(h))

    # print new_csv_header
    new_csv_header = add_header(new_csv_header, ('Article label locale', 'Nummer'))
    mapped_header = dict(remap_header(dict(map_header(csv_header))))
    # print mapped_header

    with open(arguments.get('outfile'), 'wb') as outcsv:
        csv_writer = csv.writer(outcsv, delimiter=';')
        csv_writer.writerow(new_csv_header)
        for row in csv_reader_iter:
            row = list(do_new_row(row))
            delta = len(new_csv_header) - len(row)
            if delta > 0:
                row = row + (delta * [''])

            # duplicate(row, 'SNWarenausgang', 'SNWareneingang')
            # duplicate(row, 'SNWarenausgang', 'SNWareneingang')
            csv_writer.writerow(row)


    print "Done."
    """
    print new_csv_header
    for row in csv_reader_iter:
        row = list(do_new_row(row))
        delta = len(new_csv_header) - len(row)
        if delta > 0:
            row = row + (delta * [''])

        duplicate(row, 'Herstellernummer', 'Nummer')
        duplicate(row, 'SNWarenausgang', 'SNWareneingang')
        print row
    """

现在，尽管它先写着“ARTICLE LABEL”，但 sku 会先打印。我的猜测：这是由于 csv 文件的顺序造成的，因为 sku 是那里的第一个字段......对吗？

如果您使用DictWriter来自csvlib 您可以指定列的顺序。使用DictReader以字典形式从文件中读取行。然后，您只需在创建时明确指定键的顺序即可DictWriter.

https://docs.python.org/2/library/csv.html#csv.DictReader https://docs.python.org/2/library/csv.html#csv.DictReader

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

csv

更改 csv 中的列顺序（python）的相关文章

如何计算 pandas datetime 对象的均值和方差？

如何计算 YYYY MM DD 形式的 python 日期时间对象的汇总统计数据均值和标准差我想对具有不同 ID 的不同日期时间对象组执行此操作数据如下 import datetime as dt df pd DataFrame Da
类的 IPython 表示

我正在使用我创建的模块尝试 IPython 但它没有显示类对象的实际表示相反它显示类似的内容 TheClass module TheClass name I heavily在这个模块中使用元类我有真正有意义的类表示应该向用户显示是
Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
Python 3d 绘图设置固定色阶

我正在尝试绘制两个 3d 数组第一个数组的 z 值在范围内 0 15 0 15 第二个来自 0 001 0 001 当我绘图时色标自动遵循数据范围如何设置自定义比例我不想看到 0 001 的浅色而应该看到 0 15 的浅色如何修
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
XSLT 将动态 XML 转换为 CSV 并且 XML 节点不完全重复 II

我正在尝试创建 XSLT 将 XML 转换为 CSV 这里放置了我的 XML 和预期输出任何人都知道如何获得以下输出请优先分享我我的 XML 是

随机推荐

有没有办法在 CSS 计算中包含 pi ？

我有一个用于进度条的 SVG 圆形动画其中stroke dashoffset动画来自0 radius to radius 0 0 到 100 圆的周长的方程是pi d 有没有办法使用CSScalc函数可以使用 pi 值而不仅仅是舍入值
将 MongoDB 与本机驱动程序和 Express.js 结合使用时，“拓扑被破坏”

我已经实现了从 MongoDB 获取数据的简单应用程序 const express require express const app express const port 3000 const MongoClient require mo
求两个数组中最大的共同元素？

给定两个数组如何找到两个数组的最大公共元素我正在考虑对两个数组 n log n 进行排序然后对另一个数组中一个已排序数组从较大的数组开始中的每个元素执行二分搜索直到找到匹配项 eg a 1 2 5 4 3 b 9 8 3 Max
Android - 限制 backStack 中的片段数量？

目前我有一项活动并且正在向其中添加片段搜索歌曲详细信息设置等我实现了基于侧面的菜单导航因此现在作为副作用添加到 Backstack 的片段数量没有限制有什么方法可以限制片段的数量或删除旧的条目例如每个歌曲详情片段都有
Lua字符串char编码

我看不到 Lua 对其字符串使用什么编码 Im using string byte s i j 其中有文档返回字符 s i s i 1 的内部数字代码 s j i 的默认值为 1 j 的默认值为 i 请注意数字代码不一定可以跨平台移植
在java apache.commons.io中，如何避免读取旧的日志消息

我正在使用 java Tail listener API 来执行 tailf 功能在 Linux 中即每当日志文件中更新日志消息时此 API 就会打印消息我的代码如下 public static void main String
使用 BigCommerce API 获取产品图像

长话短说几个月前我使用 Bigcommerce API 为 WordPress 制作了一个插件用于获取小组件区域中的产品现在我已经更新了单个文件 Bigcommerce php 现在函数 getProductImages 不存在我
为什么编译器除以 2 时会右移 31 位？

我已经反汇编了编译器生成的代码我发现它生成了以下指令序列 mov eax edx shr eax 1Fh add eax edx sar eax 1 这段代码的目的是什么我知道 sar eax 1 除以 2 但是什么 shr eax 1
在 Visual Studio IDE 中查看与类关联的控件列表

我用的是VS的表单设计器我放置了一个label on my form 然后删除它的文本目前我无法找到该标签如何查看与给定类关联的控件列表查看 gt 其他窗口 gt 文档大纲
使用 ajax 请求中的 JSON 响应更新 JQuery 进度条

All 我有一个 AJAX 请求它向服务器发出 JSON 请求以获取同步状态 JSON 请求和响应如下我想显示 JQuery UI 进度条并根据 getStatus JSON 响应中返回的百分比更新进度条状态如果状态为 insync
SQLite CASE/WHEN 语句

这是我的 CASE WHEN 声明但正如你所看到的我收到了这个错误我不知道为什么我想做的就是检测 MAJKA 字段中的某些内容何时发生更改因此如果 MAJKA 列的某些其他字段为空请不要触摸它们而是将值更改为 MAJKA 列
从哈希数组中收集值

我有以下格式的数据结构 data hash price 1 count 3 price 2 count 3 price 3 count 3 有没有一种有效的方法来获取值 price作为一个数组 1 2 3 首先如果您使用 ruby arr
Laravel 5.4 中的混合/版本图像？

我想对一组图像使用混合首先我复制它们 mix copy resources images public images 然后版本 mix version 上面的内容对图像没有任何作用我也尝试过指定路径 mix version public
在 android.webkit.CookieManager 中存储会话 cookie

我使用 Volley 库来执行我的应用程序的请求现在我确实需要按照以下顺序执行一些操作使用 Volley 库的 POST 请求我收到带有会话 cookie 的 204 响应我需要将该 cookie 设置为与 WebView 一起使用
如果使用回形针 gem on Rails 没有上传图片，如何设置默认图片？

下面是我的代码 class Profile lt ActiveRecord Base belongs to user validates first name presence true validates last name presen
使 git diff 正确显示 UTF8 编码的字符

我有一个文件其中包含使用 UTF8 编码的瑞典语字符 If I cat文件显示正常但如果我这样做git diff特殊字符被打印例如 Example git diff output name Magler
如何在单个域上为 React app + Express 设置 k8s 入口？

我有一个使用 React 构建的前端应用程序和在 Nodejs 上构建的后端应用程序两者都有一个单独的 Docker 镜像因此在 k8s gce 上有一个单独的部署每个部署都有对应的k8s服务比方说fe serice and be
验证嵌套形式中子对象的唯一性无法正常工作

我对 Rails 中的范围唯一性验证有疑问如果我尝试直接在子模型中创建具有不想重复的同一组属性的新对象则效果很好但是当我尝试创建具有两个不唯一的子对象的父对象时验证没有被触发背景我有一个 Rails 3 2 中的应用程序其视图
连接3个表并检索所有表中的所有记录

我正在连接三个表执行完整的外部连接以便可以从所有表中检索所有记录我面临的问题是我加入表的顺序表格信息替代文本 http img235 imageshack us img235 7980 tableinfoow1 png http
更改 csv 中的列顺序（python）

我制作了一个脚本它读取给定的输入文件 csv 以某种方式操作数据并写入输出文件 csv 就我而言我给定的输入文件如下所示 sku article name 1 MyArticle 对于我的输出文件我需要重新排列这些列还有更多但我认

更改 csv 中的列顺序（python）

更改 csv 中的列顺序（python） 的相关文章

随机推荐

热门标签

更改 csv 中的列顺序（python）的相关文章