如何添加百分比列

2024-05-26

我想计算每行中所有行中的值的百分比并将其添加为另一列。输入（分隔符为\t）：

添加第三列的所需输出显示基于第二列中的值计算的百分比：

1   10   12.50   
2   10   12.50
3   20   25.00
4   40   50.00

我尝试自己做，但是当我计算所有行的总计时，我不知道如何保持行的其余部分不变。非常感谢您的帮助！

在这里，一步 ~~pass~~ 的 awk 解决方案 -

awk 'NR==FNR{a = a + $2;next} {c = ($2/a)*100;print $1,$2,c }' file file

[jaypal:~/Temp] cat file
1   10      
2   10
3   20
4   40
[jaypal:~/Temp] awk 'NR==FNR{a = a + $2;next} {c = ($2/a)*100;print $1,$2,c }' file file
1 10 12.5
2 10 12.5
3 20 25
4 40 50

Update:如果输出中需要制表符，则只需将 OFS 变量设置为“\t”。

[jaypal:~/Temp] awk -v OFS="\t" 'NR==FNR{a = a + $2;next} {c = ($2/a)*100;print $1,$2,c }' file file
1   10  12.5
2   10  12.5
3   20  25
4   40  50

模式 {action} 语句的突破：

第一个模式是NR==FNR。 FNR 是 awk 的内置变量，用于跟踪给定文件中的记录数（默认情况下用换行符分隔）。因此，在我们的例子中，FNR 为 4。NR 与 FNR 类似，但它不会重置为 0。它会继续增长。所以在我们的例子中 NR 是 8。
此模式仅适用于前 4 条记录，而这正是我们想要的。仔细阅读 4 条记录后，我们将总计分配给一个变量a。请注意，我们没有初始化它。在awk我们不必这样做。但是，如果整个第 2 列都是 0，这就会中断。因此，您可以通过在第二个操作语句中放置 if 语句来处理它，即仅当 a > 0 时才进行除法，否则除以 0 或其他值。
next之所以需要，是因为我们并不真正希望执行第二个模式 {action} 语句。next告诉 awk 停止进一步的操作并移至下一条记录。
一旦解析了四个记录，下一个模式{action}就开始，这非常简单。计算百分比并打印第 1 列和第 2 列以及它们旁边的百分比。

Note: 正如 @lhf 在评论中提到的，只有当文件中有数据集时，这一行才有效。如果通过管道传递数据，它将不起作用。

在评论中，正在讨论如何做到这一点awk one-liner从 a 获取输入pipe代替file。我能想到的唯一方法是将列值存储在array然后使用for loop吐出每个值及其百分比。

Now arrays in awk are associative并且永远不会按顺序排列，即从数组中取出值的顺序不会与它们进入的顺序相同。因此，如果可以的话，那么下面的一行应该可以工作。

[jaypal:~/Temp] cat file
1   10      
2   10
3   20
4   40

[jaypal:~/Temp] cat file | awk '{b[$1]=$2;sum=sum+$2} END{for (i in b) print i,b[i],(b[i]/sum)*100}'
2 10 12.5
3 20 25
4 40 50
1 10 12.5

为了让它们按顺序排列，您可以将结果通过管道传递给sort.

[jaypal:~/Temp] cat file | awk '{b[$1]=$2;sum=sum+$2} END{for (i in b) print i,b[i],(b[i]/sum)*100}' | sort -n
1 10 12.5
2 10 12.5
3 20 25
4 40 50

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

awk

如何添加百分比列的相关文章

如何使用AWK从文件中连续输出行

我有一个多行文件我想连续输出文件的某些行比如第一次从第1行打印到第5行下次打印第2行到第6行依此类推我发现 AWK 是一个非常有用的函数我尝试自己编写代码但它什么也没输出以下是我的代码 bin bash for n in
如何格式化 .CSV 文件的日期字段并在字符串字段中包含多个逗号

我有一个 CSV 文件 file csv 其数据全部用双引号引起来文件的示例格式如下 column1 column2 column3 column4 column5 column6 column7 Column8 Column9 Colu
BASH - 随机排列文件中字符串中的字符

我有一个文件 filename txt 具有以下结构 gt line1 ABC gt line2 DEF gt line3 GHI gt line4 JKL 我想打乱字符串中的字符not开始机智 gt 输出将例如如下所示 gt line
awk 比较多个文件

我有2个文件 file1 1 apple 2 mango 3 banana 44 orange file2 1 apple 22 31 xyz 2 man 3 banana 44 oran 44 orange 我需要使用第 1 列和检查第
使用 Sed 或 Awk 进行数据转换 - 名称到标题

我有以下格式的数据 APP OWNER hari APP AREA Work Business Area AUS APP ID 124080 APP OWNER ari APP AREA Work AUS APP ID 124345 我希望
如何使用AWK脚本检查表的所有列数据类型？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案在这里我正在检查表中第一列的数据类型但我想知道AWK中表的所有列数据类型我尝试过但只能获得一列数据类型例如 Column 1
如何删除最后一次出现模式后的所有行？

我想删除最后一次出现模式之后的所有行除了模式本身 file txt honor apple redmi nokia apple samsung lg htc file txt 我想要什么 honor apple redmi nokia a
使用正确的头打印文件名

我想获取当前目录中的文件名使得文件的第一行等于myWord 我想结合find type f命令与 exec选项与head 1 filename但无济于事有没有一些聪明的单行的解决方案来解决这个问题您可以使用find with awk
awk: hping: 打印 icmp 发起/接收之间的差异

我有以下输出hping http ports su net hping在 OpenBSD 上 hping icmp ts www openbsd org HPING www openbsd org re0 129 128 5 194 icm
通过特定分隔符删除字符串

我的文件中有几列其中第二列有分隔符我想删除第二列中的第一个第三个和第四个字符串并将第二个字符串留在该列中但我有正常的分隔符空间所以我不知道 input 22 16050075 A G 16050075 A G 22 16050
Awk - 计算两个文件之间的每个唯一值和匹配值

我有两个文件首先我尝试获取第 4 列中每个唯一字段的计数然后匹配第二个文件的第二列中的唯一字段值 File1 第 4 列的每个唯一值和 File2 第 2 列包含我需要在两个文件之间匹配的值所以本质上我试图 gt 如果 file2
如何将查找和替换限制为 CSV 中的一列？

我有一个 4 列 CSV 文件例如 0001 fish animal eats worms I use sed对文件进行查找和替换但我需要将此查找和替换限制为仅在第 3 列中找到的文本如何让查找和替换仅发生在这一列上您确定要使用se
用于编辑 /etc/sudoers 文件的正则表达式模式

我想删除 etc sudoers 文件中的 uncommnet 轮组那么我应该使用什么正则表达式模式 cat etc sudoers Allows members of the sys group to run networking so
AWK 错误：尝试在标量上下文中使用数组

我正在学习AWK 这是一个简单的代码片段我尝试将字符串拆分为数组并迭代它 BEGIN split a b c a for i 1 i lt length a i print a i 运行此代码时我收到以下错误 awk awk txt 4
bash - 检查特定列中的单词，检查该行其他列中的值，将该行剪切并粘贴到新文本文件中

我的文本文件包含约 20k 行如下所示 file A ATOM 624 SC1 SER 288 54 730 23 870 56 950 1 00 0 00 ATOM 3199 NC3 POP 487 50 780 27 750 27 5
AWK 或 sed 方式粘贴非相邻行

cat file aaa bbb ccc ddd eee jjj kkk lll mmm nnn ooo ppp 以下 AWK 命令会将 mmm 行粘贴到 ddd eee 行的末尾有没有更简单的方法使用 AWK 或 sed 来做到这一点
向 CSV 文件添加新列

我有一个 CSV 文件如下所示 12345 TestTest 1 2 TestTest 我想将日期例如 YYYY MM DD HH MM SS 添加到 CSV 文件的开头或结尾正如您在上面的示例中所看到的双引号包含列上的值逗号
如何调用 awk 中的 split 函数来分割“\.”上的字符串？

我该如何使用split用分割的函数例如首先考虑分割 echo 03 26 12 awk split 0 a print a 3 a 2 a 1 产生以下输出 122603 但如果传入的字符串是 echo 03 26 12 awk sp
awk 反转行和单词

我对编程语言之类的东西很陌生所以我必须用 awk 反转文件中的所有行以及这些行中的所有单词并将其打印出来要反转的 File1 aa bb cc foo 做为 File1 的输出打印应该是这样的就像 foo 一样 cc bb aa 我在
如何比较两个文件中的多列并在找到匹配时从另一列检索相应的值

我有两个文件 File1 txt 和 File2 txt 我需要将 File1 中的三列 1 2 和 3 分别与 File2 的 4 5 和 6 进行比较如果找到匹配项我想从 File2 的第 2 列中检索相应的值并将其粘贴到输出中 T

随机推荐

优化查找所有实现 IInterface 的类以及使用特定类型显式实现它的类

我定义了一个接口 ISerializeDeserialize 和一些继承通用接口的类我还有一些使用 CodeDomProvider 生成代码的程序集它生成从同一接口继承的类但使用特定类型实现它我想要实现的是获取通用实现和实现特定类型
如何将flex和bison与Qt项目集成？

我正在 git 源代码控制下使用 Qt4 制作 GUI 程序 Github页面 https github com vinayak garg dic sim 项目的一小部分需要扫描和解析所以我想在项目中使用flex和bison 我能想到3种
在 Mule 3.4 中模拟 while 循环

我需要在 Mule Flow 中使用 while 循环来从自定义 DAO 中加载数据块我使用表达式转换器来访问 DAO 直到他不再提供任何项目我不知道 DAO 提供的项目总量 Mule 3 4 中没有内置 while 循环我的第一个想
Haskell Fibonacci 达到最大指定数？

我有一个已启动并正在运行的 Haskell 函数但它做错了事情它应该输出最多指定最大数量的斐波那契数列像这样 fibonacciSequence 86 1 1 2 3 5 8 13 21 33 54 我的代码当前输出斐波那契数列中的前
YQL：不再支持 html 表

我使用 YQL 获取一些 html 页面以从中读取信息从今天起我收到返回消息不再支持 html 表请参阅https policies yahoo com us en yahoo terms product atos yql index
如何使用线程使 Windows 服务长期运行

我有一个 win 服务托管一些我需要保持长时间运行的工作流程一个 WorkflowApplication 和一个 WorkflowServiceHost 因为 OnStart 要求它完成并返回操作系统所以我有一个在线程池中的另一个线程上
西班牙语单词的正则表达式是什么？

正则表达式语言使用 B 来包含 A Z a z 0 9 和并且 b 被定义为单词边界如何编写匹配所有有效西班牙语单词包括诸如等字符的正则表达式我正在使用 NET 使用西班牙语区域设置并使您的正则表达式区域设置敏感
Nginx - 特定位置的另一个根

我在下面有一些静态 html 文件 var www project1 该项目的 Nginx 配置是 server name www project1 com project1 com root var www project1 locati
dc js 复合条形图折线图

我有一个 dc js 条形图如下所示这个叉形小提琴 http jsfiddle net 89218vf1 3 此条形图将加载预定义的过滤器例如本例中的 25 35 现在我需要显示一个与条形图复合的折线图突出显示带有高低线的过滤数据
对于 aws s3，预检响应无效（重定向）

我正在尝试将图像上传到我的 Amazon S3 存储桶但即使我已经正确设置了 CORS 配置我仍然收到此 CORS 错误这是我的 CORS 配置
如何用线条在一个Excel散点图中绘制多个分组数据

我在 Excel 中的一张图表带线的散点图中绘制分组数据按索引时遇到一些困难我将非常感谢您的帮助我的数据分为三列第一列是数据或组的索引即每组数据的唯一编号第二列是时间第三列是数据 Group Time Data 1 1
Phonegap Cordova Statusbar 插件创建双栏

我正在开发一个使用phonegap 的应用程序通过 CLI 构建而不是 PhoneGap 构建我的 cordova plugin statusbar 插件有问题打开时它将增加额外的条高度这是它的样子双高菜单栏我通过两种方式实现
如果外部程序挂起，如何退出进程 (.exec())

让我解释一下我的软件我的软件所做的只是创建 10 个线程并为每个线程分配许多任务然后每个线程创建一个运行时进程该进程将启动一个 cmd 批处理文件该文件又将启动一个程序该程序将远程登录到设备我有大约 200 个设备以轮询其
我对 C# 接口成员的默认访问修饰符感到困惑[重复]

这个问题在这里已经有答案了什么是访问修饰符interface方法它应该是public or protected因为当你实现它们时你可以访问它们这是有道理的也应该是abstract因为他们没有实施但最近我在读一本书名叫通过 C 进
“你好，TensorFlow！”使用 C API

出于学习目的如何使用 TensorFlow C API 编写此 Python 示例 import tensorflow as tf hello tf constant hello TensorFlow sess tf Session pr
模板类型推导参考

我一直在使用具有以下形式代码的模板来进行类型推导打印 include
使用 sed 和 grep/egrep 进行搜索和替换

我在用egrep R后跟包含大约 10 个并集的正则表达式如下所示 jpg png gif等等这很好用现在我想替换所有找到的字符串 bmp 我在想类似的事情 egrep lR jpg png gif sed s some expres
VSTO 工具：Office 2010 到 2013 升级

我正在开发 Excel 的 VSTO 工具项目我现在正在升级我的机器我的旧笔记本电脑运行的是 Windows 7 x64 Office 2010 和 Visual Studio 2012 我的新机器运行的是 Windows 8 x6
如何为 GlassFish Web 应用程序提供对外部资源（文件）的访问？

我是一个有点玻璃鱼 http en wikipedia org wiki GlassFish初学者所以请原谅我对这个问题的无知基本上我们正在为一个游戏网站提供服务为了使我们的网络应用程序可以下载客户端我们将其复制到domain1中
如何添加百分比列

我想计算每行中所有行中的值的百分比并将其添加为另一列输入分隔符为 t 1 10 2 10 3 20 4 40 添加第三列的所需输出显示基于第二列中的值计算的百分比 1 10 12 50 2 10 12 50 3 20 25 00 4 4

如何添加百分比列

如何添加百分比列 的相关文章

随机推荐

热门标签

如何添加百分比列的相关文章