修改awk中的文本文件

2024-01-07

我有一个文本文件，如以下小示例：

chr1    HAVANA  transcript  12010   13670   .   +   .   gene_id "ENSG00000223972.4"; transcript_id "ENST00000450305.2"; gene_type "pseudogene"; gene_status "KNOWN"; gene_name "DDX11L1"; tr
anscript_type "transcribed_unprocessed_pseudogene"; transcript_status "KNOWN"; transcript_name "DDX11L1-001"; level 2; ont "PGO:0000005"; ont "PGO:0000019"; havana_gene "OTTHUMG00000000961.2"; havana_tran
script "OTTHUMT00000002844.2";
chr2    HAVANA  exon    53  955 .   +   .   gene_id "ENSG00000223972.4"; transcript_id "ENST00000450305.2"; gene_type "pseudogene"; gene_status "KNOWN"; gene_name "DDX11L1"; transcript
_type "transcribed_unprocessed_pseudogene"; transcript_status "KNOWN"; transcript_name "DDX11L1-001"; exon_number 1; exon_id "ENSE00001948541.1"; level 2; ont "PGO:0000005"; ont "PGO:0000019"; havana_gene
 "OTTHUMG00000000961.2"; havana_transcript "OTTHUMT00000002844.2";

这个小例子的预期输出是：

chr1    HAVANA  transcript  11998   12060   .   +   .   gene_id "ENSG00000223972.4"; transcript_id "ENST00000450305.2"; gene_type "pseudogene"; gene_status "KNOWN"; gene_name "DDX11L1"; tr
anscript_type "transcribed_unprocessed_pseudogene"; transcript_status "KNOWN"; transcript_name "DDX11L1-001"; level 2; ont "PGO:0000005"; ont "PGO:0000019"; havana_gene "OTTHUMG00000000961.2"; havana_tran
script "OTTHUMT00000002844.2";
chr2    HAVANA  exon    41  103 .   +   .   gene_id "ENSG00000223972.4"; transcript_id "ENST00000450305.2"; gene_type "pseudogene"; gene_status "KNOWN"; gene_name "DDX11L1"; transcript
_type "transcribed_unprocessed_pseudogene"; transcript_status "KNOWN"; transcript_name "DDX11L1-001"; exon_number 1; exon_id "ENSE00001948541.1"; level 2; ont "PGO:0000005"; ont "PGO:0000019"; havana_gene
 "OTTHUMG00000000961.2"; havana_transcript "OTTHUMT00000002844.2";

在输入文件中，有不同的行。每行开头为chr。每行都有一些列，分隔符是制表符或“;”。我想从此文件创建一个新文件，其中仅第 4 列和第 5 列发生更改。事实上，新文件中的第 4 列将是((column 4 in original file)-12)新文件中的第五列是((column 4 in original file)+50)。输入文件和输出文件之间的唯一区别在于第四列和第五列的数字。我尝试这样做awk使用以下命令：

awk 'BEGIN { FS="\t;" } {print  $1"\t"$2"\t"$3"\t"$4=$4-12"\t"$5=$4+50"\t"$6"\t"$7"\t"$8"\t"$9" "$10";"$11" "$12";"$13" "$14";"$15" "$16";"$17" "$18";"$19" "$20";"$21" "$22";"$23" "$24";"$25" "$26";"$27" "$28";"$29" "$30";"$31" "$32";"$33" "$34";"$35" "$36";"$37" "$38";" }' input.txt > test2.txt

当我运行代码时，它会返回以下错误：

awk: cmd. line:1: BEGIN { FS="\t;" } {print  $1"\t"$2"\t"$3"\t"$4=$4-12"\t"$5=$4+50"\t"$6"\t"$7"\t"$8"\t"$9" "$10";"$11" "$12";"$13" "$14";"$15" "$16";"$17" "$18";"$19" "$20";"$21" "$22";"$23" "$24";"$25" "$26";"$27" "$28";"$29" "$30";"$31" "$32 ";" $33" "$34";"$35" "$36";"$37" "$38";" }
awk: cmd. line:1:                                                                                                                                                                                                                         ^ syntax error
awk: cmd. line:1: BEGIN { FS="\t;" } {print  $1"\t"$2"\t"$3"\t"$4=$4-12"\t"$5=$4+50"\t"$6"\t"$7"\t"$8"\t"$9" "$10";"$11" "$12";"$13" "$14";"$15" "$16";"$17" "$18";"$19" "$20";"$21" "$22";"$23" "$24";"$25" "$26";"$27" "$28";"$29" "$30";"$31" "$32 ";" $33" "$34";"$35" "$36";"$37" "$38";" }
awk: cmd. line:1:                                                                                                                                                                                                                                      ^ syntax error

你知道如何修复它吗？我想获得与输入文件格式完全相同的输出文件。表示相同的分隔符。

不需要单独输出每一列，修改现有数据然后打印修改后的行就足够了。

awk -F '\t' '{ col4 = $4; $4 = col4 - 12; $5 = col4 + 50; print }' OFS='\t' file

这会在打印整行之前修改第四和第五个制表符分隔的列。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

awk

修改awk中的文本文件的相关文章

从文件中读取行，在第二个文件中 grep ，并为每个 $line 输出一个文件

我有以下两个文件 sequences txt 158333741 Acaryochloris marina MBIC11017 uid58167 158333741 432 1 432 COG0001 0 158339504 Acaryoc
awk 排序多维数组[重复]

这个问题在这里已经有答案了 GNU awk 支持多维数组 gnu org software gawk manual gawk Arrays of Arrays q 1 1 dog q 1 2 999 q 2 1 mouse q 2 2 77
awk 比较多个文件

我有2个文件 file1 1 apple 2 mango 3 banana 44 orange file2 1 apple 22 31 xyz 2 man 3 banana 44 oran 44 orange 我需要使用第 1 列和检查第
使用 Sed 或 Awk 进行数据转换 - 名称到标题

我有以下格式的数据 APP OWNER hari APP AREA Work Business Area AUS APP ID 124080 APP OWNER ari APP AREA Work AUS APP ID 124345 我希望
按行号和列号对文件进行子集化

我们想要按行和列对文本文件进行子集化其中行数和列数是从文件中读取的不包括标题第 1 行和行名称第 1 列输入文件 txt制表符分隔的文本文件 header 62 9 3 54 6 1 25 1 2 3 4 5 6 96 1 1
如何拆分一行并重新排列其元素？

我在一行中有一些数据如下所示 abc edf xyz rfg yeg udh 我想呈现如下数据 abc xyz yeg edf rfg udh 以便打印备用字段并用换行符分隔有没有这样的衬里下列awk脚本可以做到这一点 gt echo
如何在正则表达式之后打印单词但不打印相似的单词？

我想要一个 awk 或 sed 命令来打印正则表达式之后的单词我想找到一个单词后面的单词但不是看起来相似的单词该文件如下所示 somethingsomething X Windows Icon xournal somethingsom
Bash：循环遍历字符串数组后无法读出带空格的字符串

我正在使用循环读取数组的内容该数组包含名为 music 的目录层次结构中的所有目录和文件内容是 find 命令先前输出的字符串这个想法是根据流派艺术家和标题将 directory contents 中每个数组元素的完整目录路径分成子
通过特定分隔符删除字符串

我的文件中有几列其中第二列有分隔符我想删除第二列中的第一个第三个和第四个字符串并将第二个字符串留在该列中但我有正常的分隔符空间所以我不知道 input 22 16050075 A G 16050075 A G 22 16050
匹配模式后添加行[重复]

这个问题在这里已经有答案了我有一个文件说test具有以下值 Linux Solaris Fedora Ubuntu AIX HPUX 如何在匹配 AIX 的行后面添加一行系统主机名如果我做 echo hostname gt gt tes
使用 awk 读取文件并搜索另一个文件

我正在读取一个文件每行都有数字我需要搜索另一个满足这些数字和其他条件的文件我正在尝试使用 awk 来做到这一点但遇到了问题 File a txt 1476 1477 1497 现在我需要打印第 12 列包含这些数字的行以及第 3 列
使用 awk 解析日志文件

我尝试使用以下代码解析日志文件 if line match then awk 2 vFiler echo vFiler 解释有一些行以这样的模式开头或 vol 后跟名称我想找到所有以或 vol 并将后面的字符串设置为等于变量但我真
awk 返回两个变量

现在这就是我正在做的事情 ret ls la awk print 3 9 usr echo ret awk print 1 fil echo ret awk print 2 问题是我没有运行ls我正在运行一个需要时间的命令因此您可以理解其
如何使用 bash 中提供的工具生成一系列非周末日期？

我想生成一个文件列表其中名称包含 filename date 例如file 20111101 file 20120703 开始November 1 2011直到今天应该不包括周末 Thanks 2011年试试这个 for y in 20
AWK 错误：尝试在标量上下文中使用数组

我正在学习AWK 这是一个简单的代码片段我尝试将字符串拆分为数组并迭代它 BEGIN split a b c a for i 1 i lt length a i print a i 运行此代码时我收到以下错误 awk awk txt 4
AWK 或 sed 方式粘贴非相邻行

cat file aaa bbb ccc ddd eee jjj kkk lll mmm nnn ooo ppp 以下 AWK 命令会将 mmm 行粘贴到 ddd eee 行的末尾有没有更简单的方法使用 AWK 或 sed 来做到这一点
删除目录中的文件，其中匹配模式的数量低于Linux上的阈值[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我怎样才能删除所有 txt目录中的文件其中grep gt wc l小于2 Example file1 txt gt BB gt AA
在linux中将包含word的行从一个文件复制到另一个文件

我想复制包含某些单词的行file1 to file2 Suppose file1 ram 100 ct 50 gopal 200 bc 40 ravi 50 ct 40 krishna 200 ct 100 file2应该只有包含 ct 的
如何使用管道字符分隔符分隔字段

我知道这个问题已经被问过但我发现没有一个解决方案对我有用我有一个程序其输出如下 COUNT 293 1 lps 我对第二个字段感兴趣但是这些尝试都没有成功 spawn 1 cut d f2 spawn 1 cut d f2 spaw
在 bash 中将 kB 和 GB 转换为 MB

我使用 awk 和 sed 来获取表中的分区列表及其大小我想用它来计算各个表的每日增量这是我的输出现在我正在努力将所有大小转换为 MB 匹配第二个字段中的数字并根据 MB 或 GB 字符串相乘的最佳 bash 方法是什么 201706

随机推荐

Android 数据绑定与自定义适配器

我正在尝试使用Android 的数据绑定功能 http developer android com tools data binding guide html使用自定义适配器和 ListView 我在覆盖自定义适配器时遇到问题getView
如何在 bash for 循环中执行 psql 命令

我想在 bash 脚本中执行 psql 语句并将结果输出到文件中我下面的代码可以按需要工作 bin bash query select from mytable psql lt
如何将 FlexBox 项目扩展到全屏而不移动其他 Flex 项目？

我有一个盒子的弹性盒子布局单击这些框时它们会扩展为全屏问题是当盒子展开时它会移动其他弹性元素导致动画看起来跳跃弹性布局还可以防止展开的框接触屏幕顶部这是一个小提琴向您展示我在说什么 fiddle https jsfiddl
WPF 通过覆盖方法更新 UI 不起作用

我正在尝试从 ViewModel 更新 WPF UI 风景
什么是 JSP 上下文？

我想知道这个 java 对象到底是什么以及它的主要用途是什么我看过java文档但这让我更困惑它是否有会话请求应用程序等关系范围 JspContext JspContext 令人困惑因为它似乎没有做任何 ServletContex
如何在Python中反转字典（其值是列表）？ [复制]

这个问题在这里已经有答案了我想编写一个函数它接收字典作为输入参数并返回输入字典的反向值其中原始字典的值用作返回字典的键原始字典的键用作返回字典的值返回的字典解释如下 dict Accurate exact precise exact
如何使用 septice 在明火中创建持久房间？

我正在使用以下内容iq在 openfire 中创建持久房间的消息 var configiq iq to chatObj getActiveChatRoomName chatObj groupChatService type set c x
使用js将字符串附加到图像src

我有一个页面里面有 img src images product whatever image jpg alt 我希望在加载页面时将字符串 Action thumbnail 附加到 src 的值使其成为src images produ
为什么stream api不是为异常处理而设计的？

Fixtures BiConsumer
使用 Python 读取 UTF8 CSV 文件

我正在尝试使用 Python 读取带有重音字符的 CSV 文件仅限法语和或西班牙语字符基于 csvreader 的 Python 2 5 文档 http docs python org library csv html http do
使用光流进行特征跟踪

我找到了一个类似的问题 https stackoverflow com questions 9701276 opencv tracking using optical flow 9702540 comment13031247 9702540
将材质图标与样式组件一起使用

刚刚开始使用样式组件有没有办法设置第三方图标例如 Material Design Icon 的样式这是我到目前为止的代码但显然它不起作用相关代码位于内容组件下方 Thanks const MaterialIcon props gt
localStorage html5 功能在 Samsung Android 设备上的 WebView 中不起作用

我有一个用 WebView 包装的 html5 应用程序为了在页面之间存储和检索用户输入值我使用本地存储html5 功能它在我的 Nexus 4 Android 4 4 4 上运行良好但在 Samsung Galaxy Tab 2
罗马尼亚语区域设置

经过谷歌搜索一段时间后我发现 Android 2 3 版本确实支持它但我没有找到它支持的最低版本如果 Android 2 2 版本不支持罗马尼亚语那么有什么替代方案感谢您的关注这是已解决的类似问题 Android 支持的语言区域
使用正则表达式检查文本框不允许小数

我想创建一个 TextChanged 事件来检查输入文本是否符合特定条件如果不符合则删除最后输入的字符在本例中标准是数字 1 位小数和 1 位分数我正在测试仅用于数字和小数的正则表达式并遇到了问题我尝试了几种不同的表达式我不擅
如何在 Laravel 代码中嵌入视频

我正在开发一个项目在该项目中我将 youtube 视频链接存储在数据库中然后检索这些链接并使用刀片模板引擎尝试将它们嵌入到页面中我使用循环将视频放入页面中由于某种原因我在浏览器中看不到任何视频它覆盖了提到的空间但不渲染任何东
QSqlQuery size() 总是返回-1

QSqlQuery query QString queryText SELECT FROM section query exec queryText qDebug lt lt query size always 1 while query
ViewPager Fragments 未在 onCreate 中启动

我似乎在更新 ViewPager 中使用的片段时遇到问题无论我尝试使用 onCreate onCreateView 还是 onResume 以下是我在 MainFragment 中设置 ViewPager 的方法 public View
绘制多条徒手折线或曲线图 - 添加撤消功能

我正在尝试创建一个具有撤消和重做功能的简单绘图应用程序我假设您可以将要绘制的内容添加到列表中并调用该列表来绘制所有内容然后撤消应该只是删除最后添加的项目并再次重新绘制所有内容问题是如何将绘制的内容添加到列表中并使用该列表撤消我正
修改awk中的文本文件

我有一个文本文件如以下小示例 chr1 HAVANA transcript 12010 13670 gene id ENSG00000223972 4 transcript id ENST00000450305 2 gene type p

修改awk中的文本文件

修改awk中的文本文件 的相关文章

随机推荐

热门标签

修改awk中的文本文件的相关文章