在 Perl 中，参考文件和一系列文件之间的映射

2024-01-04

我想在 Perl 中映射两个数据集。我有一个不变的数据集（ref 1），必须从一系列文件（1-20）中提取其他数据以匹配 ref1。

Ref1
ID1    ID2
1       HZ
1       HX
1       HY
2       C  
2       HZ
2       N

File 1
ID2    ID3
HA      5 
HB      4
HC      7
N       2

File 2
ID2    ID3
C      9
HZ     11
N      0

理想输出：

ID1 ID2 ID3 
1   HZ   5
1   HX   4 
1   HY   7
2   C    9
2   HZ   11
2   N    0

匹配发生在 ref1 中 ID2 的第一个字母与 file1 中 ID2 的第一个字母之间，直到完成所有 ID1 条目的匹配，然后打开 file2 并与所有编号为 2 的 ID1 进行匹配。文件名的格式为 number001.txt 、number002.txt等，因此可以从文件名中检索ID1。

我希望这是有道理的。我是 Perl 的初学者，这是我到目前为止所拥有的：

#!/usr/bin/perl
use strict;
use warnings;

my $ref1 = 'test.txt';
my $input_path = '/path/';

open my $fh, '<' $ref1 or die "Can't read $ref1: $!";
chomp (my @ref1 = <$fh>);

my %hash = @ref1;

my @filehandles;
for ($i=0; $i<20, $i++) {
    local *FILE;
    open(FILE, ">number$i.txt") or die $!;
    push(@filehandles, *FILE);
}

任何建议都会非常有帮助。

这并没有按照您的想法进行：

chomp (my @ref1 = <$fh>);
my %hash = @ref1;

在这里转置键/值并没有什么魔力——所以你要做的就是得到一个如下所示的哈希值：

      '2       C  ' => '2       HZ',
      'ID1    ID2' => '1       HZ',
      '1       HX' => '1       HY',
      '2       N' => undef

我打赌那不是你想要的。

我怀疑你可能想要的是：

    my %ref1;
    while ( <$input> ) {
        chomp;
        my ( $key, $value ) = split;
        push ( @{$ref1{$key}}, $value );
    }
    print Dumper \%ref1;

您还将打开文件以便在第二个循环中进行写入。您可能也不想这样做。

我会选择类似的东西：

#!/usr/bin/perl
use strict;
use warnings;

use Data::Dumper;

my $ref1       = 'ref1.txt';
my $input_path = '/path/';

open my $ref1_fh, '<', $ref1 or die "Can't read $ref1: $!";

my %ref1;
while (<$ref1_fh>) {
    chomp;
    next if m/ID/;
    my ( $key, $value ) = split;
    my $zeropadded = sprintf( "%03d", $key );
    my ($firstletter) = ( $value =~ m/^(\w)/ );
    push( @{ $ref1{$zeropadded}{$firstletter} }, $value );

}

print Dumper \%ref1;

print join( "\t", "ID1", "ID2", "ID3" ), "\n";
foreach my $filename ( glob("number*.txt") ) {
    my ($ref_num) = ( $filename =~ m/number(\d+)/ );
    open( my $input, "<", $filename ) or warn $!;
    while (<$input>) {
        chomp;
        my ( $key, $value ) = split;
        my ($firstletter) = ( $key =~ m/^(\w)/ );
        if ( defined $ref1{$ref_num}{$firstletter}
            and @{ $ref1{$ref_num}{$firstletter} } )
        {
            my $refkey = pop( @{ $ref1{$ref_num}{$firstletter} } );

            print join( "\t", int $ref_num, $refkey, $value ), "\n";
        }
    }
    close($input);
}

我已将“ref”数字转换为零填充，因此它直接匹配文件名，因为您指定的文件名是number001.txt匹配1 in ref1.

我还要插入以下内容$ref1进入数组的哈希值，键入您要查找的第一个字母 - 弹出“查找”值直到为空。

因此我们得到：

ID1 ID2 ID3
1   HY  5
1   HX  4
1   HZ  7
2   C   9
2   HZ  11
2   N   0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

perl

在 Perl 中，参考文件和一系列文件之间的映射的相关文章

perl：正确的“内容类型”格式以返回“图像数据 uri”

我有一个模板angularjs期待着image data uri由通过调用的服务器调用返回src的属性img模板的元素 img width 200px height 200px src http localhost 3000 returni
在 Perl 中查找标量变量的数据类型

我有一个接受用户输入的函数输入可以是整数浮点数或字符串我有三个重载函数应该根据输入数据的数据类型调用它们例如如果用户输入一个整数比如100 则应该调用具有整数参数的函数如果用户输入字符串例如 100 则应调用具有字符串参数
如何在 Perl 中的不同包之间共享全局值？

是否有一种标准方法可以对模块进行编码以保存要包含在每个其他包中的全局应用程序参数例如 use Config 一个简单的包只包含our变量只读变量怎么样已经有一个标准配置模块 http perldoc perl org Config
“get”在 Perl 中不起作用

我是 Perl 新手在过去的几天里我制作了一些简单的脚本通过 get 将网站的源代码保存到我的计算机上他们做了他们应该做的事情但不会获得论坛网站的内容非论坛网站工作得很好知道发生了什么事吗这是问题块 my url http
无法在 Mac 上安装 DBD::mysql

第一次发帖格式可能不太对请见谅我一直在尝试使用 cpan 在 macOS Catalina 上安装 DBD mysql 但尚未成功我使用了perlbrew 并尝试了mysql和mariaDB 但仍然没有成功另外我在网上研究了不同
如何将 cpanminus 与本地 CPAN::Mini 一起使用？

我已经创建了自己的 CPAN 本地副本minicpan http search cpan org rjbs CPAN Mini 1 111007 bin minicpan并设法重新配置 cpan 来使用它太棒了但是我将如何使用它cpan
在 Perl 中组装 XML

我需要对 NetApp 文件管理器进行 API 调用我知道我需要发送什么原始 XML
Perl 构建、单元测试、代码覆盖率：一个完整的工作示例

我找到的关于 Perl 构建过程单元测试和代码覆盖率的大多数 Stackoverflow 答案都只是将我指向 CPAN 那里的文档指向 CPAN 模块绝对没有任何问题因为完整的文档应该位于此处不过在很多情况下我很难找到完整的工作
Perl - 以相反的顺序逐行读取文件[重复]

这个问题在这里已经有答案了可能的重复如何在 Perl 中从文件末尾读取行 https stackoverflow com questions 303053 how can i read lines from the end of fil
如何检测已更改的网页？

在我的应用程序中我使用 LWP 定期获取网页无论如何是否要检查两次连续提取之间网页是否在某些方面发生了变化除了明确进行比较之外是否有在较低协议层生成的任何签名例如 CRC 可以提取并与旧签名进行比较以查看可能的更改有两种可能的
Perl 删除目录中的所有文件

我怎样才能删除allPerl 中目录中的文件不删除目录我的主机只允许最多 250 000 个文件而我的 tmp 文件夹会在所有会话 cookie 运行的情况下快速填充 250 000 个 qouta 在这种情况下我无法删除 tmp
Perl 中如何释放内存？

我的代码如下所示 my var my var new while 1 while my k v each var a sub v var A map var var new keys var new var new B sub a sub
如何在正则表达式中匹配“/*”？

stuff d learning perl tmp txt open STUFF stuff or die Cannot open stuff for read while
使用perl，在每行都有相同单词的情况下如何选择最后两行？

Bini 21 89753 20 47853 20 27835 18 34952 16 23454 Bini 16 89753 14 47853 13 27835 12 34952 11 23454 Bini 10 09014 我的文件有一
Path::Class::File 或 ::Dir & Moose 初始化和强制

目前有 package Local use warnings use Moose use Method Signatures Simple use Path Class File use Path Class Dir method buil
Perl 和 Unix 如何以相同的顺序对 Unicode 字符串进行排序？

我正在尝试获取 Perl 和 GNU Linuxsort 1 程序就如何对 Unicode 字符串进行排序达成一致我在跑sort with LANG en US UTF 8 在Perl程序中我尝试了以下方法 use Unicode Col
根据插入顺序迭代哈希？

不想对条目进行排序使用它也不会保留顺序 foreach my val keys hash 默认情况下 Perl 5 中的哈希值是无序的您可以使用tie http perldoc perl org functions tie html a
在 Google 表格应用程序中进行身份验证

我有一个类似批处理的应用程序由调度程序定期调用无需人类用户参与它使用 PerlNet Google 电子表格 http metacpan org pod Net Google Spreadsheets包通过从数据库获取的数据来更新 G
当值相同时，为什么我的值比较返回 false？

我有一个 perl 脚本可以将 Excel XLS 文件中的数据加载到数据库中首先它检查文件中的值的日期时间是否已存在于数据库中如果是它会检查文件中的值是否与数据库中的值相同如果它们相同则跳过该值如果不同则更新数据库中的值
在 Perl 中如何用空格填充字符串的一部分？

你更喜欢哪个版本 usr bin env perl use warnings use strict use 5 010 my p 7 33 my prompt my key very important text my value Hell

随机推荐

为什么在这种情况下会生成classname$1.class？ [复制]

这个问题在这里已经有答案了我编写了以下代码来实现单例模式 public final class Test static final class TestHolder private static final Test INSTANCE n
SQL 检查列中的所有值

我在 Oracle DB 中有下表 ID VALUE 1 1 1 2 1 3 2 1 2 2 3 1 3 2 3 3 4 1 如何选择具有全部 3 个值 1 2 3 的 ID 最简单的选择通常是这样的 SQL gt ed Wrote fil
如何将数组写入nodejs中的文件并保留方括号？

我想将矩阵写入 js 文件当我使用 console log matrix 时一切都很好但是当我将其写入文件时结果会有所不同 var fs require fs var matrix new Array 10 for var i 0
在 Angularjs 中对基于 Promise 的代码进行单元测试

我在尝试在 Angularjs 中测试基于 Promise 的代码时遇到了困难我的控制器中有以下代码 scope markAsDone function taskId tasksService removeAndGetNext taskI
重命名列正则表达式，如果不匹配则保留名称

data First Column 1 2 3 Second Column 1 2 3 First Mid LAST Ending 1 2 3 First1 Mid1 LAST1 Ending 1 2 3 df pd DataFrame d
Doctrine 部分查询返回完整对象

我正在尝试优化查询因为我需要一个简单的列表作为附属于多个实体的实体所以我创建了这个查询你应该给我返回 id 和名称 public function findAllOrderByName qb this gt createQueryBu
更改主题，例如 Fabric Web（默认/深色）

在fabric的文档页面中现在每个示例组件都有更改主题功能 IE example https developer microsoft com en us fabric controls web button 在此输入图像描述 https
Linux内核中的内存屏障是如何使用的

内核源码Documentation memory barriers txt中有一个说明如下所示 CPU 1 CPU 2 B 7 X 9 Y 8 C Y STORE A 1 STORE B 2
Microsoft Bot Framework DirectLine 无法访问对话

我正在尝试使用 Microsoft Bot Framework DirectLine API 读取消息并将其添加到其他用户和我的机器人之间的现有对话中根据我所读到的内容我相信使用主秘密时这应该是可能的但它对我不起作用我正在使用 We
即使有事务，SQLite 插入也会变慢

即使对于事务我也遇到了 sqlite 插入性能的问题我的 Android 应用程序从 Web 服务接收大约 23 000 行我必须将它们插入到单个表中 Web 服务已分区以便我在对 WS 的每个请求中收到大约 2000 行并将这
完整句子的反义词

我想以相反的格式打印字符串 Input My name is Archit Patel Output Patel Archit is name My 我已经绑定了以下内容但它显示为letaP tihcrA si eman ym publi
将所有匹配项收集到一个单元格中的电子表格公式

我有一个电子表格如下所示 A B C D FirstName SurnameName Address UniqueFamilyId Abe Black 1 Elm Ave Black 1 Elm Ave Joe Doe 7 Park Ln
iOS/Xcode 为项目中的框架启用按需资源

有没有人建立过一个项目Enable On Demand Resources set to YES用于与该项目相关的框架我正在开发的应用程序中的大多数目录资源都被保留并带入框架中的项目中并且出现构建错误Target
将 Gstreamer 与 Qt 连接以便在 Qt Widget 中播放 gstreamer 视频

我尝试使用声子播放视频但无法成功 Off late通过Qt论坛了解到即使是最新版本的Qt也不支持phonon 就在那时我开始使用 Gstreamer 关于如何将 Gstreamer 窗口与 Qt 小部件连接有什么建议吗我的目标是在 Qt
将 Django 数据库后端从 MySql 更改为 PostgreSQL

我使用 Django 1 2 和 1 3 以及 MySql 后端使用 South 迁移 MySql 数据库时偶尔会收到一条错误消息 Error found during real run of migration Aborting Sin
将项目（jar）导入Eclipse

我有一个 jar 文件需要将其导入到 Eclipse 中但是我不想将该 jar 作为引用的库我需要像普通项目一样包含 jar 其中包含包和 java 文件我尝试执行以下操作新建 Java 项目 gt 导入 gt 常规 gt
Application_Error - GetLastError() 或 GetLastError().GetBaseException()

处理错误时Application Error 我应该使用这两个中的哪一个我找到了两者的多个例子但并不清楚一个是否比另一个更好是否存在只有一个会显示正确错误的情况另外我怀疑这很重要但该应用程序正在使用 MVC 4 这取决于您到底需
在 Eclipse 项目资源管理器上下文菜单中的“项目”上方添加项目

我正在为我们的开发环境开发一个基于 eclipse 的定制 IDE 在我的新视角中我包含了一个项目资源管理器并且我能够在上下文菜单中添加命令但是当我在新类型中包含一个新向导项目向导时它会显示在项目向导我希望它位于它之
IIS：如何使用 Microsoft.Web.Administration 在网站中创建虚拟目录

我正在寻找一种在默认网站中使用 Microsoft Web Administration 创建虚拟目录但不创建应用程序的方法我发现的唯一方法是创建应用程序 Microsoft Web Administration ServerManage
在 Perl 中，参考文件和一系列文件之间的映射

我想在 Perl 中映射两个数据集我有一个不变的数据集 ref 1 必须从一系列文件 1 20 中提取其他数据以匹配 ref1 Ref1 ID1 ID2 1 HZ 1 HX 1 HY 2 C 2 HZ 2 N File 1 ID2 ID3

在 Perl 中，参考文件和一系列文件之间的映射

在 Perl 中，参考文件和一系列文件之间的映射 的相关文章

随机推荐

热门标签

在 Perl 中，参考文件和一系列文件之间的映射的相关文章