Perl：正则表达式不抓取代码中的多行 C 风格注释

2024-05-20

我有一个 Perl 程序：

读取用 C 编写的 SRC 文件
使用 SRC 文件中的正则表达式匹配来查找特定格式的数据以用作目标文件名
打开新的目标文件
执行另一个正则表达式匹配以查找包含关键字 abcd 的所有 C 风格注释 /* */。注意：这些注释可以是 1 行或多于 1 行，因此正则表达式会查找第一个 /*，然后查找关键字 abcd，然后在遇到结束符之前查找任意数量的文本和空格 */
将正则表达式匹配写入目标文件

#!/usr/bin/perl
use warnings;
use strict;

my $src = 'D:\\Scripts\\sample.c';
my $fileName;

# open source file for reading
open(SRC_FH,'<',$src) or die $!;

while(my $row = <SRC_FH>){
    if ($row =~ /([0-9]{2}\.[0-9]{2}\.[0-9]{3}\.[a-z,0-9]{2}|[0-9]{2}\.[0-9]{2}\.[0-9]{3}\.[a-z,0-9]{3})/){
        $fileName = $1;
    }
}

my $des = "D:\\Scripts\\" . $fileName . ".txt";

# open destination file for writing
open(DES_FH,'>',$des) or die $!;

print("copying content from $src to $des\n");

seek SRC_FH, 0, 0;

while(my $row = <SRC_FH>){
    if ($row =~ /(\/\*.*abcd.[\s\S]*?\*\/)/){
        print DES_FH "$1\n";
    }
}

# always close the filehandles
close(SRC_FH);

close(DES_FH);
print "File content copied successfully!\n";

我的问题是，我认为由于 perl 代码的执行方式，尽管正则表达式是正确的，但我的目标文件仅写入了 1 行注释。任何超过 1 行的 C 风格注释都不会写入目标文件。我的第二个 if 语句中缺少什么？

我在这里检查了我的第二个 if 语句正则表达式https://regexr.com/ https://regexr.com/它的工作原理是捕获多行 C 风格注释以及也包含关键字 abcd 的单行注释。

所以我尝试了 zdim 下面的第一个建议。这是我使用的：

#!/usr/bin/perl
use warnings;
use strict;

my $src = 'D:\\Scripts\\sample.c';
my $fileName;
my @comments;

# open source file for reading
open(SRC_FH,'<',$src) or die $!;

while(my $row = <SRC_FH>){
    if ($row =~ /([0-9]{2}\.[0-9]{2}\.[0-9]{3}\.[a-z,0-9]{2}|[0-9]{2}\.[0-9]{2}\.[0-9]{3}\.[a-z,0-9]{3})/){
        $fileName = $1;
    }
}

my $des = "D:\\Scripts\\" . $fileName . ".txt";

# open destination file for writing
open(DES_FH,'>',$des) or die $!;

print("copying content from $src to $des\n");

#seek SRC_FH, 0, 0;

my $content = do {
    #read whole file at once
    local $/;
    open (SRC_FH,'<', $src) or die $!;
    <SRC_FH>;
};

#if($content =~ /(\/\*.*abcd.[\s\S]*?\*\/)/sg){
#       my @comments = $content;
#   }

my @comments = $content =~ /(\/\*.*abcd.[\s\S]*?\*\/)/sg;

foreach (@comments){
    print DES_FH "$1\n";
}

#while(my $row = <SRC_FH>){
#   if ($row =~ /(\/\*.*abcd.[\s\S]*?\*\/)/){
#       print DES_FH "$1\n";
#   }
#}

# always close the filehandles
close(SRC_FH);

close(DES_FH);
print "File content copied successfully!\n";

结果是将sample.c 中的所有内容复制到目标文件。完整的 1:1 副本。我希望从 C 文件中提取所有单行和多行注释。

示例1： /* A B C D */ 示例2： /* 一些文本 * 更多评论 abcd 和一些更多评论 */

最终解决方案

#!/usr/bin/perl
use warnings;
use strict;

my $src = 'D:\\Scripts\\sample.c';
my $fileName;

# open source file for reading
open(SRC_FH,'<',$src) or die $!;

while(my $row = <SRC_FH>){
    if ($row =~ /([0-9]{2}\.[0-9]{2}\.[0-9]{3}\.[a-z,0-9]{2}|[0-9]{2}\.[0-9]{2}\.[0-9]{3}\.[a-z,0-9]{3})/){
        $fileName = $1;
    }
}

my $des = "D:\\Scripts\\" . $fileName . ".txt";

# open destination file for writing
open(DES_FH,'>',$des) or die $!;

print("copying content from $src to $des\n");

seek SRC_FH, 0, 0;

my $content = do{local $/; <SRC_FH>};

my @comments = $content =~ /(\/\*.*abcd.[\s\S]*?\*\/)/g;

for(@comments){
    print DES_FH "$_\n";
}

# always close the filehandles
close(SRC_FH);

close(DES_FH);
print "File content copied successfully!\n";

我的第二个 if 语句中缺少什么？

好吧，没什么——只是在多行 C 注释中，它的两行都没有/* and */。因此，当逐行读取文件时，正则表达式无法匹配多行注释。

要捕获此类评论：

将整个文件读入字符串（“slurp”它），然后添加/s正则表达式上的修饰符，以便.也匹配换行符。还使用/g修饰符 so 可以捕获字符串中的所有此类模式。单程

my $content = do { 
    local $/;  # undef record separator so the whole file is read at once
    open my $src_fh, '<', $src_file or die $!;  # have to re-open
    <$src_fh>;                                  # reads it all
};  # lexical filehandle gets closed as we leave scope

# NOTE -- there may be difficulties in capturing comments in a C source file
my @comments = $content =~ /.../sg;  # your regex

或者使用库来获取文件，例如

use Path::Tiny;
my $content = path($src_file)->slurp;

Or,

当你看到时设置一个标志/*，获取/打印所有行，直到结束*/，然后取消设置该标志。这是一个基本版本

my $inside_comment = 0;
while (<$src_fh>) {
    if (m{(/\*.*)}) {         #/ fix syntax hilite
        $inside_comment = 1;  # opening line for the comment 
        say $des_fh $1; 
    } 
    elsif (m{(.*\*/)}) {      # closing line for the comment
        say $des_fh $1; 
        $inside_comment = 0; 
    } 
    elsif ($inside_comment) { say $des_fh $_}
}

我测试了所有这些，但请检查并改进。其一，这对于前导空格来说很有趣。

注意：从 C 程序中获取所有注释通常可能相当棘手。

这是单行版的 slurping

my $file_content = do { local (@ARGV, $/) = $file_name; <> }

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

perl

Perl：正则表达式不抓取代码中的多行 C 风格注释的相关文章

正则表达式仅匹配大写“单词”，但有一些例外

我的技术字符串如下 The thing P1 must connect to the J236 thing in the Foo position 我想用正则表达式匹配那些仅大写的单词即这里P1 and J236 问题是当句子的第一个字母
nginx 代理重定向，带有来自 uri 的端口

我正在尝试使用 nginx 进行重定向这个想法是将某些端口的 uri id 1234 重定向到 localhost 1234 固定端口的重定向 location id 1234 rewrite id 1234 1 break proxy
如何使用 mod rewrite / htaccess 创建具有两个或多个参数的友好 URL？

新手在这里重写Mod 我想在 URL 中传递两个 URL 参数但采用更友好的格式如果用户通过 example com blah123 sys 在本例中我应该能够提取 MySQL 记录 blah123 和模式类型 sys 这是例子 URL
python 文件中的单词分析和评分

我正在对一个句子进行逐字分析例如嘿那里这是一部很棒的电影我有很多像上面这样的句子我有一个巨大的数据集文件如下所示我必须快速查找该单词是否存在如果是则进行分析并存储在字典中例如从单词的文件中获取分数句子最后一个单词的分数
正则表达式仅匹配字母数字和连字符，删除 javascript 中的其他所有内容

我想删除除字母数字和连字符之外的所有内容到目前为止我已经得到了这个但它不起作用 String String replace a zA Z0 9 ig 有什么帮助吗如果要删除除字母数字连字符和下划线之外的所有内容请否定字符类如下
如何使用 PHP preg_replace 链接 Twitter 用户名？

我想搜索我的 Twitter 状态对象的文本属性并将 username 替换为 a href username a 到目前为止我尝试过的看起来像这样 pattern 1 a zA Z0 9 replace a href 1 2 a new
如何连接行并添加分隔符？

命令J连接线命令gJ连接线删除空格是否还有连接行的命令在行之间添加分隔符 Example Input text other text more text text 我想做的事选择这4行如果开始和或 EOL 处有空格请将其删除
Preg_replace() 删除除查询结尾之外的所有内容

首先为我糟糕的英语感到抱歉我有这样的疑问 SELECT t1 SELECT COUNT FROM table a t2 WHERE t1 id t2 id c AND t2 status 1 AS aula FROM table c t
从字符串中提取数字 (Regex C++)

假设我有一根绳子S 1 this is a number 200 Val 54 4class find57 我想用Regex仅提取这些数字 num 1 1 num 2 200 num 3 54 而不是 4class 中的 4 或 find5
使用 javascript 将多行、缩进的 json 转换为单行

我想出了以下函数用于将多行缩进的 json 转换为单行 function text var outerRX s n r g innerRX s n r return text replace outerRX function 0 1 r
如何为不同的 Perl 应用程序安装专门的环境？

就功能而言是否有与 Python 相同或接近的东西虚拟环境 http pypi python org pypi virtualenv what it does 但是对于 Perl 来说呢我已经用 Python 进行了一些开发并且将非系统
正则表达式删除块注释也删除 * 选择器

我正在尝试使用 bash 从 css 文件中删除所有块注释我有以下 sed 命令的正则表达式 sed r s w s w d 这可以很好地去除块注释例如 This is a comment this is another comment
正则表达式接受 4 条规则中的 3 条

我似乎无法让正则表达式正确满足以下要求长度在 8 到 20 之间的字符串必须包含至少 1 个大写字母字符至少 1 个小写字母字符以及至少 1 个数字或至少 1 个特殊字符字符或两者假设特殊字符仅限于包括我最初是这样写的 A Z
Perl Tk 模块有哪些缺点？

与在 Perl 中创建 GUI 的其他解决方案相比 Tk 模块有哪些缺点我最近浏览了 Perl 的各种 gui 模块这是我的总结免责声明最终我发现现有模块都不能满足我的需求所以我开始编写自己的 gui 工具包 Tk 工作起来很不错
Perl 中可以使用哪种语法糖来减少左/右值运算符与 if 语句的代码？

那里有很多语句因为 Perl 是一种非常甜蜜的语言但任何语言中最常用的语句都是 if 语句和设置值的组合我想我已经找到了很多但仍然存在一些空白最终目标是不必多次编写变量名这是我到目前为止所拥有的 r s r s unless
正则表达式匹配整个单词[重复]

这个问题在这里已经有答案了我在 stackoverflow 上看到了很多关于使用正则表达式进行全词匹配的例子我有以下情况我想用 www xyz com 替换 www abc com string RetVal I am going t
Java中字符串中特殊字符的替换

Java中如何替换字符串 E g String a adf sdf 如何替换和避免特殊字符您可以删除除此之外的所有字符可打印的 ASCII 范围 http en wikipedia org wiki ASCII ASCII printab
正则表达式拆分数字和字母组，不带空格

如果我有一个像 11E12C108N 这样的字符串它是字母组和数字组的串联如何在中间没有分隔符空格字符的情况下分割它们例如我希望分割结果为 tokens 0 11 tokens 1 E tokens 2 12 tokens 3 C
如何确保我的代码永远不会直接退出？

eval require file subsequent code goes here If file包含一个exit语句后面的代码就没有机会运行如何解决以便后续代码始终有机会运行eval已经完成了中止是不可能的exit call f
shell中如何分割字符串

我有一个变量作为 string ABC400p2q4 我怎样才能分开ABC400 and p2q4 我需要将它分成两个变量结果我得到 echo var1 ABC400 echo var2 p2q4 可以用任何字母字符代替 ABC 可以用任

随机推荐

finish() 完成活动但它仍然在后台

我有一个关于 android studio 中活动的 finish 方法的问题我有这个简单的代码 public class MainActivity extends AppCompatActivity Override protected
合并两个（或更多）PDF

背景我需要为我的销售人员提供每周报告包该包包含几个 5 10 个水晶报告 Problem 我想允许用户运行所有报告并且只运行单个报告我想我可以通过创建报告然后执行以下操作来做到这一点 List
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
检查缓存后 System.Web.HttpContext.Current 自身为空

今天我遇到了一个奇怪的问题这对我来说毫无意义总结如下在方法内部我检查缓存的项目如下所示 private async Task
Graphviz：能够接受更大文件的在线工具[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有谁知道有一个很好的在线网站来渲染 graphviz 点文件该文件将需要更大的文件例如 200 行
更改 Grafana 端口

我目前在 Grafana 中有 InfluxDB 提供仪表板我最终将在服务器上部署这个堆栈但是 Grafana 的默认端口是 80 我必须更改此端口但我不知道如何更改有人可以帮忙吗 Thanks 变化不仅在于 etc grafana
TransactionScope 是否需要开启 DTC 服务？

根据我的阅读为了在 NET 中使用 TransactionScope 您需要运行 Windows 中的分布式事务协调器服务我有那个服务关掉并且我的应用程序似乎运行相同并且回滚事务没有问题我错过了什么吗它如何能够发挥作用呢我正在运
如何使用canvas.toDataURL()将画布保存为图像？

我目前正在构建一个 HTML5 Web 应用程序 Phonegap 本机应用程序我似乎不知道如何将画布保存为图像canvas toDataURL 有人可以帮我吗这是代码有什么问题吗我的画布被命名为 canvasSignature J
Django Rest Framework：字段名称“likes”对于模型“userPost”配置不正确无效

在我的 Django Rest Framework api 中我尝试向我的模型 UserPosts 添加一个属性该属性返回所述帖子的所有喜欢尽管我尽了最大努力但我仍然遇到这个错误下面是我的帖子模型 class UserPosts
如何将 PhoneGap 与 Visual Studio 结合使用

我在 Windows 8 VS 2012 上开始使用 PhoneGap 时遇到问题即我不知道如何安装模板我打开从PhoneGap下载的模板项目但它们与VS2012兼容我不知道从哪里开始创建我的第一个简单的 CRUD 应用程序我想
如何使用 jest 模拟第三方库

我正在开发一个node js应用程序使用nestjs我有一堂课叫LoggerService如下 export class LoggerService private logger Rollbar constructor this logge
具有共享依赖项的多模块项目的 Gradle 配置

使用 gradle 制作第一个项目所以我研究了 spring gradle hibernate 项目如何组织 gradle 文件并开始制作自己的项目但是找不到错误为什么我的配置不起作用子项目无法解决依赖关系所以项目树 Root
将数字分解为单个数字的数组

如果我有整数 123 并且我想将数字分解为数组 1 2 3 最好的方法是什么我已经搞乱了很多并且我有以下工作 var number 123 var digits Array String number map Int strtoul S
Mysqli 更新抛出 Call to a member function bind_param() 错误[重复]

这个问题在这里已经有答案了我有一个 70 80 字段表单需要插入到表中因此我首先根据表单中的输入名称在数据库中创建了一个表而不是手动创建一个巨大的插入语句这是我使用的代码创建更改表 function createTable ar
Java：正则表达式排除空值

在问题中here https stackoverflow com questions 51359056 java regexp for a separated group of digits 我得到了正则表达式来匹配 1 到 99 之间的一
Ember.js 处理 View 事件后转换到路由

Setup 我有一个 Ember 应用程序支持使用 Imgur API 上传图像我已经有一个工作路线和模板来处理任何 Imgur ID 但我想在上传新图像后转换到此路线使用返回的 Imgur ID 这是该应用程序的相关部分 http
如何获取 WebElement 的父级[重复]

这个问题在这里已经有答案了我试过了 private WebElement getParent final WebElement webElement return webElement findElement By xpath 但我得到
查询参数更改时，路线不会更新

在我的应用程序中有多个链接其中我有一些links与相同的route但与不同的query parameters 比如说我有这样的链接 deposits withdrawals deposits withdrawals id 1 depo
如何使用自定义 DbFunction 将字符串转换为小数

我有一个将小数和其他类型保存为字符串的表我想在数据库上下文上编写一个 Linq 查询该查询将转换为数据库转换而不是本地转换出于性能原因 This 非工作的example 从概念上讲是我想要实现的目标 using var conte
Perl：正则表达式不抓取代码中的多行 C 风格注释

我有一个 Perl 程序读取用 C 编写的 SRC 文件使用 SRC 文件中的正则表达式匹配来查找特定格式的数据以用作目标文件名打开新的目标文件执行另一个正则表达式匹配以查找包含关键字 abcd 的所有 C 风格注释注意这些注释

Perl：正则表达式不抓取代码中的多行 C 风格注释

Perl：正则表达式不抓取代码中的多行 C 风格注释 的相关文章

随机推荐

热门标签

Perl：正则表达式不抓取代码中的多行 C 风格注释的相关文章