如何使用 Perl 从纯文本中提取 URL？

2024-05-01

我需要 Perl 正则表达式来解析纯文本输入并将所有链接转换为有效的 HTML HREF 链接。我已经尝试了在网上找到的 10 个不同版本，但没有一个可以正常工作。我还测试了 StackOverflow 上发布的其他解决方案，但似乎都不起作用。正确的解决方案应该能够找到纯文本输入中的任何 URL 并将其转换为：

<a href="$1">$1</a>

我尝试过的其他正则表达式无法正确处理的某些情况包括：

URL 位于行尾，后跟回车符
包含问号的 URL
以“https”开头的 URL

我希望另一个 Perl 人员已经有一个他们正在使用的正则表达式，可以分享。在此先感谢您的帮助！

你要URI::查找 http://search.cpan.org/dist/URI-Find。提取链接后，您应该能够很好地处理其余问题。

这在中得到了回答perlfaq9 http://faq.perl.org/perlfaq9.html的回答“如何提取 URL？” http://faq.perl.org/perlfaq9.html#How_do_I_extract_URL，顺便一提。这些 perlfaq 中有很多好东西。 :)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Perl 从纯文本中提取 URL？的相关文章

正则表达式中连字符的这种用法有效吗？

NB I only想知道它是否是正则表达式定义中未转义连字符的有效应用它是not关于匹配电子邮件连字符或反斜杠的含义量词或其他任何内容的问题另外请注意链接的答案并没有真正讨论转义未转义连字符之间的有效性问题通常我会像这样声明
使用正则表达式查找除一个字符串之外的所有字符串[重复]

这个问题在这里已经有答案了我想匹配除字符串之外的所有字符串 ABC 例子 A gt Match F gt Match AABC gt Match ABCC gt Match CBA gt Match ABC gt No match 我尝试
正则表达式仅允许特定数字

我正在寻找一个只允许输入特定数字的正则表达式例如2 4 5 6 10 18 我尝试过类似的东西 2 4 5 6 10 18 我输入的任何内容都无法通过正则表达式然后计算机用手指着我并大笑我哪里出错了单引号是不必要的您正在寻找的正则
本地“关闭”binmode(STDOUT, ":utf8")

我的脚本开头有以下块 usr bin perl5 w use strict binmode STDIN utf8 binmode STDOUT utf8 binmode STDERR utf8 在某些子程序中当存在其他编码来自远程子程序
如何匹配单引号字符串中的双反斜杠？

我需要区分带有单反斜杠和双反斜杠的字符串 Perl 对它们一视同仁 print n qqq www eee rrr print n qqq www eee rrr 将给出相同的结果 qqq www eee rrr qqq www eee r
在 Perl 中如何打印到变量而不是文件？

如何使用 Perl 打印到变量我已经在一个程序上工作了一段时间它记录了它的迭代的以非常详细的方式取得进展 print loghandle some message 但是我还想有选择地将一些消息打印到不同的文件中当然我可以在代码中添
URL 中的点 (.) 字符错误

当我点击编辑具有此 url 的用户时遇到问题ASP NET MVC 3项目 http domain com 8089 User EditUser username surname IDUser e11a621p df11 4687 9903
改进将字符串转换为可读的 url

以下函数重写包含各种字符的新闻和产品标题的 url 我希望创建的字符串仅包含字母数字值和但没有结尾或空格也没有重复的下面的函数工作正常但我想知道是否有任何方法可以将其编写得更简单或更有效 function urlName stri
正则表达式 - 剥离非数字并删除分（如果有）

我目前正在开发一个 PHP 项目需要一些正则表达式的帮助我希望能够获取用户输入的货币值并删除所有非数字和小数位分 Ex 2 000 00 到 2000 2 000 00 美元到 2000 2abc000 到 2000 2 000 到
Apache 重写 - 获取 PHP 中的原始 URL

我在 nginx 或 Apache 中重写了这个地址 http domain com hello 到像这样的脚本 http domain com test php ref hell 如何在 PHP 中访问这个重写的 URL 因为如果我使用
如何只读取文件的第一行

我已经用谷歌搜索了一段时间但我找不到只读取文件第一行的函数我需要读取文本文件的第一行并从中提取日期 Perl 新手 open my file lt filename txt my firstLine lt file gt close f
如何从 URL 字符串中删除某些参数？

我有这个var存储表示充满参数的 URL 的字符串我正在使用 AngularJS 我不确定是否有任何有用的模块或者可能使用纯 JavaScript 来删除不需要的 URL 参数而无需使用正则表达式例如我需要删除 month 05并且
正则表达式提取美国邮政编码，但不提取假代码

使用 XML 包和 XPath 从网站上抓取地址有时我只能得到一个嵌入了我想要的邮政编码的字符串提取邮政编码很简单但有时会显示其他五位数字的字符串以下是 df 中问题的一些变体 zips lt data frame id seq 1
优化正则表达式以过滤数千个 HTML 选择选项

背景我开发了一个基于 jQuery 的穿梭小部件 https stackoverflow com a 13557000 59087对于 HTMLselect元素因为我找不到一个经过最低限度编码并提供正则表达式过滤器来补偿的元素变音符号
所有语言中特殊字符的 Java 正则表达式

在我的用户输入字段中我想允许某些特殊字符字母和数字的组合我应该确保正则表达式模式在输入时允许此设置任何语言基本上我构建的这个正则表达式也应该支持 unicode 表示如何使用 Java 中的 Pattern 类来实现这一点这里给
正则表达式匹配任何重复两次的字符

我试图确定提供的字符串是否包含重复两次的字符以下是我正在使用的正则表达式 a z 1 1 但是当针对以下字符串进行测试时下面的两个字符串都与模式匹配尽管我使用了 1 gt gt gt re findall r a z 1 1 abc
R 获取子字符串和正则表达式？

我有一组文件名字符串我想提取符号之后但文件扩展名之前的所有字符例如文件名之一是 HelloWorld you txt 我想返回字符串you 这是我的代码 hashPos grep name fixed TRUE dotPos len
通过搜索查找下一个文本并突出显示不起作用

当在搜索框中搜索任何文本时它可以找到并突出显示正确的文本但是当搜索下一个新文本时它无法找到下一个新文本再次搜索时它不起作用我无法找到问题这JS below JS button search click function va
PCRE 匹配 C 中的所有组

我想使用 PCRE C 库递归地匹配一个组 e g pattern d subject 5 6 3 2 OVECCOUNT 30 pcrePtr pcre compile pattern 0 error erroffset NULL rc
htaccess 301 重定向 - 删除查询字符串 (QSA)

我一直在努力处理一些 htaccess 重定向我只是花了一些时间在堆栈上阅读和搜索但无法获得适合我的场景的答案我正在将旧客户端网站的 301 重定向到新客户端旧页面有参数查询我想从网址中删除它 menu php idCategor

随机推荐

如何在自定义 rxcpp 运算符上调用 on_error

我创建了一个简单的 rx 运算符它将字符串流转换为 json 流并且工作正常但是我希望能够引发自定义异常并且我不知道如何调用on error认购方式操作员称为convertStringToJson可以在此处找到工作示例 http
C# HttpWebRequest 服务器未返回完整响应

我正在向返回带有数据的 HTML 的服务器发出 HTTP 请求但有时它会停在中间没有任何明确的解释例如响应结束 Content length 14336 chars p p br ul ul example com var auth
如何将 ipython 笔记本线程发布到 WordPress 博客中？

我知道 nbconvert 并且我能够将笔记本文件转换为 html 但我找不到将此 html 文件嵌入到 wordpress 中的方法有人尝试过并成功吗我们可以使用以下方法解决这个问题简单的 Mathjax 插件 https wordp
如何从反应上下文中获取数据

我有一个名为的 React 类GlobalDataProvider import React Component from react const DataContext React createContext export default
OpenLayers 3 中的边界如何工作？

是否有这样的概念OpenLayers Bounds http dev openlayers org docs files OpenLayers BaseTypes Bounds js htmlOpenLayers 2 x 中的内容仍然存在于
如何确定 WPF 中的光标大小？

在 Windows 窗体中有一个 Cursor Size 属性允许您获取光标对象的大小宽度高度如何在 WPF 中确定此信息 SystemParameters 类公开光标宽度 http msdn microsoft com en u
在 MATLAB 中高效地形成动态窗口

有人可以帮助我提供一种有效的方法或者帮助我执行提供的代码以尽可能少的步骤获得相同的结果我将感激你我有一个原始数组 A 1 1 1 4 3 4 5 4 4 3 3 1 0 0 2 6 2 6 3 6 6 2 7 4 8 7 2 2 2
如何将急切执行中的模型转换为静态图并保存在 .pb 文件中？

想象一下我有模型 tf keras Model class ContextExtractor tf keras Model def init self super init self model self get model def cal
按名称查找控件的父级

当在 xaml 代码中设置名称时有没有办法通过名称找到 WPF 控件的父级尝试这个 element VisualTreeHelper GetParent element as UIElement 在哪里元素是 Children 您需要
如何在Java程序中调用DLL中的方法

我正在尝试使用 JNA 调用 DLL 中的方法到目前为止已经使用加载了DLL Runtime getRuntime load myworkspace test dll 该 dll 包含我需要访问的方法如何在我的 Java 文件中执行 D
MVC T4 MvcTextTemplateHost 和定制的“控制器”T4 模板

我正在创建自己的自定义 T4 模板该模板与我的 MVC Web 应用程序中包含的 ADO NET 实体框架模型 edmx 文件集成以供参考请简单浏览一下以下两个网址斯科特汉塞尔曼 T4 代码生成 Visual Studio 最保
为什么我的代码中总是大写？
如何以编程方式锁定 Windows 工作站？ [复制]

这个问题在这里已经有答案了可能的重复使用 C 以编程方式锁定 Windows 工作站 https stackoverflow com questions 1263047 lock windows workstation programm
将 Magick::Image 转换为 cv::Mat

我正在尝试将通过 Magick 从 GIF 加载的图像转换为cv Mat 我已经从cv Mat to Magick Image但似乎无法找到如何从 Magick 中的图像中提取数据以便将其加载到 Mat 中最好的方法是什么供参考反过来
确定 WPF 元素相对于某个父元素的边界矩形

我认为这是一个非常简单的请求但我似乎无法在搜索中找到确凿的答案如何确定窗口中特定视觉元素相对于其他父元素的边界我尝试过使用LayoutInformation GetLayoutSlot但这似乎只是返回一个Rect在 0 0 处并且不反
如何在python日志模块中获取当前日志级别

我正在尝试创建一个基本记录器无需外部包即可着色 these have to be the first functions so I can use it in the logger settings def create log name
为什么 Jupyter 突然将数据框显示为基于文本的？

我已经使用 jupyter 笔记本有一段时间了如果我这样做的话df head 它总是返回一个格式良好的表格格式现在我调用了数据我得到了这个为什么我该如何解决它 import pandas as pd df pd read csv
如何循环用户输入直到输入整数？

我想运行一个交互式程序提示用户输入学生人数如果用户输入除整数之外的字母或其他字符则应再次询问他们输入学生人数我有以下代码 public int createArrays Scanner s int size System out
Neo4j 的 Cypher 查询语言是开源的吗？

Neo4j的语言Cypher的现状如何我真的很喜欢它但我想避免 Neo4j 锁定是否还有像 Gremlin 中那样的其他 Cypher 界面 Regards Cypher 完全是 OSS 请参阅https github com neo
如何使用 Perl 从纯文本中提取 URL？

我需要 Perl 正则表达式来解析纯文本输入并将所有链接转换为有效的 HTML HREF 链接我已经尝试了在网上找到的 10 个不同版本但没有一个可以正常工作我还测试了 StackOverflow 上发布的其他解决方案但似乎都不起作

如何使用 Perl 从纯文本中提取 URL？

如何使用 Perl 从纯文本中提取 URL？ 的相关文章

随机推荐

热门标签

如何使用 Perl 从纯文本中提取 URL？的相关文章