如何使用正则表达式匹配包含表情符号的 URL?

2024-03-08

如何编写正则表达式来匹配包含表情符号的 URL?正则表达式应匹配普通字母数字 URL 以及域名、路径和/或参数中包含表情符号的 URL,例如:

http://????.to

http://www http://www.????.to/????????

http://????.to/I❤️编码?ref=????

当今大多数网络应用程序(包括但不限于社交网络、在线社区等)都会自动检测用户以文本形式发布的 URL,并将其转换为超链接。尽管如此,几乎没有一个(包括 StackOverflow)能够正确匹配包含表情符号的 URL(例如上面报告的示例),这些 URL 是有效的、100% 有效且变得越来越流行。 由于所有这些原因,当前的问题与使用任何编程语言的更现代的 URL 匹配正则表达式的代码实现非常相关。


此正则表达式匹配普通字母数字 URL 以及域名、路径和/或参数中包含表情符号的 URL:

https?:\/\/(www\.)?[-a-zA-Z0-9\u1F60-\uFFFF@:%._\+~#=]{2,256}\.[a-z]{2,256}\b([-a-zA-Z0-9\u1F60-\uFFFF@:%_\+.~#?&//=]*)

在这里尝试一下:https://regexr.com/3gsl9 https://regexr.com/3gsl9

请注意,将来添加新表情符号时,可能需要更新包含表情符号的 unicode 字符范围(即 \uXXXX-\uXXXX)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用正则表达式匹配包含表情符号的 URL? 的相关文章

随机推荐