如何编写正则表达式来匹配包含表情符号的 URL?正则表达式应匹配普通字母数字 URL 以及域名、路径和/或参数中包含表情符号的 URL,例如:
http://????.to
http://www http://www.????.to/????????
http://????.to/I❤️编码?ref=????
当今大多数网络应用程序(包括但不限于社交网络、在线社区等)都会自动检测用户以文本形式发布的 URL,并将其转换为超链接。尽管如此,几乎没有一个(包括 StackOverflow)能够正确匹配包含表情符号的 URL(例如上面报告的示例),这些 URL 是有效的、100% 有效且变得越来越流行。
由于所有这些原因,当前的问题与使用任何编程语言的更现代的 URL 匹配正则表达式的代码实现非常相关。
此正则表达式匹配普通字母数字 URL 以及域名、路径和/或参数中包含表情符号的 URL:
https?:\/\/(www\.)?[-a-zA-Z0-9\u1F60-\uFFFF@:%._\+~#=]{2,256}\.[a-z]{2,256}\b([-a-zA-Z0-9\u1F60-\uFFFF@:%_\+.~#?&//=]*)
在这里尝试一下:https://regexr.com/3gsl9 https://regexr.com/3gsl9
请注意,将来添加新表情符号时,可能需要更新包含表情符号的 unicode 字符范围(即 \uXXXX-\uXXXX)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)