YouTube 完整的 Java 正则表达式

2024-05-26

我需要解析几个页面才能获取他们所有的 Youtube ID。

我在网上找到了很多正则表达式，但是：Java 的正则表达式并不完整（它们要么除了 ID 之外还给我垃圾，要么错过了一些 ID）。

我发现似乎完整的一个是托管的here https://stackoverflow.com/questions/5830387/php-regex-find-all-youtube-video-ids-in-string/5831191#5831191。但它是用 JavaScript 和 PHP 编写的。不幸的是我无法将它们翻译成JAVA。

有人可以帮我用 Java 重写这个 PHP 正则表达式或下面的 JavaScript 正则表达式吗？

'~
    https?://         # Required scheme. Either http or https.
    (?:[0-9A-Z-]+\.)? # Optional subdomain.
    (?:               # Group host alternatives.
      youtu\.be/      # Either youtu.be,
    | youtube\.com    # or youtube.com followed by
      \S*             # Allow anything up to VIDEO_ID,
      [^\w\-\s]       # but char before ID is non-ID char.
    )                 # End host alternatives.
    ([\w\-]{11})      # $1: VIDEO_ID is exactly 11 chars.
    (?=[^\w\-]|$)     # Assert next char is non-ID or EOS.
    (?!               # Assert URL is not pre-linked.
      [?=&+%\w]*      # Allow URL (query) remainder.
      (?:             # Group pre-linked alternatives.
        [\'"][^<>]*>  # Either inside a start tag,
      | </a>          # or inside <a> element text contents.
      )               # End recognized pre-linked alts.
    )                 # End negative lookahead assertion.
    [?=&+%\w]*        # Consume any URL (query) remainder.
    ~ix'

/https?:\/\/(?:[0-9A-Z-]+\.)?(?:youtu\.be\/|youtube\.com\S*[^\w\-\s])([\w\-]{11})(?=[^\w\-]|$)(?![?=&+%\w]*(?:['"][^<>]*>|<\/a>))[?=&+%\w]*/ig;

首先，您需要插入额外的反斜杠\foreach 反斜杠在旧的正则表达式中，否则java认为你转义了字符串中的一些其他特殊字符，而你没有这样做。

https?:\\/\\/(?:[0-9A-Z-]+\\.)?(?:youtu\\.be\\/|youtube\\.com\\S*[^\\w\\-\\s])([\\w\\-]{11})(?=[^\\w\\-]|$)(?![?=&+%\\w]*(?:['\"][^<>]*>|<\\/a>))[?=&+%\\w]*

接下来，当您编译模式时，您需要添加CASE_INSENSITIVE旗帜。这是一个例子：

String pattern = "https?:\\/\\/(?:[0-9A-Z-]+\\.)?(?:youtu\\.be\\/|youtube\\.com\\S*[^\\w\\-\\s])([\\w\\-]{11})(?=[^\\w\\-]|$)(?![?=&+%\\w]*(?:['\"][^<>]*>|<\\/a>))[?=&+%\\w]*";

Pattern compiledPattern = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher matcher = compiledPattern.matcher(link);
while(matcher.find()) {
    System.out.println(matcher.group());
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

regex

Youtube

YouTube 完整的 Java 正则表达式的相关文章

如何默认将 Maven 插件附加到阶段？

我有一个 Maven 插件应该在编译阶段运行所以在项目中consumes我的插件我必须做这样的事情
Java中反射是如何实现的？

Java 7 语言规范很早就指出本规范没有详细描述反射我只是想知道反射在Java中是如何实现的我不是问它是如何使用的我知道可能没有我正在寻找的具体答案但任何信息将不胜感激我在 Stackoverflow 上发现了这个关于 C
Java JDBC：更改表

我希望对此表进行以下修改添加状态列 varchar 20 日期列时间戳我不确定该怎么做 String createTable Create table aircraft aircraftNumber int airLineCompa
给定两个 SSH2 密钥，我如何检查它们是否属于 Java 中的同一密钥对？

我正在尝试找到一种方法来验证两个 SSH2 密钥一个私有密钥和一个公共密钥是否属于同一密钥对我用过JSch http www jcraft com jsch 用于加载和解析私钥更新可以显示如何从私钥 SSH2 RSA 重新生成公钥
使用 Android 发送 HTTP Post 请求

我一直在尝试从 SO 和其他网站上的大量示例中学习但我无法弄清楚为什么我编写的示例不起作用我正在构建一个小型概念验证应用程序它可以识别语音并将其文本作为 POST 请求发送到 node js 服务器我已确认语音识别有效并且服务
制作一个交互式Windows服务

我希望我的 Java 应用程序成为交互式 Windows 服务用户登录时具有 GUI 的 Windows 服务我搜索了这个我发现这样做的方法是有两个程序第一个是服务第二个是 GUI 程序并使它们进行通信服务将从 GUI 程序获取
加速代码 - 3D 数组

我正在尝试提高我编写的一些代码的速度我想知道从 3d 整数数组访问数据的效率如何我有一个数组 int cube new int 10 10 10 我用价值观填充其中然后我访问这些值数千次我想知道由于理论上所有 3d 数组都存储在内
Mockito when().thenReturn 不必要地调用该方法

我正在研究继承的代码我编写了一个应该捕获 NullPointerException 的测试因为它试图从 null 对象调用方法 Test expected NullPointerException class public void c
在 SQLite 中搜索时排除 HTML 标签和一些 UNICODE 字符

更新 4 我已经成功运行了firstchar例如但现在的问题是使用regex 即使包含头文件它也无法识别regex操作员有什么线索可以解决这个问题吗更新 2 我已经编译了sqlite3我的项目中的库我现在正在寻找任何人帮助我为我的
Java按日期升序对列表对象进行排序[重复]

这个问题在这里已经有答案了我想按一个参数对对象列表进行排序其日期格式为 YYYY MM DD HH mm 按升序排列我找不到正确的解决方案在 python 中使用 lambda 很容易对其进行排序但在 Java 中我遇到了问题 f
加密 JBoss 配置中的敏感信息

JBoss 中的标准数据源配置要求数据库用户的用户名和密码位于 xxx ds xml 文件中如果我将数据源定义为 c3p0 mbean 我会遇到同样的问题是否有标准方法来加密用户和密码保存密钥的好地方是什么这当然也与 tomcat
如何在 javadoc 中使用“<”和“>”而不进行格式化？

如果我写
仅将 char[] 的一部分复制到 String 中

我有一个数组 char ch 我的问题如下如何将 ch 2 到 ch 7 的值合并到字符串中我想在不循环 char 数组的情况下实现这一点有什么建议么感谢您花时间回答我的问题 Use new String value offset
Java执行器服务线程池[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 如果我使用 Executor 框架在
如何从终端运行处理应用程序

我目前正在使用加工 http processing org对于一个小项目但是我不喜欢它附带的文本编辑器我使用 vim 编写所有代码我找到了 pde 文件的位置并且我一直在从 vim 中编辑它们然后重新打开它们并运行它们重新加载脚
如何从泛型类调用静态方法？

我有一个包含静态创建方法的类 public class TestClass public static
捕获的图像分辨率太大

我在做什么我允许用户捕获图像将其存储到 SD 卡中并上传到服务器但捕获图像的分辨率为宽度 4608 像素和高度 2592 像素现在我想要什么如何在不影响质量的情况下获得小分辨率图像例如我可以获取或设置捕获的图像分辨率为原始图像分
java.lang.IllegalStateException：驱动程序可执行文件的路径必须由 webdriver.chrome.driver 系统属性设置 - Similiar 不回答

尝试学习 Selenium 我打开了类似的问题但似乎没有任何帮助我的代码 package seleniumPractice import org openqa selenium WebDriver import org openqa s
如何实现仅当可用内存较低时才将数据交换到磁盘的写缓存

我想将应用程序生成的数据缓存在内存中但如果内存变得稀缺我想将数据交换到磁盘理想情况下我希望虚拟机通知它需要内存并将我的数据写入磁盘并以这种方式释放一些内存但我没有看到任何方法以通知我的方式将自己挂接到虚拟机中before an O
Spring Boot @ConfigurationProperties 不从环境中检索属性

我正在使用 Spring Boot 1 2 1 并尝试创建一个 ConfigurationProperties带有验证的bean 如下所示 package com sampleapp import java net URL import j

随机推荐

padStart 有什么替代方案[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我在 javascript 中使用 padStart 但它不适用于 Internet Explorer
{PHP} 致命错误：不在对象上下文中时使用 $this (Joomla)

我真的不了解 php 并且碰壁了问题是我的网站显示以下错误 Fatal error Using this when not in object context in hermes web07 b2350 pow thefoodie htd
Objective-c 截断字符串并在末尾添加省略号

如何在 Objective C 中截断字符串然后在末尾添加省略号 NSString origString A very long string blah blah blah const int clipLength 18 if origS
按年月分组并在 Python 中查找前 N 个最小值列

基于来自的输出数据帧这个链接 https stackoverflow com questions 69931611 resample by month and find certain number of columns which hav
Spring boot如何自定义HttpMessageConverter

后端 Spring boot项目 v1 3 0 发布向前端提供Rest JSON Api 刚才遇到错误 Infinite recursion StackOverflowError 我决定改变习惯FastJsonHttpMessageCon
从 php/linux 获取 pdf 的布局模式（横向或纵向）

给定一个 PDF 如何使用 PHP lib 或 Linux 命令行工具获取 PDF 的布局模式或相对宽度高度 Using http www tecnick com public code cp dpage php aiocp dp tc
线程“main”中出现异常 java.lang.NoClassDefFoundError: junit/textui/ResultPrinter 更新到 Yosemite 后

我最近将系统从 Mavericks OSX 更新到 Yosemite 我过去可以右键单击测试并运行它现在我得到了例外 Library Java JavaVirtualMachines jdk1 7 0 71 jdk Contents Ho
仅为两个控制器分配不同的域

我使用的是旧的 Yii v1 我只需要为两个控制器分配不同的域所以我有一堆控制器 HomeController php CategoryController php GuestbookController php ShopControll
等待进程直到所有子进程完成？ [复制]

这个问题在这里已经有答案了我有一个创建两个或更多子进程的主进程我希望主进程等待所有子进程完成其操作并退出 main script py p1 subprocess Popen python script1 py p2 subproces
使用 AForge.Net 进行车牌识别

我目前正在做一个项目自动车牌检测和识别我正在使用 AForge Net 我使用了一个简单的算法虽然效率不是很高但是可以满足我的要求我计算出高度宽度和高宽比高度宽度超过 40辆汽车的车牌号我搜索了图像中位于范围内的矩形
为什么可以让属性的名称与其返回类型相同？

在C 中为什么可以这样做 public Int32 Int32 get set 但不是这个 public int int get set 我的问题应该更清楚属性的返回类型是否可以与属性具有相同的名称变量的命名不得与 C 中的语言关键字
如何禁用Spring Boot参数分割

我们有许多 RestController 接收用户编写的通用语言短语短语可以很长并且包含标点符号例如句号当然还有逗号简化控制器示例 RequestMapping value countphrases method RequestMe
JMeter 为子功能添加 Think Time

在 JMeter 中当我右键单击线程控制器时我有一个选项 Add Think Time to children功能当我点击它时我会看到每个采样器Test Action暂停与Uniform Random Timer随机延迟 10
如何向 Django 表单添加表单控件？

我尝试将表单控件添加到我为 Django 制作的表单应用程序中我已经创建了该应用程序并希望将表单添加到引导程序模板中但是我不知道如何为我的电子邮件字段添加引导程序的更时尚的文本框我希望最终得到类似于此引导模板一角的登录字段的内容尽
Android ConstraintLayout：如何在另一个视图下面添加动态视图

我正在尝试在运行时在约束布局中将 TextView 添加到另一个下面但我最终总是只有一个文本视图其余的都隐藏在它后面我尝试了几种方法包括链接视图但似乎没有任何效果 private void method int position
React this 与已经绑定的方法未定义[重复]

这个问题在这里已经有答案了我有一个反应应用程序我正在尝试使用 JavaScript 文件中的数据构建一个导航栏组件我的 NavbarData js 文件如下所示 const NavbarData id 1 text Typograph
如何推导出 alpha-beta 剪枝的时间复杂度？

我了解极小极大和 alpha beta 剪枝的基础知识在所有文献中他们谈论最佳情况的时间复杂度是 O b d 2 其中 b 分支因子 d 树的深度基本情况是所有首选节点都为 O b d 2 首先扩大在我的最佳情况示例中我有一个
TravisCI：如何允许环境变量失败

如何允许具有特定环境变量值的构建失败例如 travis yml env TEST GROUP Smoke TEST GROUP other How to allow failures for this variable matrix al
获取保存到照片库的图像的 PHAsset/localIdentifier

我在用着UIImageWriteToSavedPhotosAlbum https www hackingwithswift com example code media uiimagewritetosavedphotosalbum how
YouTube 完整的 Java 正则表达式

我需要解析几个页面才能获取他们所有的 Youtube ID 我在网上找到了很多正则表达式但是 Java 的正则表达式并不完整它们要么除了 ID 之外还给我垃圾要么错过了一些 ID 我发现似乎完整的一个是托管的here https st

YouTube 完整的 Java 正则表达式

YouTube 完整的 Java 正则表达式 的相关文章

随机推荐

热门标签

YouTube 完整的 Java 正则表达式的相关文章