使用 Python 从 Javascript 中提取文本

2024-02-25

我一直在查看如何执行此操作的示例,但不太明白。我正在使用 beautifulsoup 来抓取一些数据 - 我可以使用它来查找我想要的数据,但它包含在以下代码块中。我正在尝试从中提取时间戳信息。我有一种感觉正则表达式在这里工作,但我似乎无法弄清楚 - 有什么建议吗?

    <script class="code" type="text/javascript">
    $(document).ready(function(){
    line1 = [['2009-02-23 10 AM', 5203], ['2009-02-08 10 AM', 3898], ['2009-02-09 10 AM', 4923], ['2009-02-22 10 AM', 3682], ['2009-02-21 10 AM', 3238], ['2009-02-20 10 AM', 4648]];
    options1 = {
    etc other text
      }
    });
    </script>

您不能使用 BS 来获取此数据 - BS 仅适用于 HTML/XML,不适用于 JavaScript。

你必须使用regular expressions或标准字符串函数。


EDIT:

text = '''<script class="code" type="text/javascript">
    $(document).ready(function(){
    line1 = [['2009-02-23 10 AM', 5203], ['2009-02-08 10 AM', 3898], ['2009-02-09 10 AM', 4923], ['2009-02-22 10 AM', 3682], ['2009-02-21 10 AM', 3238], ['2009-02-20 10 AM', 4648]];
    options1 = {
    etc other text
      }
    });
    </script>'''

import re

re.findall("'([^']*)'", text)

result:

['2009-02-23 10 AM',
 '2009-02-08 10 AM',
 '2009-02-09 10 AM',
 '2009-02-22 10 AM',
 '2009-02-21 10 AM',
 '2009-02-20 10 AM']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Python 从 Javascript 中提取文本 的相关文章

随机推荐

  • 将文件“移动”到包含路径列表中意味着什么?

    在 Zend Framework 初学者指南 一书中 它说 的内容library 目录应该移动到 PHP 中的某个位置 include 路径 列表 我不明白 不包括引用特定位置中特定目录的路径保留值 是这个意思吗 或者我是否必须将文件夹移动
  • Matplotlib Pandas 日期时间频率

    我正在尝试使用 matplotlib 绘制一些数据 并希望减少显示的 DateTime x 轴刻度数 我能够使用 plt locator 将垃圾箱的数量减少一半 但日期时间与条形不对齐 有什么办法可以解决这个问题吗 我希望只显示 10 个刻
  • 使用javascript或jquery动态添加Div到html页面

    我想要一个主 div 并且能够动态添加与主 div 处于同一级别的新 div 像这样的事情 div div div div 任何帮助都会很棒 parent div append div div 或者如果你想要新创建的 div s 出现在其他
  • 使用 XOR 和补码解析位

    当向量中的所有其他数字恰好出现三次时 我无法找到仅出现一次的数字 class Solution public int singleNumber vector
  • JSP EL 和自动完成

    在我的 servlet 中 request setAttribute list myList 在我的 Jsp 中
  • 适用于 Android 的 Firebase Cloud Messaging 中的 InvalidRegistration 错误

    我正在开发一个使用推送通知功能的 Android 应用程序 我需要从服务器推送 我使用 Firebase 这是我第一次使用 Firebase 但是当我使用 PHP 和 CURL 从服务器推送时 它给了我无效的注册错误 我像这样在 Andro
  • 将配置单元行分组到此行的数组中

    我有一个如下表 User String Alias String JohnDoe John JohnDoe JDoe Roger Roger 我想将用户的所有别名分组在一个数组中 在一个新表中 如下所示 User String Alias
  • 使用 Openshift 的裸域

    我在使用 Google 的 GAE 云产品时遇到的最大问题之一是它无法处理裸域 它可以处理子域 www 但不能处理裸域 这是一个大问题 因为您的应用程序将无法处理客户端请求中的 PATH 或子目录 因为它在 DNS 转发到 www 子域期间
  • 在 R 中创建空间集群 LISA 地图

    我想创建一张显示现象的局部空间集群的地图 最好使用局部莫兰 LISA 在下面的可重现示例中 我使用以下方法计算本地莫兰指数spdep但我想知道是否有简单的方法来映射簇 最好使用ggplot2 Help library UScensus200
  • 即使添加控制台插件后,console.log 在 iOS Phonegap 应用程序中也不起作用

    我在 Cordova CLI 中创建了一个 Phonegap iOS 应用程序 我已经添加了控制台插件 是的 deviceready 被成功调用 但是 console log 不起作用并且不会在 XCode 日志中打印任何内容 插件安装 科
  • AWS X-Ray GoLang Lambda 到 lambda 跟踪并显示在服务地图中

    我有一个 API 网关 它在 Go 中调用 Lambda 函数 1 和 Lambda 函数 2 我想看到这两个函数加入到服务映射中 到目前为止 我能够做到这一点的唯一方法是创建一个自定义分段 例如称为 父级 并从此上下文创建一个子分段 例如
  • 无法让 pip install 在 EMR 集群上运行

    我有一个 EMR emr 5 30 0 集群 我尝试从 S3 中的引导文件启动 引导程序文件的内容是 bin bash sudo pip3 install user matplotlib pandas pyarrow pyspark 我的
  • Android 4.4 KitKat 未收到 cookie

    在我的应用程序中 我向服务器发送 POST 请求 并从服务器接收响应 我从响应中收集了不同的 cookie 特别是用户信息 因此 我发送登录请求并在服务器响应后接收 cookie 以保持登录 在 Android 4 3 及更低版本中 我可以
  • Web 服务作为 JAR 文件,还是另一个 WAR 中的 WAR?

    我有一个在 Tomcat 6 上运行的 SOAP Web 服务 使用 Spring Web Services Java 现在我想将此 Web 服务合并到另一个大型 Web 应用程序中 使用 Spring Java 而不是 Web 服务 并使
  • 如何使用 mDNS 将所有子域路由到单个主机?

    我有一个开发网络服务器托管为 myhost local 它是使用 Bonjour mDNS 找到的 服务器正在运行 avahi daemon 网络服务器还希望处理其自身的任何子域 例如 cat myhost local 和 dog myho
  • 如何在Java中将一个双精度数按点分割成两个十进制数?

    尝试按点将双精度数分成两个小数部分 像这样 1 9变成1和9 0 16分为0和16 这就是我所做的 但似乎有点多余 最好的方法是什么 原始编号始终为 Just 0 x 或 1 x 或 0 xx 或 1 xx 且 xx gt 10 doubl
  • 从 KeyMembers 中获取身份字段

    我想得到KeyMembers我在 Edmx 中设置的位置StoreGeneratedPattern to Identity有没有办法做到这一点 我可以使用以下代码获取 KeyMembers private static IEnumerabl
  • Flink 中的水印和触发器有什么区别?

    我读到 排序运算符必须缓冲它接收到的所有元素 然后 当它接收到水印时 它可以对时间戳低于水印的所有元素进行排序 并按排序顺序发出它们 这是正确 因为水印表明不能有更多元素到达并与已排序元素混合 https cwiki apache org
  • 在 Ansible 中使用 BuildKit 进行 docker 构建

    我正在使用这个 Ansible 模块community docker docker image构建 docker 镜像 我想用 secret标志 因此我需要启用 BuildKit 我确实编辑了 etc docker daemon json文
  • 使用 Python 从 Javascript 中提取文本

    我一直在查看如何执行此操作的示例 但不太明白 我正在使用 beautifulsoup 来抓取一些数据 我可以使用它来查找我想要的数据 但它包含在以下代码块中 我正在尝试从中提取时间戳信息 我有一种感觉正则表达式在这里工作 但我似乎无法弄清楚