rvest 函数 html_nodes 返回 {xml_nodeset (0)}

2024-05-20

我正在尝试抓取以下网站的数据框

http://stats.nba.com/game/0041700404/playbyplay/ http://stats.nba.com/game/0041700404/playbyplay/

我想创建一个表格，其中包含比赛日期、整场比赛的得分以及球队名称

我正在使用以下代码：

game1 <- read_html("http://stats.nba.com/game/0041700404/playbyplay/")

#Extracts the Date
html_nodes(game1, xpath = '//*[contains(concat( " ", @class, " " ), concat( " ", "game-summary-team--vtm", " " ))]//*[contains(concat( " ", @class, " " ), concat( " ", "game-summary-team__lineup", " " ))]')

#Extracts the Score
html_nodes(game1, xpath = '//*[contains(concat( " ", @class, " " ), concat( " ", "status", " " ))]//*[contains(concat( " ", @class, " " ), concat( " ", "score", " " ))]')

#Extracts the Team names
html_nodes(game1, xpath = '//*[contains(concat( " ", @class, " " ), concat( " ", "game-summary-team__name", " " ))]//a')

不幸的是，我得到以下信息

{xml_nodeset (0)}
{xml_nodeset (0)}
{xml_nodeset (0)}

我看过很多关于这个问题的问题和答案，但似乎没有一个有帮助。

不幸的是，rvest 不能很好地处理动态创建的 JavaScript 页面。它最适合静态 HTML 网页。

我建议看一下硒 https://github.com/ropensci/RSelenium。最后，我使用以下方法从页面中得到了一些东西rsDriver https://ropensci.github.io/RSelenium/reference/rsDriver.html

代码示例：

library(RSelenium)
rD <- rsDriver() # runs a chrome browser, wait for necessary files to download
remDr <- rD$client
#no need for remDr$open() browser should already be open
remDr$navigate("http://stats.nba.com/game/0041700404/playbyplay/")

teams <- remDr$findElement(using = "xpath", "//span[@class='team-full']")
teams$getElementText()[[1]]
# and so on...

remDr$close()
# stop the selenium server
rD[["server"]]$stop() 
# if user forgets to stop server it will be garbage collected.
rD <- rsDriver()
rm(rD)
gc(rD)

等等...

PS：我在使用当前 R 的 Windows 上安装它时遇到了一些麻烦 * 这worked https://stackoverflow.com/a/50500592/8291949 * 如何为 R 设置 rselenium？ https://stackoverflow.com/questions/42468831/how-to-set-up-rselenium-for-r

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

xpath

webscraping

cssselectors

rvest

rvest 函数 html_nodes 返回 {xml_nodeset (0)} 的相关文章

如何提取与 R 中主题 ID 列表匹配的行？

我有一个包含许多主题 ID 的数据框每个主题都有重复观察我还有一个单独的数据框其中只有一个主题 ID 列表我想从更大的数据框中匹配和提取如何以允许我引用不同数据帧中的SubjectID列表的方式编写代码不确定我是否完全理解这个问
Jsoup - 获取仅包含指定属性及其值的 HTML 标记

我想用jsoup从页面中提取具有以下内容的元素only一些特定的属性和值我已经经历过以下提到的方法但没有一个很好地解决了我的目的 Jsoup s getElementsByAttributesMatching 选择查询的这种格式 doc
如何对同一列上的数据帧列表中的所有数据帧进行排序？

我有一个数据框列表dataframes list 举个例子我把dput dataframes list 在底部我想对列列表中的所有数据框进行排序enrichment 我可以对一个数据框进行排序 first dataframe lt da
无法在我的抓取工具中设置超时选项以防止无限循环

我已经使用 IE 在 vba 中编写了一个脚本在其搜索框中的网页中启动搜索通过点击搜索按钮根据搜索填充结果网页加载它是searchbox几秒钟后它就会打开但是我的下面的脚本可以处理这个障碍并以正确的方式执行搜索现在我有一个稍微
将年月格式转换为 POSIXct [重复]

这个问题在这里已经有答案了我有一些年月形式的数据我想将其格式化以用于绘图ggplot date lt c 2016 03 2016 04 2016 05 2016 06 2016 07 2016 08 2016 09 2016 10 2
如何在for循环中引用变量？

我正在循环访问不同的 data tables 和 data table 中的变量但我在引用内部变量时遇到问题for loop dt1 lt data table a1 c 1 2 3 a2 c 4 5 2 dt2 lt data tabl
如何用Python抓取动态网页

我正在努力做什么抓取下面的网页以获取二手车数据 Issue 刮掉整个页面在上面的 url 中仅显示前 30 项这些可以通过我在下面编写的代码来抓取其他页面的链接显示为 1 2 3 但链接地址似乎是用 Javascript 编写的
删除ggplot2中的负图区域[重复]

这个问题在这里已经有答案了如何删除 ggplot2 中 x 轴和 y 轴下方的绘图区域请参见下面的示例我尝试了几个主题元素 panel border panel margin plot margin 但没有任何运气 p lt ggpl
如何从 Fortran 调用 R 函数？

根据http gallery rcpp org articles r function from c http gallery rcpp org articles r function from c Rcpp 允许用户从 C 调用 R 函数
R中的一元加/减是什么？

来自 R 的详细信息部分Syntax http stat ethz ch R manual R patched library base html Syntax html帮助页面定义了以下一元和二元运算符他们被列出在优先级组中从最高
如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
使用 purrr 迭代替换数据帧列中的字符串

我想用purrr使用以下命令在数据框列上迭代运行多个字符串替换gsub 功能这是示例数据框 df lt data frame Year 2019 Text c rep a aa 5 rep a bb 3 rep a cc 2 gt df
如何使用 usmap 标记数字而不是名称？

我知道 usmap 有一个选项label in plot usmap 我想标记一些数字而不是状态名称我想 usmap 中应该有与州质心坐标相关的数据但我不知道如何找到它如果我能得到坐标然后我可以用它来标记数字geom text 这
R 中的快速 QR 分解

我有大量矩阵需要对其执行 QR 分解并存储生成的 Q 矩阵进行归一化以便 R 矩阵在其对角线上具有正数除了使用之外还有其他方法吗qr 功能这是工作示例 system time Parameters for the matrix t
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
twitterR 和 ROAuth R 软件包安装

我在安装 CRAN 上的 twitteR 和 RAOuth 软件包时遇到一些问题我尝试了几种不同的方法在 Windows 下使用源代码在 Ubuntu 下使用 RStudio 我尝试了以下命令 sudo apt get install
r 中训练和测试数据的最小最大缩放/归一化

我正在创建一个函数它将训练集和测试集作为其参数最小最大缩放标准化并返回训练集并使用这些same最小值和最小最大范围的值标准化并返回测试集到目前为止这是我想出的功能 min max scaling lt function tr
只读取选定的列

谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re

随机推荐

如何从源视图 (aspx) 中的 C# 中为按钮事件添加事件处理程序

为 HTML 源视图中的按钮创建代码隐藏 webforms 事件处理程序的最简单方法是什么在 VB NET 中切换到代码隐藏页面并使用顶部的对象和事件组合框来选择和创建非常容易在 C 中这些都缺失了我真的不喜欢设计视图确保属性
获取当前线程 id 和进程 id 作为整数？

有没有办法以整数形式获取 Rust 中的当前进程 ID 和线程 ID 我得到的最接近的是 std thread current id 它返回一个不透明的ThreadId目的当尝试访问其u64场我得到 error E0611 field
SQL-Server：备份集保存现有数据库以外的数据库的备份

我正在尝试恢复数据库的 SQL Server 备份文件但它抛出如下错误备份集保存除现有数据库之外的数据库的备份我的数据库是SQL Server 2008 备份文件是2005年的可能是什么问题我也遇到过这个问题解决方案不要创建空
无法解析类型为 xxx 的任何 bean；限定符：[@javax.enterprise.inject.Any()]

我有一个 LoginProvider 接口 public interface LoginProvider boolean login String username String password 以及两种不同的实现 public clas
iOS UIButton 带有圆角和背景 bug

我发现圆形 UIButton 存在一个奇怪的问题这是我创建此按钮的代码块 let roundedButton UIButton type System roundedButton frame CGRectMake 100 100 100
在 PHP 中比较两个对象的最快方法是什么？

假设我有一个对象在本例中为 User 对象并且我希望能够使用单独的类来跟踪更改用户对象不必以任何方式改变它的行为才能发生这种情况因此我的单独的类创建它的干净副本将其存储在本地某个位置然后可以将 User 对象与原始版本进行
将 ninject 与 Ninject.Web.Api 用于 Web Api 2 一起使用在 ASP.NET MVC 5 中不起作用

我正在开发一个 Asp NET MVC 项目我的项目也有 web api 我正在使用 ASP NET MVC5 和 Web Api 2 以及 Visual Studio 3 我正在使用 ninject 进行依赖项注入我知道 ninjec
React PropTypes 与 Flow

PropTypes 和 Flow 涵盖相似的内容但使用不同的方法 PropTypes 可以在运行时向您发出警告这有助于快速找到来自服务器等的格式错误的响应但是 Flow 似乎是未来并且具有泛型等概念是一个非常灵活的解决方案 Nuc
在 Visual Studio Code 中调试 Go 测试

在我的 Windows 计算机上我安装了 Visual Studio Code 要手动运行测试我进入控制台到项目文件夹并输入 go test main test go 它工作完美但我遇到一种情况我需要调试我的测试以了解发生了什么为
如何捕获一个 int

我正在使用 IL 抛出一个 Int32 并捕获它这只是出于好奇我并没有试图实现任何目标所以请不要告诉我抛出异常而不是 int method private hidebysig static void Main string args
div 边框上的内边距

我想在 css 边框上添加填充将其拉入 div 内远离边缘使用 css 可以吗 css3 很好 webkit 这是设计我通过将一个 div 放在一个 div 中然后给内部 div 一个边框来做到这一点我想让标记尽可能精简所以如
为什么main()后面有函数定义？

我假设最常用的系统功能之一 ls由最权威的程序员之一 Richard Stallman 编写的最著名的操作系统之一 linux 的代码可能是真正编写良好的代码的一个例子因此由于它是开源的我决定看一下代码参见例如here http m
Netty通道读取混乱

我三个月前开始使用 Netty 最初它看起来非常简单且易于使用因为我遵循了 4 x 系列主页中给出的示例当我更深入地探索它时我无法理解某些事件或回调名称例如我无法理解以下内容之间的区别 ChannelRead ChannelHa
Swift 3.0 Pin 颜色注释在 MapView 中没有改变

我有兴趣根据案例场景更改注释的图钉颜色在一个函数中我发送了一个数组用于确定引脚注释的颜色到目前为止我已经设置了一个名为 ColorPointAnnotation 的子类它将确定 pinColor 然后在 switch 语句中
如何在 Loopback 4 中使用有状态请求？

在 v3 中我们可以在底层 Express 上定义中间件例如快速会话 https github com expressjs session 添加一个session请求对象上的属性在 v4 中看起来没有对应的东西并且底层的 Expr
“同态映射类型”是什么意思？

我在一些 TypeScript PR 中看到过同态映射类型这个术语这是一个例子 https github com microsoft TypeScript pull 21919 https github com microsoft T
Apple M1 芯片上的 React Native run-android 抛出错误，“无法打开脚本的 dsl 通用类缓存”

我正在使用 React Native 构建移动应用程序我现在尝试在 Android 模拟器上运行我的应用程序首先这是继续这个问题 https stackoverflow com questions 69260732 react nat
Spark Scala Cassandra 连接器删除所有行失败，并出现 IllegalArgumentException 要求失败异常

创建表 CREATE TABLE test word groups group text word text count int PRIMARY KEY group word 插入数据 INSERT INTO test word group
StatET调试工具

我想我只是很密集但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级可视化调试提供实验性支持需要 Eclipse 3 6 或
rvest 函数 html_nodes 返回 {xml_nodeset (0)}

我正在尝试抓取以下网站的数据框 http stats nba com game 0041700404 playbyplay http stats nba com game 0041700404 playbyplay 我想创建一个表格其中包

rvest 函数 html_nodes 返回 {xml_nodeset (0)}

rvest 函数 html_nodes 返回 {xml_nodeset (0)} 的相关文章

随机推荐

热门标签