我正在使用 Rselenium 导航到网页。下面的代码就是这么做的。我没有提供网址,因为我在一家需要 VPN 连接的公司中使用该网址:
RSelenium::startServer()
require(RSelenium)
remDr <- remoteDriver()
remDr$navigate("some url")
导航到网页后,在 html 源代码中我有下表:
<font size="2">
<table border="1">
<tbody>
<tr>
<td> item1 </td>
<td> 0 </td>
<td> 0.05 </td>
<td> 2.43 </td>
<td align="center"> Pct </td>
<td align="center"> 1 </td>
</tr>
</tbody>
</table>
现在的问题是如何取出这个表的内容呢?请假设该 url 不存在,否则我可以使用 XML 函数:readHTMLTable(remDr$getCurrentUrl())。但由于某种原因这不起作用。我只需要使用远程驱动程序句柄(remDr)。
非常感谢您抽出时间
就像是:
library(XML)
doc <- htmlParse(remDr$getPageSource()[[1]])
readHTMLTable(doc)
应该允许您访问 html 并处理其中包含的表格。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)