XPATH 查询、HtmlAgilityPack 和提取文本

2024-05-21

我一直在尝试从名为“tim_new”的类中提取链接。我也得到了解决方案。

给出了解决方案、片段和必要的信息here https://stackoverflow.com/questions/2982862/extracting-a-table-row-with-a-particular-attribute-using-htmlagility-pack

上述 XPATH 查询是"//a[@class='tim_new']，我的问题是，这个查询如何区分代码片段的第一行（在上面的链接中给出）和代码片段的第二行。

更具体地说，这个 XPATH 查询的直译（英文）是什么。

此外，我想编写几行代码来提取针对的文本NSE:

<div class="FL gL_12 PL10 PT15">BSE: 523395 &nbsp;&nbsp;|&nbsp;&nbsp; NSE: 3MINDIA &nbsp;&nbsp;|&nbsp;&nbsp; ISIN: INE470A01017</div>

希望能帮助您形成必要的选择查询。

我的代码写成：

IEnumerable<string> NSECODE = doc.DocumentNode.SelectSingleNode("//div[@NSE:]");

但这看起来不对。希望得到一些帮助。

第一个选择中的 XPath 为“选择所有具有名为 class 且值为 tim_new 的属性的文档元素”。括号中的内容不是您要返回的内容，而是您应用于搜索的条件。

我没有 HTML Agility 包，但如果您尝试查询以“NSE:”作为文本的 div，第二个查询的 XPath 应该是“//div”，那么您需要过滤使用 LINQ。

就像是

var nodes = 
    doc.DocumentNode.SelectNodes("//div[text()]").Where(a => a.InnerText.IndexOf("NSE:") > -1);

因此，用英语来说，“将所有立即包含文本的 div 元素返回到 LINQ，然后检查内部文本值是否包含 NSE:”。再说一次，我不确定语法是否完美，但这就是想法。

XPath“//div[@NSE:]”将返回所有具有名为 NSE: 的属性的 div，无论如何，这都是非法的，因为属性名称中不允许使用“:”。您正在寻找元素的文本，而不是其属性之一。

希望有帮助。

注意：如果您的嵌套 div 都包含文本，如下所示<div>NSE: some text<div>NSE: more text</div></div>你会得到重复的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

html

xpath

htmlagilitypack

XPATH 查询、HtmlAgilityPack 和提取文本的相关文章

F10键没被抓住

I have a Windows Form and there overriden ProcessCmdKey However this works with all of the F Keys except for F10 I am tr
使用 openssl 检查服务器安全协议

我有一个框架应用程序它根据使用方式连接到不同的服务器对于 https 连接使用 openssl 我的问题是我需要知道我连接的服务器是否使用 SSL 还是 TLS 以便我可以创建正确的 SSL 上下文目前如果我使用错误的上下文尝试
线程安全的 C++ 堆栈

我是 C 新手正在编写一个多线程应用程序不同的编写者将对象推入堆栈读者将它们从堆栈中拉出或至少将指针推入对象 C 中是否有任何内置结构可以在不添加锁定代码等的情况下处理此问题如果没有那么 Boost 库呢 EDIT 你好感谢您
如何检查元素的内容是否为空，如果是，则在 jquery 中删除该元素

我目前正在尝试选择某个 div 内没有内容的任何 h2 元素并将其删除这是我的 html 代码 div class skipToContainer h2 class vidSkipTo Hello h2 h2 class vidSkipT
如何在 C# 中使用 XmlDsigC14NTransform 类

我正在尝试使用规范化 xml 节点System Security Cryptography Xml XMLDsigC14nTransformC net Framework 2 0 的类该实例需要三种不同的输入类型 NodeList Str
更改其他页面的主窗口内容

在 WPF 应用程序的主窗口中我有一个 Badged 元素来自材料设计这是我的代码
从包含大量文件的目录中检索文件

我的目录包含近 14 000 000 个 wav 格式的音频样本所有普通存储没有子目录我想循环浏览文件但是当我使用DirectoryInfo GetFiles 在该文件夹上整个应用程序冻结了几分钟可以用另一种方式完成吗也许读取
为什么WCF中不允许方法重载？

假设这是一个ServiceContract ServiceContract public interface MyService OperationContract int Sum int x int y OperationContract
HTML 和 JavaScript - 将滚动操作从一个元素传递到另一个元素

假设我有两个 div div div div A scrollable list div 我想让它当光标停在里面时 control并且鼠标滚轮滚动 view将会滚动无论如何要实现这一目标好的快速修复对我有用即使固定 div 不可滚动
iOS Safari Mobile 禁用上一个和下一个选择输入

上周五我发现了关于此问题的类似问题但似乎无法再次找到它如果有人能指出我正确的方向那就太好了本质上我在一个页面上有多个选择菜单第一个在加载时填充第二个在第一个选择时填充够简单的但是在 iOS 设备中当您点击选择元素时它会
在 .NET 中记录 StackOverflowException

最近我的 NET 应用程序 asp net 网站中出现了堆栈溢出异常我之所以知道该异常是因为它出现在我的 EventLog 中我知道 StackOverflow 异常无法被捕获或处理但是有没有办法在它杀死您的应用程序之前记录它我
数字和小数的输入掩码

在测试我的程序后我发现了以下错误我在 sqlserver 中的表包含价格数字 6 2 我的程序的用户输入价格 555 00 就很好了但是当他输入 555555 时这是错误的所以我需要指定掩码其中尾数是可选的 0 到 999 小
随机定位的 div，不重叠

所有 div 都像我需要的那样随机放置但它们偶尔会重叠这只是一个机会问题我怎样才能防止这种情况发生理想情况下我能够设置它们之间的最小距离我可以通过进一步开发当前的 javascript 来实现这一目标吗我需要考虑完全不同的方
跨浏览器：禁用输入字段的不同行为（文本可以/不能复制）

我有一个被禁用的输入 html 字段在某些浏览器 Chrome Edge Internet Explorer 和 Opera 中可以选择并复制文本但至少在 Firefox 中这是不可能的您可以通过在不同浏览器中执行以下代码来测试
在 SQL Server 上执行分页的最佳方式是什么？

我有一个数据库超过200万记录我需要执行分页以在我的 Web 应用程序上显示该应用程序每页必须有 10 条记录DataGrid 我已经尝试使用ROW NUMBER 但是这种方式会选择所有 200 万条记录然后只得到 10 条记录我也
将一个 long 转换为两个 int 以进行重构

我需要将一个参数作为两个 int 参数传递给 Telerik Report 因为它不能接受长参数将 long 拆分为两个 int 并在不丢失数据的情况下重建它的最简单方法是什么使用掩蔽和移位是最好的选择根据文档 long 保证为 64
使用 JavaScript onclick 添加表格行

我正在尝试使用 javascript 添加下面找到的完全相同的元素我已经尝试了这里找到的所有解决方案我什至尝试用php echo但没有运气无需更改任何输入名称或类似内容只需单击该按钮即可向表中添加另一行仅此而已这是该元素 tr
jquery：选择xpath或将xpath转换为css？

我需要基于 xpath 选择或者将 xpath 转换为 css 有插件或者内置功能吗 ex html body div a 4 each 并非所有 xpath 表达式都可以转换为类似 CSS 的选择器或者不能有效地工作您可以使用 eq
创建带有部分的选项卡式侧边栏 WPF

我正在尝试创建一个带有部分的选项卡式侧边栏如 WPF 中的以下内容我考虑过几种方法但是有没有更简单更优雅的方法呢方法一列表框 Using a ListBox并将 SelectedItem 绑定到右侧内容控件所绑定的值为了区分标
使用 JQuery 预填充选择字段的下拉选项验证

我有这个 JQuery 片段来防止选择已在另一个字段中选择的下拉选项 var coll select name service on change function coll each function var val this value

随机推荐

每次 UIScrollView 释放时都会发生内存泄漏

在我的应用程序中我有一个滚动视图和四个表格视图每次拖动然后释放时我都会泄漏 48 字节这确实很重要正如您所看到的两组泄漏都有相同的来源有人见过这样的泄漏吗 Edit 1 当我单击泄漏旁边的箭头时我会得到泄漏的以下信息您所看
查找其索引的乘积可被另一个数字 X 整除的对的数量

给定一个数组和某个值 X 找到满足以下条件的对的数量 i lt j a i a j and i j X 0 Array size lt 10 5 我想这个问题有一段时间了但只能想出蛮力解决方案通过检查所有对这显然会超时 O N 2 t
使用 Objective C 将 RGB 彩色图像更改为灰度图像

我正在开发一个将彩色图像更改为灰度图像的应用程序然而有些图片显示出来是错误的我不知道代码有什么问题也许我输入的参数有误请帮忙 UIImage c UIImage imageNamed downRed png CGImageRef
如何检查主音量是否静音

如何在 Windows 7 操作系统中检查主音量是否静音我有静音或取消静音的代码 IE Public Const APPCOMMAND VOLUME MUTE As Integer H80000 Public Const APPCOMMAN
rake cucumber 和 rake spec 始终使用“开发”环境

我运行 Cucumber 和 RSpec 测试的 rake 任务始终使用我的development环境以下是相关的配置文件 RAILS ROOT config environments cucumber rb Edit at your o
C free() 是如何工作的？ [复制]

这个问题在这里已经有答案了可能的重复 malloc 和 free 如何工作 https stackoverflow com questions 1119134 how malloc and free work include
寻求有关共享内存锁定问题的文章

我正在审查一些代码并对所使用的技术感到怀疑在Linux环境中有两个进程附加多个共享内存段第一个进程定期加载新的集合要共享的文件并将共享内存ID shmid 写入主共享内存段中的一个位置第二道工序不断读取这个主位置并使
如何将 Spark DataFrame 以 csv 格式保存在磁盘上？

例如这样的结果 df filter project en select title count groupBy title sum 将返回一个数组如何将 Spark DataFrame 作为 csv 文件保存在磁盘上 Apache Sp
客户端应用程序立即对数据库中的更新做出反应的最佳方式是什么？

对数据库中的数据更新做出立即反应的最佳方法是什么我能立即想到的最简单的方法是一个线程它检查数据库中某些数据的特定更改并持续等待在某个预定义的时间长度内再次检查它这个解决方案对我来说似乎是浪费和次优的所以我想知道是否有更好的方法我
如何在 VSTS 中的托管代理上运行或安装工具

我想在 VSTS 上以管理员身份运行 cmd 实际上我正在尝试在 VSTS 托管代理上安装带有 Chocolatey 工具管理器的 git tfs 因此我在 VSTS 命令行任务上运行以下命令 SystemRoot System32 Wi
如何使用 zio-test 测试异常情况

我有以下功能我想测试 def people id Int RIO R People 如果有 People 则此函数返回 Peopleid 分别如果没有则失败例如 IO fail ServiceException s No People
postgresql中的按日期聚合函数分组

我在运行此查询时遇到错误 SELECT date updated at count updated at as total count FROM persons WHERE persons updated at BETWEEN 2012 1
如何在 d3 js 中突出显示从根到选定节点的路径？

我使用 d3 js 创建了一棵树现在我创建了一个下拉菜单其中包含树中所有节点的列表现在从下拉菜单中选择一个节点时我想突出显示从根到该特定节点的路径这个怎么做首先创建一个 flatten 函数它将分层数据变成一个 n 数组 f
emacs 去掉 shell 中的所有 ansi 颜色代码

我在 OS X 上使用 emacs 24 但遇到了一个奇怪的问题我看不到任何颜色代码 Emacs 似乎只是忽略它们我的动机是查看 C 项目的 cmake llvm 和 googletest 框架的彩色输出我想在编译模式下查看颜色但是
创建 Cookie 时需要帮助

我有一个名为yes和另一个名叫no
搜索多个字段

我想我没有正确理解 django haystack 我有一个包含多个字段的数据模型我希望搜索其中两个字段 class UserProfile models Model user models ForeignKey User unique
外部实体更改后索引不更新

我目前正在开发一个项目使用 JPA 2 1 保存数据并使用 hibernate search 4 5 0 final 搜索实体映射类和索引后搜索工作正常但是当我更改值时描述B 类从 someStr 到 anotherStr 数据库
重定向到 /admin/login/ 结果为 302

当用户未经身份验证时我尝试重定向到登录页面在我的settings py我的课程有 MIDDLEWARE CLASSES path to AuthRequiredMiddleware 这是我的课程 class AuthRequiredMi
改进迭代文本解析的 clojure lazy-seq 使用

我正在编写一个 Clojure 实现这次编码挑战 http biostar stackexchange com questions 1759 code golf mean length of fasta sequences 尝试找出 Fas
XPATH 查询、HtmlAgilityPack 和提取文本

我一直在尝试从名为 tim new 的类中提取链接我也得到了解决方案给出了解决方案片段和必要的信息here https stackoverflow com questions 2982862 extracting a table ro

XPATH 查询、HtmlAgilityPack 和提取文本

XPATH 查询、HtmlAgilityPack 和提取文本 的相关文章

随机推荐

热门标签

XPATH 查询、HtmlAgilityPack 和提取文本的相关文章