org.dom4j.InvalidXPathException: Invalid XPath expression: '/html'. Caused by: org/dom4j/Element
这是什么原因?
这样写xpath("/html")没有错吧。
======================
解决办法,去掉/jre/lib/ext/目录下的jaxen.jar包,把该jar包放在classpath目录下。[之所以把这个包放在这个目录下,原因是看到源码中的INSTALL文档如下描述的]
INSTALL 写道
To install Jaxen, you need to place:
jaxen-1.1.3.jar
In your CLASSPATH or your jre/lib/ext directory.
This includes support for all object-models.
Of course, you'll also need the supporting jars for your
object-model, such as jdom.jar, xom.jar, or similar.
bob@werken.com
maven的pom.xml之间去掉对dom4j依赖,添加对jaxen的依赖,避免dom4j的重复?。
至此,该问题解决了。知道具体原因后在完善。
=================================
在用xpath解析由html转化的xml时,为什么正确的xpath表达式却得不到匹配的值?
需要注意的是名字空间,参看下面这篇文章,有两种办法。
关于dom4j无法解析xmlns问题及生成非UTF-8字符集乱码问题的解决
http://blog.csdn.net/shadowkiss/archive/2009/06/15/4269816.aspx
留下问题:为什么名字空间会影响到xpath规则?
分享到:
相关推荐
主要给大家详细介绍了关于python使用xpath中遇到:的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧。
回归正题,大家晕头转脑的看完繁杂的语法之后,已经迫不及待写点什么东西了,然后部分同学可能遇到了这个 或者类似 Element a at 0x???????,这样的一个值,然后大家带着问题去搜,然后全是英文啊,什么一大堆...
java爬取网页用到的一些jar 具体的使用方法 看链接
基于Jsoup的XPath选择器。 开始使用: @Test public void testSelect() { String html = " <html><div><a href='https://github.com'>github.com</a></div> " + " <table><tr><td>a</td><td>b</td></tr>...
个人觉得这个工具比任何自动化测试框架都好使,使用关键字和数据双驱动,不需要写一行代码,无需维护脚本,只需要维护用例数据。Web元素只需要在Chrome中复制...使用遇到问题,可以在网站上面发帖,我会第一时间回复
个人觉得这个工具比任何自动化测试框架都好使,使用关键字和数据双驱动,不需要写一行代码,无需维护脚本,只需要维护用例数据。Web元素只需要在Chrome中复制...使用遇到问题,可以在网站上面发帖,我会第一时间回复。
selenium+firefox在定位时遇到selenium.common.exceptions.NoSuchElementException: Message: Unable to locate element: 由于是js加载页面,想确认是否是js的原因,随后进行多次调试时发现“//div”竟然也出现了...
而昨晚在使用 XPATH 的时候, 遇到一个问题, 改了一个晚上才搞定, 差点没吐血. 果然基础知识要掌握扎实啊!! 假设有以下一份 XML 文档: 我们要获取所有歌曲的标题, 一般是使用以下的 XPATH 表达式: 代码如下: /...
驱动+Xpath+隐式等待+层级定位+frame嵌套+弹出框+下拉框+联想输入下拉框+AutoIT
* 使用新节点替换原来的旧节点。 * * @param oldNode * 要被替换的旧节点。 * @param newNode * * 替换后的新节点。 * @exception DOMException * 如果此节点为不允许 * newNode节点类型的子...
通过学习爬虫,你最后不一定选择爬虫工程师这个岗位,但是在学习爬虫的过程中,你将会接触到的各种工具,方法,服务组件,都会在你以后的生活和工作中帮到你,让你知道,在遇到一个问题的时候,解决方法在哪个地方。
在开发过程中,很有可能会遇到这样的情况,服务端返回的是html的内容,但需要在客户端显示纯文本内容,这时候就需要解析这些html,拿到里面的纯文本。达到这样的目的可以有很多途径,比如自己写正则表达式,但对于...
c++中值得注意的资源文件的路径写法问题,你有可能会遇到的
我们做自动化测试可能遇到的问题:1.大量使用name、id、xpath等页面元素。无论是功能修改、UI重构还是交互性改进都会影响到这些元素,这使得Selenium测试变得非常脆弱。 我们做自动化测试可能遇到的问题: 1....
什么是 XML ? XML 指可扩展标记语言(eXtensible ... SAX解析器是基于事件处理的,需要从头到尾把XML文档扫描一遍,在扫描的过程中,每次遇到一个语法结构时,就会调用这个特定语法结构的事件处理程序,向应用程序发送
遇到的问题----------------------------------------- 获取的网页中的表格数据隐藏,尝试requests无法获取。判断可能是动态加载的网页 尝试----------------------------------------- 1. 通过XHR,js查找隐藏数据...
而且通常情况下,可以借助XPath,直接查询XML节点。 SAX解析XML,是基于事件通知的模式,一边读取XML文档一边处理,不必等整个文档加载完之后才采取操作,当在读取解析过程中遇到需要处理的对象,会发出通知对其进行...
HtmlAgilityPack 是 .NET 下的一个 HTML 解析类库。支持用 XPath 来解析 HTML 。 命名空间: HtmlAgilityPack
分享给大家供大家参考,具体如下...这里使用了xpath,在写代码的过程中遇到两个问题: 1、xml的史路径属性为D:\xx\…时load不了文件,改为”/”(linux下的分隔符)就可以了 2、获取一个节点的属性,使用::attributes,编