`
Anddy
  • 浏览: 191466 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

xpath的使用遇到的问题

    博客分类:
  • java
阅读更多

org.dom4j.InvalidXPathException: Invalid XPath expression: '/html'. Caused by: org/dom4j/Element

这是什么原因?
这样写xpath("/html")没有错吧。

 

======================

解决办法,去掉/jre/lib/ext/目录下的jaxen.jar包,把该jar包放在classpath目录下。[之所以把这个包放在这个目录下,原因是看到源码中的INSTALL文档如下描述的]

INSTALL 写道
To install Jaxen, you need to place:

jaxen-1.1.3.jar

In your CLASSPATH or your jre/lib/ext directory.
This includes support for all object-models.
Of course, you'll also need the supporting jars for your
object-model, such as jdom.jar, xom.jar, or similar.

bob@werken.com

 

maven的pom.xml之间去掉对dom4j依赖,添加对jaxen的依赖,避免dom4j的重复?。

 

至此,该问题解决了。知道具体原因后在完善。

 

=================================

在用xpath解析由html转化的xml时,为什么正确的xpath表达式却得不到匹配的值?

 

需要注意的是名字空间,参看下面这篇文章,有两种办法。


关于dom4j无法解析xmlns问题及生成非UTF-8字符集乱码问题的解决

http://blog.csdn.net/shadowkiss/archive/2009/06/15/4269816.aspx

 

留下问题:为什么名字空间会影响到xpath规则?

 

 

分享到:
评论
1 楼 wshy33 2012-10-17  
按照这个“去掉/jre/lib/ext/目录下的jaxen.jar包,把该jar包放在classpath目录下”试了,确实可以。

相关推荐

    python使用xpath中遇到:<Element a at 0x39a9a80>到底是什么?

    主要给大家详细介绍了关于python使用xpath中遇到:的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧。

    python使用xpath中遇到:Element a at 0x39a9a80到底是什么?

    回归正题,大家晕头转脑的看完繁杂的语法之后,已经迫不及待写点什么东西了,然后部分同学可能遇到了这个 或者类似 Element a at 0x???????,这样的一个值,然后大家带着问题去搜,然后全是英文啊,什么一大堆...

    java爬取网页用到的一些jar

    java爬取网页用到的一些jar 具体的使用方法 看链接

    xsoup:当jsoup遇到XPath时

    基于Jsoup的XPath选择器。 开始使用: @Test public void testSelect() { String html = " <html><div><a href='https://github.com'>github.com</a></div> " + " <table><tr><td>a</td><td>b</td></tr>...

    基于java+Selenium实现的Web和接口自动化测试工具

    个人觉得这个工具比任何自动化测试框架都好使,使用关键字和数据双驱动,不需要写一行代码,无需维护脚本,只需要维护用例数据。Web元素只需要在Chrome中复制...使用遇到问题,可以在网站上面发帖,我会第一时间回复

    自动化测试工具

    个人觉得这个工具比任何自动化测试框架都好使,使用关键字和数据双驱动,不需要写一行代码,无需维护脚本,只需要维护用例数据。Web元素只需要在Chrome中复制...使用遇到问题,可以在网站上面发帖,我会第一时间回复。

    《python3网络爬虫开发实战》学习笔记::selenium——xpath:Unable to locate element

    selenium+firefox在定位时遇到selenium.common.exceptions.NoSuchElementException: Message: Unable to locate element: 由于是js加载页面,想确认是否是js的原因,随后进行多次调试时发现“//div”竟然也出现了...

    操作XML文档遇到的XMLNS问题及解决方法 (C# 和 PHP)

    而昨晚在使用 XPATH 的时候, 遇到一个问题, 改了一个晚上才搞定, 差点没吐血. 果然基础知识要掌握扎实啊!! 假设有以下一份 XML 文档: 我们要获取所有歌曲的标题, 一般是使用以下的 XPATH 表达式: 代码如下: /...

    UI自动化工作中容易出问题的点

    驱动+Xpath+隐式等待+层级定位+frame嵌套+弹出框+下拉框+联想输入下拉框+AutoIT

    android xml文件操作

    * 使用新节点替换原来的旧节点。 * * @param oldNode * 要被替换的旧节点。 * @param newNode * * 替换后的新节点。 * @exception DOMException * 如果此节点为不允许 * newNode节点类型的子...

    Python教学-爬虫开发之从入门到实战

    通过学习爬虫,你最后不一定选择爬虫工程师这个岗位,但是在学习爬虫的过程中,你将会接触到的各种工具,方法,服务组件,都会在你以后的生活和工作中帮到你,让你知道,在遇到一个问题的时候,解决方法在哪个地方。

    HtmlAgilityPack.1.4.0

    在开发过程中,很有可能会遇到这样的情况,服务端返回的是html的内容,但需要在客户端显示纯文本内容,这时候就需要解析这些html,拿到里面的纯文本。达到这样的目的可以有很多途径,比如自己写正则表达式,但对于...

    c++路径写法

    c++中值得注意的资源文件的路径写法问题,你有可能会遇到的

    如何让oracle的自动化测试脚本跑得更快

    我们做自动化测试可能遇到的问题:1.大量使用name、id、xpath等页面元素。无论是功能修改、UI重构还是交互性改进都会影响到这些元素,这使得Selenium测试变得非常脆弱。  我们做自动化测试可能遇到的问题:  1....

    在Ruby中处理XML和XSLT以及XPath的简单教程

    什么是 XML ? XML 指可扩展标记语言(eXtensible ... SAX解析器是基于事件处理的,需要从头到尾把XML文档扫描一遍,在扫描的过程中,每次遇到一个语法结构时,就会调用这个特定语法结构的事件处理程序,向应用程序发送

    爬取全国空气质量监测网代码.py

    遇到的问题----------------------------------------- 获取的网页中的表格数据隐藏,尝试requests无法获取。判断可能是动态加载的网页 尝试----------------------------------------- 1. 通过XHR,js查找隐藏数据...

    xml解析新浪新闻_客户端

    而且通常情况下,可以借助XPath,直接查询XML节点。 SAX解析XML,是基于事件通知的模式,一边读取XML文档一边处理,不必等整个文档加载完之后才采取操作,当在读取解析过程中遇到需要处理的对象,会发出通知对其进行...

    Html Agility Pack网页解析爬虫功能工具

    HtmlAgilityPack 是 .NET 下的一个 HTML 解析类库。支持用 XPath 来解析 HTML 。 命名空间: HtmlAgilityPack

    php实现解析xml并生成sql语句的方法

    分享给大家供大家参考,具体如下...这里使用了xpath,在写代码的过程中遇到两个问题: 1、xml的史路径属性为D:\xx\…时load不了文件,改为”/”(linux下的分隔符)就可以了 2、获取一个节点的属性,使用::attributes,编

Global site tag (gtag.js) - Google Analytics