1、导包
官网地址:https://jsoup.org/ 这里可以找到jar包的下载链接;
2、简要说明
- 按照官网的介绍,
jsoup
是一个用于解析HTML的Java库,XML相对于HTML来讲更为严格肯定也是没有问题的; jsoup
以文件、字节流或URL等各种方式将HTML/XML文件转换为一个Document
对象;- 这个
Document
对象和HTML中的Document对象极为类型,甚至很多方法都完全相同,可以简单地理解为DOM树的Java实现;
[……]
官网地址:https://jsoup.org/ 这里可以找到jar包的下载链接;
jsoup
是一个用于解析HTML的Java库,XML相对于HTML来讲更为严格肯定也是没有问题的;jsoup
以文件、字节流或URL等各种方式将HTML/XML文件转换为一个Document
对象;Document
对象和HTML中的Document对象极为类型,甚至很多方法都完全相同,可以简单地理解为DOM树的Java实现;student.dtd
<!-- students元素下只能包含student元素 -->
<!ELEMENT students (student*)>
<!-- student元素下必须包含name、age、sex元素 -->
<!ELEMENT student (name,age,sex)>
<!--name元素类型为字符串(元素下必须包含字符串)-->
<!ELEMENT name (#PCDATA)>
<!--name元素类型为字符串(元素下必须包含字符串)-->
<!ELEMENT age (#PCDATA)>
<!--name元素类型为字符串(元素下必须包含字符串)-->
<!ELEMENT sex (#PCDATA)>
<!--属性列表,student下包含number属性,ID类型,必需-->
<!ATTLIST student number ID #REQUIRED>
student.xml
的两个版本