您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

Jsoup的简易使用示例

2025/1/13 20:51:23发布21次查看
测试用网页
<!doctype html><!-- http://jwc.yangtzeu.edu.cn/ --><html class="outlin colo"><head>     <meta charset="utf-8">     <title>长江大学</title>     <link type="text/css" rel="stylesheet" href="./css/reset.css">     <link type="text/css" rel="stylesheet" href="./css/layout.css">     <link type="text/css" rel="stylesheet" href="./css/yangtze.css">     <script src="base.js"></script>     <script src="./js/nodeobject.js"></script>     <script src="./js/yangtze.js"></script></head><body>     <p id="content">         <!-- 顶部图片p -->         <p id="header-imagep"></p>         <!-- 顶部菜单p -->         <p id="header-menup">             <p id="header-menu-table">                 <p class="header-menu-cell"><a href="#" title="首页">首页</a></p>                 <p class="header-menu-cell"><a href="#" title="机构设置">机构设置</a></p>                 <p class="header-menu-cell"><a href="#" title="规章制度">规章制度</a></p>                 <p class="header-menu-cell"><a href="#" title="教学建设">教学建设</a></p>                 <p class="header-menu-cell"><a href="#" title="教务管理">教务管理</a></p>                 <p class="header-menu-cell"><a href="#" title="考务管理">考务管理</a></p>                 <p class="header-menu-cell"><a href="#" title="实践创新">实践创新</a></p>                 <p class="header-menu-cell"><a href="#" title="质量评估">质量评估</a></p>                 <p class="header-menu-cell"><a href="#" title="学务管理">学务管理</a></p>                 <p class="header-menu-cell"><a href="#" title="服务指南">服务指南</a></p>                 <p class="header-menu-cell"><a href="#" title="下载中心">下载中心</a></p>             </p>         </p>         <p class="space"></p>         <!-- 顶部时间p -->         <p id="header-datep"></p>         <p class="space"></p>         <!-- 中间的tablep -->         <p id="table">             <!-- 左侧table-cell -->             <p id="table-left">                 <p id="table-left-imagep"></p>                 <p class="space"></p>                 <h2 class="h2-style">高教信息<a href="#">+more</a></h2>                 <ul class="ul-type-1">                     <li style="color : red;"><img src="./images/li_bg.jpg"> <a href="#">教育部高等教育司2016年工作要点</a></li>                     <li><img src="./images/li_bg.jpg"> <a href="#">湖北省教育厅高等教育处2016年工作要点</a></li>                     <li><img src="./images/li_bg.jpg"> <a href="#">湖北省教育厅高等教育处2015年工作要点</a></li>                     <li><img src="./images/li_bg.jpg"> <a href="#">省委高校工委 省教育厅关于印发201</a></li>                     <li><img src="./images/li_bg.jpg"> <a href="#">教育部2015年工作要点</a></li>                     <li><img src="./images/li_bg.jpg"> <a href="#">近两年就业率较低的本科专业名单</a></li>                 </ul>                 <p class="space"></p>                 <h2 class="h2-style">友情链接</h2>                 <p id="select-type"></p>             </p>             <p class="space"></p>             <!-- 中间table-cell -->             <p id="table-center">                 <p id="table-center-toplinep"><span id="notice" onmouseover="switchtab(this)">教务通知</span><span id="thisweek" onmouseover="switchtab(this)">本周事务</span></p>                 <ul id="notice-ul">                     <li>关于组织2017年(第十二届)长江大学大学生化学实验<span>2017-03-30</span></li>                     <li>关于核查文科相关学院2013级毕业班学生成绩的通知<span>2017-03-30</span></li>                     <li>关于组织申报第二批校级双语教学示范课程的通知<span>2017-03-30</span></li>                     <li>查看更多...</li>                 </ul>                 <ul id="thisweek-ul">                     <li>2016~2017学年第二学期6~7月份主要教学工作安排<span>2017-03-30</span></li>                     <li>2016~2017学年第二学期5月份主要教学工作安排<span>2017-03-30</span></li>                     <li>2016~2017学年第二学期4月份主要教学工作安排<span>2017-03-30</span></li>                     <li>2016~2017学年第二学期3月份主要教学工作安排<span>2017-03-30</span></li>                     <li>查看更多...</li>                 </ul>                 <p class="choosetab"><span>教务通知</span><span>本周事务</span></p>             </p>             <!-- 右侧table-cell -->             <p id="table-right">             </p>         </p>         <p class="space"></p>         <!-- 底部的menup -->         <p id="bottom-menup"></p>         <p class="space"></p>     </p>     <!-- 最底部的p -->     <p id="footer"></p>     <script>         setup();         switchtab(elementbyid(notice));         addeventss();    </script></body></html>
java代码
import java.io.file;import java.util.arraylist;import org.jsoup.jsoup;import org.jsoup.nodes.document;import org.jsoup.nodes.element;import org.jsoup.select.elements;public class app {    public static void main(string args[]) {        try {             file input = new file(/users/youxianming/documents/project/html project/yangtze/yangtze.html);             document doc = jsoup.parse(input, utf-8, http://yangtze.com/);            // 根据元素id获取元素            {                 element content = doc.getelementbyid(content);                 system.out.println(content);             }            // 根据css的class名获取元素数组            {                 arraylist<element> list = doc.getelementsbyclass(space);                for (element element : list) {                     system.out.println(element + \n);                 }             }            // 根据标签获取元素数组            {                 arraylist<element> list = doc.getelementsbytag(p);                for (element element : list) {                     system.out.println(element + \n);                 }             }            // 根据元素中含有的属性值获取元素数组            {                 arraylist<element> list = doc.getelementsbyattribute(href);                for (element element : list) {                     system.out.println(element + \n);                 }             }            // 根据元素中含有的属性值获取元素数组            {                 element content = doc.getelementbyid(header-menu-table);                // 元素的父元素                system.out.println(content.parent());                // 元素的所有子元素                system.out.println(content.children());                // 与该元素平级的第一个兄弟元素                 system.out.println(content.child(0).firstelementsibling());                // 与该元素平级的最后一个兄弟元素                 system.out.println(content.child(0).lastelementsibling());                // 该元素的前一个兄弟元素                 system.out.println(content.child(1).previouselementsibling());                // 该元素的下一个兄弟元素                 system.out.println(content.child(0).nextelementsibling());             }            // 一个元素中的数据            {                 element content = doc.getelementsbyclass(ul-type-1).first().child(0);                // 获取文本内容                system.out.println(content.text());                // 获取tag名字                system.out.println(content.tagname());                // 获取tag对象                system.out.println(content.tag());                // 获取属性字典                system.out.println(content.attributes());                // 获取当前内容当中的html内容                system.out.println(content.html());                // 获取外部的html内容                system.out.println(content.outerhtml());                // 获取属性style的值                 system.out.println(content.attr(style));             }            // 使用选择器语法来查找元素            {                 elements elements = null;                // 通过标签查找元素                 elements = doc.select(a);                 system.out.println(elements);                // 通过id查找元素                 elements = doc.select(#content);                 system.out.println(elements);                // 通过class查找元素                 elements = doc.select(.ul-type-1);                 system.out.println(elements);                // 通过属性查找元素                 elements = doc.select([href]);                 system.out.println(elements);                // 通过属性前缀查找元素                 elements = doc.select([^hr]);                 system.out.println(elements);                // 通过属性值来查找元素                 elements = doc.select([id=notice]);                 system.out.println(elements);                // 匹配属性值开头                 elements = doc.select([onmouseover^=swit]);                 system.out.println(elements);                                 // 匹配属性值结尾                 elements = doc.select([onmouseover$=(this)]);                 system.out.println(elements);                                 // 匹配包含了属性值                 elements = doc.select([onmouseover*=tab]);                 system.out.println(elements);                                 // 正则表达式匹配                 elements = doc.select(ul[id~=^notice]);                 system.out.println(elements);             }         } catch (exception e) {             system.out.println(e);         }     } }
注意
以下地方请自行替换,本人是从本地加载的html
以下是获取元素的几种情形
以上就是jsoup的简易使用示例 的详细内容。
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product