![网络数据采集技术:Java网络爬虫实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/251/33831251/b_33831251.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.4 条件判断与循环
条件判断语句是Java程序中最常见的选择控制结构,共分为三种形式:if、if-else和if-else if-else语句。程序2-1为这三种语句的语法格式。
程序2-1
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_26_01.jpg?sign=1739277142-xs0oaDPnNfUjkYtF77IWVkZB0Zj7GJfY-0-abdf287f5ef774be6c3e93ee8d096a62)
例如,在网络爬虫中,经常使用if-else语句判断网页是否请求成功,如程序2-2所示。
程序2-2
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_26_02.jpg?sign=1739277142-HkF1Hc51M91XNVwP6h6j81WtCYyS61x6-0-ceecde5c7233c8686b467347ed4a0c85)
循环语句是Java程序中重要的结构,其功能是反复执行某段程序。Java中共有三种语句实现循环操作,即while,do-while和for循环语句。程序2-3为这三种语句的语法格式。
程序2-3
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_01.jpg?sign=1739277142-zTv0mldGFMF0KC0JJO25MQJQPCAW0nuD-0-037c68b33a5a578f36086b2f9dfbebdd)
如在网络爬虫中,使用while循环URL队列,反复执行URL请求以及解析任务,直到队列为空,即所有URL采集完成。程序2-4为执行的流程。
程序2-4
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_02.jpg?sign=1739277142-bYNxuBaSfpJpKrIZrSO8ZZId0vvZYcZe-0-0f2ef543e6b6fca30f79322073e290c2)
另外,如果采集的页面包含多页,可以通过for循环的方式,拼接每页URL,并将这些URL添加到队列中,如程序2-5所示。
程序2-5
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_03.jpg?sign=1739277142-UWDxAsEw1TADTeCW2YWfx89C77mMaGhO-0-91d491e71a96b4c97263b08d5c285b62)
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_28_01.jpg?sign=1739277142-8vXCfXhIYoIMU6dNo1Nv5dc9Z7p5t4Xm-0-1fbbae19dbd4d1e441f1b5bbae7b47bf)