bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

jsoup怎么用

本篇內容主要講解“jsoup怎么用”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“jsoup怎么用”吧!

創新互聯建站服務項目包括茂南網站建設、茂南網站制作、茂南網頁制作以及茂南網絡營銷策劃等。多年來,我們專注于互聯網行業,利用自身積累的技術優勢、行業經驗、深度合作伙伴關系等,向廣大中小型企業、政府機構等提供互聯網行業的解決方案,茂南網站推廣取得了明顯的社會效益與經濟效益。目前,我們服務的客戶以成都為中心已經輻射到茂南省份的部分城市,未來相信會繼續擴大服務區域并繼續獲得客戶的支持與信任!

jsoup是一款Java的HTML解析器,可以從html中解析數想要的數據,是用java寫爬蟲必備的工具。

每日增量、總量數據隨意切換

jsoup怎么用

閱讀量、粉絲量、評論數、點贊數、總排名、周排名…… 任意選取

jsoup怎么用

隨意選取時間區間

jsoup怎么用

自從有了這個工具后,我博客一切數據盡收眼底,每天看著這數據一點點的變化,還是蠻有成就感、蠻開心的呢 !!

如何做?

秀完該告訴大家如何做的,首先你得有臺能執行定時任務的主機,云主機或者你臥室的主機都可以,然后得有個數據庫,至于整體功能其實就是一個簡單的增刪改查。哦 不對,只有增查沒有刪改,數據展示的話我用了螞蟻金服開源的可視化庫antv g2,我用的3.8 bug很多不推薦,推薦使用highchart。

我認為其中比較復雜的部分應該是html數據解析的部分,這部分后面我會直接把我代碼告訴你。其次就是數據庫的存儲和查詢,我用spring-boot搭了個web服務,用了spring-boot-starter-quartz寫了每天晚上11:55的定時任務,用mybatis-spring-boot-starter來讀寫數據庫。

html的解析代碼,需要看懂csdn博客頁的html布局,然后逐漸調試獲取數據,當然csdn官方一改版,代碼就執行不了了,所幸這種致命性改版頻率不會特別高,這大半年我就遇到過2-3次,代碼如下,可以直接拿來用,把url換成自己博客url就可以了。

public class CommonUtils {
    private static Logger log = LoggerFactory.getLogger(CommonUtils.class);

    private static Map<String, String> headers;

    static {
        headers = new HashMap<>();
        headers.put("referer", "https://www.google.com/");
        headers.put("User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0" +
                ".4183.83 Safari/537.36");
    }

    public static BlogInfoDao getBlogInfo() {
        int retry = 3;
        while (--retry > 0) {
            try {
                BlogInfoDao blogInfoDao = new BlogInfoDao();
                blogInfoDao.setDate(new Date());
                Document doc = Jsoup.connect("https://blog.csdn.net/xindoo").headers(headers).get();
                Element blogElement = doc.getElementsByClass("data-info d-flex item-tiling").get(0);
                // 文章數量
                int articleCnt = Integer.parseInt(blogElement.getElementsByTag("dl").get(0).attr("title"));
                blogInfoDao.setArticleCnt(articleCnt);
                // 周排名
                int wranking = Integer.parseInt(blogElement.getElementsByTag("dl").get(1).attr("title"));
                blogInfoDao.setWranking(wranking);
                // 總排名
                int ranking = Integer.parseInt(blogElement.getElementsByTag("dl").get(2).attr("title"));
                blogInfoDao.setRanking(ranking);
                // 總閱讀量
                int viewCnt = Integer.parseInt(blogElement.getElementsByTag("dl").get(3).attr("title"));
                blogInfoDao.setViewCnt(viewCnt);

                blogElement = doc.getElementsByClass("data-info d-flex item-tiling").get(1);
                // 總積分
                int scoreCnt = Integer.parseInt(blogElement.getElementsByTag("dl").get(0).attr("title"));
                blogInfoDao.setScore(scoreCnt);
                // 粉絲數量
                int fansCnt = Integer.parseInt(blogElement.getElementsByTag("dl").get(1).attr("title"));
                blogInfoDao.setFansCnt(fansCnt);
                // 點贊量
                int likeCnt = Integer.parseInt(blogElement.getElementsByTag("dl").get(2).attr("title"));
                blogInfoDao.setLikeCnt(likeCnt);
                // 評論量
                int commentCnt = Integer.parseInt(blogElement.getElementsByTag("dl").get(3).attr("title"));
                blogInfoDao.setCommentCnt(commentCnt);
                // 收藏量
                int collectCnt = Integer.parseInt(blogElement.getElementsByTag("dl").get(4).attr("title"));
                blogInfoDao.setCollectCnt(collectCnt);

                return blogInfoDao;
            } catch (Exception e) {
                log.error("get bloginfo error, {}", e);
            }
        }
        return null;
    }
}

blogInfoDao是我封裝的用來和數據庫交互的類,沒啥內容這里就不再貼了。

到此,相信大家對“jsoup怎么用”有了更深的了解,不妨來實際操作一番吧!這里是創新互聯網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

分享名稱:jsoup怎么用
路徑分享:http://vcdvsql.cn/article42/iigsec.html

成都網站建設公司_創新互聯,為您提供ChatGPT自適應網站服務器托管外貿建站小程序開發電子商務

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

網站優化排名