用java爬取杭電oj已ac代碼

      網友投稿 714 2025-04-02

      前言

      電腦的硬盤突然壞了,新安裝的eclipse的代碼全沒了,后來發現杭電上已經ac的代碼可以查看到,我是個有強迫癥的人,我寧愿做很多件不同的事也不愿意做一件相同的事(復制黏貼)許多次,所以就突發奇想,做個爬蟲爬取已經ac的代碼。

      實現

      用java爬取杭電oj已ac代碼

      首先打開杭電的首頁,這里有我想要的信息

      這里,解決的問題的序列號事我們想要的。查看網頁源碼

      就在這里找到我們想要的信息,我們要將他存下來,然后進去分析。

      接著隨便點擊一個進去分析。

      對這個圖片信息,注意鏈接是有規律的,通過簡單拼湊就可以進入,注意第一個 run id這個信息,是需要分析抓取的,然后點擊code len的鏈接。

      發現自己的代碼就在這。發現鏈接,就是通過run id拼湊而來。這樣思路就清晰了。

      1:抓取主頁面,獲得題目號。

      2:對于每個題目號,拼湊地址進入第二個界面,在分析爬取這里的run id。

      3:通過run id號拼湊地址進入有代碼的網頁,在通過解析工具獲取代碼。

      4:通過io傳輸傳到本地文件

      5:ps(解析工具:jsoup)注意要通過f12抓取登陸過的cookie模擬登陸,因為只爬一次,就直接抓取cookie值傳入。

      附上代碼:

      1:抓取主頁面

      import java.io.IOException; import java.util.HashMap; import java.util.Map; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class exercise {//爬取標題 public static void main(String[] args) throws IOException { Map map=new HashMap();//粗存id和正確的次數 String url="http://acm.hdu.edu.cn/userstatus.php?user=1315426911";//我的杭電頁面 Document doc=Jsoup.connect(url).get(); Elements links=doc.getElementsByTag("script"); Elements links1=links.attr("language", "javascript"); Element links2=links1.get(links1.size()-2); String links3=links2.html(); System.out.println(links3);//輸出p(1001,2,6);p(1003,2,16);p(1006,1,3);p(1008,1,1);p(1009,3,16);********** String value[]=links3.split(";");//獲取總共的題目數 int length=value.length; for(int i=0;i 如果對后端、爬蟲等感性趣歡迎關注我的個人公眾號交流:`bigsai`

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      12

      13

      14

      15

      16

      17

      18

      19

      20

      21

      22

      23

      Java

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:同時在多個單元格中輸入相同內容或公式(在excel中,如果要同時在多個單元格中輸入相同的數據
      下一篇:物聯網低代碼平臺:簡化開發,提升效率
      相關文章
      亚洲13又紧又嫩又水多| 亚洲啪啪AV无码片| 亚洲免费在线视频| 伊人久久综在合线亚洲91| 亚洲精品乱码久久久久久不卡 | 国产亚洲日韩在线三区| 亚洲国产av一区二区三区| 亚洲精品无码久久久久A片苍井空| 亚洲性69影院在线观看| 亚洲国产精品网站久久| 亚洲国产成人精品久久 | 亚洲AⅤ永久无码精品AA| 无码天堂va亚洲va在线va| 亚洲爆乳无码专区www| 亚洲精品天堂无码中文字幕| 亚洲av无码一区二区三区天堂| 亚洲精品乱码久久久久久V| 亚洲精品无码久久久久秋霞| 老司机亚洲精品影院在线观看| 日日摸日日碰夜夜爽亚洲| 亚洲国产综合久久天堂| 久久久久亚洲AV成人网人人软件 | 亚洲最新黄色网址| 亚洲中文无码a∨在线观看| 亚洲国产精品综合久久20| 亚洲永久网址在线观看| 亚洲AV无码一区二区三区久久精品 | 亚洲国产精品综合一区在线| 亚洲性色成人av天堂| 亚洲AV成人影视在线观看| 亚洲精品人成网线在线播放va| 久久精品国产亚洲AV天海翼| 亚洲国产aⅴ综合网| 亚洲人成网站在线播放vr| 亚洲综合自拍成人| 亚洲va乱码一区二区三区| 亚洲日韩精品无码专区| 国产亚洲成在线播放va| 国产亚洲一区区二区在线| 亚洲AV人人澡人人爽人人夜夜 | 亚洲VA综合VA国产产VA中|