IT虾米网

java获取网页源码详解

luoye 2020年09月19日 编程语言 174 0

获取网页的源码:

package com.atguigu.crud.controller; 
 
import java.io.BufferedReader; 
import java.io.BufferedWriter; 
import java.io.FileWriter; 
import java.io.IOException; 
import java.io.InputStreamReader; 
import java.net.MalformedURLException; 
import java.net.URL; 
 
public class ssssss { 
      public static void main(String[] a){ 
            try { 
                URL url=new URL("http://www.baidu.com"); 
                BufferedReader reader=new BufferedReader(new InputStreamReader(url.openStream())); 
                BufferedWriter writer=new BufferedWriter(new FileWriter("index.html")); 
                String line; 
                while((line=reader.readLine())!=null){ 
                    System.out.println(line); 
                    writer.write(line); 
                    writer.newLine(); 
                } 
                reader.close(); 
                writer.close(); 
            } catch (MalformedURLException e) { 
                e.printStackTrace(); 
            } catch (IOException e) { 
                e.printStackTrace(); 
            } 
 
        } 
}

 还有一个更简单的: 需要用到 jsoup-1.7.2.jar

String html = Jsoup.connect("你的网址").get().html();

 

发布评论

分享到:

IT虾米网

微信公众号号:IT虾米 (左侧二维码扫一扫)欢迎添加!

blob:http 地址的原理及生成方法详解
你是第一个吃螃蟹的人
发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。