收缩
杭州北大青鸟网上课堂--JAVA教程:介绍java如何下载网页


JAVA教程:介绍java如何下载网页

发布来源:杭州北大青鸟 浏览次数:
文章摘要: 在java中,java.net.URL类能够对实际的url 进行建模通过这个类可以对相应的Web服务器发出请求并且获得相应的文档Java.net.URL类有一个默认的文档.java.net.URL类有一个默认的构造函数,使用URL地 ...

在java中, java.net.URL类能够对实际的url

进行建模 通过这个类  可以对相应的Web服务器发出请求并且获得相应的文档 Java.net.URL类有一个默认的文档.java.net.URL类有一个默认的构造函数,使用 URL地址作为参数,构造URL对象

URL pageURL= new URL(path);

之后,可以通过获得的URL对象来获得网络流,进而像操作本地文件一样来操作网络资源.

 InputStream stream=pageURL.openStream();


 

可以将网页看做网络文件,然后按照文件读取的方式把它读出来并保存到本地.以下是一个下载网页的小程序 

注意程序中"utf-8"解决乱码问题

public static String downLoadPage(String path)
	{
		StringBuffer sb=null;
		try {
			// 根据传入的路径构造url
			URL pageUrl=new URL(path);
			try {
				// 创建网络流
				BufferedReader reader=
					new BufferedReader(new InputStreamReader(pageUrl.openStream(),"utf-8"));
				String  line;
				// 读取网页内容
		new StringBuffer();
				while((line=reader.readLine())!=null)
				{
					sb.append(line);
				}
			
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
			
			
		} catch (MalformedURLException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		// 返回网页内容
		return sb.toString();
	}

}

代码中的reader.readline();有可能会抛出异常,因为网速可能不稳,如果下载网页的过程中出现错误.还需要重试.如果重试仍然出错 可以使用Thread类中的sleep方法休息片刻等待网速稳定后继续

 

	
 
  
	public static void main(String[] args) {
		
		String loadFile=downLoadPage("http://www.baidu.com");
		System.out.println(loadFile);
		
	}

也可以采用Scanner对象下载网页


文章来源于杭州电脑学校——杭州北大青鸟西湖校区www.bdqnxh.com,转载请注明出处。

 


关键词:JAVA,教程,介绍,java,如何,下载,网页,在,java,中,

上一篇:JAVA教程:相对路径与绝对路径

下一篇:JAVA教程:JS部分常用表达式