C#教程

关注公众号 jb51net

关闭
首页 > 软件编程 > C#教程 > C#获取网页源代码的方法

C#利用WebClient和WebRequest获取网页源代码的示例代码

作者:xiaoshuaishuais

本文介绍了在C#中通过WebClient和WebRequest两种方式获取网页源码的详细步骤,并提供了示例代码,这些方法适用于从网络上抓取网页内容,需要的朋友可以参考下

WebClient类获取网页源代码

WebClient类在System.Net命名空间下,WebClient类向URI标识的任何本地、Intranet或Internet资源发送数据以及从这些资源接收数据的方法。

using System.IO;
using System.Net;
using System.Text;

PageUrl = "http://www.webkaka.com"; //获取源代码的网页
WebClient wc = new WebClient(); // 创建WebClient实例提供向URI 
wc.Credentials = CredentialCache.DefaultCredentials; // 获取或设置Internet 请求进行身份验证的网络凭据。

Encoding enc = Encoding.GetEncoding("GB2312"); // 乱码就改成 utf-8 或 GB2312
Byte[] pageData = wc.DownloadData(PageUrl); 
ContentHtml.Text = enc.GetString(pageData); // 输出字符串HTML代码

WebRequest类获取网页源代码

WebRequest类是.NET Framework中“请求/响应”模型的abstract基类,用于访问Internet数据。应用程序处理WebRequest类的实例,而协议特定的子类则执行请求的具体细节,请求从应用程序发送到某个特定的URI。注册WebRequest子类通常是为了处理某个特定的协议(如HTTP或FTP),但是也可以注册它以处理对特定服务器或服务器上的路径的请求。

WebRequest类中最常用的是Create方法,为指定的URI方案初始化新的WebRequest实例。

public static WebRequest Create
(
  string requestUriString
)

注意:Create方法将运行时 WebRequest 类的子类作为与requestUri最接近的注册匹配项返回。如,以http://的URI在requestUri中传递时,由Create返回HttpWebRequest。如果为传递以file://开头的URI,则Create将返回FileWebRequest实例。.

WebResponse类是abstract基类,特定的响应类从该抽象基类派生。而从WebResponse类派生的协议特定的类携带请求的详细信息。

public virtual WebResponse GetResponse ()

  返回值:对Internet请求的响应的WebResponse。
using System.IO;
using System.Net;
using System.Text;
PageUrl = "http://www.webkaka.com"; //获取源代码的网页
WebRequest request = WebRequest.Create(PageUrl); //返回WebRequest的子类HttpWebRequest
WebResponse response = request.GetResponse(); //返回对 Internet 请求的响应
Stream resStream = response.GetResponseStream(); //从 Internet 资源返回数据流。 
Encoding enc = Encoding.GetEncoding("GB2312"); // 乱码就改成 utf-8 / GB2312
StreamReader sr = new StreamReader(resStream, enc); //以一种特定的编码从字节流中读取字符。 
ContentHtml.Text = sr.ReadToEnd(); //输出HTML代码
sr.Close();

到此这篇关于C#利用WebClient和WebRequest获取网页源代码的示例代码的文章就介绍到这了,更多相关C#获取网页源代码的方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文