Python urlopen()函数 示例分享
投稿:hebedich
urlopen(url, data=None, proxies=None) 即创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据;参数proxies用于设置代理。
好了,废话少说,我们先看看几个示例吧
一、打开一个网页获取所有的内容
复制代码 代码如下:
from urllib import urlopen
doc = urlopen("http://www.baidu.com").read()
print doc
二、获取Http头
复制代码 代码如下:
from urllib import urlopen
doc = urlopen("http://www.baidu.com")
print doc.info()
print doc.info().getheader('Content-Type')
三、使用代理
1. 查看环境变量
复制代码 代码如下:
print ""n".join(["%s=%s" % (k, v) for k, v in os.environ.items()])
print os.getenv("http_proxy")
2. 设置环境变量
复制代码 代码如下:
import os
os.putenv("http_proxy", "http://proxyaddr:<port>")
3. 使用代理
复制代码 代码如下:
# Use http://www.someproxy.com:3128 for http proxying
proxies = {'http': 'http://www.someproxy.com:3128'}
filehandle = urllib.urlopen(some_url, proxies=proxies)
# Don't use any proxies
filehandle = urllib.urlopen(some_url, proxies={})
# Use proxies from environment - both versions are equivalent
filehandle = urllib.urlopen(some_url, proxies=None)
filehandle = urllib.urlopen(some_url)