## urllib
[python2.7模块文档][1]
该模块提供了用于获取万维网(the World Wide Web)数据的高层接口。该模块在python3中有改变。
### urlopen
urllib.urlopen(url[, data[, proxies]])
打开URL所表示的网络上的对象。它会使用socket连接网络上的某个服务器。 如果连接失败,会抛出**IOError**异常。如果一切顺利,返回一个file-like对象。该对象拥有以下方法:
`read(),readline(),readlines(),fileno(),close(),info(),getcode() 和geturl()`,同时也支持iterator。
>[info] geturl()函数返回网页的真实URL。geturl()函数用于获得重定向后的URL。
### urlretrieve
urllib.urlretrieve(url[, filename[, reporthook[, data]]])
如果需要,将由URL表示的网络对象复制到本地文件。如果URL指向本地文件,或存在对象的有效缓存副本,则不会复制对象。返回一个元组(filename, 头)其中filename是可以找到对象的本地文件名,头是返回的urlopen()返回的对象的`info()`方法。
### urlencode
urllib.urlencode(query[, doseq])
将需要传入的参数进行编码
### unquote
~~~
>>> from urllib import unquote
>>> unquote('%C4%A7%CA%DE')
'\xc4\xa7\xca\xde'
>>> print unquote('%C4%A7%CA%DE')
魔兽
~~~
---
## urllib2
[python2.7模块文档][2]
### urlopen
urllib2.urlopen(url[, data][, timeout])
打开 URL url, url参数可以是一个字符串,也可以是一个 Request 对象.
>[danger] HTTPS 请求不会做任何验证服务器证书的动作.
这个方法返回一个类文件对象,并带有三个附加方法。
>[info] geturl() — 返回所获取资源的URL, 通常用于决定是否跟着一个重定向
info() — 返回页面的元信息,例如头部信息,信息以 mimetools.表单的形式显现。信息例子 (请看 HTTP头快速参考)
getcode() — 返回响应的HTTP状态码.
当错误时引发 **URLError**
### Request
urllib2.Request(url[, data][, headers])
>[info] data 可以是字符串,不在需要使用urlencode转化
headers 为字典形式
### URLError
urllib2.URLError
url地址问题引起的Error
### HTTPError
urllib2.HTTPError
比如没有权限访问指定的资源
### 使用cookie
```
# 生成cookie容器
cookie = cookielib.CookieJar()
# cookie处理器
handler = urllib2.HTTPCookieProcessor(cookie)
# 生成opner,有方法opener.open
self.opener = urllib2.build_opener(handler)
try:
request = urllib2.Request(url=url, headers=headers)
response = opener.open(request)
return response.read()
except urllib2.URLError, e:
if hasattr(e, 'reason'):
print "连接服务器失败, 错误原因", e.reason
return None
```
### httpd基本的帐号认证
~~~
def login():
auth_handler = urllib2.HTTPBasicAuthHandler()
auth_handler.add_password(realm='Secrete Aera',
uri=remote_host,
user='jenkins',
passwd='jenkins')
opener = urllib2.build_opener(auth_handler)
# ...and install it globally so it can be used with urlopen.
urllib2.install_opener(opener)
~~~
## [测试例子][3]
[1]:http://python.usyiyi.cn/translate/python_278/library/urllib.html#module-urllib
[2]:http://python.usyiyi.cn/translate/python_278/library/urllib2.html#module-urllib2
[3]:https://www.cnblogs.com/poerli/p/6429673.html
- 前言
- 环境搭建
- pypi
- 打包
- Python 2 和 Python 3 的版本之间差别
- 项目
- 第一部分
- 第1章 基础
- Python安装
- python代码文件类型
- python对象
- 核心数据类型
- 核心数据类型--整型和浮点型
- 核心数据类型--字符串
- str.format
- 核心数据类型--列表
- 核心数据类型--元组
- 核心数据类型--字典
- 核心数据类型--集合
- 核心数据类型--文件对象
- 调用bash
- 标准输入输出
- str-repr
- 字符编码
- 迭代器和生成器
- 第2章 语句和语法
- 赋值语句
- if语句
- while语句
- for语句
- assert
- 第3章 函数
- 函数作用域
- 工厂函数
- 内置函数
- 递归
- 嵌套作用域和lambda
- 参数传递
- 函数式编程
- property可写与可读
- 第5章 模块
- 模块导入
- 模块命名空间
- 相对导入和绝对导入
- 模块重载
- 在模块中隐藏数据
- 过渡性重载
- 第6章 类
- 面向对象还是面向过程?
- 构造函数 析构函数
- call
- 运算符重载
- str()
- 待定
- 即时生成属性
- 多态
- 线程和进程
- thread模块
- threading模块
- threading线程锁
- 糖果机
- multiprocessing
- 阻塞非阻塞同步异步
- 单线程和多线程对比
- 生产者消费者模型
- 第二部分
- 获取系统资源信息
- 获取进程所占的物理内存
- dmidecode获取系统信息
- 网络编程
- 网络基础
- python中的套接字
- socket模块
- 第三部分 高级功能
- 闭包入门
- 闭包的应用
- 装饰器入门
- 装饰器应用
- 第四部分 项目实战
- graphite
- 模块
- collections
- datetime
- Enum
- faker
- fabric
- fileinput
- fire
- fnmatch
- getpass
- glob
- hashlib
- heapq
- json模块
- log
- os
- Paramiko
- parser
- platform
- pyyaml
- Queue
- random
- re
- 特殊符号和字符
- re模块
- shelves
- subprocess
- time
- urllib_urllib2_requests
- urllib urllib2
- requests
- 标准模块ConfigParser
- 扩展模块Mysqldb
- 扩展模块dns
- 扩展模块request
- uuid
- cacheout 缓存库
- delorean 时间
- 附录
- 内置函数
- python实现各种排序算法
- 常见报错
- pymongo
- pyrocksdb
- 常用
- ERROR