### 1.安装
[redis安装](https://xintiaohuiyi.gitbook.io/flask-note/7redisjian-zhi-dui-shu-ju-ku/115-redisde-an-zhuang-yi-ji-ke-hu-duan-lian-jie)
[RedisPy库安装](/1kai-fa-huan-jing-pei-zhi/15-cun-chu-ku-de-an-zhuang/153-redis-pyde-an-zhuang.md)
[RedisDump安装](/1kai-fa-huan-jing-pei-zhi/15-cun-chu-ku-de-an-zhuang/154-redisdumpde-an-zhuang.md)
redis教程笔记:https://xintiaohuiyi.gitbook.io/flask-note/7redisjian-zhi-dui-shu-ju-ku
### 2.Redis、StricRedis
RedisPy库提供Redis和StrictRedis用于实现Redis命令操作
官方推荐使用StrictRedis
### 3.连接Redis
有两种连接方式
第一种:
```
from redis import StrictRedis
redis = StrictRedis(host="localhost",port="6379",db=0,password=None)
redis.set("name","angle")
print(redis.get("name"))
```
运行结果:
```
b'angle'
```
第二种:
```
from redis import StrictRedis,ConnectionPool
pool = ConnectionPool(host="localhost",port="6379",db=0,password=None)
redis = StrictRedis(connection_pool=pool)
redis.set("name","miku")
print(redis.get("name"))
```
运行结果:
```
b'miku'
```
ConnectionPool能够支持通过URL连接,url的格式如下:
```
Redis TCP 连接:redis://[:password]@host:port/db
Redis TCP+SSL 连接:rediss://[:password]@host:port/db
Redis Unix Socket 连接:unix://[:password]@/path/to/socket.sock?db=db
```
实例:
```
url = "redis://:@localhost:6379/0"
# 调用 from_url() 方法创建一个 ConnectionPool,然后将其传给 StrictRedis 即可完成连接
pool = ConnectionPool.from_url(url)
redis = StrictRedis(connection_pool=pool)
redis.set("name","angle")
print(redis.get("name"))
```
### 4. Key 操作 {#4-key-操作}
在这里主要将 Key 的一些判断和操作方法做下总结:
| 方法 | 作用 | 参数说明 | 示例 | 示例说明 | 示例结果 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| exists\(name\) | 判断一个key是否存在 | name: key名 | `redis.exists('name')` | 是否存在name这个key | True |
| delete\(name\) | 删除一个key | name: key名 | `redis.delete('name')` | 删除name这个key | 1 |
| type\(name\) | 判断key类型 | name: key名 | `redis.type('name')` | 判断name这个key类型 | b'string' |
| keys\(pattern\) | 获取所有符合规则的key | pattern: 匹配规则 | `redis.keys('n*')` | 获取所有以n开头的key | \[b'name'\] |
| randomkey\(\) | 获取随机的一个key | | `randomkey()` | 获取随机的一个key | b'name' |
| rename\(src, dst\) | 将key重命名 | src: 原key名 dst: 新key名 | `redis.rename('name', 'nickname')` | 将name重命名为nickname | True |
| dbsize\(\) | 获取当前数据库中key的数目 | | `dbsize()` | 获取当前数据库中key的数目 | 100 |
| expire\(name, time\) | 设定key的过期时间,单位秒 | name: key名 time: 秒数 | `redis.expire('name', 2)` | 将name这key的过期时间设置2秒 | True |
| ttl\(name\) | 获取key的过期时间,单位秒,-1为永久不过期 | name: key名 | `redis.ttl('name')` | 获取name这key的过期时间 | -1 |
| move\(name, db\) | 将key移动到其他数据库 | name: key名 db: 数据库代号 | `move('name', 2)` | 将name移动到2号数据库 | True |
| flushdb\(\) | 删除当前选择数据库中的所有key | | `flushdb()` | 删除当前选择数据库中的所有key | True |
| flushall\(\) | 删除所有数据库中的所有key | | `flushall()` | 删除所有数据库中的所有key | True |
### 5. String操作 {#5-string操作}
Redis 中存在最基本的键值对形式存储,用法总结如下:
| 方法 | 作用 | 参数说明 | 示例 | 示例说明 | 示例结果 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| set\(name, value\) | 给数据库中key为name的string赋予值value | name: key名 value: 值 | `redis.set('name', 'Bob')` | 给name这个key的value赋值为Bob | True |
| get\(name\) | 返回数据库中key为name的string的value | name: key名 | `redis.get('name')` | 返回name这个key的value | b'Bob' |
| getset\(name, value\) | 给数据库中key为name的string赋予值value并返回上次的value | name: key名 value: 新值 | `redis.getset('name', 'Mike')` | 赋值name为Mike并得到上次的value | b'Bob' |
| mget\(keys, \*args\) | 返回多个key对应的value | keys: key的列表 | `redis.mget(['name', 'nickname'])` | 返回name和nickname的value | \[b'Mike', b'Miker'\] |
| setnx\(name, value\) | 如果key不存在才设置value | name: key名 | `redis.setnx('newname', 'James')` | 如果newname这key不存在则设置值为James | 第一次运行True,第二次False |
| setex\(name, time, value\) | 设置可以对应的值为string类型的value,并指定此键值对应的有效期 | name: key名 time: 有效期 value: 值 | `redis.setex('name', 1, 'James')` | 将name这key的值设为James,有效期1秒 | True |
| setrange\(name, offset, value\) | 设置指定key的value值的子字符串 | name: key名 offset: 偏移量 value: 值 | `redis.set('name', 'Hello') redis.setrange('name', 6, 'World')` | 设置name为Hello字符串,并在index为6的位置补World | 11,修改后的字符串长度 |
| mset\(mapping\) | 批量赋值 | mapping: 字典 | `redis.mset({'name1': 'Durant', 'name2': 'James'})` | 将name1设为Durant,name2设为James | True |
| msetnx\(mapping\) | key均不存在时才批量赋值 | mapping: 字典 | `redis.msetnx({'name3': 'Smith', 'name4': 'Curry'})` | 在name3和name4均不存在的情况下才设置二者值 | True |
| incr\(name, amount=1\) | key为name的value增值操作,默认1,key不存在则被创建并设为amount | name: key名 amount:增长的值 | `redis.incr('age', 1)` | age对应的值增1,若不存在则会创建并设置为1 | 1,即修改后的值 |
| decr\(name, amount=1\) | key为name的value减值操作,默认1,key不存在则被创建并设置为-amount | name: key名 amount:减少的值 | `redis.decr('age', 1)` | age对应的值减1,若不存在则会创建并设置为-1 | -1,即修改后的值 |
| append\(key, value\) | key为name的string的值附加value | key: key名 | `redis.append('nickname', 'OK')` | 向key为nickname的值后追加OK | 13,即修改后的字符串长度 |
| substr\(name, start, end=-1\) | 返回key为name的string的value的子串 | name: key名 start: 起始索引 end: 终止索引,默认-1截取到末尾 | `redis.substr('name', 1, 4)` | 返回key为name的值的字符串,截取索引为1-4的字符 | b'ello' |
| getrange\(key, start, end\) | 获取key的value值从start到end的子字符串 | key: key名 start: 起始索引 end: 终止索引 | `redis.getrange('name', 1, 4)` | 返回key为name的值的字符串,截取索引为1-4的字符 | b'ello' |
### 6. List操作 {#6-list操作}
List,即列表。Redis 还提供了列表存储,列表内的元素可以重复,而且可以从两端存储,用法总结如下:
| 方法 | 作用 | 参数说明 | 示例 | 示例说明 | 示例结果 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| rpush\(name, \*values\) | 在key为name的list尾添加值为value的元素,可以传多个 | name: key名 values: 值 | `redis.rpush('list', 1, 2, 3)` | 给list这个key的list尾添加1、2、3 | 3,list大小 |
| lpush\(name, \*values\) | 在key为name的list头添加值为value的元素,可以传多个 | name: key名 values: 值 | `redis.lpush('list', 0)` | 给list这个key的list头添加0 | 4,list大小 |
| llen\(name\) | 返回key为name的list的长度 | name: key名 | `redis.llen('list')` | 返回key为list的列表的长度 | 4 |
| lrange\(name, start, end\) | 返回key为name的list中start至end之间的元素 | name: key名 start: 起始索引 end: 终止索引 | `redis.lrange('list', 1, 3)` | 返回起始为1终止为3的索引范围对应的list | `[b'3', b'2', b'1']` |
| ltrim\(name, start, end\) | 截取key为name的list,保留索引为start到end的内容 | name:key名 start: 起始索引 end: 终止索引 | `ltrim('list', 1, 3)` | 保留key为list的索引为1到3的元素 | True |
| lindex\(name, index\) | 返回key为name的list中index位置的元素 | name: key名 index: 索引 | `redis.lindex('list', 1)` | 返回key为list的列表index为1的元素 | b'2' |
| lset\(name, index, value\) | 给key为name的list中index位置的元素赋值,越界则报错 | name: key名 index: 索引位置 value: 值 | `redis.lset('list', 1, 5)` | 将key为list的list索引1位置赋值为5 | True |
| lrem\(name, count, value\) | 删除count个key的list中值为value的元素 | name: key名 count: 删除个数 value: 值 | `redis.lrem('list', 2, 3)` | 将key为list的列表删除2个3 | 1,即删除的个数 |
| lpop\(name\) | 返回并删除key为name的list中的首元素 | name: key名 | `redis.lpop('list')` | 返回并删除名为list的list第一个元素 | b'5' |
| rpop\(name\) | 返回并删除key为name的list中的尾元素 | name: key名 | `redis.rpop('list')` | 返回并删除名为list的list最后一个元素 | b'2' |
| blpop\(keys, timeout=0\) | 返回并删除名称为在keys中的list中的首元素,如果list为空,则会一直阻塞等待 | keys: key列表 timeout: 超时等待时间,0为一直等待 | `redis.blpop('list')` | 返回并删除名为list的list的第一个元素 | \[b'5'\] |
| brpop\(keys, timeout=0\) | 返回并删除key为name的list中的尾元素,如果list为空,则会一直阻塞等待 | keys: key列表 timeout: 超时等待时间,0为一直等待 | `redis.brpop('list')` | 返回并删除名为list的list的最后一个元素 | \[b'2'\] |
| rpoplpush\(src, dst\) | 返回并删除名称为src的list的尾元素,并将该元素添加到名称为dst的list的头部 | src: 源list的key dst: 目标list的key | `redis.rpoplpush('list', 'list2')` | 将key为list的list尾元素删除并返回并将其添加到key为list2的list头部 | b'2' |
### 7. Set操作 {#7-set操作}
Set,即集合。Redis 还提供了集合存储,集合中的元素都是不重复的,用法总结如下:
| 方法 | 作用 | 参数说明 | 示例 | 示例说明 | 示例结果 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| sadd\(name, \*values\) | 向key为name的set中添加元素 | name: key名 values: 值,可为多个 | `redis.sadd('tags', 'Book', 'Tea', 'Coffee')` | 向key为tags的set中添加Book、Tea、Coffee三个内容 | 3,即插入的数据个数 |
| srem\(name, \*values\) | 从key为name的set中删除元素 | name: key名 values: 值,可为多个 | `redis.srem('tags', 'Book')` | 从key为tags的set中删除Book | 1,即删除的数据个数 |
| spop\(name\) | 随机返回并删除key为name的set中一个元素 | name: key名 | `redis.spop('tags')` | 从key为tags的set中随机删除并返回该元素 | b'Tea' |
| smove\(src, dst, value\) | 从src对应的set中移除元素并添加到dst对应的set中 | src: 源set dst: 目标set value: 元素值 | `redis.smove('tags', 'tags2', 'Coffee')` | 从key为tags的set中删除元素Coffee并添加到key为tags2的set | True |
| scard\(name\) | 返回key为name的set的元素个数 | name: key名 | `redis.scard('tags')` | 获取key为tags的set中元素个数 | 3 |
| sismember\(name, value\) | 测试member是否是key为name的set的元素 | name:key值 | `redis.sismember('tags', 'Book')` | 判断Book是否为key为tags的set元素 | True |
| sinter\(keys, \*args\) | 返回所有给定key的set的交集 | keys: key列表 | `redis.sinter(['tags', 'tags2'])` | 返回key为tags的set和key为tags2的set的交集 | {b'Coffee'} |
| sinterstore\(dest, keys, \*args\) | 求交集并将交集保存到dest的集合 | dest:结果集合 keys:key列表 | `redis.sinterstore('inttag', ['tags', 'tags2'])` | 求key为tags的set和key为tags2的set的交集并保存为inttag | 1 |
| sunion\(keys, \*args\) | 返回所有给定key的set的并集 | keys: key列表 | `redis.sunion(['tags', 'tags2'])` | 返回key为tags的set和key为tags2的set的并集 | {b'Coffee', b'Book', b'Pen'} |
| sunionstore\(dest, keys, \*args\) | 求并集并将并集保存到dest的集合 | dest:结果集合 keys:key列表 | `redis.sunionstore('inttag', ['tags', 'tags2'])` | 求key为tags的set和key为tags2的set的并集并保存为inttag | 3 |
| sdiff\(keys, \*args\) | 返回所有给定key的set的差集 | keys: key列表 | `redis.sdiff(['tags', 'tags2'])` | 返回key为tags的set和key为tags2的set的差集 | {b'Book', b'Pen'} |
| sdiffstore\(dest, keys, \*args\) | 求差集并将差集保存到dest的集合 | dest:结果集合 keys:key列表 | `redis.sdiffstore('inttag', ['tags', 'tags2'])` | 求key为tags的set和key为tags2的set的差集并保存为inttag | 3 |
| smembers\(name\) | 返回key为name的set的所有元素 | name: key名 | `redis.smembers('tags')` | 返回key为tags的set的所有元素 | {b'Pen', b'Book', b'Coffee'} |
| | srandmember\(name\) | 随机返回key为name的set的一个元素,但不删除元素 | name: key值 | `redis.srandmember('tags')` | 随机返回key为tags的set的一个元素 |
### 8. Sorted Set操作 {#8-sorted-set操作}
Sorted Set,即有序集合,它相比集合多了一个分数字段,利用它我们可以对集合中的数据进行排序,其用法总结如下:
| 方法 | 作用 | 参数说明 | 示例 | 示例说明 | 示例结果 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| zadd\(name,\_args, \*\_kwargs\) | 向key为name的zset中添加元素member,score用于排序。如果该元素存在,则更新其顺序 | name: key名 args: 可变参数 | `redis.zadd('grade', 100, 'Bob', 98, 'Mike')` | 向key为grade的zset中添加Bob,score为100,添加Mike,score为98 | 2,即添加的元素个数 |
| zrem\(name, \*values\) | 删除key为name的zset中的元素 | name: key名 values: 元素 | `redis.zrem('grade', 'Mike')` | 从key为grade的zset中删除Mike | 1,即删除的元素个数 |
| zincrby\(name, value, amount=1\) | 如果在key为name的zset中已经存在元素value,则该元素的score增加amount,否则向该集合中添加该元素,其score的值为amount | name: key名 value: 元素 amount: 增长的score值 | `redis.zincrby('grade', 'Bob', -2)` | key为grade的zset中Bob的score减2 | 98.0,即修改后的值 |
| zrank\(name, value\) | 返回key为name的zset中元素的排名(按score从小到大排序)即下标 | name: key名 value: 元素值 | `redis.zrank('grade', 'Amy')` | 得到key为grade的zset中Amy的排名 | 1 |
| zrevrank\(name, value\) | 返回key为name的zset中元素的倒数排名(按score从大到小排序)即下标 | name: key名 value: 元素值 | `redis.zrevrank('grade', 'Amy')` | 得到key为grade的zset中Amy的倒数排名 | 2 |
| zrevrange\(name, start, end, withscores=False\) | 返回key为name的zset(按score从大到小排序)中的index从start到end的所有元素 | name: key值 start: 开始索引 end: 结束索引 withscores: 是否带score | `redis.zrevrange('grade', 0, 3)` | 返回key为grade的zset前四名元素 | \[b'Bob', b'Mike', b'Amy', b'James'\] |
| zrangebyscore\(name, min, max, start=None, num=None, withscores=False\) | 返回key为name的zset中score在给定区间的元素 | name:key名 min: 最低score max:最高score start: 起始索引 num: 个数 withscores: 是否带score | `redis.zrangebyscore('grade', 80, 95)` | 返回key为grade的zset中score在80和95之间的元素 | \[b'Amy', b'James'\] |
| zcount\(name, min, max\) | 返回key为name的zset中score在给定区间的数量 | name:key名 min: 最低score max: 最高score | `redis.zcount('grade', 80, 95)` | 返回key为grade的zset中score在80到95的元素个数 | 2 |
| zcard\(name\) | 返回key为name的zset的元素个数 | name: key名 | `redis.zcard('grade')` | 获取key为grade的zset中元素个数 | 3 |
| zremrangebyrank\(name, min, max\) | 删除key为name的zset中排名在给定区间的元素 | name:key名 min: 最低位次 max: 最高位次 | `redis.zremrangebyrank('grade', 0, 0)` | 删除key为grade的zset中排名第一的元素 | 1,即删除的元素个数 |
| zremrangebyscore\(name, min, max\) | 删除key为name的zset中score在给定区间的元素 | name:key名 min: 最低score max:最高score | `redis.zremrangebyscore('grade', 80, 90)` | 删除score在80到90之间的元素 | 1,即删除的元素个数 |
### 9. Hash操作 {#9-hash操作}
Hash,即哈希。Redis 还提供了哈希表的数据结构,我们可以用name指定一个哈希表的名称,然后表内存储了各个键值对,用法总结如下:
| 方法 | 作用 | 参数说明 | 示例 | 示例说明 | 示例结果 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| hset\(name, key, value\) | 向key为name的hash中添加映射 | name: key名 key: 映射键名 value: 映射键值 | `hset('price', 'cake', 5)` | 向key为price的hash中添加映射关系,cake的值为5 | 1,即添加的映射个数 |
| hsetnx\(name, key, value\) | 向key为name的hash中添加映射,如果映射键名不存在 | name: key名 key: 映射键名 value: 映射键值 | `hsetnx('price', 'book', 6)` | 向key为price的hash中添加映射关系,book的值为6 | 1,即添加的映射个数 |
| hget\(name, key\) | 返回key为name的hash中field对应的value | name: key名 key: 映射键名 | `redis.hget('price', 'cake')` | 获取key为price的hash中键名为cake的value | 5 |
| hmget\(name, keys, \*args\) | 返回key为name的hash中各个键对应的value | name: key名 keys: 映射键名列表 | `redis.hmget('price', ['apple', 'orange'])` | 获取key为price的hash中apple和orange的值 | \[b'3', b'7'\] |
| hmset\(name, mapping\) | 向key为name的hash中批量添加映射 | name: key名 mapping: 映射字典 | `redis.hmset('price', {'banana': 2, 'pear': 6})` | 向key为price的hash中批量添加映射 | True |
| hincrby\(name, key, amount=1\) | 将key为name的hash中映射的value增加amount | name: key名 key: 映射键名 amount: 增长量 | `redis.hincrby('price', 'apple', 3)` | key为price的hash中apple的值增加3 | 6,修改后的值 |
| hexists\(name, key\) | key为namehash中是否存在键名为key的映射 | name: key名 key: 映射键名 | `redis.hexists('price', 'banana')` | key为price的hash中banana的值是否存在 | True |
| hdel\(name, \*keys\) | key为namehash中删除键名为key的映射 | name: key名 key: 映射键名 | `redis.hdel('price', 'banana')` | 从key为price的hash中删除键名为banana的映射 | True |
| hlen\(name\) | 从key为name的hash中获取映射个数 | name: key名 | `redis.hlen('price')` | 从key为price的hash中获取映射个数 | 6 |
| hkeys\(name\) | 从key为name的hash中获取所有映射键名 | name: key名 | `redis.hkeys('price')` | 从key为price的hash中获取所有映射键名 | \[b'cake', b'book', b'banana', b'pear'\] |
| hvals\(name\) | 从key为name的hash中获取所有映射键值 | name: key名 | `redis.hvals('price')` | 从key为price的hash中获取所有映射键值 | \[b'5', b'6', b'2', b'6'\] |
| hgetall\(name\) | 从key为name的hash中获取所有映射键值对 | name: key名 | `redis.hgetall('price')` | 从key为price的hash中获取所有映射键值对 | {b'cake': b'5', b'book': b'6', b'orange': b'7', b'pear': b'6'} |
### 10. RedisDump {#10-redisdump}
RedisDump 提供了强大的 Redis 数据的导入和导出功能,本节我们来看下它的具体用法。
首先确保已经安装好了 RedisDump。
RedisDump 提供两个可执行命令,redis-dump 用于导出数据,redis-load 用于导入数据。
#### redis-dump {#redis-dump}
我们可以首先输入如下命令查看所有可选项:
```
redis-dump -h
```
运行结果如下:
```
Usage: redis-dump [global options] COMMAND [command options]
-u, --uri=S Redis URI (e.g. redis://hostname[:port])
-d, --database=S Redis database (e.g. -d 15)
-s, --sleep=S Sleep for S seconds after dumping (for debugging)
-c, --count=S Chunk size (default: 10000)
-f, --filter=S Filter selected keys (passed directly to redis' KEYS command)
-O, --without_optimizations Disable run time optimizations
-V, --version Display version
-D, --debug
--nosafe
```
可以看到其参数,-u 代表 Redis 连接字符串,-d 代表数据库代号,默认全部,-s 代表导出之后的休眠时间,-c 代表分块大小,默认是 10000,-f 代表导出时的过滤器,-O 代表禁用运行时优化,-V 显示版本,-D 开启调试。
我们拿本地的 Redis 做测试,运行在 6379 端口上,密码为 foobared,导出命令如下:
```
redis-dump -u :123456@localhost:6379
```
如果没有密码的话可以不加密码前缀,命令如下:
```
redis-dump localhost:6379
```
运行之后可以将本地 0-15号 数据库的所有数据输出出来,例如:
```
{"db":0,"key":"name","ttl":-1,"type":"string","value":"angle","size":5}
{"db":0,"key":"user","ttl":-1,"type":"string","value":"angle","size":5}
{"db":0,"key":"username","ttl":-1,"type":"string","value":"angle","size":5}
```
每条数据都包含五个字段,db 即数据库代号,key 即键名,ttl 即该键值对的有效时间,type 即键值类型,size 即占用空间。
如果想要将其输出为 Json 行文件,可以使用如下命令:
```
redis-dump -u :123456@localhost:6379 > ./redis_data.json
redis-dump localhost:6379 > redis_data.json
```
这样我们就可以成功将 Redis 的所有数据库的所有数据导出成 Json 行文件了。
另外我们可以使用 -d 参数指定某个数据库的导出,例如只导出 1 号数据库的内容:
```
redis-dump localhost:6379 -d 0> redis_data.json
```
如果只想导出特定的内容,如想导出 adsl 开头的数据,可以加入 -f 参数用来过滤,命令如下:
```
redis-dump -u :123456@localhost:6379 -f adsl:* > ./redis.data.jl
```
其中 -f 的参数即 Redis 的 keys 命令的参数,可以写一些过滤规则。
#### redis-load {#redis-load}
我们同样可以首先输入如下命令查看所有可选项:
```
redis-load -h
```
运行结果如下:
```
redis-load --help
Try: redis-load [global options] COMMAND [command options]
-u, --uri=S Redis URI (e.g. redis://hostname[:port])
-d, --database=S Redis database (e.g. -d 15)
-s, --sleep=S Sleep for S seconds after dumping (for debugging)
-n, --no_check_utf8
-V, --version Display version
-D, --debug
--nosafe
```
可以看到其参数,-u 代表 Redis 连接字符串,-d 代表数据库代号,默认全部,-s 代表导出之后的休眠时间,-n 代表不检测 UTF-8 编码,-V 显示版本,-D 开启调试。
我们可以将 Json 行文件导入到 Redis 数据库中:
```
< redis_data.json redis-load -u :123456@localhost:6379
```
这样就可以成功将 Json 行文件导入到数据库中了。
另外如下命令同样可以达到同样的效果:
```
cat redis_data.json | redis-load -u :123456@localhost:6379
```
以上便是 RedisDump 的使用概述,使用它我们可以高效便捷地实现 Redis 数据库的导入导出。
- 介绍
- 1.开发环境配置
- 1.1 python3的安装
- 1.1.1 windows下的安装
- 1.1.2 Linux下的安装
- 1.1.3 Mac下的安装
- 1.2 请求库的安装
- 1.2.1 requests的安装
- 1.2.2 selenium的安装
- 1.2.3 ChromeDriver的安装
- 1.2.4 GeckoDriver 的安装
- 1.2.5 PhantomJS的安装
- 1.2.6 aiohttp的安装
- 1.3 解析库的安装
- 1.3.1 lxml的安装
- 1.3.2 Beautiful Soup的安装
- 1.3.3 pyquery的安装
- 1.3.4 tesserocr的安装
- 1.4 数据库的安装
- 1.4.1 MySQL的安装
- 1.4.2 MongoDB的安装
- 1.4.3 Redis的安装
- 1.5 存储库的安装
- 1.5.1 PyMySQL的安装
- 1.5.2 PyMongo的安装
- 1.5.3 redis-py的安装
- 1.5.4 RedisDump的安装
- 1.6 Web库的安装
- 1.6.1 Flask的安装
- 1.6.2 Tornado的安装
- 1.7 App爬取相关库的安装
- 1.7.1 Charles的安装
- 1.7.2 mitmproxy的安装
- 1.7.3 Appium的安装
- 1.8 爬虫框架的安装
- 1.8.1 pyspider的安装
- 1.8.2 Scrapy的安装
- 1.8.3 Scrapy-Splash的安装
- 1.8.4 ScrapyRedis的安装
- 1.9 布署相关库的安装
- 1.9.1 Docker的安装
- 1.9.2 Scrapyd的安装
- 1.9.3 ScrapydClient的安装
- 1.9.4 ScrapydAPI的安装
- 1.9.5 Scrapyrt的安装
- 1.9.6-Gerapy的安装
- 2.爬虫基础
- 2.1 HTTP 基本原理
- 2.1.1 URI和URL
- 2.1.2 超文本
- 2.1.3 HTTP和HTTPS
- 2.1.4 HTTP请求过程
- 2.1.5 请求
- 2.1.6 响应
- 2.2 网页基础
- 2.2.1网页的组成
- 2.2.2 网页的结构
- 2.2.3 节点树及节点间的关系
- 2.2.4 选择器
- 2.3 爬虫的基本原理
- 2.3.1 爬虫概述
- 2.3.2 能抓怎样的数据
- 2.3.3 javascript渲染的页面
- 2.4 会话和Cookies
- 2.4.1 静态网页和动态网页
- 2.4.2 无状态HTTP
- 2.4.3 常见误区
- 2.5 代理的基本原理
- 2.5.1 基本原理
- 2.5.2 代理的作用
- 2.5.3 爬虫代理
- 2.5.4 代理分类
- 2.5.5 常见代理设置
- 3.基本库使用
- 3.1 使用urllib
- 3.1.1 发送请求
- 3.1.2 处理异常
- 3.1.3 解析链接
- 3.1.4 分析Robots协议
- 3.2 使用requests
- 3.2.1 基本用法
- 3.2.2 高级用法
- 3.3 正则表达式
- 3.4 抓取猫眼电影排行
- 4.解析库的使用
- 4.1 使用xpath
- 4.2 使用Beautiful Soup
- 4.3 使用pyquery
- 5.数据存储
- 5.1 文件存储
- 5.1.1 TXT 文件存储
- 5.1.2 JSON文件存储
- 5.1.3 CSV文件存储
- 5.2 关系型数据库存储
- 5.2.1 MySQL的存储
- 5.3 非关系数据库存储
- 5.3.1 MongoDB存储
- 5.3.2 Redis存储
- 6.Ajax数据爬取
- 6.1 什么是Ajax
- 6.2 Ajax分析方法
- 6.3 Ajax结果提取
- 6.4 分析Ajax爬取今日头条街拍美图
- 7.动态渲染页面爬取
- 7.1 Selenium的使用
- 7.2 Splash的使用
- 7.3 Splash负载均衡配置
- 7.4 使用selenium爬取淘宝商品
- 8.验证码的识别
- 8.1 图形验证码的识别
- 8.2 极验滑动验证码的识别
- 8.3 点触验证码的识别
- 8.4微博宫格验证码的识别
- 9.代理的使用
- 9.1 代理的设置
- 9.2 代理池的维护
- 9.3 付费代理的使用
- 9.4 ADSL拨号代理
- 9.5 使用代理爬取微信公总号文章
- 10.模拟登录
- 10.1 模拟登陆并爬去GitHub
- 10.2 Cookies池的搭建
- 11.App的爬取
- 11.1 Charles的使用
- 11.2 mitmproxy的使用
- 11.3 mitmdump“得到”App电子书信息
- 11.4 Appium的基本使用
- 11.5 Appnium爬取微信朋友圈
- 11.6 Appium+mitmdump爬取京东商品
- 12.pyspider框架的使用
- 12.1 pyspider框架介绍
- 12.2 pyspider的基本使用
- 12.3 pyspider用法详解
- 13.Scrapy框架的使用
- 13.1 scrapy框架介绍
- 13.2 入门
- 13.3 selector的用法
- 13.4 spider的用法
- 13.5 Downloader Middleware的用法
- 13.6 Spider Middleware的用法
- 13.7 Item Pipeline的用法
- 13.8 Scrapy对接Selenium
- 13.9 Scrapy对接Splash
- 13.10 Scrapy通用爬虫
- 13.11 Scrapyrt的使用
- 13.12 Scrapy对接Docker
- 13.13 Scrapy爬取新浪微博
- 14.分布式爬虫
- 14.1 分布式爬虫原理
- 14.2 Scrapy-Redis源码解析
- 14.3 Scrapy分布式实现
- 14.4 Bloom Filter的对接
- 15.分布式爬虫的部署
- 15.1 Scrapyd分布式部署
- 15.2 Scrapyd-Client的使用
- 15.3 Scrapyd对接Docker
- 15.4 Scrapyd批量部署
- 15.5 Gerapy分布式管理
- 微信公总号文章实战
- 源码
- other