# lxml
1. pip安装
>pip install lxml
2. wheel安装
>https://pypi.org/project/lxml/#files
>pip install lxml-4.2.5-cp37-cp37m-win_amd64.whl
3. 验证安装
import lxml
# Beautiful Soup
- pip安装
>pip install beautifulsoup4
- 验证安装
```
from bs4 import BeautifulSoup
soup = BeautifulSoup('<p>Hello</p>','lxml')
print(soup.p.string)
```
# pyquery
1. 相关链接
>https://pyquery.readthedocs.io/en/latest/
2. pip安装
>pip install pyquery
3. wheel安装
>https://pypi.org/project/pyquery/#files
>pip install pyquery-1.4.0-py2.py3-none-any.whl
4. 验证安装
import pyquery
# tesserocr
1. 相关链接
>https://digi.bib.uni-mannheim.de/tesseract/
2. Windows下安装,双击运行`tesseract-ocr-setup-3.05.01.exe`,此时可以勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言,语言较多,下载时间会比较长,请耐心等待,然后一路点击Next按钮即可。
3. 安装完成后,需要设置两个环境变量 $PATH(直接填入安装的路径) 和 $TESSDATA_PREFIX(这个需要新建)
4. 验证安装 `tesseract -v`
5. wheel安装tesserocr
>https://github.com/simonflueckiger/tesserocr-windows_build/releases
>pip install tesserocr-2.3.1-cp37-cp37m-win_amd64
6.
- 工欲善其事必先利其器
- 请求库
- 解析库
- 数据库
- 存储库
- Web库
- app爬取相关库
- 爬虫框架
- 部署相关库
- ipython
- 基础
- 数学函数
- 随机函数
- 三角函数
- 字符串内建函数
- 列表方法
- 字典内置方法
- 正则表达式
- os
- 字符串及数字的判断
- 常用魔术方法
- db
- mongodb
- mysql
- redis
- ORM
- ODM
- mongodb操作方法
- sqlite3
- access
- files
- Excel
- xml文件
- Python环境
- anaconda
- pip常用命令
- virtualenv
- pyenv
- cmder
- 远程开发
- Jupyter
- crawler
- appium环境搭建
- adb工具
- uiautomator
- 运行Appium+Python Clinet + 夜神模拟器
- DesiredCapabilities参数大全
- requests
- scrapy
- gerapy
- scrapyd
- 请求头fake_useragent库
- 数据传递过程
- 数据清洗及入库pipelines.py
- scrapy调用阿布云代理
- 图片下载
- PyQt5
- pyinstaller
- 攻防
- xss
- xss反射
- Chrome模拟微信浏览器
- flask
- 注册app
- 蓝图Blueprint
- 表单验证wtforms
- Flask-SQLAlchemy
- 数据处理
- json
- tornado
- settings
- 工具
- fiddler
- ab压力测试工具
- 高阶
- 队列
- 多线程
- 消息队列
- 定时任务框架APScheduler
- Django
- 路由分离
- 模型
- admin
- Android
- apk逆向工程