流程:
第一步:创建xxx项目
~~~
scrapy startproject woaiwojia
~~~
第二步:创建要抓取的名称及抓取网址
~~~
scrapy genspider ershoufang https://sh.5i5j.com/ershoufang/
~~~
第三步:编写items.py,明确需要提取的数据
第四步:编写spiders/xxx.py 编写爬虫文件,处理请求和响应,以及提取数据(yeild item)
第五步:编写pipelines.py管道文件,处理spider返回item数据
第六步:编写settings.py,启动管理文件,以及其他相关设置
第七步:执行爬虫