scrapy · 编程知识

官网： https://scrapy-chs.readthedocs.io/zh-cn/latest/intro/install.html ![](https://img.kancloud.cn/eb/18/eb185bf8a4c87f8eaf045feacea05f4d_1193x715.png) crapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。其最初是为了[页面抓取](https://en.wikipedia.org/wiki/Data_scraping#Screen_scraping)(更确切来说,[网络抓取](https://en.wikipedia.org/wiki/Web_scraping))所设计的，也可以应用在获取API所返回的数据(例如[Amazon Associates Web Services](https://www.amazon.com/ap/signin?openid.return_to=https%3A%2F%2Faffiliate-program.amazon.com%2Fassoc_credentials%2Fhome&openid.identity=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0%2Fidentifier_select&openid.assoc_handle=amzn_associates_us&openid.mode=checkid_setup&marketPlaceId=ATVPDKIKX0DER&openid.claimed_id=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0%2Fidentifier_select&openid.ns=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0&openid.pape.max_auth_age=0)) 或者通用的网络爬虫。本文档将通过介绍Scrapy背后的概念使您对其工作原理有所了解，并确定Scrapy是否是您所需要的。当您准备好开始您的项目后，您可以参考[入门教程](http://scrapy-chs.readthedocs.io/zh_CN/latest/intro/tutorial.html#intro-tutorial)。 ##创建项目 scrapy startproject appdemo 运行 (baidu 为任务) scrapy crawl baidu