💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
## **创建项目** scrapy startproject project_name ---------- 创建爬虫模板 scrapy genspider douban movie.douban.com ----------------- 启动爬虫 scrapy crawl 爬虫名 输出日志 scrapy crawl douban_spider -s LOG_FILE=douban.log 把下面命令保存到文件,然后直接运行这文件 from scrapy import cmdline cmdline.execute('scrapy crawl douban_spider -s LOG_FILE=douban.log'.split()) split()去掉空字符,防止出错 ***** 命令行调试模式 scrapy shell 抓取的url ----------------- 保存数据 scrapy crawl douban_spider -o test.csv scrapy crawl douban_spider -o test.json --------------------- fetch命令主要用来显示爬虫爬取的过程 scrapy fetch http://mail.qq.com/ --------------------- scrapy resume crawl 帮你google了一下scrapy resume crawl,然后直接就定位到官方文档的任务暂停与重启了 就是加一个选项就OK scrapy crawl somespider -s JOBDIR=crawls/somespider-1