scrapy基于终端的持续化存储的, 有些注意事项
基于终端的持续化存储的使用
使用命令:
1 | scrapy crawl spiderName -o filePath |
好处: 简洁高效便捷
基于终端的持续化要只能对 parse 方法返回值进行存储.
而且存储的文件, 必须是 json , jsonlines, jl, csv, xml , marshal, pickle 格式的文件.
注意事项
而且 parse 方法返回的值, 必须是字典类型或者列表嵌套字典, 也就是必须返回 json , 如果是 普通的列表类型或者字符串类型,都会报错
1 | import scrapy |
各位都是白嫖党, 打赏就免了