0x01 前言
大家好,我还是那个菜菜的Adminxe,依旧还是很菜,然后这几天也是准备深入爬虫,比如学习完,想要去爬一下小说网,或者是XX影片,或者是XX图书漫画,反正你懂的就行了,我是那个脑力小可爱-酷酷的菜!
今天准备给大家分享的是py...
Adminxe
5年前 (2020-05-15) 4309℃ 0评论
12喜欢
一 相关背景
网络爬虫(Web Spider)又称网络蜘蛛、网络机器人,是一段用来自动化采集网站数据的程序。如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络爬虫不仅能够为搜索引擎采集网络信息,而且还可以作为定向信息采集器,定向采集某些网...
Adminxe
5年前 (2019-11-12) 2641℃ 0评论
4喜欢
Request库的异常
requests.ConnectionError:网络连接错误一场,如DNS查询失败,拒绝连接等
requests.HTTPError:HTTP错误异常
requests.URLRequired:URL缺失异常
requests.TooManyR...
Adminxe
6年前 (2018-10-30) 3762℃ 0评论
5喜欢
解释器为Python3.6
第三方库: requests 和 lxml
爬虫为单进程爬虫
每小时大概能爬取9K张图片
实际爬取数量和电脑性能和网络速度有关
import os
import shutil
...
Adminxe
9年前 (2015-10-15) 3650℃ 0评论
9喜欢