pyspider是全国产的一个开源爬虫框架。
调度、采集、任务处理、结果统计都比较优秀。
在centos下安装pyspider,还是有些小坑的。
这里罗列下基本的安装步骤:
创建虚拟环境
123mkdir pyspidercd pyspider/virtualenv env
安装centos的开发环境、依赖库
12sudo yum install libcurl-develsudo yum install libxml2-devel libxslt-devel python-devel
为了顺利pip顺利安装,打个补丁
123export PYCURL_SSL_LIBRARY=nsspip uninstall pycurlpip install pycurl --no-cache-dir
安装pyspider
1pip install pyspider
启动pyspider
1pyspider
然后,访问主机端口5000,使用pyspider。
ps,这货蛮好用的。