朱记大数据吧 关注:3,179贴子:3,124
  • 1回复贴,共1

利用爬虫能够提高数据采集的效率吗?

只看楼主收藏回复

大家都知道采集数据是要花费时间的,但是也不可以一直等着,尤其是需要采集大量数据的情况下。因此如何提高爬虫数据采集效率便是非常关键的,今天大家一块去了解如何提高爬虫数据采集效率问题。


1楼2020-07-11 13:20回复
    1.尽量减少网站访问次数
    单次爬虫把主要时间消耗在网络请求等待响应上边,因此能减少网站访问就减少网站访问,既减少本身的工作量,也缓解网站的压力,还减少被封的风险。第一步要做的便是流程优化,尽可能精简流程,某些数据倘若能够在一个网页页面内获得就不需要在好几个网页页面下获得。接着去重,同样是非常关键的手段,爬过的就不再继续爬了。


    2楼2020-07-11 13:22
    回复