通用爬;虫技术也就是全网爬虫。其实现过程如下:1.();2.根据初始的url爬取页面并获得新的url;3.将新的url放到url队列中,在于第二步内获取下一个新的url地址之后,会将新的url地址放到

5 查阅

通用爬;虫技术也就是全网爬虫。其实现过程如下:1.();2.根据初始的url爬取页面并获得新的url;3.将新的url放到url队列中,在于第二步内获取下一个新的url地址之后,会将新的url地址放到url队列中;4.从url队列中读取新的url,并依据新的url爬取网页,同时从新的网页中获取新的url并重复上述的爬取过程;5.满足爬虫系统设置的停止条件时,停止爬取。

A.获取初始url

B.对爬取过程中产生的url进行存储

C.对爬取到的网页内容进行唯一标识的制定

D.以上都不对

参考答案:

答案:A

超星尔雅学习通