题目内容
(请给出正确答案)
[多选题]
常用的爬虫技巧有以下哪些()。
A.更改header,伪装成浏览器进行爬取
B.设置爬取的时间间隔
C.应用神经网络算法识别网站验证码
D.通过代理服务器进行爬取
查看答案
如果结果不匹配,请 联系老师 获取答案
A.更改header,伪装成浏览器进行爬取
B.设置爬取的时间间隔
C.应用神经网络算法识别网站验证码
D.通过代理服务器进行爬取
A.其基本方法是按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止
B.处于较浅目录层次的页面都可以首先被爬行
C.爬虫在完成一个爬行分支后返回到上一链接节点进一步搜索其它链接,直到所有链接遍历完
D.比较适合垂直搜索或站内搜索