A.简单低级的网络爬虫,数据采集速度快,伪装度低,如果没有反爬机制,它们可以很快地抓取大量数据,甚至因为请求过多,造成网站服务器不能正常工作,影响了企业的业务开展
B.反爬机制也是一把双刃剑,一方面可以保护企业网站和网站数据,但是,另一方面,如果反爬机制过于严格,可能会误伤到真正的用户请求
C.如果既要和“网络爬虫”死磕,又要保证很低的误伤率,那么又会增加网站研发的成本
D.反爬机制不利于信息的自由流通,不利于网站发展,应该坚决取消
A.cookielib库提供可存储cookie的对象,以便于与urllirequest库配合使用来进行访问
B.过于频繁的爬虫不会带给网站额外的压力
C.使用split()可以进行字符串的拆分
D.正则表达式可以实现对爬取信息的快速过滤
A.基于API返回的结果通常会比较干净
B.基于API的爬虫任务中,速度一般较慢
C.基于API的爬虫爬取的好处是没有次数的限制
D.基于API的爬取能够覆盖网站所有信息