![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
[单选题]
网络数据采集法,主要通过网络爬虫或网站公开API的方式获取,网络爬虫从网页的()开始获取。
A.HTML
B.WWW
C.URL
D.XML
查看答案
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.HTML
B.WWW
C.URL
D.XML
A.简单低级的网络爬虫,数据采集速度快,伪装度低,如果没有反爬机制,它们可以很快地抓取大量数据,甚至因为请求过多,造成网站服务器不能正常工作,影响了企业的业务开展
B.反爬机制也是一把双刃剑,一方面可以保护企业网站和网站数据,但是,另一方面,如果反爬机制过于严格,可能会误伤到真正的用户请求
C.如果既要和“网络爬虫”死磕,又要保证很低的误伤率,那么又会增加网站研发的成本
D.反爬机制不利于信息的自由流通,不利于网站发展,应该坚决取消
B.为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部分
C.爬虫从一个或若干个初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件
D.网络爬虫的行为和人们访问网站的行为是完全不同的
A.电子商务网站自我服务式的口碑营销板块
B.专门提供日常生活类口碑信息与相应服务的网站
C.通过社区网站或网站社区,聚合网友提供一种或几种商品的口碑信息以服务于其它用户
D.专业提供口碑信息搜索的网站
E.社区口碑营销平台