首页 > 公务员考试

题目内容（请给出正确答案）

[单选题]

（）又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据

A.深层页面爬虫

B.增量式网络爬虫

C.聚焦网络爬虫

D.通用网络爬虫

答案

D、通用网络爬虫

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“（）又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,…”相关的问题

第1题

()又称全网爬虫，爬行对象从一些种子URL扩充到整个网络。

（)又称全网爬虫，爬行对象从一些种子URL扩充到整个网络。

点击查看答案

第2题

()又称主题网络爬虫，指选择性地爬行预先定义好的与主题相关的页面。

（)又称主题网络爬虫，指选择性地爬行预先定义好的与主题相关的页面。

点击查看答案

第3题

以下关于深度优先的爬行策略的说法，正确的有（)。

A.其基本方法是按照深度由低到高的顺序，依次访问下一级网页链接，直到不能再深入为止

B.处于较浅目录层次的页面都可以首先被爬行

C.爬虫在完成一个爬行分支后返回到上一链接节点进一步搜索其它链接，直到所有链接遍历完

D.比较适合垂直搜索或站内搜索

点击查看答案

第4题

只会在需要的时候爬行新产生或发生更新的页面，并不爬行没有发生变化的页面的爬虫是（)。

A.通用网络爬虫

B.专用网络爬虫

C.聚焦网络爬虫

D.增量式网络爬虫

点击查看答案

第5题

()网络爬虫的爬行范围和数量巨大，对于爬行速度和存储空间要求较高，对于爬行页面的顺序要求相对较低。

（)网络爬虫的爬行范围和数量巨大，对于爬行速度和存储空间要求较高，对于爬行页面的顺序要求相对较低。

点击查看答案

第6题

深层网络（DeepWeb)爬虫爬行过程中最重要部分就是（)。

A.表单填写

B.主题定义

C.链接评价

D.内容评价

点击查看答案

第7题

Deep Web爬虫体系结构中的LVS用于（)。

A.本地页面URL集

B.表示填充表单的数据源

C.待爬行URL集

D.初始URL集合

点击查看答案

第8题

在网络爬虫的爬行策略中，应用最为常见的是（）。

A.深度优先遍历策略

B.广度优先遍历策略

C.高度优先遍历策略

D.反向链接策略

E.大站优先策略

点击查看答案

第9题

scrapy框架描述错误的是（）

A.它更容易构建大规模的抓取项目

B.它同步处理请求，速度非常快

C.它可以使用自动调节机制自动调整爬行速度

D.提供了一个爬虫任务管理界面，可以实现爬虫的停止，启动，调试，支持定时爬取任务

点击查看答案

第10题

聚焦网络爬虫又称主题网络爬虫。（)

点击查看答案

第11题

关于各种网络爬虫，以下说法不正确的是（)。

A、通用网络爬虫通常采用并行工作方式，但需要较长时间才能刷新一次页面。

B、通用网络爬虫适用于为搜索引擎搜索广泛的主题，有较强的应用价值。

C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接，保留有用的链接并将其放入等待抓取的URL队列。

D、增量式爬虫在需要的时候爬行新产生或发生更新的页面，并重新下载所有页面

点击查看答案

长沙图香大数据有限公司版权所有 ©2024

湘ICP备20011576号-2 营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）