首页 > 继续教育

题目内容（请给出正确答案）

[单选题]

连续不断地爬取网页信息，较容易被网站识别，想要实现间隔15s来爬取网页需要使用以下哪一项指令（）。

A.timestop（5）

B.timesleep（15）

C.timestrptime（15）

D.timesleep（5）

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“连续不断地爬取网页信息，较容易被网站识别，想要实现间隔15s…”相关的问题

第1题

以下哪种说法是正确的（）。

A.网站服务器可以识别你使用的访问软件，因为在发送访问请求中有特定位置的字符串和软件类型相关

B.低级别的代理服务器十分容易被识别

C.可以通过修改opener的proxy来模拟浏览器访问

D.爬取图片的流程被中断时，之前所有爬取的信息都将被自动删除

点击查看答案

第2题

搜索引擎友好意味着网站的网页内容更容易被（)收录，也就意味着用户通过搜索引擎获得网站信息的机会大大增加。

A.雅虎

B.Google

C.分类目录

D.搜索引擎

点击查看答案

第3题

常用的爬虫技巧有以下哪些（）。

A.更改header，伪装成浏览器进行爬取

B.设置爬取的时间间隔

C.应用神经网络算法识别网站验证码

D.通过代理服务器进行爬取

点击查看答案

第4题

以下关于API爬虫哪些说法是错误的（）。

A.基于API返回的结果通常会比较干净

B.基于API的爬虫任务中，速度一般较慢

C.基于API的爬虫爬取的好处是没有次数的限制

D.基于API的爬取能够覆盖网站所有信息

点击查看答案

第5题

下列说法正确的是（）。

A.cookielib库提供可存储cookie的对象，以便于与urllirequest库配合使用来进行访问

B.过于频繁的爬虫不会带给网站额外的压力

C.使用split（）可以进行字符串的拆分

D.正则表达式可以实现对爬取信息的快速过滤

点击查看答案

第6题

预留信息验证是中国银行为帮助客户有效识别正版银行网站防范不法分子利用假网站进行网上诈骗的一项服务。当客户登录中国银行电子银行或进行网上购物支付时，网页上会自动显示客户预留的信息，以便客户验证是否登录了真实的中国银行网站。()此题为判断题(对，错)。

点击查看答案

第7题

中文互联网数据统计分析服务提供商cnzz免费的（)产品是目前国内站长使用最多的网站流量系统，通过它站长可以随时知道网站的被访问情况，每天多少人看了哪些网页，新访客的来源是哪里，网站的用户分布在什么地区等非常有价值的信息数据。

A.全景统计

B.数据中心

C.站长统计

D.流量分析

点击查看答案

第8题

以下（)场景可以使用MaxcomputeMR实现。

A.Web访问日志分析：分析用户访问行为，个性化推荐等

B.搜索，比如pagerank、网页爬取等

C.机器学习：监督学习、无监督学习、分类算法等

D.广告推荐：用户点击购买行为预测

点击查看答案

第9题

（）实际是一个文件，它存放在世界某个角落的某一台计算机中，通过网址来识别与存取。

A.网站

B.网页

C.站点

D.URL

点击查看答案

第10题

ENISA：用户供应（provisioning）相关的漏洞示例是什么？（）

A．政府获取生物识别信息

B．管理不善的备份或档案系统

C．凭证容易被拦截和重放

D．远程访问管理接口

E．FIPS140-2密码实现

点击查看答案

第11题

数据采集工具不能爬取学术信息。（）

点击查看答案

湘ICP备20011576号-2 营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）