题目内容（请给出正确答案）

[单选题]

以下关于网络爬虫的描述中，错误的一项是（)。

A.在爬虫开始的时候，需要给爬虫输送一个URL列表，作为爬虫的起始位置

B.爬虫程序会抓取所有网页，以保证搜索正确性

C.根据某种抓取策略爬行新发现的URL，如此重复下去

D.对于商业搜索引擎来说，分布式爬虫是必须采用的技术

提问人：网友xxxiao2019 发布时间：2022-01-07

参考答案

查看官方参考答案

如搜索结果不匹配，请联系老师获取答案

网友答案

查看全部（）

· 有4位网友选择 C，占比44.44%
· 有3位网友选择 A，占比33.33%
· 有1位网友选择 D，占比11.11%
· 有1位网友选择 B，占比11.11%

ABCD

提交我的答案

登录提交答案，可赢取奖励机会。

您可能会需要：

重置密码查看订单联系客服

安装简答题APP，拍照搜题省时又省心！

更多“以下关于网络爬虫的描述中，错误的一项是（)。”相关的问题

第1题

以下关于网络爬虫的描述中，错误的一项是（)

A、在爬虫开始的时候，需要给爬虫输送一个URL列表，作为爬虫的起始位置

B、根据某种抓取策略爬行新发现的URL，如此重复下去

C、爬虫程序会抓取所有网页，以保证搜索正确性

D、对于商业搜索引擎来说，分布式爬虫是必须采用的技术

点击查看答案

第2题

下面关于网络爬虫的描述正确的是（)。

A.网络爬虫由控制节点、爬虫节点和资源库构成

B.网络爬虫中可以有多个控制节点，每个控制节点下可以有多个爬虫节点

C.控制节点之间可以互相通信，控制节点和其下的各爬虫节点之间也可以进行互相通信

D.属于同一个控制节点下的各爬虫节点间不可以互相通信

点击查看答案

第3题

关于网络爬虫协议文件robots.txt，说法错误的是:A一个网站可以放多个不同robots文件Brobots文件

关于网络爬虫协议文件robots.txt，说法错误的是:

A一个网站可以放多个不同robots文件

Brobots文件不可以用xml格式命名

Cdisallow用来描述不希望被访问到的一个URL

Drobots文件可以放在任何位置

点击查看答案

第4题

网络爬虫按照系统结构和实现技术，大致可以分为多种类型，以下属于爬虫分类的是()

网络爬虫按照系统结构和实现技术，大致可以分为多种类型，以下属于爬虫分类的是（)

A.通用网络爬虫

B.聚焦网络爬虫

C.增量式网络爬虫

D.以上都是

点击查看答案

第5题

下面关于网络爬虫的描述错误的是()。

A.网络爬虫是一个自动提取网页的程序

B.为搜索引擎从万维网上下载网页，是搜索引擎的重要组成部分

C.爬虫从一个或若干个初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列，直到满足系统的一定停止条件

D.网络爬虫的行为和人们访问网站的行为是完全不同的

点击查看答案

第6题

下列不属于网络静态数据主动获取手段的是：

A.非聚焦型网络爬虫

B.通用型网络爬虫

C.DeepWeb网络爬虫

D.增量式网络爬虫

点击查看答案

第7题

以下不是搜索引擎的主要功能模块的一项是（)

A、网络爬虫

B、搜索排序

C、PageRank

D、搜索引擎索引

点击查看答案

第8题

以下不是搜索引擎的主要功能模块的一项是（)。

A、PageRank

B、搜索排序

C、搜索引擎索引

D、网络爬虫

点击查看答案

第9题

只会在需要的时候爬行新产生或发生更新的页面，并不爬行没有发生变化的页面的爬虫是（)。

A.通用网络爬虫

B.专用网络爬虫

C.聚焦网络爬虫

D.增量式网络爬虫

点击查看答案

第10题

以下选项中，Python网络爬虫方向的第三方库是（)。

A.A.numpy

B.B.openpyxl

C.C.PyQt5

D.D.scrapy

点击查看答案

警告：系统检测到您的账号存在安全风险

为了保护您的账号安全，请在“简答题”公众号进行验证，点击“官网服务”-“账号验证”后输入验证码“”完成验证，验证成功后方可继续查看答案！

微信搜一搜

简答题

点击打开微信

警告：系统检测到您的账号存在安全风险

抱歉，您的账号因涉嫌违反简答题购买须知被冻结。您可在“简答题”微信公众号中的“官网服务”-“账号解封申请”申请解封，或联系客服。

微信搜一搜

简答题

点击打开微信