-
澳博投注网:一些公司或个人试图使网络爬虫突破道德规则和技术障碍
时间:2021/3/20 10:14:32 作者: 来源: 阅读:147 评论:0内容摘要:网络的本质和价值在于连接,其核心是实现数据的流动和共享。网络爬虫作为一种数据捕获的技术工具,通过爬行增强了网络节点之间的连接,提升了网络的整体价值。它是构建互联网开放共享理念的重要技术基石。但网络爬虫所做的并不总是鲜花和掌声,特别是当涉及到隐私和网络安全。因此,为了规范爬虫,维护网络秩序,“robots.txt协议”于...网络的本质和价值在于连接,其核心是实现数据的流动和共享。网络爬虫作为一种数据捕获的技术工具,通过爬行增强了网络节点之间的连接,提升了网络的整体价值。它是构建互联网开放共享理念的重要技术基石。但网络爬虫所做的并不总是鲜花和掌声,特别是当涉及到隐私和网络安全。因此,为了规范爬虫,维护网络秩序,“robots.txt协议”于1994年诞生。虽然该协议只是一个“绅士协议”,但它已逐渐被视为网络爬虫技术应用的公认行业标准,并已成为一种评判标准。爬行行为是否被网站允许的主要依据。在2014年百度公司诉奇虎360违反《机器人协议》一案中,法院认为被告未遵守原告网站上的《机器人协议》,其行为明显不当,应承担相应的不良后果。
技术本身是一个中立的工具。善与恶、合法与非法的关键,在于使用者的选择。最初通过机器人协议,一方获得了数据和信息,另一方增加了流量和关注度,大家都很开心。然而,机器人协议可以阻止“绅士”,但很难阻止“小人”。一些爬虫程序不遵守规则,随意抓取他人不愿意共享的数据和信息,大量挤压服务器资源,将它们变成“网络害虫”。例如,近年来,一些大数据风控公司为了谋取经济利益,利用爬虫技术在互联网上非法收集用户个人信息并转售给第三方。
web爬虫设计的初衷是利用计算机技术自动编制网站索引,更新信息,为用户提供高效的检索服务。它有三个基本功能:访问、下载和分析(分析和过滤数据)。目前,爬行动物作恶主要是通过异化前两种功能,具体表现为三种作恶方式。
一种是恶意获取未经授权的数据。对数据的访问是“网络爬虫”的起点,也是其价值的来源。出于经济利益或其他特殊目的,一些公司或个人试图使网络爬虫突破道德规则和技术障碍(网站“反爬虫”措施),并爬行未来。已授权或超出授权范围的数据。
本类更新
-
07-06澳博投注网:我国北部大部分地区受强暖高压系统控制
-
07-05澳博投注网:反映了美国在世界各地宣扬的不公正和不公正
-
07-04澳博投注网:为支持疫情防控和经济社会发展的有效协调
-
07-03澳博投注网:珠海市将实施由政府投资的优质产业载体驱动的创新发展道路
-
07-02澳博投注网:资源禀赋导致我国能源消费结构以煤为主
-
07-01澳博投注网:在线用户数和交易额在北京市场处于领先地位
-
06-30澳博投注网:为欧洲和世界的安全与稳定做些有益的事情
-
04-15澳博投注网:用心灵解决人民的急迫和渴望
-
04-14澳博投注网:影响俄罗斯基础研究和创新技术的发展
-
03-22澳博投注网:疫情期间在学校或身边发生的感人故事
本类推荐
本类排行
-
03-16澳博投注网:我们现在比历史上任何时候都更接近中华民族伟大复兴的目标
-
03-20澳博投注网:一些公司或个人试图使网络爬虫突破道德规则和技术障碍
-
12-25澳博投注网:促进居民储蓄向投资转化需要财富效应
-
12-24澳博投注网:要切实抓好制止餐饮浪费工作
-
03-17澳博投注网:苍翠绿色扮靓美丽中国
-
03-18澳博投注网:占整个黑猫投诉平台的比重
-
03-14澳博投注网:战斗的第四军抗日军队和第五是共产国际交通站的位置
-
03-16澳博投注网:我国消费市场恢复性增长 呈现五大特征
-
04-10澳博投注网:有效稳定市场预期和信贷环境
-
03-24澳博投注网:两种快速发展的新兴辅助技术