Web爬虫现在是不是合法了-电子发烧友网

技术无罪？江湖传言，互联网上50%以上的流量都是由爬虫创造的，很多人都表示：无爬虫就无互联网的繁荣。也正因为此，网上各种爬虫教程风靡不绝，惹各路大神小白观之参与之。但是，无节制的背后往往隐藏着风险，类似“只因写了一段爬虫，公司200多人被抓！”、“程序员爬虫竟构成犯罪？”等报道也时有发生。关于爬虫合法性的讨论，CSDN也在此前的《爬虫到底违法吗？这位爬虫工程师给出了答案》、《不要在爬虫犯罪的边缘疯狂试探！》等文章中进行了探讨——但是，关于爬虫的争论一直甚嚣尘上。

近日，美国法院驳回 LinkedIn 针对分析公司 HiQ 抓取其数据的申诉一事件，似乎又为网络爬虫的自由添砖加了瓦。决议表明：任何可公开获得且未经版权保护的数据都可供抓取！可以说，这是数据隐私和数据监管时代的历史性时刻。那么，作为开发者的你，如何看到这一事件呢？关于爬虫的风险性又该怎么定论？

2019年末，美国上诉法院驳回了 LinkedIn 针对分析公司 HiQ 抓取其数据的申诉。

这项决议是数据隐私和数据监管时代的历史性时刻。这项决议表明，任何可公开获得且未经版权保护的数据都可供网络爬虫自由抓取。

但是抓取数据的商业用途仍然有限

然而，这项决议并没有授予 HiQ 或其他网络爬虫将抓取获得的数据用于商业目的的自由。

例如，网络爬虫可以在 YouTube 上搜索视频标题，但由于这些视频已获得版权，因此不可以将 YouTube 视频转发到自己的网站上。

一般来说，无论你以何种方式获取数据，数据（包括视频或音乐之类的媒体文件数据）的版权依然有效。

某些形式的网页爬虫仍然是非法的

这项决议也没有赋予网络爬虫自由地从需要身份验证的站点获取数据的权利。

例如，根据规定网络爬虫不可以登录到 Facebook 并下载用户的数据。

该规则不包括那些要求用户在认证之前必须同意使用条款的网站，因为通常这些服务条款都会禁止诸如自动收集数据之类的活动。

但是，由于公开站点无法要求用户在访问数据之前同意任何服务条款，因此用户可以自由使用网络爬虫程序从站点收集的数据。

各个网站仍然可以使用技术来限制网络爬虫

尽管如今各个公司不太可能通过法律途径应对网络爬虫程序，但他们仍然可以通过其他方式限制网络爬虫。

例如，各个网站可以使用“限速”等技术来防止爬虫程序一次下载太多网页。此外，各个网站还可以使用 CAPTCHA 等技术来测试是用户还是网络爬虫正在请求该页面。

这些技术通常用于防止恶意机器人导致网站超载，引起网站崩溃。但是，这些技术也可以广泛用于限制网络爬虫的自动抓取。

LinkedIn可能会进一步上诉

尽管美国上诉法院驳回了LinkedIn的请求，但他们可能还有最后一步棋：向美国最高法院提出上诉。

美国最高法院有权推翻上诉法院的判决，而且还可以撤销网络爬虫公开使用非版权数据的合法化。但是，并非所有上诉至最高法院的决定都能得到实际的审查。

但是，我们仍然可以认为最高法院很可能会审查本案的裁决。毕竟数据政策和相关的隐私问题是相对较新的法律，而且会对 LinkedIn 等公司产生重大的商业影响。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Web

Web

+关注

关注
2

文章
1272

浏览量
69817
爬虫

爬虫

+关注

关注
0

文章
82

浏览量
7047

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Web爬虫现在是不是合法了

评论

ADS8556电路，测干电池电压得到的结果有上下0.01V的偏差，是不是太大了？

DAC80004的转换速率是不是用setting time这个参数来衡量

IP地址数据信息和爬虫拦截的关联

海外爬虫IP的合法边界：合规性探讨与实践

揭秘贴片功率电感发烫究竟是不是烧坏了

详细解读爬虫多开代理IP的用途，以及如何配置！

THS3091放大了脉宽是1ns的脉冲，脉冲的脉宽展宽，是不是THS3091的压摆率不够?

谷景告诉你屏蔽绕线功率电感是不是感量越大性能越好

STM32G0如果只执行写保护编程时，先擦除选项字节，此时读保护字节是FF，那是不是就读保护生效了？

STM32的USB速度提不上去是怎么回事？

STVD是不是不支持C99?

请问STM32Cube包含的FATFS例程是不是已经支持8G以上的SD卡了？

STM32F207V FSMC是不是上电运行后就应该用示波器测量能够在PB7管脚上测量到一个锁存信号了？

共模电感是不是感值越大越好

一文看懂插件环形电感线圈究竟是不是随便绕的