0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Web爬虫现在是不是合法了

Wildesbeast 来源:今日头条 作者:Tom Waterman 2020-02-04 14:45 次阅读

技术无罪?江湖传言,互联网上50%以上的流量都是由爬虫创造的,很多人都表示:无爬虫就无互联网的繁荣。也正因为此,网上各种爬虫教程风靡不绝,惹各路大神小白观之参与之。但是,无节制的背后往往隐藏着风险,类似“只因写了一段爬虫,公司200多人被抓!”、“程序员爬虫竟构成犯罪?”等报道也时有发生。关于爬虫合法性的讨论,CSDN也在此前的《爬虫到底违法吗?这位爬虫工程师给出了答案》、《不要在爬虫犯罪的边缘疯狂试探!》等文章中进行了探讨——但是,关于爬虫的争论一直甚嚣尘上。

近日,美国法院驳回 LinkedIn 针对分析公司 HiQ 抓取其数据的申诉一事件,似乎又为网络爬虫的自由添砖加了瓦。决议表明:任何可公开获得且未经版权保护的数据都可供抓取!可以说,这是数据隐私和数据监管时代的历史性时刻。那么,作为开发者的你,如何看到这一事件呢?关于爬虫的风险性又该怎么定论?

2019年末,美国上诉法院驳回了 LinkedIn 针对分析公司 HiQ 抓取其数据的申诉。

这项决议是数据隐私和数据监管时代的历史性时刻。这项决议表明,任何可公开获得且未经版权保护的数据都可供网络爬虫自由抓取。

但是抓取数据的商业用途仍然有限

然而,这项决议并没有授予 HiQ 或其他网络爬虫将抓取获得的数据用于商业目的的自由。

例如,网络爬虫可以在 YouTube 上搜索视频标题,但由于这些视频已获得版权,因此不可以将 YouTube 视频转发到自己的网站上。

一般来说,无论你以何种方式获取数据,数据(包括视频或音乐之类的媒体文件数据)的版权依然有效。

某些形式的网页爬虫仍然是非法的

这项决议也没有赋予网络爬虫自由地从需要身份验证的站点获取数据的权利。

例如,根据规定网络爬虫不可以登录到 Facebook 并下载用户的数据。

该规则不包括那些要求用户在认证之前必须同意使用条款的网站,因为通常这些服务条款都会禁止诸如自动收集数据之类的活动。

但是,由于公开站点无法要求用户在访问数据之前同意任何服务条款,因此用户可以自由使用网络爬虫程序从站点收集的数据。

各个网站仍然可以使用技术来限制网络爬虫

尽管如今各个公司不太可能通过法律途径应对网络爬虫程序,但他们仍然可以通过其他方式限制网络爬虫。

例如,各个网站可以使用“限速”等技术来防止爬虫程序一次下载太多网页。此外,各个网站还可以使用 CAPTCHA 等技术来测试是用户还是网络爬虫正在请求该页面。

这些技术通常用于防止恶意机器人导致网站超载,引起网站崩溃。但是,这些技术也可以广泛用于限制网络爬虫的自动抓取。

LinkedIn可能会进一步上诉

尽管美国上诉法院驳回了LinkedIn的请求,但他们可能还有最后一步棋:向美国最高法院提出上诉。

美国最高法院有权推翻上诉法院的判决,而且还可以撤销网络爬虫公开使用非版权数据的合法化。但是,并非所有上诉至最高法院的决定都能得到实际的审查。

但是,我们仍然可以认为最高法院很可能会审查本案的裁决。毕竟数据政策和相关的隐私问题是相对较新的法律,而且会对 LinkedIn 等公司产生重大的商业影响。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Web
    Web
    +关注

    关注

    2

    文章

    1272

    浏览量

    69802
  • 爬虫
    +关注

    关注

    0

    文章

    82

    浏览量

    7035
收藏 人收藏

    评论

    相关推荐

    ADS8556电路,测干电池电压得到的结果有上下0.01V的偏差,是不是太大

    我的ADS8556电路,测干电池电压得到的结果有上下0.01V的偏差,是不是太大
    发表于 01-15 08:07

    DAC80004的转换速率是不是用setting time这个参数来衡量

    DAC的转换速率是不是用setting time这个参数来衡量?如果建立时间是1us,是不是表示转换速率是1Msps,我看到DAC80004的setting time是5.8us,在产品选型的时候
    发表于 12-31 08:00

    IP地址数据信息和爬虫拦截的关联

    IP地址数据信息和爬虫拦截的关联主要涉及到两方面的内容,也就是数据信息和爬虫。IP 地址数据信息的内容丰富,包括所属地域、所属网络运营商、访问时间序列、访问频率等。 从IP地址信息中可以窥见
    的头像 发表于 12-23 10:13 115次阅读

    海外爬虫IP的合法边界:合规性探讨与实践

    海外爬虫IP的合法边界主要涉及合规性探讨与实践。
    的头像 发表于 10-12 07:56 295次阅读

    揭秘贴片功率电感发烫究竟是不是烧坏了

    电子发烧友网站提供《揭秘贴片功率电感发烫究竟是不是烧坏了.docx》资料免费下载
    发表于 09-30 14:44 0次下载

    详细解读爬虫多开代理IP的用途,以及如何配置!

    爬虫多开代理IP是一种在爬虫开发中常用的技术策略,主要用于提高数据采集效率、避免IP被封禁以及获取地域特定的数据。
    的头像 发表于 09-14 07:55 574次阅读

    THS3091放大脉宽是1ns的脉冲,脉冲的脉宽展宽,是不是THS3091的压摆率不够?

    用THS3091,放大脉宽是1ns的脉冲,脉冲的脉宽展宽,是不是THS3091的压摆率不够。 1ns脉宽的脉冲,是不是压摆率=2×pi×f×Vpk要大于10000V/us,
    发表于 08-19 06:02

    谷景告诉你屏蔽绕线功率电感是不是感量越大性能越好

    谷景告诉你屏蔽绕线功率电感是不是感量越大性能越好 编辑:谷景电子 屏蔽绕线功率电感是一种普遍的电路电感元件,它对于电路运行的稳定性特别重要。而电感量作为屏蔽绕线功率电感的一个性能指标,也是我们在做
    的头像 发表于 06-10 18:48 619次阅读

    STM32G0如果只执行写保护编程时,先擦除选项字节,此时读保护字节是FF,那是不是就读保护生效

    如果只执行写保护编程时,先擦除选项字节,此时读保护字节是FF,那是不是就读保护生效?程序再修改为A5,会不会就引起FLASH整块擦除?不想修改写保护会引起FLASH擦除,是不是不行?
    发表于 05-20 08:17

    STM32的USB速度提不上去是怎么回事?

    搞了很久的STM32的USB结果感觉连USB最简单的都没搞懂 现在主要是USB速度提不上去,速度一直在20,30KB晃荡 目前没开双缓冲的,不过我看别人的速度都能到100多KB/s; 郁闷现在是
    发表于 05-17 08:10

    STVD是不是不支持C99?

    内容如标题所示,麻烦有懂的朋友告诉下我,这个问题花费我很多时间。 不知道STVD是不是不支持C99??
    发表于 05-16 08:04

    请问STM32Cube包含的FATFS例程是不是已经支持8G以上的SD卡

    STM32Cube包含的FATFS例程是不是已经支持8G以上的SD卡? 我手头没有合适的卡做测试,有人知道么 stm324xg_eval_sd.c 文件的uint8_t
    发表于 05-16 06:18

    STM32F207V FSMC是不是上电运行后就应该用示波器测量能够在PB7管脚上测量到一个锁存信号

    现在需要用到FSMC,那是不是上电运行后就应该用示波器测量能够在PB7管脚上测量到一个锁存信号
    发表于 05-15 08:16

    共模电感是不是感值越大越好

    电子发烧友网站提供《共模电感是不是感值越大越好.docx》资料免费下载
    发表于 03-29 14:38 2次下载

    一文看懂插件环形电感线圈究竟是不是随便绕的

    在插件环形电感线圈的制造过程中,绕线是非常重要的一个环节。插件环形电感线圈绕线看起来很容易的一个步骤,但对于插件环形电感线圈的性能却有着特被重要的影响。那么,你觉得插件环形电感线圈绕线是不是可以随便绕制呢?
    的头像 发表于 03-12 19:19 1790次阅读
    一文看懂插件环形电感线圈究竟<b class='flag-5'>是不是</b>随便绕的