为超过 100 万开发者提供专业的 API 服务,所有 API 均提供免费的服务
网络抓取并不是什么新鲜事。许多企业和个人使用网络抓取来收集和汇总信息。但是,随着API技术的进步,企业现在可以收集和解析以前没有结构化形式的原始数据。因此,企业在使用网络抓取的方式上变得更加创新。现在,特别是在创业领域,企业正在转向网络抓取来创建自己的服务。
然而,尽管有其优点,但网络抓取经常受到批评。人们经常问“网络抓取合法吗?有些人认为网络抓取类似于数据盗窃。当然,网络抓取有滥用的可能性。但是,您不能仅仅因为该过程可能被滥用而将其称为非法。
当然,这是一个讨论。这不是法律建议。如果您有任何疑问,应咨询您所在司法管辖区的律师。
那么,让我们来看看网络抓取在当今数字世界中的法律地位。
什么时候抓取网页是非法的?
从本质上讲,网络抓取只是一种自动做事的方式,需要大量的时间和额外的努力来手动完成。然而,这并不是说,关于我们可以和不能刮什么,不应该有限制。也就是说,如果您以合乎道德的方式使用它,网络抓取是收集“公共”和可访问数据的理想策略。
例如,亚马逊上的商品信息和其他类似类别都是公开信息。每个可以访问互联网的人都可以访问亚马逊的网站并找到该信息。这就引出了一个问题,“如果人们可以手动访问信息,为什么自动化工具不能做同样的事情?归根结底,如果数据是公开的,那么如何访问它是否重要?
另一方面,数据不是公开的,或者访问有限,使用网络抓取会引起法律问题。要继续以亚马逊为例,您的个人身份信息、购物车状态、订单列表和类似信息将受到保护。在这种情况下,出于个人或商业目的访问该数据的网络抓取很可能是非法的(当然是不道德的)。不幸的是,事情并没有那么简单。泄露私人信息是个人的非法行为。当错误在于使用该工具的人时,我们可以将网络抓取归咎于一个过程吗?
如何利用网络抓取实现公共利益?
在数据公开的情况下,“网络抓取是否合法”的问题是没有意义的。相反,公共信息是使用网络抓取技术研究和构建有用的数字解决方案的理想场所。
回到我们的亚马逊产品列表示例,通过网络抓取,您可以收集和分析数据以开发市场见解。真正使消费者受益的见解。例如,某个类别中评分最高或价格最低的产品。此外,您还可以从另一个类似的网站获取和合并产品列表。有了这些信息,您可以开发一种比较不同在线商店的价格或质量的服务。
在许多用例中,您可以通过抓取可公开访问的数据来创建商业上可行的产品。
Web 抓取是一种从辅助资源访问更新信息的强大技术。就这样。作为一种技术,网络抓取只是让事情变得更容易。政策制定者不应该问“网络抓取是否合法”,而应该把重点放在保护他们(和我们)在网络上的数据上。
Last Updated on 2022-07-12 by admin