案件回溯
李某和吴某是一家科技公司的员工,他们平时的工作就是从网上收集数据,然后把数据汇总分析后生成相应的商业报告,从而卖给有需求的客户,说白了也算是大数据行业嘛。
由于有大量的数据需求,而李某和吴某一直以来的获取效率都比较低,他们便想过通过一些技术手段去获取数据。但这哥俩儿只懂一些粗浅的技术,各大网站的反爬风控又严,属于是看又看不懂,学也学不会。
于是二人便找到了懂爬虫技术的陈某,最终双方约定以100万次/400元的价格,由陈某提供爬取各类平台数据的接口。
有了程序之后,效率直接超级加倍,李某和吴某自然是大行其道,爬的天昏地暗不亦乐乎。
但在今天的商业社会中,数据早已成为很多公司赖以生存的核心竞争力,属于是公司的重要数字资产,是不容许别人轻易染指的,尤其是李某和吴某这样子的大量爬取。
国内某知名地图软件就是李某和吴某的爬取对象之一。在2023年2月上旬的时候,该地图软件公司在日常风险监控工作中察觉到异常情况:有身份不明的用户持续不断地对其数据库中的地理坐标数据进行爬取,且每日窃取的数据量高达100万至400万条之多!这些被窃取的数据包含商家信息、服务详情、用户评价、排名情况以及地理位置等关键内容。
卧榻之侧岂容他人酣睡,该公司立即采取行动,迅速启动了拦截程序,然而,对方伪造的请求特征与真实用户的行为极为相似,难以辨别。直到同年5月,该公司最终选择向公安机关报案。在侦查过程中,警方还发现另一家与之相关的互联网平台公司,其数据也遭到了李某和吴某的非法爬取,于是两案直接并案处理。
经查,李、吴使用陈某某提供的、专门用于绕过验证机制的爬虫接口,非法爬取互联网平台美食、商超类数据共计8亿余行,调用地图软件公司地理坐标类数据达300余万次。
2023年6月,公安机关先后将李某、吴某抓获归案。
2023年7月21日,陈某某在广州被抓获。
案件后续
三人到案之后,公安机关重点对犯罪嫌疑人所持电脑中发现的参数获取脚本、程序等进行功能鉴定,并结合陈某等人的供述与聊天记录,明确各类数据的获取方式、数量及访问次数等。
由于该案技术性、专业性强,公安机关在侦查取证阶段花了不少的精力与时间,相信在等待是否会被起诉的这段日子里,李某、吴某、陈某三人内心是饱受煎熬的。
但人总是要为自己做过的事买单。今年6月,公安机关最终还是以涉嫌非法获取计算机信息系统数据罪将陈某等3人移送普陀区检察院审查起诉。但在如何统计两家被爬虫侵害的公司的经济损失上,却遇到了难题。
地图软件公司本身是有对外开放的付费接口,所以是可以参照市场查询价格来估算其经济损失的,而另一家互联网公司的情就比较复杂,其涉案的数据属于公司不可对外售卖的核心经营资产,没有办法直接估定其经济价值,办案人员就只能够核算出爬虫造成的流量费用方面的损失。但由于时间比较久,这类记录的保存期限又短,大部分也被后续新的运营数据所替代和覆盖,属于是只剩一摊子糊涂账了。
鉴于此,检察机关决定:选取案发时段前后该互联网公司其他月份的数据作为参照基准,进而推算出服务器流量费用的结算标准,以及单条数据的平均流量成本作为关键指标。
经过反复核查与验证后,承办检察官最终确认,陈某等3人的非法行为给两家公司造成的经济损失总计达5万余元。
检察机关认为,李某某、吴某某两人违反国家规定,分别采用技术手段侵入计算机信息系统,获取该计算机信息系统中存储、处理或者传输的数据,情节严重,其行为分别触犯了《中华人民共和国刑法》第二百八十五条第二款,犯罪事实清楚,证据确实、充分,应当以非法获取计算机信息系统数据罪追究其刑事责任。
至于提供爬虫技术的陈某,虽然与李、吴二人素未谋面,仅在网络联系中提供有偿爬虫程序及接口,专门用于规避系统验证机制。但李、吴利用该工具实施非法爬取,三人实际形成了上下游协作关系。因此,承办检察官认定,陈某某的行为更符合提供侵入计算机信息系统程序罪的构成要件,且属情节特别严重。
2025年8月28日,普陀区检察院依法对三人提起公诉,最终法院依法判决如下:
以提供侵入计算机信息系统程序罪判处被告人陈某有期徒刑三年,缓刑三年,并处罚金3万元;
以非法获取计算机信息系统数据罪判处被告人李某有期徒刑二年,缓刑二年,并处罚金3万元;
以非法获取计算机信息系统数据罪判处处被告人吴某有期徒刑六个月,缓刑一年,并处罚金1万元。
K言K语
在这个案子里面,写爬虫的陈某,最终获刑是要比李某、吴某两个始作俑者还重的。这下大家应该深刻理解技术是把双刃剑了吧,功夫越强,就有可能判的越狠。
不过说到底,若想不出事,除非己莫为,自己不去干那些损害他方利益的事,那法律的铁拳怎么也锤不到你头上。
