百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

近12亿电商用户信息被泄露:平台该担何责?数据爬取使用亟需规范

cac55 2025-02-28 15:00 12 浏览 0 评论

日前,淘宝近12亿条用户信息被泄露一案引发关注。

河南省商丘市睢阳区人民法院公布的一起案件显示,犯罪分子通过自己开发软件爬取到了淘宝客户的数字ID、淘宝昵称、手机号码等信息近12亿条,用于从事淘宝客推广业务,共获利34万余元,最终被判处侵犯公民个人信息罪。

近年来,数据泄露案件频发。有专家指出,尽管企业在其中也是受害者之一,但是从个人信息保护的角度,只要用户因信息泄露遭受损失,平台需肩负一定责任。

随着国家及地方层面的立法纷纷落地,压在我国企业数据安全的担子日渐加重,不履行相关义务的将会面临罚款。另一方面,爬虫等网络技术的应用也亟需法律规制,这些技术的使用边界正待进一步的规范。

淘宝近12亿用户信息被泄露

裁判文书显示,2020年8月,淘宝(中国)软件有限公司报警称,7月6日至13日时,有黑产通过mtop订单评价接口绕过平台风控批量爬取加密数据。这期间爬取的字段量巨大,平均每天爬取数量为500万,爬取内容包括买家用户昵称、用户评价内容、昵称等敏感字段。

经淘宝排查发现,逯某有重大作案嫌疑,其在黎某开设的湖南省浏阳市泰创网络科技有限公司(以下简称“浏阳泰创”)任技术员一职。

浏阳泰创的主要业务是淘宝客,即在微信群里进行淘宝商品的推广,从而获得淘宝网佣金和商家服务费。

2019年11月起,逯某在家中开发爬虫软件“淘评评”,通过淘宝网页接口爬取客户信息,并将其中的手机号码提供给黎某。

爬取的信息用于何处?黎某将这些信息数据导入一个名为“微信加人”的软件中,用以添加微信好友。据公司员工描述,公司创立了多个微信群,最多可能达1100个,每个群的人数在90到200人之间不等。这些员工负责在群里发送广告链接,一旦淘宝用户在广告群里购买了商品,公司即可获得佣金。

截至2020年7月,该公司利用爬取的信息经营共获利340187.68元。经司法鉴定,逯某通过其开发的软件爬取淘宝客户的数字ID、淘宝昵称、手机号码等淘宝客户信息共计1180738048条,逯某将其爬取信息中的淘宝客户手机号码通过微信文件的形式发送给被告人黎某使用共计19712611条。

被爬取的信息是否还用于其他地方?逯某称,除了将手机号提供给黎某外,客户ID和淘宝昵称都存在了自己的电脑硬盘中,未有外泄。黎某方则辩称,起诉书指控395万余是公司全部的经营额,获利数额应是37万元,未将信息用非法目的。上述信息均被法院采纳。

法院最终认为,逯某和黎某违反了国家规定,非法获取公民个人信息,情节特别严重,均已构成了侵犯公民个人信息罪。综合其犯罪情节及社会危害性,法院判处黎某有期徒刑3年6个月,并处罚金35万;逯某有期徒刑3年3个月,并处罚金10万。

平台对数据泄露有何责任?

不过,逯某最初因涉嫌非法获取计算机信息系统数据、非法控制计算机信息系统罪被刑事立案,后检察院提起公诉,指控其嫌弃侵犯公民个人信息罪。

为何罪名前后有所更改?

“一个行为犯多条罪很正常。”北京清律律师事务所首席合伙人熊定中解释,因逯某通过网页接口爬取数据,没有侵入计算机系统的动作,被判个人信息犯罪最为合理。

上海申伦律师事务所律师夏海龙则表示,以购买、收受、交换等方式获取公民个人信息都可能构成侵犯公民个人信息罪。但构成非法获取计算机信息系统数据、非法控制计算机信息系统罪的前提是嫌疑人行为违反《刑法》语境下的“国家规定”,单就逯某擅自爬取淘宝网用户信息这一行为,尚达不到此严重程度。

“黑客被判为侵犯公民个人信息罪,而不是非法获取计算机信息系统数据罪,这样淘宝因计算机系统数据被窃被而被行政处罚的风险就小了很多。”上海大邦律师事务所高级合伙人游云庭说。

游云庭以一则平台因技术漏洞致数据泄露被追责的案件举例,2011年12月,北京警方接到CSDN网站报案,称其服务器被入侵,核心数据遭到泄露,CSDN网站后被整改。

据警方调查,嫌疑人利用CSDN网站漏洞,非法侵入服务器获取用户数据,以涉嫌非法获取计算机数据罪被刑事拘留。同时,CSDN网站未落实国家信息安全等级保护制度,安全管理制度和技术保护措施落实不到位是造成用户信息泄露的主要原因。

根据《计算机信息系统安全保护条例》第20条第1款规定,有违反计算机信息系统安全等级保护制度,危害计算机信息系统安全的行为,应由公安机关处以警告或者停机整顿。北京市公安局向CSDN网站提出了具体整改要求,并对运营公司北京创新乐知信息技术有限公司做出行政警告处罚。

“一般来说,在类似事件中平台往往也是受害者,只要平台采取了必要的技术防护措施、在数据泄露事件中没有过错,事发后能够及时向用户和监管部门通知相关情况,并采取补救措施、积极挽回损失,一般不会被行政处罚。”夏海龙分析,但是从个人信息保护的角度看,只要用户因信息泄露遭受损失,平台就需要首先向用户赔偿损失。

企业数据安全责任加重

近年来国际上频发的数据泄露事件,不仅让涉事平台承担着高昂的损失费用,还可能因危及大量用户的个人信息安全,面临着巨额罚款。

2020年11月,美国酒店集团万豪就因遭受网络攻击,致使数百万客户个人数据泄露,收到了英国监管机构(ICO)开具的1840万英镑巨额罚单。ICO调查发现,万豪没有按照通用数据保护条例(GDPR)要求,采取适当的技术或组织措施来保护其系统上的个人数据。

社交巨头脸书亦多次深陷数据泄露的泥潭。今年4月,脸书被指泄露5.33亿用户数据,尽管后来澄清系2年前的旧消息,并已修复相关漏洞。但不由让人联想起2018年英国“剑桥分析”公司非法获取8700万脸书用户数据一事,此案最终以脸书同意支付50亿美元罚款落幕。

随着国家及地方的立法纷纷落地,压在我国企业肩头的数据安全的担子也将逐渐变重。

6月10日通过的《数据安全法》规定,开展数据活动的组织、个人不履行数据安全保护义务的(包括采取必要措施保障数据安全、加强风险监测、开展风险评估等),由有关主管部门责令改正,给予警告,可以并处5万元以上50万元以下罚款。

正在二审的《个人信息保护法》草案也对个人信息处理者提出了相应要求,如制定内部管理制度和操作规程、对个人信息实行分类管理、采取相应的加密、采取相应的加密和去标识化等安全技术措施、制定并组织实施个人信息安全事件应急预案等。

深圳、上海、天津、安徽等地的数据立法同样高度重视数据安全问题。

如6月2日发布的《深圳经济特区数据条例(征求意见稿)》提到,数据处理者应当落实数据安全管理责任,防止数据泄露、毁损、丢失、篡改和非法使用,落实监测预警措施,制定数据安全应急预案,风险发生时及时告知相关权利人,并向网信部门和有关行业主管部门报告。

不当使用爬虫涉多重法律风险

对内,作为数据收集和处理者的企业应建立起完善的数据保护体系;对外,爬虫等网络技术的应用也亟需进一步规范。

网络爬虫是互联网时代一项运用非常普遍的网络信息搜索技术,最早应用于搜索引擎领域,通过搜集网页上的信息或数据,将其纳入数据库中。

不当使用网络爬虫技术可能带来多重法律风险。除了上述提到的非法获取计算机信息系统数据、非法控制计算机信息系统罪和侵犯公民个人信息罪,还可能触及侵犯著作权罪、诈骗罪,构成不正当竞争等。

如上海市徐汇区人民法院公布的一起案件中,段某于2013年开始视频网站,未经著作权人许可,利用爬虫技术对乐视、土豆等视频网站的影视作品设置加框链接,屏蔽片头广告,转而在自己的网页内发布广告,获利74余万。法院最终判定段某构成侵犯著作权罪。

另一则上海市宝山区人民法院公布的案件中,爬虫技术成为了实施诈骗的工具。叶某雇佣他人,通过购买爬虫软件获取淘宝网新开店店家信息,冒充淘宝客服人员向店家发送店铺未激活、交易关闭等虚假信息,以帮助店家解决问题为由诱骗被害人同意其进行远程协助并提供支付宝账户及密码,后其通过电脑远程操作的方式使用被害人支付宝为视频账户充值。法院认为,叶某的行为构成诈骗罪。

与爬虫相关的法律问题,更多的是涉及垄断及不正当竞争的争议。如2013年的“百度诉360案”、2017年的“酷米客诉车来了案”,以及2016年的“微博诉脉脉非法抓取用户信息案”,该案被称为“我国首例大数据不正当竞争纠纷案”。

6月14日,美国最高法院要求下级法院重审领英诉讼竞争对手hiQ Labs抓取用户公开资料一案。此前,因相关法案并不禁止公司抓取可在互联网上公开访问的数据,领英败诉。

这些案件的争议点多为数据权属问题,网络爬虫能轻易收集用户数据,而在数据即石油的将来,保有对用户数据的控制权是各互联网经营者的必争之地。

以“微博诉脉脉非法抓取用户信息案”为例,人脉社交应用脉脉上线之初曾与新浪微博合作,用户可通过微博账号和个人手机号注册登录脉脉。但新浪微博发现,脉脉还大量抓取、使用了新浪微博用户的头像、名称、职业、教育等信息。双方遂终止合作,新浪微博提起诉讼。

一审和二审法院均认为,脉脉的上述行为构成不正当竞争。法院二审判决指出,在数据资源已经成为互联网企业重要的竞争优势及商业资源的情况下,互联网行业中,企业竞争力不仅体现在技术配备,还体现在其拥有的数据规模。脉脉违反《开发者协议》,未经用户同意且未经新浪微博授权,获取其用户的相关信息并展示在脉脉应用的人脉详情中,侵害了新浪微博的商业资源,不正当的获取竞争优势,这种竞争行为已经超出了法律所保护的正当竞争行为。

目前,我国尚未有针对网络爬虫技术的配套法律法规。多重纠纷之下,网络爬虫的使用边界正在被规范。在网信办2019年5月发布的《数据安全管理办法(征求意见稿)》中,首次划定了网络爬虫的法律红线。

意见稿第2章第16条规定,网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;此类行为严重影响网站运行,如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。

更多内容请下载21财经APP

相关推荐

MIRIX重塑AI记忆:超Gemini 410%,节省99.9%内存,APP同步上线

MIRIX,一个由UCSD和NYU团队主导的新系统,正在重新定义AI的记忆格局。在过去的十年里,我们见证了大型语言模型席卷全球,从写作助手到代码生成器,无所不能。然而,即使最强大的模型依...

硬盘坏了怎么把数据弄出来对比10种硬盘数据恢复软件

机械硬盘或固态硬盘损坏导致数据丢失时,应立即停止对硬盘的读写操作,并根据损坏类型选择逻辑层恢复工具或专业物理恢复服务。紧急处置措施立即停止通电使用:发现硬盘异响、无法识别或数据异常时,需立即断开连接,...

蓝宝石B850A WIFI主板新玩法:内存小参调节体验

蓝宝石前段时间发布了一款性价比极高的主板:NITRO氮动B850AWIFI主板。这款主板的售价只要1349元,相比普遍1500元以上的B850主板,确实极具竞争力。虽然价格实惠,蓝宝石NITR...

内存卡损坏读不出怎么修复?这5个数据恢复工具汇总,3秒挽回!

在数字化生活的浪潮中,内存卡凭借小巧便携与大容量存储的特性,成为相机、手机、行车记录仪等设备存储数据的得力助手,承载着无数珍贵回忆与重要文件。然而,当内存卡突然损坏无法读取,无论是误删、格式化、病毒入...

内存卡修复不再难,2025年必学的6款软件工具

内存卡出现问题时,通常是因为文件系统损坏、物理损坏或病毒感染。通过专业的修复工具,我们可以尝试恢复数据并修复内存卡。内存卡修复利器:万兴恢复专家万兴恢复专家是一款功能强大的数据恢复软件,支持多种设备和...

有5款内存卡修复工具汇总,内存卡数据轻松找回!

在如今的数字时代,内存卡作为不可或缺的存储介质,广泛应用于相机、手机、行车记录仪等各类设备中,承载着我们珍贵的照片、视频以及重要文件。然而,数据丢失的风险却如影随形,误删、格式化、病毒入侵、硬件故障等...

揭秘:如何通过多种方式精准查询内存条型号及规避风险?

以下是内存条型号查询的常用方法及注意事项,综合了物理查看、软件检测、编码解析等多种方式:一、物理标签查看法1.拆机查看标签打开电脑主机/笔记本后盖找到内存条,观察标签上的型号标识。例如内存标签通常标...

内存卡数据恢复5个工具汇总推荐,轻松找回珍贵记忆!

在这个数字化时代,内存卡作为我们存储珍贵照片、重要文件的常用载体,广泛应用于手机、相机、平板电脑等设备。但数据丢失的意外却常常不期而至,误删除、格式化、病毒攻击,甚至内存卡的物理损坏,都可能让辛苦保存...

电脑内存智能监控清理,优化性能的实用软件

软件介绍Memorycleaner是一款内存清理软件。功能很强,效果很不错。Memorycleaner会在内存用量超出80%时,自动执行“裁剪进程工作集”“清理系统缓存”以及“用全部可能的方法清理...

TechPowerUp MemTest64:内存稳定性测试利器

TechPowerUpMemTest64:内存稳定性测试利器一、软件简介TechPowerUpMemTest64,由知名硬件信息工具GPU-Z的出品公司TechPowerUp发布,是一款专为64位...

微软推出AI恶意软件检测智能体Project Ire,精确度高达98%

IT之家8月6日消息,当地时间周二,微软宣布推出可自主分析恶意软件的AI检测系统原型——ProjectIre。该项目由微软研究院、Defender研究团队及Discovery&a...

农村老木匠常用的20种老工具,手艺人靠它养活一家人,你认识几种

生活中的手艺老匠人是非常受到尊敬和崇拜的,特别是在农村曾经的老匠人都是家里的“座上宾”。对于民间传统的手艺人,有一种说法就是传统的八大匠:木匠、泥匠、篾匠、铁匠、船匠、石匠、油匠和剃头匠。木匠的祖始爷...

恶意木马新变种伪装成聊天工具诱人点击

国家计算机病毒应急处理中心通过对互联网监测发现,近期出现一种恶意木马程序变种Trojan_FakeQQ.CTU。该变种通过伪装成即时聊天工具,诱使计算机用户点击运行。该变种运行后,将其自身复制到受感染...

学习网络安全 这些工具你知道吗?

工欲善其事必先利其器,在新入门网络安全的小伙伴而言。这些工具你必须要有所了解。本文我们简单说说这些网络安全工具吧!Web安全类web类工具主要是通过各种扫描工具,发现web站点存在的各种漏洞...

5分钟盗走你的隐私照片,这个全球性漏洞到底有多可怕?

这个时代,大家对电脑出现漏洞,可能已经习以为常。但如果机哥告诉大家,这个漏洞能够在5分钟内,破解并盗取你所有加密文件,而且还无法通过软件和补丁修复...这可就有点吓人啦。事情是酱婶的。来自荷兰埃因...

取消回复欢迎 发表评论: