编辑 | 于斌
出品 | 于见(ID:mpyujian)
在IT行业中,“删库跑路”一直都是很多程序员发泄工作压力的“口头禅”。但在实际工作中,一般很少有人能真的做出这种事,因为这种行为不仅强烈违反了基本的职业操守,更是一种严重损害公司商业利益的违法行为,稍有不慎就会“牢底坐穿”。
可让人没有想到的是,这事在微盟上发生了。2月25日,微盟集团发布的一则公告引起舆论热议,微盟方面表示自己的系统生产环境数据不幸遭遇员工“恶意破坏”, 因个人精神、生活等原因,微盟研发中心运维部核心运维人员贺某于此前登入公司内网跳板机,对微盟系统生产环境进行了大肆破坏。
在“内鬼”的恶意破坏之下,近年来发展迅猛的SaaS服务“新贵”微盟集团遭遇这种事情显然颇显无奈。不可否认的是,微盟的相关用户数据与公司正常经营也势必会在短时间内遭受影响。
但话说回来,因为内部员工恶意破坏致使整个集团系统被破坏乍听起来很“不可思议”,但实际上在业内是时有发生的,此前就有过多次其他公司内部员工因企业纠纷采取删数据、破坏系统等激进行为的新闻报道。
比如在2015年5月,携程官方网站及APP曾大面积瘫痪,无法正常使用。事后携程说明原因,称经技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
从携程的案例来看,数据丢失是企业在信息化时代都避免不了的问题,连OTA巨头携程都会遇到这样的严重事故。在这场事件当中,除了感慨微盟集团的“运气”不好,行业内更应该反思的是对于企业系统权限管理、备份以及应急处置的提前布局。只有这样,才有可能在以后尽量避免类似情形的再次发生。
系统被员工恶意破坏,微盟火速应对
核心运维人员恶意破坏的后果无疑是严重的,此举导致微盟公司系统出现了大面积的服务集群无法响应,大量用户数据被删除,相关服务商户的正常经营行为受到严重影响。
所幸的是,微盟方面第一时间收到了系统监控报警,也立刻启动了紧急响应机制,它与腾讯云技术团队正在一起研究制定生产环境和数据修复方案。
根据官方公告信息显示,预计到2月28日24点前,相关损坏和数据恢复工作将会完成,而在中间这段时间内,微盟将提供临时过渡方案,还会针对此次受到不同程度影响的商户拟定相关赔付方案。
从结果上看,尽管遭遇核心运维人员恶意破坏很无奈,但微盟方面的反应也还算得上迅速,再加上腾讯云技术团队方面的大力协助,相信微盟将很快会完成相应的数据恢复、系统恢复工作,所造成的相关商户损失也会控制在有限的范围之内。
作为“腾讯系”企业,随着企业数字化升级和广告营销需求的持续增长,微盟集团正持续受益于与腾讯等巨头的合作,它近些年在SaaS、精准营销市场中保持着高速的增长态势。
在“新经济SaaS第一股”的盛名之下,微盟集团自赴港上市以来在公司业绩和股价方面的表现均比较良好。只是没有想到的是,正在企业一片欣欣向荣之时,它却遭遇了如此“尴尬”,只能说希望微盟能够尽快解决好此事所带来的负面影响,积极吸取经验教训,在未来继续保持好自己的上升势头。
任何企业都难以避免的“意外”之下,反思才是重点
对于类似这次微盟系统遭恶意破坏事件,相信不管是微盟还是其他SaaS类服务企业,它们一定是在技术机制、企业文化等各层面严格要求了自身的数据安全、技术安全的。但同时也需要承认的是,即便拥有再强的技术研发实力、企业管理机制,这种内部核心员工“犯罪式”恶意破坏的事件也难免会出现“百密一疏”的情况。
有鉴于此,在任何企业都难以避免的这种“意外”之下,遭遇危机之后的及时响应与反思才是重点。只有积极吸取经验教训,才有可能在未来让自己的系统安全“护城河”更加牢固。
人的一生有高光有低谷,企业也是如此,作为SaaS第一股的微盟,我相信以它精湛的技术、无双的品牌和合理的运营方式,会再次像火箭一样向上冲锋。
总的来说,这次微盟事件给到业界的一大思考就是,如何在系统权限、数据备份和应急处理上下足功夫才能有效避免此类事件的发生?或者即便发生可以更快地实现数据恢复、系统恢复?这些问题都给相关行业的系统服务提供商敲响了警钟。
从专业建议上来看,为了避免、减少类似事件的影响,企业可以在系统安全保障体系的建设上进行以下几个维度的深入思考。
首先,企业账户需要严格分等级、分权限、分体系设定,比如要限制研发人员对数据库本身进行操作,从技术上限制他们只能通过页面级的控制台进行数据项的更新及简单运维操作,部分敏感表或数据项的操作需主管审批。
其次,生产环境管理制度需要确保每一步操作都被执行规范,并被纳入监管。比如一般技术人员访问生产环境,只能指定机器、指定账号进行登录,且部分登录需执行主管审批流程。
而后,还要设立机房管理制度、不同级别和不同维度的备份机制等,尤其是核心数据,至少要实时保障2到3份以上的异机、异地备份。
另外,设立系统数据快照机制,强制执行数据快照,此举可以保证一般人员无法直接修改或干预系统数据。与此同时,还可以通过实时监控、利用大数据和AI等来实现智能风控,当频繁涉及对敏感数据的操作时,给予告警、暂停、走审批等流程的风控策略。
最后跳出技术本身的限制上来,就像前面所说,再好的技术与机制都可能会有“百密一疏”的情况,毕竟人类的智慧是无穷的,意外性的“内鬼”更是防不胜防,这就需要企业在安全意识和警示培训上进行不定期进的宣传,尤其是真实案例的宣讲。
当后续被追责的意识被警示案例深入到人心,再辅以定期的安全演练,针对机房断网、断电、丢数据、服务掉线等进行联合操演,以及定期的线上考核培训等。以此从根本上让员工明白:恶意破坏系统的影响是有限的,但所需承担的后果是极为严重的。