您好,欢迎访问数据库运维|优化|安装|迁移|服务官网!
13261661949
墨菲定律之运维惨案数据库损坏+备份“哑火”-行业新闻-数据库运维|优化|安装|迁移|服务_uDBok.com

新闻动态

联系我们

墨菲定律之运维惨案数据库损坏+备份“哑火”-行业新闻-数据库运维|优化|安装|迁移|服务_uDBok.com

地址:北京市昌平区高新经济开发区
手机:13261661949

咨询热线13261661949

墨菲定律之运维惨案数据库损坏+备份“哑火”

发布时间:2021-02-23 01:28:48人气:2425

信息安全如同一个木桶,整个防护体系是否巩固完全取决于短板。因而即便网络层、操作体系的安全防护已相对完善,可假如真正存放中心信息的数据库体系得不到应有的保护运维数据库,照样会带来欠好的影响。
数据库损坏产生的后果,不止是机密数据泄露导致商业诺言受损,更多的是导致组织无法正常作业,影响事务工作。
上一年,暴雪文娱与网易公司旗下的《炉石传说》由于遭受数据库毛病而终究不得不挑选服务器归档——意味着只保存前史归档数据。
为什么暴雪文娱与网易公司这样的游戏行业领导者,仍会遇到数据库损坏,而且没有进行数据备份这样的事端呢?

运维数据库

 
事情回忆
在某个周六下午,当时没有太多的人在加班。15:20数据库由于供电意外中断的原因而产生毛病,导致数据损坏。
暴雪与网易的工程师们来不及反思数据损坏产生的原因,第一时间着手进行抢修——重启数据库而且测验数据康复。看起来问题应该很快就可以处理。
但不幸的是,由于相关备份数据库也呈现毛病,这些测验均未成功。
暴雪文娱与网易测验了各种处理方案仍未能有效处理数据损坏事端。此刻,服务器的保护时间也已超过24小时。服务中断,用户仍焦急等候,直接收入丢失预计达数百万。终究不得已经过数据归档——游戏回档的方式让服务器持续作业。
过后,暴雪文娱与网易公司也以为呈现这样的事端是不可接受的。
事情反思
回过头来看暴雪与网易的数据库事端,“周末”、“停电”、“数据库毛病”、“备份数据库毛病”、“数据康复失利”一系列低概率的事情不约而同的在同一时间产生。咱们是不是以为太匪夷所思了,其实不然。
一开始咱们提到了墨菲规律:假如事情有变坏的或许,不论这种或许性有多小,它总会产生。咱们可以得出这样一个结论:技能危险可以由或许性变为突发性的事实。
经过检讨并学习此次事端所带来的经历,咱们需求更注重优化的监测。IT负责人经过监测能否回答好两个问题是要害。数据库是否安全?备份数据是否安全?
IT 运维 2.0
       IT运维2.0年代,需求重视不同人物的数据需求,过多实时的数据一则成本高,二则干扰大。此刻,需求区分不同人物的数据需求,一线运维人员更多的是看服务状况,因而需求设置实时告警的信息;上层的运维管理人员期望看到的是服务周期性的状况、趋势和比照。
假如把数据库比作库房,那么备份体系就如同消防栓相同,是最终的一道安全线。一旦产生严重险情,需求经过消防栓进行灭火。仅仅布置了消除栓是不行的,库房管理员依然需求时间重视库房的各项反常指标,例如温度、湿度等;安全管理员则需求定时查看消防栓。这两项作业作为日子中有必要的两道程序,关于存放着中心信息的数据库体系却没有标准到位。
在这种情况下,一旦呈现数据库毛病,IT运维人员能否及时发现问题、第一时间智能定位问题、在最短的时间内快速处理问题?在数据库无法修正的情况下,备份数据是否正确?备份是否完全?数据康复是否可以顺畅处理毛病?这关于大多数IT运维都是难以回答的问题。
AnyRobot日志云以数据库安全为中心,供给数据库安全双重保障。
       一、保障数据库自身安全
AnyRobot 内置数据库反常检测引擎、数据保护引擎,可以实时监控数据库安全,第一时间发现数据自身层面上的数据反常、内部层面上的违规操作、外部层面上的侵略检测。一起,使用机器学习危险猜测,为管理员供给安全改善办法及危险预防办法的告警。管理员收到告警后,AnyRobot为用户供给以告警目标为中心的可视化报表。“哪台数据库主机有问题”、“那个数据库实例有问题”,管理员一望而知。完结定位后,AnyRobot可以捕获反常要害日志及信息,协助管理员在最短的时间内处理问题,管理员也可以经过联系图谱、安全报表、机器学习等途径进行深度下钻,发掘危险来源。
       二、灾备可视化,深度保障灾备数据安全
企业布置了灾备体系,不能停留在只设置备份使命或许只重视备份完结情况。这是远远不行的,网易的数据库事端便是一个很好的比如。关于灾备体系首先要做到灾备可视化,了解备份功率、数据积压、灾备成效等。其次还需求对备份的有效性进行深度透视,例如在体系定时停机断电前,是否可以及时完结备份,断电突发导致的事端需求保证备份办法可以依然有效。
AnyRobot 日志云功用优势介绍
      • 秒级布置,会集统一管理
• 数据安全可视化
• 全方位告警中心+机器学习危险猜测
• 联系图谱——探索式相关剖析
• 机器学习——备份积压危险猜测、数据库危险猜测
       一.秒级布置,会集统一管理
收集演示
运维管理员在AnyRobot日志云界面上可以完结秒级布置,无需复杂的配置操作。经过简略的输入项就可以在最短的时间内,把所有的数据库、备份体体系一管理起来,协助管理员防止了复杂而又很多的服务器、体系布置作业。
       二.数据安全可视化
部分可视化剖析视图展现
AnyRobot 日志云为用户供给开箱即用的数据库安全可视化报表、灾备可视化报表。
数据库安全可视化可以实时监控数据库安全。数据库安全作为数据安全的要害,需求在日常作业中时间重视。AnyRobot日志云一旦呈现数据危险,当即发送告警告诉体系管理员;协助运维人员及时发现问题,然后智能定位问题,最终快速处理问题;结合内置的告警战略、机器学习危险猜测为数据库安全保障供给了囊括“事前-事中-过后”的标准处理思路。
灾备可视化可以实时监控灾备体系工作状况。灾备作为企业数据安全的生命底线,需求保证可以在要害时间正常作业。AnyRobot日志云让管理员在实时掌握备份动态的一起量化衡量备份的价值,例如备份功率怎么、是否存在数据积压、备份成效怎么、能否保证发挥备份功用等候一系列的灾备盲点。
       关于不同的人物,AnyRobot 可视化报表供给了不同视点的价值。
运维管理员对数据安全、备份数据安全一望而知,可以清楚地看出体系是否在稳定工作。一起支撑大屏展现。
运维人员经过可视化报表,可以快速进行查看作业。对很多的数据库、备份数据库完结统一管理,进步运维功率。一旦收到AnyRobot的数据安全警报,可以第一时间智能定位毛病数据库,而且日志云能供给信息协助运维人员在最短的时间内排除毛病,防止影响事务正常工作。
       三.全方位告警中心+机器学习危险猜测
部分告警战略展现
AnyRobot 供给一整套开箱即用的智能告警战略,一起支撑数据行为基线剖析、机器学习危险猜测告警。在全方位覆盖数据库安全危险的一起可以做到智能化猜测剖析数据库安全状况,经过行为基线剖析和机器学习,确定数据库中潜在的危险并进行剖析和猜测。
一旦呈现数据库危险和备份危险,AnyRobot会当即发送告警告诉管理员,管理员经过可视化报表和联系图谱可以快速定位和处理问题。
       四.联系图谱——探索式相关剖析
联系图谱将单一文字式记录的日志,进行体系化、头绪化的联系图谱相关剖析。可以协助管理员完结数据库告警溯源,而且明晰灾备使命履行概览;不仅如此,联系图谱真正做到让管理员从海量的日志记录中解放出来,经过以告警为中心的相关剖析,完结快速排障和溯源剖析。
备份使命呈现反常情况时,是什么原因导致的?除了体系危险还或许存在人为危险,例如操作不妥或许歹意修正备份战略、备份目标犯错等等。经过联系图谱可以以管理员或许以使命为中心打开相关剖析。可以清楚地看到管理员对哪些目标做了具体什么操作?备份使命什么时候被创建了、什么时候被修正了、什么时候被暂停了、什么时候被删除了。协助管理员完结从事务视点对备份效果进行相关剖析。
       五.机器学习——备份积压和数据库危险猜测
AnyRobot内置反常检测引擎,可以对数据库危险、灾备危险进行猜测。
在备份过程中,往往存在数据积压,怎么积压过多或许备份不及时,那么关于数据安满是一种潜在的危险。
AnyRobot可以猜测未来数据积压情况和备份完结度。假如未来数据积压过多,那么管理员可以依据猜丈量增大备份速度或许合理增加备份主机;积压的数据需求多久才可以清空,假如在数据保护和物理断电前无法完结,那么管理员有必要及时采取办法,保证备份体系能在产生保护意外、断电意外导致的数据事端时正常作业。
经过机器学习还可以对数据库安全进行危险猜测,自学习危险趋势、危险模型,对数据库潜在的危险进行告警,可以有效协助运维管理员提前对体系进行调优、排障,从而防止了潜在的数据损坏危险。
总结
回忆上一年暴雪文娱和网易公司产生的数据库事端,关于企业来说是一类应该防止且可以防止的事端。AnyRobot关于这类事端,可以供给多场景、全方位、多人物的应对战略。
在日常运维中,经过安全可视化报表对数据安全一望而知,而且为用户监控“备份安全底线”。在事前防止潜在的数据危险,在事中协助企业快速定位问题、处理问题,在过后可以供给深度的剖析报表、协助企业事端溯源的一起改善安全战略。

推荐资讯

13261661949