3000元建设个人网站,域名解析错误是网络问题还是电脑问题,微网页制作模板,长沙形友网络科技有限公司摘要#xff1a; “太刺激了#xff0c;太刺激了#xff01;如果那个48%真出问题#xff0c;整个安全部的双11就可能是3.25#xff01;”
“太刺激了#xff0c;太刺激了#xff01;如果那个48%真出问题#xff0c;整个安全部的双11就可能是3.25#xff01;”知命推了…摘要 “太刺激了太刺激了如果那个48%真出问题整个安全部的双11就可能是3.25”
“太刺激了太刺激了如果那个48%真出问题整个安全部的双11就可能是3.25”知命推了推眼镜语速明显快了一些。伴随着肢体语言知命表现出来的是程序员解除了重大Bug时的那种兴奋与激动。
用这部IMDB评分最高的电影向阿里安全的工程师致敬
MTEE3是什么那个48%又是什么鬼
知命阿里安全业务安全产品技术高级专家智能风控平台MTEE3的技术负责人。这一切他向我们和盘托出。
MTEE3性能、智能双重加持
MTEE3的中文名称叫业务安全智能风控平台最后面的3代表这是全新一代的3.0系统。这套系统的功用是为阿里经济体的各类核心业务提供账号安全、黄牛刷单、活动反作弊、内容安全、人机识别等几十种风险的防护与保障。据悉在2017天猫双11当天MTEE3处理了超过300亿次的业务风险扫描扫描峰值超过200万次/秒这组数据在全球来看也是独一无二的同时也证明了系统的性能非常强悍。
为了便于我们更了解知命先做了业务安全的概念普及。
“MTEE3是业务层的安全防控平台。”知命向笔者解释道。据知命介绍从业务层来看传统的安全威胁如盗号、垃圾账号通过机器批量申请的帐号等对于网站的正常运营是有影响的。黑灰产利用这些账号来抢红包、薅羊毛。
“防羊毛党我们叫营销反作弊还有就是黄牛党我们的平台有很多热销产品比如酒水、手机等还有识别机器行为的人机防控还有就是内容方面的防控。这些都是在网络层以上的我们叫业务安全。”知命说。
据介绍阿里的业务安全基于大数据实时分析建模技术通过每个用户行为背后数千个数据指标的实时计算利用规则引擎、模型引擎、关系网络、团伙分析、设备画像、语义分析、机器视觉等技术对风险进行快速有效的防控而运行的平台就叫MTEE3。MTEE3上部署了大量的规则和模型为阿里经济体多个业务提供防护。“我们将用户的行为称为‘事件’比如用户的注册、登录、修改基础信息、聊天、下单、支付、发货、收货、评价等等每个行为点上我们都会去进行防控。”知命告诉笔者正是因为进行全链路的防控所以MTEE3能够“轻易地”识别出恶意账号等。
MTEE3的“轻易地”还包含了其毫秒级的响应能力今年双11MTEE3将下单环节的风险扫描控制在10毫秒左右用户几乎无感知。
综上所述MTEE3的性能是非常强大的但除此之外它还具备了智能的特性。对此知命也进行了详细的解释。
对于正常的用户、机器账号抑或是黄牛MTEE3会分析很多的变量指标然后综合进行判断。这些变量有多个维度这些维度包括有账号、设备、环境、内容以及用户的行为等。
“MTEE3对这些信息进行实时的计算和分析而且这个过程需要在极短的时间内完成。”知命说。
知命表示MTEE3都是基于信息流的计算它并不是将所有的数据保存下来然后再通过数据库去查询因为这样效率会非常低。阿里安全的工程师赋予MTEE3的是一边计算一边存储的模式经过计算后得出结论然后将结果返回给交易最后再存下来。“MTEE3其实具备的是流式计算的能力。”知命说。
知命告诉笔者基于规则和模型的安全防控基本上历年都在用。而今年安全策略中心团队在双11智能化上的突破是全新启用了决策天平利用机器学习算法进行智能化决策并在双11中使用首战告捷。决策天平综合考虑风险防控、用户体验、商业考量等多方面因素利用全局寻优算法计算当前最优解并考虑到风险分布的变化利用强化学习对最优解进行修正产出下一时刻的风险处置决策通过系统自动化执行决策同时利用实时计算做到了秒级的决策方案更新。决策天平打造了未来风控模式的雏形。
“刺激的”2017双11
对于知命和他的团队来说2017年的双11是相当“刺激”的。
首先他们要解决性能的问题。如果只是简单地叠加资源比如增加服务器数量这个问题看上去似乎也不是那么的难。然而事实却是知命面对的是资源的增长只有那么一点点但要求的指标比如交易峰值却是要比去年双11翻倍。
这个问题怎么解
阿里安全的工程师对计算引擎进行了完全重写方式的改造目的就是让它算得更快性能提升100%有余同时对策略体系的部署进行优化而与其他安全防护层比如网络层进行实时联动提升整体的效率。
另外2017双11安全策略中心团队和产品技术团队一起针对策略体系也进行了重构改造建立起层次化、体系化的策略架构去除策略孤岛规则和机器学习模型有机组合筑起全新的防控大坝提升对风险的覆盖率和精准度。
知命告诉笔者由于补贴方案到最后两天都还会有变更因此相应的策略、模型和规则等都会产生实时的变化同时黑产从哪里来这个也无法确定。这三方面的“不确定”让阿里安全的技术团队承受着极大的压力。
然而知命和他的团队还是提出了解决方案。“由于这些不确定性所以我们今年决定要容忍一些变化。特别是计算引擎我们希望在策略变化的前提下系统的性能是能保证的资源消耗要在同一量级而不是说线性增长。”知命说。据介绍MTEE3项目团队做了相当多的工作比如将规则引擎、模型引擎进行重构改造特别是规则引擎全部重写。经过改造之后MTEE3的性能成倍增长。
“我们做这个项目双11是个重要的节点但并不是只为了它更是要为未来做准备是为了策略的重构做升级。计算引擎一直在运行运行过程中进行升级相当于是给飞行中的飞机换引擎这是相当大的挑战。”知命说。
实际上MTEE3是2017年3月份才上线的。但是到618的时候并没有被应用而99酒水节才是真正意义上的实战检验。而这次之后就是双11了。
我们非常好奇双11前夕知命和他的团队是怎样的状态和节奏
11月8日MTEE3接到最后一个需求变更。这个时间点原本是不再允许接受新的需求变更了但经过各个Leader的综合判断这个变更必须进行。
11月9日晚上十点的时候知命和小伙伴们还在反复地测试MTEE3。到了11月10日早上七点反复测试多轮所有功能点终于全部验证完毕。
一切看上去似乎风平浪静。
然而早11月10日零点的时候又发现了一个“大问题”。“安全策略工程师发现下单场景下安全防控策略存在48%的防控拦截失败最大的挑战在于阿里安全的工程师不确定究竟是所有策略出了问题还是只有一条策略是这样。但此时距离2017双11已经不足24小时。”知命说。
“本来大战前1天是希望大家休息一下了但还是赶紧把所有人叫起排查这个问题。”知命说“最后搞到11月10日凌晨三点多幸好最终查证是虚惊一场。这个是真的非常刺激”
MTEE3保护着上亿的资金如果双11当天这48%拦截失败后果无法想象。“今年跟以前不一样今年是前期的准备压力特别大。特别是那个48%太刺激了太刺激了。如果这个没防住整个安全部的双11就可能是3.25”知命说。
直到11月10日晚上知命还在和策略中心团队对焦重点防控人群的问题而最终敲定具体的策略已经是当晚八点多钟。
但真正到了11月11日零点的时候负责MTEE3系统的工程师反而放松下来。“去年我们整整待了36个小时加上跨境一共是38个小时。今年待到晚上2点多很多同学就已经可以回去睡觉了。”知命淡淡地说到。
作者华蒙