昆山seo网站优化软件,北京网站建设 网络推广,上海公交建设公司官网,下载软件用哪个软件好http://www.infoq.com/cn/news/2018/01/netflix-engineering-culture 在技术圈儿#xff0c;Netflix 是一家非常有特色的互联网公司。他们信奉“自由与责任”的企业文化#xff0c;鼓励工程师发挥自己的爱好与特长#xff1b;特别开放#xff0c;很多内部系统都开源了…http://www.infoq.com/cn/news/2018/01/netflix-engineering-culture 在技术圈儿Netflix 是一家非常有特色的互联网公司。他们信奉“自由与责任”的企业文化鼓励工程师发挥自己的爱好与特长特别开放很多内部系统都开源了所有业务都运行在云上随之而来有很多自己的工具特色的运维文化。 在明年 4 月 2022 日的 QCon 北京 2018 上我们有幸邀请到 Netflix 工程总监 Katharina Probst她将分享 Netflix 的工程文化以及运维方面的理念和经验。 InfoQ 曾有文章介绍 Netflix 的企业文化技术漫谈为什么Netflix的企业文化会备受整个硅谷的推崇而这次Katharina 将现场分享《工程文化挖掘工程师的最大价值》。 丹尼尔·平克的《驱动力》一书指出了如何提高绩效、焕发热情的三大要素自主Autonomy、专精Mastery和目的Purpose。本次演讲也将从这三个方面出发探讨如何让工程师发掘出自己的最大潜能。 自主设定良好的环境但是不控制目标的日常执行。专精为每个人提供锻炼技能的条件并对成长提供反馈。目的将工程师连接起来为公司的使命而奋斗。Katharina 还曾撰文介绍 Netflix 背后独特的运维理念。 在Netflix“自由与责任”的价值观体现的淋漓尽致。一方面工程团队可以自由地向产品添加功能和服务不需要审批和繁琐的程序。另一方面作为产品的所有者要负责服务的运维和支持。 优势当然是各团队可以灵活快速地实现新功能。当然有利就有弊整个系统的规模也随之爆炸性增长没有人能记着所有系统的所有变更。 这种情况下Netflix 是如何保证其服务的高可用性和用户体验的呢秘密就在于 Netflix 的 CORE SRE 团队。 SRE 是指 Site Reliability Engineer (网站可靠性工程师)。这个概念大家应该并不陌生。 CORE 是几个单词的首字母缩写Cloud云、Operations运维、Reliability可靠性、Engineering工程。一语双关既可以看成“云运维可靠性工程”也可以看成“核心”。 这个团队非常小不到 10 个人。虽然人少但是都是骨干人才。可以把这个团队看作 Netflix 服务的中枢神经系统。这个团队是干什么的呢 他们要尽可能多的从整体上把握 Netflix 的系统进而让系统更好、更可靠。具体而言其工作是 理解事故incident发现事故和健康运维状况下的模式将模式转变成工具和最佳实践防患于未然。理解事故 事故发生时SRE 往往是第一响应人。这个人要定位问题深入了解事故确定严重等级看看应该找谁来解决问题。要找的人可能是服务的所有者或者外部合作伙伴比如设备供应商。 CORE SRE 团队要根据自己对整个系统的理解决定在既定情况下采用哪种缓解策略最好比如把流量切到其他区域。 发现事故和健康运维状况下的模式 事故解决后SRE 的工作才算真正开始。下一步是仔细研究事故提很多问题。比如 • 事故是什么原因导致的 • 我们之前怎么做能够避免这次事故 • 是不是有某个最佳实践并没有遵守 • 是不是团队遵守了某个最佳实践但是没起到预期效果 • 团队应该怎么做以避免再次发生类似事故 • 在事故发生时我们掌握了哪些信息能让我们更快地理解事故原因 • 有什么工具可以帮我们降低事故严重性和持续时间 • 这种问题之前发生过吗有没有什么模式 • 卷入事故的团队是不是犯了更多主动失误发生了什么 除了提问分析还要分析事故数据发现模式。 将模式转变成工具和最佳实践防患于未然 让 Core SRE 团队和关键工程团队配合工作一方面 SRE 团队可以更好地理解痛点一方面也可以传达最佳实践等理念。 工具建设收集各方面指标这个就不一一具体介绍了。 在现场Katharina 将为我们具体阐述背后的各种理念和做法。 2018QCon全球软件开发大会北京站目前正在8折报名中感兴趣的不要错过。有任何问题可咨询购票经理Hanna电话15110019061微信qcon-0410。转载于:https://www.cnblogs.com/linkenpark/p/8472368.html