-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
SRE工程师应知应会97件事 版权信息
- ISBN:9787519876319
- 条形码:9787519876319 ; 978-7-5198-7631-9
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 所属分类:>>
SRE工程师应知应会97件事 本书特色
编辑推荐
站点可靠性工程(SRE)比以往任何时候都更加重要。知道如何保持系统的可靠性,已经成为了一项关键技能。有了这本实用性很强的书,新手和老手都将能了解到许多在 SRE场景中发生的对话。你将获得关于多个主题的可操作建议,包括如何采用SRE、为什么SLOS很重要、何时需要升级事件响应机制,以及监控和可观测性有何不同等。
专家推荐
测试你的灾难恢复计划。
——Tana Reilly
将同理心融入到SRE工具中。
——Daniella Niyonkuru
我能给团队的z佳建议。
——Nicole Forsgren
在哪里进行SRE。
——Fatema Boxwala
面对第d一页。
——Andrew Louis
预算有误,现在该怎么办?
——Alex Hidalgo编辑推荐
站点可靠性工程(SRE)比以往任何时候都更加重要。知道如何保持系统的可靠性,已经成为了一项关键技能。有了这本实用性很强的书,新手和老手都将能了解到许多在 SRE场景中发生的对话。你将获得关于多个主题的可操作建议,包括如何采用SRE、为什么SLOS很重要、何时需要升级事件响应机制,以及监控和可观测性有何不同等。
专家推荐
测试你的灾难恢复计划。
——Tana Reilly
将同理心融入到SRE工具中。
——Daniella Niyonkuru
我能给团队的z佳建议。
——Nicole Forsgren
在哪里进行SRE。
——Fatema Boxwala
面对第d一页。
——Andrew Louis
预算有误,现在该怎么办?
——Alex Hidalgo
让你的工作得到认可:写一个充分展示自我的文档。
——Julia Evans,Karla Burnett
SRE工程师应知应会97件事 内容简介
Incident Labs的联合创始人 Jaime Woo和Emil Stolarsky从整个行业收集了97条简单实用的技巧,包括值得信赖的*z佳实践和解决棘手问题的新方法。通过了解发人深省的推动领域发展的问题,以及我们给出的合理建议,你将会提高和完善你的 SRE 技能。
SRE工程师应知应会97件事 目录
前言 1
第1 章 用六个词来概括站点可靠性工程 6
Alex Hidalgo
第2 章 知道我们为什么真的需要可靠性么? 8
Niall Murphy
第3 章 构建自调节过程 10
Denise Yu
第4 章 SRE 家宴上的四个工程师 12
Jacob Scott
第5 章 可靠性堆栈 14
Alex Hidalgo
第6 章 基础设施:这就是力量所在 16
Charity Majors
第7 章 关于弹性的思考 18
Justin Li
第8 章 开发周期中的可观测性 20
Charity Majors, Liz Fong-Jones
第9 章 一切都是可以理解的 22
Bouke van der Bijl
第10 章 Wikipedia 是如何为你服务的 24
Effie Mouzeli
第11 章 为什么你应该对TCP 有所了解? 27
Julia Evans
第12 章 管理接口的重要性 30
Salim Virji
第13 章 说到存储,请考虑分布式 32
Salim Virji
第14 章 数据基数的作用 34
Charity Majors, Liz Fong-Jones
第15 章 安全就像洋葱 36
Lucas Fontes
第16 章 用话语记录 38
Tanya Reilly
第17 章 通往SRE 之路 40
Fatema Boxwala
第18 章 亲爱的未来团队 42
Frances Rees
第19 章 可持续性与职业倦怠 44
Denise Yu
第20 章 不要听从老师傅的建议 46
John Looney
第21 章 面对次的事故呼叫 48
Andrew Louis
第22 章 SRE,文化至上 50
Matthew Huxtable
第23 章 在小型组织中人人都是SRE 52
Matthew Huxtable
第24 章 审计你的环境以促进改善 54
Joan O’Callaghan
第 25 章 事故响应,从小处着手 56
Thai Wood
第26 章 独当一面的SRE:独自一个人影响大规模的变革 58
Ashley Poole
第27 章 设计SLO 度量的目标 60
Ben Sigelman
第 28 章 我有错误预算——现在怎么办 62
Alex Hidalgo
第29 章 如何改变现状 64
Joan O’Callaghan
第30 章 问题定位方法论 67
Avishai Ish-Shalom, Nati Cohen
第31 章 初创公司如何建立 SRE 思维 69
Tamara Miner
第32 章 自力更生,在企业中落地SRE ! 71
Vanessa Yiu
第33 章 不知道没关系,出错也没关系 73
Todd Palino
第34 章 讲故事是一种超能力 75
Anita Clarke
第35 章 让你的工作得到认可: 写一份自夸的文档 78
Julia Evans, Karla Burnett
第36 章 让大家看到你的工作成果 81
Lorin Hochstein
第37 章 被忽视的工程技能 84
Murali Suriar
第38 章 卸下远程值守的包袱 86
Jason Hand
第 39 章 事件处理大师 88
Andrew Louis
第40 章 毫不费力的事件管理 90
Suhail Patel, Miles Bryant, Chris Evans
第41 章 如果你在做运行手册,就把它们做好 92
Spike Lindsey
第 42 章 为什么我厌恶我们的流程手册 94
Frances Rees
第43 章 什么样的工具运行良好 97
Michelle Brush
第44 章 将同理心注入SRE 工具 99
Daniella Niyonkuru
第45 章 使用ChatOps 来实现共情 102
Daniella Niyonkuru
第46 章 迅速行动,唯快不破 104
Michelle Brush
第 47 章 能在生产系统中运行才算确认 106
Ingrid Epure
第 48 章 有时候修复本身就是问题 108
Jake Pittis
第49 章 传奇故事 110
Elise Gale
第50 章 监控指标不是SLI( 衡量一切的陷阱) 112
Brian Murphy
第51 章 当SLO 遭受质疑时如何去改善 114
Narayan Desai
第52 章 产品可靠性的整体方法 117
Kristine Chen, Bart Ponurkiewicz
第 53 章 寻找失去的时间 120
Ingrid Epure
第54 章 答疑时间的意外收获 122
Tamara Miner
第55 章 为内部客户建立他们真正想要使用的工具 124
Vinessa Wan
第56 章 个体和交互那些事 126
Vinessa Wan
第57 章 SRE 的人员能力基线 128
Effie Mouzeli
第58 章 远程高效或高效远程 130
Avleen Vig
第 59 章 余量和个体132
Kurt Andersen
第 60 章 系统余量的重要性 134
Kurt Andersen
第61 章 更少的电子表格,更多的餐巾纸 136
Jacob Bednarz
第62 章 巧妙地引入DevOps 138
Vinessa Wan
第63 章 在企业中有效的SRE 文化变革 140
Vanessa Yiu
第64 章 献给我爱的所有SRE 142
Felix Glaser
第65 章 复杂:技术中超负荷的词语 145
Laura Nolan
第66 章 我给团队的好建议 147
Nicole Forsgren
第67 章 创造你的工作清单 149
Daria Barteneva, Eva Parish
第68 章 按照SLO 操作 151
David K Rensin
第 69 章 英雄是必要的,英雄主义却不是 153
Lei Lopez
第70 章 人们愿意参加的值班工作 155
Miles Bryant, Chris Evans, Suhail Patel
第71 章 学习研究人的因素和团队文化,进而改善呼叫器的疲劳度 157
Daria Barteneva
第72 章 优化恢复的平均时间 159
Spike Lindsey
第73 章 减轻和预防级联故障 161
Rita Lu
第74 章 实时健康度:可以衡量的指标 163
Caitie McCaffrey
第75 章 帮助领导者优先考虑实时健壮性的问题 165
Caitie McCaffrey
第76 章 作为外交官的SRE 168
Johnny Boursiquot
第 77 章 前瞻性部署的SRE 170
Johnny Boursiquot
第78 章 检验你的灾备计划 172
Tanya Reilly
第79 章 为什么对于SRE 实践来说培训是重要的,
并且对于培训课程来说SRE 很重要 174
Jennifer Petoff
第80 章 单一化的力量 177
Chris Evans, Suhail Patel, Miles Bryant
第81 章 每个用户价值对应的字节数 179
Arshia Mufti
第82 章 把工程博客提上议事日程 181
Anita Clarke
第83 章 要让任何人在你的上下文里运行代码 183
John Looney
第84 章 交易场所:站点可靠性工程和产品 185
Shubheksha Jalan
第85 章 透过团队看产品 187
Avleen Vig
第86 章 性能储备金 189
Dawn Parzych
第87 章 重要但不紧急:SRE 路线图 191
Laura Nolan
第88 章 那些50% 的事儿 193
Tanya Reilly
第89 章 遵循安全关键系统之路 195
Heidy Khlaaf
第90 章 适合且可实现的静态分析 197
Heidy Khlaaf
第91 章 形式化规范的重要 200
Hillel Wayne
第92 章 社会技术系统中的风险与腐烂 202
Laura Nolan
第93 章 危机中的SRE 204
Niall Murphy
第94 章 预期的风险限制 206
Blake Bisset
第95 章 跨越局部风险:细数愤怒的小鸟 208
Blake Bisset
第96 章 来自软件安全专业人士的一些建议 210
J Paul Reed
第97 章 故障:让我们有机会一窥缺陷 212
Lorin Hochstein
第98 章 第三代SRE 214
Bj?rn “Beorn” Rabenstein
作者介绍 216
编者介绍 237
SRE工程师应知应会97件事 作者简介
Emil Stolarsky是一名SRE工程师,曾在Shopify和DigitalOcean的负责Kubernetes平台工作,负责缓存、性能和灾难恢复。业余时间里,他会听Flume的音乐,并通过攀岩来克服恐高症。Jaime Woo的职业生涯始于分子生物学,之后他热衷于讲故事,在DigitalOcean、Riot Games和Shopify 工作过,在那里他又重新开始了工程通信方面的工作。他是一位获得奖项提名的作家,也特别爱吃饺子。
- >
有舍有得是人生
有舍有得是人生
¥14.4¥45.0 - >
莉莉和章鱼
莉莉和章鱼
¥14.3¥42.0 - >
诗经-先民的歌唱
诗经-先民的歌唱
¥13.5¥39.8 - >
朝闻道
朝闻道
¥15.0¥23.8 - >
名家带你读鲁迅:朝花夕拾
名家带你读鲁迅:朝花夕拾
¥10.5¥21.0 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥13.5¥24.0 - >
月亮虎
月亮虎
¥14.4¥48.0 - >
二体千字文
二体千字文
¥14.0¥40.0
-
网络工程师教程(第2版)
¥69.3¥99 -
Python 数据分析基础
¥41¥69 -
Python 3.5从零开始学
¥26.4¥59 -
虚拟化与容器技术
¥49.9¥69.8 -
UG NX 11.0工程图教程-(含1DVD)
¥30.4¥59.9 -
程序设计语言编译原理(第3版)
¥25.4¥39