|
1 | 1 |
|
2 | 2 | [](https://creativecommons.org/licenses/by-sa/4.0/deed.zh) |
3 | 3 | [](https://github.com/StabilityMan/StabilityGuide) |
| 4 | +[](https://stabilityman.github.io) |
4 | 5 | [](https://github.com/StabilityMan/StabilityGuide/blob/master/DingGroup_2.png) |
5 | 6 |
|
6 | 7 |
|
|
15 | 16 |
|
16 | 17 | ## 加入我们 |
17 | 18 | * [GitHub 地址](https://github.com/StabilityMan/StabilityGuide) |
| 19 | +* [在线文档站(阅读体验更佳)](https://stabilityman.github.io) |
18 | 20 | * 钉钉群号 |
19 | 21 | * 30000312(2群,推荐) |
20 | 22 | * 23179349(1群,已满) |
|
23 | 25 | ## 框架目录 |
24 | 26 | ### 0. 故障案例 |
25 | 27 | ###### [【必读】故障案例征集 & Demo 模板.md](docs/case/【必读】故障案例征集&Demo模板.md) |
26 | | -###### [【案例】Dubbo 稳定性:Nacos 注册中心可用性问题复盘](docs/case/【案例】Dubbo稳定性:Nacos注册中心可用性问题复盘.md) |
| 28 | +###### [【案例】Dubbo 稳定性:Nacos 注册中心可用性问题复盘](docs/case/【案例】Dubbo稳定性_Nacos注册中心可用性问题复盘.md) |
27 | 29 | ###### [【案例】记一次线上内存报警排查过程](docs/case/【案例】记一次线上内存报警排查过程.md) |
28 | 30 |
|
29 | 31 |
|
|
47 | 49 | ###### [饿了么监控系统 EMonitor 与 CAT 的对比](docs/processing/monitor/饿了么监控系统EMonitor与CAT的对比.md) |
48 | 50 | ###### [如何专业化监控一个Kubernetes集群](docs/processing/monitor/如何专业化监控一个Kubernetes集群.md) |
49 | 51 | ###### [2021 Gartner APM 魔力象限解读](docs/processing/monitor/2021_Gartner_APM魔力象限解读.md) |
50 | | -###### [OPLG:新一代云原生可观测最佳实践](docs/processing/monitor/OPLG:新一代云原生可观测最佳实践.md) |
| 52 | +###### [OPLG:新一代云原生可观测最佳实践](docs/processing/monitor/OPLG_新一代云原生可观测最佳实践.md) |
51 | 53 |
|
52 | 54 | #### 2.2 异常巡检 |
53 | 55 | #### 2.3 流量调度 |
|
57 | 59 |
|
58 | 60 | ### 3. 事后诊断 |
59 | 61 | #### 3.1 系统诊断 |
60 | | -###### [So Hot?快给 CPU 降降温](docs/diagnosis/system/cpu/SoHot?快给CPU降降温.md) |
| 62 | +###### [So Hot?快给 CPU 降降温](docs/diagnosis/system/cpu/SoHot_快给CPU降降温.md) |
61 | 63 |
|
62 | 64 |
|
63 | 65 | #### 3.2 JVM 诊断 |
|
86 | 88 | ##### Arthas |
87 | 89 |
|
88 | 90 | #### 3.5 链路追踪 |
89 | | -###### [【剖析|SOFARPC 框架】之 SOFARPC 链路追踪剖析](docs/diagnosis/tracing/剖析SOFARPC框架之SOFARPC链路追踪剖析.md) |
| 91 | +###### [【剖析 SOFARPC 框架】之 SOFARPC 链路追踪剖析](docs/diagnosis/tracing/剖析SOFARPC框架之SOFARPC链路追踪剖析.md) |
90 | 92 | ###### [如何检测Web服务请求丢失问题](docs/diagnosis/tracing/如何检测Web服务请求丢失问题.md) |
91 | | -###### [让可观察性带上导航,快速发现和定位业务问题:OpenTracing上写入业务信息](docs/diagnosis/tracing/让可观察性带上导航,快速发现和定位业务问题:OpenTracing上写入业务信息.md) |
92 | | -###### [链路追踪(Tracing)其实很简单——初识.md](docs/diagnosis/tracing/链路追踪(Tracing)其实很简单——初识.md) |
93 | | -###### [链路追踪(Tracing)其实很简单——单链路诊断.md](docs/diagnosis/tracing/链路追踪(Tracing)其实很简单——单链路诊断.md) |
94 | | -###### [链路追踪(Tracing)其实很简单——全量存储? No! 按需存储? YES!.md](docs/diagnosis/tracing/链路追踪(Tracing)其实很简单——全量存储%3FNo!按需存储%3FYES!.md) |
| 93 | +###### [让可观察性带上导航,快速发现和定位业务问题:OpenTracing上写入业务信息](docs/diagnosis/tracing/让可观察性带上导航_快速发现和定位业务问题_OpenTracing上写入业务信息.md) |
| 94 | +###### [链路追踪(Tracing)其实很简单——初识.md](docs/diagnosis/tracing/链路追踪其实很简单——初识.md) |
| 95 | +###### [链路追踪(Tracing)其实很简单——单链路诊断.md](docs/diagnosis/tracing/链路追踪其实很简单——单链路诊断.md) |
| 96 | +###### [链路追踪(Tracing)其实很简单——全量存储? No! 按需存储? YES!.md](docs/diagnosis/tracing/链路追踪其实很简单——全量存储No按需存储YES.md) |
95 | 97 | ###### [开源自建/托管与商业化自研Trace,如何选择?](docs/diagnosis/tracing/开源自建_托管与商业化自研Trace,如何选择?.md) |
96 | | -###### [前后端、多语言、跨云部署,全链路追踪到底有多难?](docs/diagnosis/tracing/前后端、多语言、跨云部署,全链路追踪到底有多难?.md) |
| 98 | +###### [前后端、多语言、跨云部署,全链路追踪到底有多难?](docs/diagnosis/tracing/前后端_多语言_跨云部署_全链路追踪到底有多难.md) |
97 | 99 | ###### [链路分析 K.O “五大经典问题”](docs/diagnosis/tracing/链路分析K.O“五大经典问题”.md) |
98 | 100 |
|
99 | 101 | #### 3.6 RootCause |
100 | | -###### [系统黄金指标之延迟(Latency)指标的故障诊断](docs/diagnosis/rootcause/系统黄金指标之延迟(Latency)指标的故障诊断.md) |
| 102 | +###### [系统黄金指标之延迟(Latency)指标的故障诊断](docs/diagnosis/rootcause/系统黄金指标之延迟指标的故障诊断.md) |
101 | 103 |
|
102 | 104 |
|
103 | 105 |
|
104 | 106 | ## 版本迭代 |
105 | 107 | * 2022-04-15 |
106 | | - * [OPLG:新一代云原生可观测最佳实践](docs/processing/monitor/OPLG:新一代云原生可观测最佳实践.md)@涯海 |
| 108 | + * [OPLG:新一代云原生可观测最佳实践](docs/processing/monitor/OPLG_新一代云原生可观测最佳实践.md)@涯海 |
107 | 109 | * 2021-11-17 |
108 | 110 | * [【必读】故障案例征集 & Demo 模板](docs/case/【必读】故障案例征集&Demo模板.md)@涯海 |
109 | 111 | * 2021-11-08 |
110 | 112 | * [链路分析 K.O “五大经典问题”](docs/diagnosis/tracing/链路分析K.O“五大经典问题”.md)@涯海 |
111 | 113 | * 2021-09-23 |
112 | | - * [前后端、多语言、跨云部署,全链路追踪到底有多难?](docs/diagnosis/tracing/前后端、多语言、跨云部署,全链路追踪到底有多难?.md)@涯海 |
| 114 | + * [前后端、多语言、跨云部署,全链路追踪到底有多难?](docs/diagnosis/tracing/前后端_多语言_跨云部署_全链路追踪到底有多难.md)@涯海 |
113 | 115 | * 2021-08-27 |
114 | 116 | * [开源自建/托管与商业化自研Trace,如何选择?](docs/diagnosis/tracing/开源自建_托管与商业化自研Trace,如何选择?.md)@涯海 |
115 | 117 | * 2021-05-27 |
116 | | - * [链路追踪(Tracing)其实很简单——全量存储? No! 按需存储? YES!.md](docs/diagnosis/tracing/链路追踪(Tracing)其实很简单——全量存储%3FNo!按需存储%3FYES!.md)@涯海 |
| 118 | + * [链路追踪(Tracing)其实很简单——全量存储? No! 按需存储? YES!.md](docs/diagnosis/tracing/链路追踪其实很简单——全量存储No按需存储YES.md)@涯海 |
117 | 119 | * [如何专业化监控一个Kubernetes集群](docs/processing/monitor/如何专业化监控一个Kubernetes集群.md)@佳旭 |
118 | 120 | * [2021 Gartner APM 魔力象限解读](docs/processing/monitor/2021_Gartner_APM魔力象限解读.md)@西杰 |
119 | 121 | * 2019-12-26 |
120 | 122 | * [SchedulerX 常见问题及解决方法](docs/diagnosis/plugin/scheduling/SchedulerX常见问题及解决方法.md)@学仁 |
121 | | - * [【案例】Dubbo 稳定性:Nacos 注册中心可用性问题复盘](docs/case/【案例】Dubbo稳定性:Nacos注册中心可用性问题复盘.md)@岛风 |
122 | | - * [让可观察性带上导航,快速发现和定位业务问题:OpenTracing上写入业务信息](docs/diagnosis/tracing/让可观察性带上导航,快速发现和定位业务问题:OpenTracing上写入业务信息.md)@竹影 |
| 123 | + * [【案例】Dubbo 稳定性:Nacos 注册中心可用性问题复盘](docs/case/【案例】Dubbo稳定性_Nacos注册中心可用性问题复盘.md)@岛风 |
| 124 | + * [让可观察性带上导航,快速发现和定位业务问题:OpenTracing上写入业务信息](docs/diagnosis/tracing/让可观察性带上导航_快速发现和定位业务问题_OpenTracing上写入业务信息.md)@竹影 |
123 | 125 | * 2019-11-07 |
124 | | - * [链路追踪(Tracing)其实很简单——单链路诊断](docs/diagnosis/tracing/链路追踪(Tracing)其实很简单——单链路诊断.md)@涯海 |
| 126 | + * [链路追踪(Tracing)其实很简单——单链路诊断](docs/diagnosis/tracing/链路追踪其实很简单——单链路诊断.md)@涯海 |
125 | 127 | * [Spring Boot 常见错误及解决方法](docs/diagnosis/plugin/microservice/SpringBoot常见错误及解决方法.md)@洛夜 |
126 | 128 | * [【案例】记一次线上内存报警排查过程](docs/case/【案例】记一次线上内存报警排查过程.md)@神帅 |
127 | 129 | * [饿了么监控系统 EMonitor 与 CAT 的对比](docs/processing/monitor/饿了么监控系统EMonitor与CAT的对比.md)@李刚 |
128 | 130 | * 2019-09-19 |
129 | 131 | * [Nacos常见问题及解决方法](docs/diagnosis/plugin/slb/Nacos常见问题及解决方法.md)@敦谷 |
130 | 132 | * [数据一致性检测应用场景与最佳实践](docs/processing/lostprevention/数据一致性检测应用场景与最佳实践.md)@龙多 |
131 | | - * [链路追踪(Tracing)其实很简单——初识](docs/diagnosis/tracing/链路追踪(Tracing)其实很简单——初识.md)@涯海 |
| 133 | + * [链路追踪(Tracing)其实很简单——初识](docs/diagnosis/tracing/链路追踪其实很简单——初识.md)@涯海 |
132 | 134 | * 2019-09-05 |
133 | | - * [系统黄金指标之延迟(Latency)指标的故障诊断](docs/diagnosis/rootcause/系统黄金指标之延迟(Latency)指标的故障诊断.md)@绍宽 |
134 | | - * [【剖析|SOFARPC 框架】之 SOFARPC 链路追踪剖析](docs/diagnosis/tracing/剖析SOFARPC框架之SOFARPC链路追踪剖析.md)@畅为/碧远/卓与 |
| 135 | + * [系统黄金指标之延迟(Latency)指标的故障诊断](docs/diagnosis/rootcause/系统黄金指标之延迟指标的故障诊断.md)@绍宽 |
| 136 | + * [【剖析 SOFARPC 框架】之 SOFARPC 链路追踪剖析](docs/diagnosis/tracing/剖析SOFARPC框架之SOFARPC链路追踪剖析.md)@畅为/碧远/卓与 |
135 | 137 | * [阿里云ARMS小程序监控进阶之路](docs/processing/monitor/阿里云ARMS小程序监控进阶之路.md)@慕扉 |
136 | 138 | * 2019-08-22 |
137 | | - * [So Hot?快给 CPU 降降温](docs/diagnosis/system/cpu/SoHot?快给CPU降降温.md)@涯海 |
| 139 | + * [So Hot?快给 CPU 降降温](docs/diagnosis/system/cpu/SoHot_快给CPU降降温.md)@涯海 |
138 | 140 | * [虾米SRE实践:监控体系升级之路](docs/processing/monitor/虾米SRE实践_监控体系升级之路.md)@全琮 |
139 | 141 | * [混沌工程介绍与实践](docs/prevention/resilience/混沌工程介绍与实践.md)@穹谷 |
140 | 142 | * [如何检测Web服务请求丢失问题](docs/diagnosis/tracing/如何检测Web服务请求丢失问题.md)@竹影 |
|
0 commit comments