You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: aiops-Mainteance-mit-KI_Interview.md
+196Lines changed: 196 additions & 0 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -8,6 +8,202 @@ Der eigentliche Gamechanger ist **[Application Insights Transaction Diagnostics]
8
8
9
9
Also: "Netter Assistent" = Copilot schlägt dir in der IDE `async/await` statt Callbacks vor. **Was wir meinen** = Du hast einen Latenz-Spike in der Checkout-API, und die KI korreliert in Sekunden, dass das Problem eine veraltete Library ist, die bei 500 gleichzeitigen Requests eine Connection-Pool-Exhaustion verursacht — und zeigt dir die exakte Codezeile im Distributed Trace. **Von "ich vermute" zu "ich sehe".**
10
10
11
+
### End-to-End-Ablauf: Von Smart Detection bis zum automatisch bearbeiteten GitHub Issue
12
+
13
+
Der folgende Ablauf beschreibt, wie ein Performance-Problem **vollautomatisch** von der Erkennung in Azure über die Analyse bis hin zur Code-Bearbeitung durch den GitHub Copilot Coding Agent fließen kann — **ohne Azure DevOps**, rein über Azure Cloud + GitHub.
#### Schritt 1: Smart Detection erkennt das Problem
42
+
43
+
[Smart Detection](https://learn.microsoft.com/en-us/azure/azure-monitor/alerts/proactive-diagnostics) in Application Insights läuft **vollständig automatisch** — keine manuelle Konfiguration nötig. Es analysiert die Telemetrie deiner App und erkennt per Machine Learning:
44
+
45
+
-**[Failure Anomalies](https://learn.microsoft.com/en-us/azure/azure-monitor/alerts/proactive-failure-diagnostics)**: Ungewöhnlicher Anstieg der Fehlerrate außerhalb des erwarteten Korridors
46
+
-**[Performance Anomalies](https://learn.microsoft.com/en-us/azure/azure-monitor/alerts/smart-detection-performance)**: Response-Time-Degradation, Dependency-Latenz-Verschlechterung im Vergleich zur historischen Baseline
**Beispiel-Szenario:** Smart Detection erkennt, dass die Checkout-API plötzlich 3x langsamer antwortet als ihre 7-Tage-Baseline — eine "Response Latency Degradation".
50
+
51
+
#### Schritt 2: Smart Detection als Azure Monitor Alert Rule
52
+
53
+
Seit der [Migration von Smart Detection zu Alerts](https://learn.microsoft.com/en-us/azure/azure-monitor/alerts/alerts-smart-detections-migration) werden Smart-Detection-Erkennungen als vollwertige **Azure Monitor Alert Rules** behandelt. Für jede Detection-Art wird eine eigene Alert Rule erstellt:
54
+
55
+
| Smart Detection | Alert Rule Name |
56
+
|---|---|
57
+
| Degradation in Server Response Time |`Response Latency Degradation - <resource>`|
58
+
| Degradation in Dependency Duration |`Dependency Latency Degradation - <resource>`|
> **Hinweis:** Die **Failure Anomalies**-Regel existiert bereits als Alert Rule und erfordert keine Migration.
64
+
65
+
Der Vorteil: Diese Alert Rules können mit **[Action Groups](https://learn.microsoft.com/en-us/azure/azure-monitor/alerts/action-groups)** verknüpft werden — und genau das ist der Schlüssel zur Automatisierung.
66
+
67
+
#### Schritt 3: Action Group triggert eine Logic App
68
+
69
+
Eine **Action Group** ist die Brücke zwischen dem Alert und der Automatisierung. Sie definiert, was passiert, wenn ein Alert feuert — E-Mail, SMS, Webhook, oder eben: **Logic App**.
70
+
71
+
Die Action Group wird so konfiguriert:
72
+
-**Action Type**: `Logic App`
73
+
-**Common Alert Schema**: `Yes` (damit hat die Logic App ein einheitliches JSON-Format mit `alertRule`, `severity`, `firedDateTime`, `alertTargetIDs`, `description` etc.)
74
+
75
+
#### Schritt 4 + 5: Logic App erstellt GitHub Issue und weist es Copilot zu
76
+
77
+
Die [Logic App](https://learn.microsoft.com/en-us/azure/azure-monitor/alerts/alerts-logic-apps) empfängt den Alert über einen **HTTP-Trigger** und nutzt den [GitHub-Connector](https://learn.microsoft.com/en-us/connectors/github/) (nativ in Logic Apps verfügbar), um:
78
+
79
+
**a) Ein GitHub Issue zu erstellen** (Action: `CreateIssue`):
80
+
-**Title**: z.B. `🔴 Performance Alert: Response Latency Degradation - checkout-api` (zusammengesetzt aus `alertRule` + `severity`)
81
+
-**Body**: Strukturierte Informationen aus dem Common Alert Schema:
**b) Das Issue an Copilot zuweisen** (Action: `UpdateIssue` mit `assignees: ["copilot-swe-agent"]`):
98
+
99
+
Der Logic-App-Flow sieht so aus:
100
+
1.**Trigger**: "When a HTTP request is received" (Common Alert Schema)
101
+
2.**Action**: "Create an issue" (GitHub-Connector) → gibt `issueNumber` zurück
102
+
3.**Action**: "Update an Issue" (GitHub-Connector) → setzt `assignees` auf `copilot-swe-agent` und optional Labels
103
+
104
+
> **Alternativ ohne Logic App**: Die Action Group kann auch direkt einen **Webhook** an die [GitHub REST API](https://docs.github.com/en/rest/issues/issues#create-an-issue) senden (via Azure Function als Middleware, die das Alert-JSON in die GitHub-API-Struktur transformiert). Die Logic-App-Variante ist aber No-Code und in Minuten aufgesetzt.
Sobald das Issue [Copilot zugewiesen](https://github.blog/news-insights/product-news/github-copilot-meet-the-new-coding-agent/) wird, passiert folgendes automatisch:
109
+
110
+
1. Der Agent reagiert mit einem 👀 Emoji auf das Issue
111
+
2. Er startet eine **sichere VM via GitHub Actions**, klont das Repo
112
+
3. Er analysiert die Codebase mittels **RAG (Retrieval Augmented Generation)** über GitHub Code Search
113
+
4. Er nutzt die Issue-Beschreibung (inkl. der Alert-Daten aus Azure), um den Kontext zu verstehen
114
+
5. Er erstellt einen **Draft-PR** mit Commits, Session-Logs und Reasoning-Steps
115
+
6. Er taggt den Entwickler zur **menschlichen Review**
116
+
117
+
**Sicherheits-Garantien:**
118
+
- Agent kann nur auf Branches pushen, die er selbst erstellt hat
119
+
- Der PR-Ersteller kann nicht selbst approven
120
+
- GitHub Actions laufen erst nach menschlicher Freigabe
121
+
122
+
### Was in Azure konfiguriert werden muss (Schritt-für-Schritt)
123
+
124
+
#### Voraussetzung: Application Insights aktiv
125
+
126
+
Die Web-App muss mit [Application Insights](https://learn.microsoft.com/en-us/azure/azure-monitor/app/app-insights-overview) instrumentiert sein (SDK oder Auto-Instrumentation). Smart Detection ist per Default aktiv, sobald genug Telemetrie fließt.
>**Wichtig:** Beim ersten Mal wirst du aufgefordert, dich bei GitHub zu authentifizieren. Die Logic App benötigt **write**-Berechtigungen auf das Ziel-Repository.
158
+
159
+
#### C. Action Group erstellen und mit Alert Rule verknüpfen
2. **`.github/copilot-instructions.md`** anlegen mit Kontext für den Agent:
173
+
```markdown
174
+
# Copilot Instructions
175
+
- Performance-Issues von Azure Smart Detection enthalten Alert-Daten im Issue-Body
176
+
- Prüfe zuerst die in der Alert-Description genannten Endpoints und Dependencies
177
+
- Erstelle einen Fix mit zugehörigem Unit Test
178
+
- Füge eine PR-Summary hinzu, die den Alert-Kontext referenziert
179
+
```
180
+
3. Optional: **MCP-Server** konfigurieren (z.B. GitHub MCP Server), damit der Agent auf erweiterten Kontext zugreifen kann
181
+
182
+
### Azure Copilot als manueller Analyse-Schritt (Parallel-Pfad)
183
+
184
+
Zusätzlich zum automatisierten Flow kann ein Ops-Engineer den Alert auch **interaktiv mit Azure Copilot** analysieren:
185
+
186
+
1.**Azure Portal** → Die betroffene App Service Resource öffnen
187
+
2.**Azure Copilot** (Chat-Icon oben rechts) → Prompt: *"Why is my web app slow?"*
188
+
3. Azure Copilot wählt automatisch das richtige Diagnose-Tool (z.B. "Web App Slow" Detector) und führt Checks durch
189
+
4. Ergebnis: Potenzielle Ursachen + Lösungsvorschläge + Link zu den [Transaction Diagnostics](https://learn.microsoft.com/en-us/azure/azure-monitor/app/transaction-search-and-diagnostics)
190
+
5. Follow-up: *"Give me a summary of these diagnostics"* → Copilot fasst die Insights zusammen
191
+
192
+
Dieser manuelle Pfad ist **komplementär** zum automatisierten Flow — der Mensch bekommt die tiefe Diagnostik, während der Coding Agent parallel bereits am Fix arbeitet.
> **Kein Azure DevOps involviert.** Die gesamte Kette läuft über Azure Monitor → Logic Apps → GitHub REST API → GitHub Copilot Coding Agent. Der einzige "Mensch im Loop" ist das finale PR-Review.
206
+
11
207
---
12
208
13
209
## 2. Technical Debt ist oft politisch induziert: seid schneller, billiger. Hilft KI wirklich dagegen?
0 commit comments