|
39 | 39 | </summary> |
40 | 40 |
|
41 | 41 | <div style="display:flex; overflow-x:auto; gap:10px; padding:12px 0; scroll-snap-type:x mandatory; -webkit-overflow-scrolling:touch;"> |
42 | | - <!-- 첫 번째 이미지의 측면 비율 1624x675를 사용하여 슬라이드 프레임 설정; 이미지는 object-fit:contain을 사용하여 내부에서 맞춰짐 --> |
| 42 | + <!-- 첫 번째 이미지 1624x675의 측면 비율을 사용하여 슬라이드 프레임 사용; 이미지는 object-fit:contain을 사용하여 내부에서 맞춰짐 --> |
43 | 43 | <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
44 | 44 | <img src="../monitor/api/static/web1.png" style="width:100%; height:100%; object-fit:contain;" /> |
45 | 45 | </div> |
|
84 | 84 |
|
85 | 85 | - **가볍다**: 최소한의 리소스 사용. |
86 | 86 | - **유연하다**: CLI 도구 또는 완전한 기능을 갖춘 웹 대시보드로 실행. |
87 | | -- **관리자 중심**: **VRAM 강제 실행** (한계를 초과하는 프로세스를 자동 종료) 및 **관찰 목록**과 같은 기능 포함. |
88 | | -- **개발자 친화적**: GEMM (기하학적 다중 정확 행렬 곱셈), 입자 물리학 등 내장 벤치마킹 및 스트레스 테스트 도구 (시스템 안정성을 검증하기 위한 것)를 통해 시스템 안정성을 검증. |
| 87 | +- **관리자 중심**: VRAM 강제 실행 (한계를 초과하는 프로세스를 자동 종료) 및 감시 목록과 같은 기능 포함. |
| 88 | +- **개발자 친화적**: GEMM (기하학적 다중 정확 행렬 곱셈) 및 입자 물리학과 같은 내장 벤치마킹 및 스트레스 테스트 도구 (시스템 안정성 검증). |
89 | 89 |
|
90 | 90 | ## 기능 |
91 | 91 |
|
92 | 92 | - **실시간 모니터링**: |
93 | | - - GPU 지표 상세 (사용률, VRAM, 전력, 온도) |
94 | | - - 시스템 지표 (CPU, RAM 등) |
| 93 | + - GPU 지표 상세 정보 (사용률, VRAM, 전력, 온도). |
| 94 | + - 시스템 지표 (CPU, RAM 등). |
95 | 95 |
|
96 | 96 | - **관리 및 집행**: |
97 | | - - **VRAM 제한**: GPU당 VRAM 사용량에 하드 한계 설정 |
98 | | - - **자동 종료**: VRAM 정책을 위반하는 프로세스를 자동 종료 (관리자 전용) |
99 | | - - **감시 목록**: 특정 PIDs 또는 프로세스 이름을 모니터링 |
| 97 | + - **VRAM 제한**: GPU당 VRAM 사용량에 대한 하드 한계 설정. |
| 98 | + - **자동 종료**: VRAM 정책을 위반하는 프로세스에 대해 자동으로 종료 (관리자 전용). |
| 99 | + - **워치리스트**: 특정 PIDs 또는 프로세스 이름을 모니터링. |
100 | 100 |
|
101 | 101 | - **벤치마킹 및 시뮬레이션**: |
102 | | - - **스트레스 테스트**: 열 스로틀링 및 안정성을 테스트하기 위한 구성 가능한 GEMM 워크로드 |
103 | | - - **시각화 시뮬레이션**: 상호작용 3D 입자 물리학 시뮬레이션을 통해 GPU 부하 시각화 |
| 102 | + - **스트레스 테스트**: 열 스로틀링 및 안정성을 테스트하기 위한 구성 가능한 GEMM 워크로드. |
| 103 | + - **시각적 시뮬레이션**: 상호작용 3D 입자 물리학 시뮬레이션을 통해 GPU 부하 시각화. |
104 | 104 |
|
105 | 105 | ## 로드맵 및 미래 작업 |
106 | 106 |
|
|
131 | 131 |
|
132 | 132 | ### 1. 최소한 (CLI 전용) |
133 | 133 |
|
134 | | -헤드리스 서버나 백그라운드 모니터링에 가장 적합합니다. |
| 134 | +헤드리스 서버나 백그라운드 모니터링에 최적화. |
135 | 135 |
|
136 | | -- 명령줄 인터페이스 |
137 | | -- 기본 시스템/GPU 지표 |
| 136 | +- 명령줄 인터페이스. |
| 137 | +- 기본 시스템/GPU 지표. |
138 | 138 |
|
139 | 139 | ### 2. 표준 (CLI + 웹 UI) |
140 | 140 |
|
|
147 | 147 |
|
148 | 148 | ### 3. 전체 (표준 + 시각화) |
149 | 149 |
|
150 | | -개발 및 스트레스 테스트에 가장 적합합니다. |
| 150 | +개발 및 스트레스 테스트에 가장 적합함. |
151 | 151 |
|
152 | | -- 시뮬레이션 포함 |
153 | | -- PyTorch/CuPy 벤치마크 의존성 |
| 152 | +- 시뮬레이션 포함. |
| 153 | +- PyTorch/CuPy 의존성 벤치마킹을 위한. |
154 | 154 |
|
155 | 155 | ### 빠른 시작 |
156 | 156 |
|
@@ -183,7 +183,5 @@ python health_monitor.py cli |
183 | 183 |
|
184 | 184 | ## 라이선스 |
185 | 185 |
|
186 | | -<summary>세부 사항</summary> |
187 | | - |
188 | | -[라이선스](../LICENSE)를 참조하세요. |
| 186 | +자세한 내용은 [LICENSE](../LICENSE)를 참조하세요. |
189 | 187 |
|
0 commit comments