File tree Expand file tree Collapse file tree
Expand file tree Collapse file tree Original file line number Diff line number Diff line change 273273
274274✅ [Wanda](https://arxiv.org/abs/2306.11695)
275275
276- # # TODOリスト
277-
278- # ## 量子化
279-
280- - [ ] QuIP
281-
282- - [ ] QuIP#
283-
284- - [ ] AQLM
285-
286- **注意:** QUIK、SpQRなどの特定のアルゴリズムは、特別なハードウェアやカーネルのサポートが必要であり、複数のバックエンドによる単純な量子化を行い、これらのバックエンドを使用して推論することはできません。ただし、ユーザーは引き続きツールを使用して、研究におけるこれらのアルゴリズムのパフォーマンスを評価できます。
287-
288- # ## 剪定
289-
290- - [ ] SparseGPT
291-
292- - [ ] LLM-Pruner
293-
294- この部分は近日公開予定です🚀。
295-
296- # ## ドキュメント
297-
298- - [ ] モデルを圧縮し、複数のバックエンド(例:[Lightllm](https://github.com/ModelTC/lightllm)、[TensorRT-LLM](https://github.com/NVIDIA/TensorRT-LLM))を使用して推論するエンドツーエンドの例。
299-
300- - [ ] 異なるアルゴリズムの`quant`部分の`special`に関するドキュメント。
301-
302- - [ ] ユーザーが独自に新しいアルゴリズムを追加するためのドキュメント。
303-
304- より詳細なドキュメントは近日公開予定です🚀。
276+ ✅ [ShortGPT](https://arxiv.org/abs/2403.03853)
305277
306278# # 謝辞
307279
You can’t perform that action at this time.
0 commit comments