File tree Expand file tree Collapse file tree
Expand file tree Collapse file tree Original file line number Diff line number Diff line change @@ -26,8 +26,8 @@ PaddleFormers 是基于百度深度学习框架 PaddlePaddle 搭建的 Transform
2626结合业界主流优化方法与飞桨在业务实践中积累的高效特性,PaddleFormers 致力于打造** 高性能、低资源占用** 的训练体验,帮助用户高效便捷地完成大模型训练,而无需关注底层复杂的优化细节。
2727
2828## 🆕最新更新
29+ * 2026.03.31 - PaddleFormers v1.1 正式发布!在这个版本中我们支持了 GLM-4.5 系列模型的单步与多步 MTP 训练能力。依托 MTP 架构优势,开发者可显著提升推理效率;同时针对 MTP 模块训练场景,我们新增主干网络冻结开关,灵活满足各类模型精细化调优需求。
2930* 2026.01.21 - PaddleFomers v1.0版本发布啦!我们提供了针对 LLM 和 VLM 等模型的训练能力,针对 DeepSeek-V3模型和 GLM-4.5-Air 等重点模型,我们实现了极致性能优化(训练性能明显超越 Megatron-LM )。针对 PaddleOCR-VL,我们在昆仑芯 P800、天数天垓150等国产计算芯片上进行了适配,更好的满足国内用户需求。
30- * 2026.03.31 - PaddleFormers v1.1 正式发布!在这个版本中我们支持了 GLM-4.5 系列模型的单步与多步 MTP 训练能力。针对 MTP 模块训练,我们新增了主干网络冻结开关,灵活满足模型精细化调优需求,并通过 MTP 能力有效加速推理。
3131
3232## ✨特性
3333* ** 丰富的模型支持:** PaddleFormers 实现了对于 100+ 主流的大语言模型和视觉语言模型的训练能力支持,涵盖了 DeepSeek-V3、GLM-4.5系列、Qwen2和 Qwen3系列、Qwen3-VL 等前沿模型。同时提供了对 ERNIE-4.5、ERNIE-4.5-VL、PaddleOCR-VL 等文心系列模型完备的训练能力。
You can’t perform that action at this time.
0 commit comments