fix: update image URL in swarm_intro.md and enhance Dockerfile for editable installation

binary-husky · binary-husky · commit a0dd2e406a0e · 2026-02-26T00:16:13.000+08:00
diff --git a/ajet/backbone/main_verl.py b/ajet/backbone/main_verl.py
@@ -64,7 +64,16 @@ def run_ppo(config: DictConfig) -> None:
             num_cpus=config.ray_init.num_cpus,
         )
 
-    atexit.register(lambda: ray.shutdown())  # ray shutdown on exit
+    def on_shutdown():
+        if ray.is_initialized():
+            ray.shutdown()
+        if config.ajet.enable_experimental_interchange_server:
+            if config.ajet.enable_swarm_mode:
+                from ajet.tuner_lib.experimental.interchange_utils import http_change_engine_status
+                print("Changing engine status to OFFLINE before shutdown...")
+                http_change_engine_status(config, "ENGINE.OFFLINE", global_step=0)
+
+    atexit.register(on_shutdown)  # ray shutdown on exit
 
     # Create a remote instance of the TaskRunner class, and
     # Execute the `run` method of the TaskRunner instance remotely and wait for it to complete
diff --git a/ajet/default_config/ajet_ts_default.yaml b/ajet/default_config/ajet_ts_default.yaml
@@ -48,6 +48,8 @@ ajet:
     # maximum number of parallel environments / simulate workers
     max_env_worker: 128
 
+  trainer_common:
+    logger: tensorboard
 
 # ------------------ 不需要修改 ------------------
 hydra:
diff --git a/docs/en/swarm_intro.md b/docs/en/swarm_intro.md
@@ -1,13 +1,15 @@
 # 灵活训练、动态伸缩：通义发布分布式多智能体 LLM 蜂群训练框架 AgentJet
 
 <div align="center">
-<img width="500" alt="AgentJet" src="agentjet.jpg"/>
+<img width="500" alt="AgentJet" src="https://doc.agentjet.top/agentjet.jpg"/>
 </div>
 
-TLDR：通义开源 AgentJet (AJet) 新一代前沿且易用的Agentic强化学习框架，具备全分布式蜂群训练（Swarm Training）能力，
-实现了训练和推理的完全解耦，能更高效地承担复杂LLM多智能体系统的训练工作。
-一方面，在AgentJet中，研究者可以使用非常简单的代码将多个不同LLM模型同时接入一个多智能体系统的强化学习训练中，实现真正意义的非共享参数多智能体强化学习；
-另一方面，研究者在任意设备上（甚至在自己的笔记本电脑上）运行智能体直接参与训练，并且支持随时动态添加、移除、修改智能体Rollout节点，形成不受环境限制、能随时改Bug、能从外部环境崩溃中自愈的蜂群训练网路。
+TLDR：通义开源新一代前沿且易用的Agentic强化学习框架AgentJet (AJet) 。
+AgentJet具备全分布式蜂群训练（Swarm Training）能力，
+实现了训练和推理的完全解耦，大幅简化了单智能体和多智能体LLM系统的训练流程，能更高效地承担复杂多智能体系统的训练工作。
+一方面，在AgentJet中，研究者可以使用非常简单的代码，将多个不同LLM模型同时接入一个多智能体系统的RL训练中，实现真正意义的非共享参数多智能体强化学习（MARL）；
+另一方面，研究者可在任意设备（如笔记本电脑）上运行智能体直接参与训练，
+也能随时动态添加、移除、修改智能体Rollout节点，构建不受环境限制、能随时改Bug、能从外部环境崩溃中自愈的蜂群训练网路。
 此外，AgentJet 完全开源，样例丰富，开箱即用，开放共建，并配套Token层级的追踪调试工具 & 逐版本训练性能追踪平台；
 还面向Vibe Coding开发者提供相关技能（SKILLs），允许Claude Code等工具一键辅助您的智能体编排和调试训练工作。
 
diff --git a/scripts/docker/dockerfile_zh b/scripts/docker/dockerfile_zh
@@ -48,6 +48,7 @@ RUN . /opt/venv/bin/activate && uv pip install flash_attn-2.8.3+cu12torch2.7cxx1
 
 # cache friendly layer for code changes
 COPY . .
+RUN . /opt/venv/bin/activate && uv pip install -e .[verl] -i https://mirrors.aliyun.com/pypi/simple/
 RUN wget https://dail-wlcb.oss-cn-wulanchabu.aliyuncs.com/astuner_archive/dataset.tar.gz
 RUN mkdir -p /mnt/data_cpfs/model_cache/modelscope
 RUN tar -xzf dataset.tar.gz -C /mnt/data_cpfs/model_cache/modelscope/ && rm dataset.tar.gz