System Info / 系統信息
cuda版本13.0,vllm版本0.17.1
Running Xinference with Docker? / 是否使用 Docker 运行 Xinfernece?
Version info / 版本信息
v2.7.0
The command used to start Xinference / 用以启动 xinference 的命令
docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9998:9997 --gpus all xprobe/xinference:v<your_version> xinference-local -H 0.0.0.0 --log-level debug
Reproduction / 复现过程
Expected behavior / 期待表现
成功运行模型
System Info / 系統信息
cuda版本13.0,vllm版本0.17.1
Running Xinference with Docker? / 是否使用 Docker 运行 Xinfernece?
Version info / 版本信息
v2.7.0
The command used to start Xinference / 用以启动 xinference 的命令
docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9998:9997 --gpus all xprobe/xinference:v<your_version> xinference-local -H 0.0.0.0 --log-level debug
Reproduction / 复现过程
Expected behavior / 期待表现
成功运行模型