用户体验 - 文档优化补充 - https://docs.sglang.io/platforms/ascend_npu.html - 刷新特性支持情况 - 增加部署指导 软件分发 - x86 openeuler镜像支持 - 国内镜像源同步 - 要自己构建镜像 https://docs.sglang.io/platforms/ascend_npu.html#method-2-using-docker 社区量化支持 - sglang社区量化roadmap https://github.com/sgl-project/sglang/issues/8180 - GPTQ - Compressed Tensors Agent - function call能力增强 新模型支持 - NA vllm vs sglang - sglang triton 算子分发机制分析 - sglang框架npu 适配分析 (接入昇腾的方式比vLLM代价小) 参考资料 - https://hugging-face.cn/docs/transformers/quantization/selecting - https://github.com/sgl-project/sglang/issues/12780 - https://github.com/sgl-project/sglang/issues/13664 - https://github.com/sgl-project/sglang/pull/10158
用户体验
软件分发
社区量化支持
Agent
新模型支持
vllm vs sglang
参考资料