vllm

如何监控vLLM等大模型推理性能?

近两年来,随着大语言模型(LLM)的快速普及,AI 推理应用的需求呈指数级增长。以 DeepSeek 为代表的开源大模型凭借其卓越的推理性能和准确性,在开发者社区中迅速走红。无论是企业级应用还是个人项目,DeepSeek 都成为了构建智能对话系统、内容生成工具

模型 推理 直方图 ray vllm 2025-03-18 17:55  2

vLLM 入门教程:如何配置和运行 vLLM

vLLM (Virtual Large Language Model) 是一款专为大语言模型推理加速而设计的框架,其依靠卓越的推理效率和资源优化能力在全球范围内引发广泛关注。来自加州大学伯克利分校 (UC Berkeley) 的研究团队于 2023 年提出了开

配置 curl vllm 2025-01-14 14:45  8