返回顶部我要评分获取效率正确性完整性易理解0/200提交关闭在线提单论坛求助 模型部署说明 DeepSeek V3/R1满血版本建议部署在2台Atlas 800I A2服务器上,DeepSeek-R1-Distill-Qwen-7B模型可以部署在Atlas 300I Duo上,实际LLM的部署根据所选的模型和硬件进行相应的配置。 下面的例子中,LLM部署以DeepSeek-R1-Distill-Qwen-7B和DeepSeek V3/R1满血版为例。Embedding和Rerank模型部署在一张Atlas 300I Duo卡上(实际部署时Embedding和Rerank模型可以分别部署在不同的卡上)。部署的模型列表如表1所示。 表1 部署模型列表模型类型 模型名称 LLM DeepSeek V3/R1满血版 LLM DeepSeek-R1-Distill-Qwen-7B Embedding bge-large-zh-v1.5 Rerank bge-reranker-v2-m3 父主题: 部署AI服务