DeepSeek V3/R1满血版本建议部署在2台Atlas800I A2服务器上,DeepSeek-R1-Distill-Qwen-7B模型可以部署在Atlas 300I Duo上,实际LLM的部署根据所选的模型和硬件进行相应的配置。
下面的例子中,LLM部署以DeepSeek-R1-Distill-Qwen-7B和DeepSeek V3/R1满血版为例。Embedding和Rerank模型部署在一张Atlas 300I Duo卡上(实际部署时Embedding和Rerank模型可以分别部署在不同的卡上)。
部署的模型列表如下表所示:
模型类型 |
模型名称 |
---|---|
LLM |
DeepSeek V3/R1满血版 |
LLM |
DeepSeek-R1-Distill-Qwen-7B |
Embedding |
bge-large-zh-v1.5 |
Rerank |
bge-reranker-v2-m3 |