数据库节点、应用节点、运维管理节点推荐配置如下表所示。
节点类型 |
鲲鹏服务器配置 |
部署内容 |
---|---|---|
数据库节点 |
|
部署openGauss数据库。 存储向量化后的数据, 提供向量数据的导入和检索服务。 |
应用节点 |
|
部署用户管理、文档处理(切片解析等)、AI业务流构建框架等 |
(可选)运维管理节点 |
|
部署CCAE运维管理软件。 检测集群的运行状态,方便集群的运维。 |
模型名称 |
参数 |
昇腾产品 |
鲲鹏产品配置 |
---|---|---|---|
DeepSeek V3 |
671B |
Atlas 800I A2 (2*512G) |
4台数据库节点(7260*2 2.6G/64C) 1台应用节点(7260*2 2.6G/64C) 1台网管(5250*2 2.6G/48C) |
DeepSeek-R1 |
671B |
Atlas 800I A2 (2*512G) |
4台数据库节点(7260*2 2.6G/64C) 1台应用节点(7260*2 2.6G/64C) 1台网管(5250*2 2.6G/48C) |
DeepSeek-R1-Distill-Llama-70B |
70B |
Atlas 800I A2(512G) |
2台数据库节点(7260*2 2.6G/64C) 1台应用节点(7260*2 2.6G/64C) |
DeepSeek-R1-Distill-Qwen-32B |
32B |
Atlas 800I A2(256G) |
2台数据库节点(7260*2 2.6G/64C) 1台应用节点(7260*2 2.6G/64C) |
DeepSeek-R1-Distill-Qwen-14B |
14B |
Atlas 800I A2(256G) |
2台数据库节点(7260*2 2.6G/64C) 1台应用节点(7260*2 2.6G/64C) |
Atlas 300I Duo |
1台合并部署(7260*2 2.6G/64C) |
||
DeepSeek-R1-Distill-Llama-8B |
8B |
Atlas 300I Duo |
1台(7260*2 2.6G/64C) |
DeepSeek-R1-Distill-Qwen-7B |
7B |
Atlas 300I Duo |
1台(7260*2 2.6G/64C) |
DeepSeek-R1-Distill-Qwen-1.5B |
1.5B |
Atlas 300V |
1台(7260*2 2.6G/64C) |
4节点数据库配置可以保证在1亿条数据量下,128并发检索时延小于50ms,可以减少到2台数据库节点,128并发检索时延增加到100ms。不同数据量的建议配置如下表:
数据量 |
数据库节点 |
数据库内存 |
应用节点 |
应用内存 |
---|---|---|---|---|
1亿以上 |
4台 |
(16*32G) * 4 |
1台 |
16*32G |
5千万-1亿 |
2台 |
(16*32G) * 2 |
1台 |
16*32G |
1千万-5千万 |
2台 |
(8*32G) * 2 |
1台 |
16*32G |
百万-千万 |
1台 |
(16*32G) * 1 |
1台 |
16*32G |
百万以下 |
1台合并部署(16*32G) |
4节点数据库节点分布式参考图: