执行命令

在使用测试工具之前,先要下载Python相关软件包,而所有依赖都在/data/ann-benchmarks-main/requirements.txt中,下载依赖命令如下:
pip install -r requirements.txt
为了防止创建索引时间过长,可以在“milvus/module.py”的create_index函数中指定超时参数timeout。
- 打开文件。
1
/data/ann-benchmarks-main/ann_benchmarks/milvus/module.py
- 根据实际情况修改超时参数的时间,单位为秒。
1 2 3 4 5 6
self.collection.create_index( field_name = "vector", index_params = self.get_index_param(), index_name = "vector_index", timeout = 7200 )
在本地使用milvus-hnsw算法搜索gist-960-euclidean数据集并立即获取所有查询,忽略已经存在的结果。
1 | python run.py --algorithm milvus-hnsw --batch --threads 1 --local --force --dataset gist-960-euclidean |

本命令的查询结果将存储在.hdf5后缀文件中,请参考查看结果的命令格式和执行方法进行查看。
在第一次导入数据并创建索引之后,为了复用数据,可以将“milvus/module.py”中导入数据和创建索引的代码进行注释,此时,多次测试下召回率都保持一致。
打开文件:
1 | /data/ann-benchmarks-main/ann_benchmarks/algorithms/milvus/module.py |
需要注释的代码如下。
1 2 3 | if utility.has_collection(self.collection_name): print(f"[Milvus] collection {self.collection_name} already exists, drop it...") utility.drop_collection(self.collection_name) |
1 2 | self.insert(X) self.create_index() |
1 | utility.drop_collection(self.collection_name) |
父主题: 运行测试