鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

执行命令

在使用测试工具之前,先要下载Python相关软件包,而所有依赖都在/data/ann-benchmarks-main/requirements.txt中,下载依赖命令如下:

pip install -r requirements.txt

为了防止创建索引时间过长,可以在“milvus/module.py”create_index函数中指定超时参数timeout

  1. 打开文件。
    1
    /data/ann-benchmarks-main/ann_benchmarks/milvus/module.py
    
  2. 根据实际情况修改超时参数的时间,单位为秒。
    1
    2
    3
    4
    5
    6
    self.collection.create_index(
        field_name = "vector",
        index_params = self.get_index_param(),
        index_name = "vector_index",
        timeout = 7200
    )
    

在本地使用milvus-hnsw算法搜索gist-960-euclidean数据集并立即获取所有查询,忽略已经存在的结果。

1
python run.py --algorithm milvus-hnsw --batch --threads 1 --local --force --dataset gist-960-euclidean

本命令的查询结果将存储在.hdf5后缀文件中,请参考查看结果的命令格式和执行方法进行查看。

在第一次导入数据并创建索引之后,为了复用数据,可以将“milvus/module.py”中导入数据和创建索引的代码进行注释,此时,多次测试下召回率都保持一致。

打开文件:

1
/data/ann-benchmarks-main/ann_benchmarks/algorithms/milvus/module.py

需要注释的代码如下。

1
2
3
if utility.has_collection(self.collection_name):
    print(f"[Milvus] collection {self.collection_name} already exists, drop it...")
    utility.drop_collection(self.collection_name)
1
2
self.insert(X)
self.create_index()
1
utility.drop_collection(self.collection_name)