加载数据集
ann-benchmarks有预先生成的数据集(HDF5格式)并为每个算法准备了Docker容器,以及用于验证功能完整性的测试套件。本节详细介绍了数据集的获取方式。
- 下载数据集。
方法一:wget命令下载,需要下载其他数据集时更改wget命令中数据集的名字即可。
本次测试以数据集gist-960-euclidean.hdf5为例。1 2 3
mkdir /data/ann-benchmarks-main/data cd /data/ann-benchmarks-main/data wget http://ann-benchmarks.com/gist-960-euclidean.hdf5 --no-check-certificate
方法二:下载数据集后上传到服务器“/data/ann-benchmarks-main/data”目录下。
在数据集下载页面下拉找到Data sets,在Download列表选择对应数据集。
- 修改文件访问权限,以当前用户是milvus为例。
1
chown -R milvus:milvus /data/ann-benchmarks-main/data/gist-960-euclidean.hdf5