鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

加载数据集

ann-benchmarks有预先生成的数据集(HDF5格式)并为每个算法准备了Docker容器,以及用于验证功能完整性的测试套件。本节详细介绍了数据集的获取方式。

  1. 下载数据集。

    方法一:wget命令下载,需要下载其他数据集时更改wget命令中数据集的名字即可。

    本次测试以数据集gist-960-euclidean.hdf5为例。
    1
    2
    3
    mkdir /data/ann-benchmarks-main/data
    cd /data/ann-benchmarks-main/data
    wget http://ann-benchmarks.com/gist-960-euclidean.hdf5 --no-check-certificate
    

    方法二:下载数据集后上传到服务器“/data/ann-benchmarks-main/data”目录下。

    数据集下载页面下拉找到Data sets,在Download列表选择对应数据集。

  2. 修改文件访问权限,以当前用户是milvus为例。
    1
    chown -R milvus:milvus /data/ann-benchmarks-main/data/gist-960-euclidean.hdf5