鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

数据集使用介绍

用户可以通过HiBench工具生成所需的机器学习数据集进行算法性能测试,也可通过下载官网数据集做预处理后进行算法性能测试。

表1 数据集生成方式

项目

说明

使用HiBench工具生成

CP10M1K、CP2M5K、ALS、D200M100、D10M4096、HiBench_10M_200M、HibenchRating3wx3w、ECBDL14、BostonHousing、Titanic、avazu、Movielens、Taobao、Criteo40M、Criteo150M、bremenSmall、farm、house

下载官网数据集

house、HIGGS、nytimes、Kosarak、DEEP1B、Mnist8m、Epsilon、MESH_DEFORM