鲲鹏应用使能套件 BoostKit
大数据-机器学习算法
查看原理
全球国家健康度预测
全球国家健康度预测案例,旨在用全球各国2000年至2015年人口平均寿命数据进行训练,以预测中国、德国、澳大利亚、马来西亚四个国家在2016-2025年人口平均寿命。
本案例Demo展示看到,鲲鹏BoostKit大数据使能套件通过优化Spark算法的多核亲和性以及算法原理,实现在训练精度保持一致的情况下(误差范围内),训练速度有倍级的提升。
梯度提升决策树(GBDT)算法
算法运行时长(训练进度)
(s)
训练迭代误差值(代表收敛速度,越快越好)
(s)
算法运行结果对比
- 国家
- 年份
- 训练时间(s)
- 训练性能提升率
- 寿命预测/实际结果(仅2015年前有记录值/岁)