鲲鹏社区首页
中文
注册
鲲鹏应用使能套件 BoostKit
大数据-机器学习算法
查看原理
全球国家健康度预测

全球国家健康度预测案例,旨在用全球各国2000年至2015年人口平均寿命数据进行训练,以预测中国、德国、澳大利亚、马来西亚四个国家在2016-2025年人口平均寿命。

本案例Demo展示看到,鲲鹏BoostKit大数据使能套件通过优化Spark算法的多核亲和性以及算法原理,实现在训练精度保持一致的情况下(误差范围内),训练速度有倍级的提升。

梯度提升决策树(GBDT)算法

算法运行时长(训练进度)

(s)

训练迭代误差值(代表收敛速度,越快越好)

(s)

算法运行结果对比

  • 国家
  • 年份
  • 训练时间(s)
  • 训练性能提升率
  • 寿命预测/实际结果(仅2015年前有记录值/岁)