鲲鹏社区首页
中文
注册
鲲鹏BoostKit干货店丨BoostKit那么多好用的开源软件是怎么来的?

鲲鹏BoostKit干货店丨BoostKit那么多好用的开源软件是怎么来的?

BoostKit

发表于 2021/06/24

40

迈入多样性计算时代,ARM已经成为业界主流的计算架构之一,越来越多数据中心用户正在将业务迁移到ARM平台上,其中,日益繁荣的ARM软件生态是直接影响用户选择的重要因素。

开源软件作为最重要的软件开发模式之一,是软件生态的核心。让开源软件与ARM平台进行充分的软硬件适配和性能优化,并打造可用、好用的开源软件,显得尤为关键。

厚积薄发:BoostKit使能开源软件支持鲲鹏

华为ARM和鲲鹏开源生态历程

华为早在2004年开始拥抱并积极建设ARM开源生态。2019年发布鲲鹏计算战略,鲲鹏作为ARM生态的重要组成内容,华为进一步聚焦发展鲲鹏生态。2020年发布鲲鹏BoostKit应用使能套件,全方位使能开源、贡献开源,繁荣鲲鹏的软件生态。

目前,鲲鹏BoostKit已经使能超过90%主流开源软件支持鲲鹏平台,覆盖大数据、分布式存储、数据库、虚拟化等主流场景。未来三年内,鲲鹏BoostKit将聚焦使能主流开源软件支持鲲鹏平台发挥高性能。

90%主流开源软件已支持鲲鹏平台

让开源软件可用:BoostKit推动开源社区引入ARM CI

CI(Continuous Integration,持续集成)是现代软件开发流程的重要手段,从软件的开发、构建到测试、打包全流程,确保与技术架构充分适配,实现高质量的软件代码。以往主流开源社区基于传统架构建设CI开源开发流程,如果ARM用户直接使用该开发流水线发布的软件包,常常面临着很多问题。只有在开源社区开发流程中引入ARM架构开发流水线,才能从源头解决问题,并且实现一次开发投入,长期受益。

主流开源社区支持ARM CI流程

华为致力于推动主流开源社区引入ARM CI,并将相应的ARM版本开源软件汇聚到鲲鹏BoostKit,简化开发者的下载、部署工作。以Apache Hadoop社区为例,华为发起倡议并开展历时超过半年的工作准备与技术沟通。

最终,华为成功主导推动Apache Hadoop社区于2020年初正式启用了ARM CI, 对主干开发代码进行每日周期验证。在开展验证半年后,社区正式发布了提供ARM支持的第一个版本3.3.0版本。

目前已经有Hadoop、Spark、TensorFlow、PyTorch、MariaDB等60+个开源社区在华为的主导推动下已经引入ARM CI,显著提升主流开源社区对ARM和鲲鹏架构的技术支持。

让开源软件好用:BoostKit贡献开源,使能应用极致性能

使能开源的同时,鲲鹏BoostKit还持续贡献开源,将众多关键的性能优化成果回馈至开源社区。目前鲲鹏BoostKit已有190+关键Patch包、14项关键特性例被开源社区采纳。

鲲鹏BoostKit向C语言库Glibc 2.31版本提交了重要的优化Patch,使得memcpy, memcmp, memchr, strcpy, strlen等常用函数在鲲鹏和ARM平台上的性能提升超过20%,并让众多以C语言为编程语言的软件受益。

鲲鹏BoostKit向MariaDB 10.6版本,提供锁优化、NUMA Aware、Global Counter等关键优化改进,实现MariaDB数据库在鲲鹏和ARM平台的性能提高超过40%。

本页内容