大数据调优
- 单击系统性能分析后面的。
选择“AI调优”,打开新建任务页面。
- 设置任务参数,如图1所示,需要配置的选项如表1所示。
当前AI调优分析仅支持在CentOS 7.6和openEuler 22.03 LTS版本操作系统上使用。
表1 新建AI调优分析任务(大数据)参数说明 参数
说明
任务名称
输入分析任务的名称。名称需要满足如下要求:
- 只能由中文、字母、数字和下划线组成
- 长度为1~64个字符
应用分类
配置需要调优的应用类别,选择“大数据”。
应用名称/版本
配置需要调优的应用,可选Hive 3.1、Spark 3.1和Flink 1.12。
root密码
配置Devkit节点的root密码。AI调优涉及root操作,需要确保用户拥有root权限。应用名称选择“Hive 3.1”时需配置。
Master&Benchmark节点
配置压测工具所在节点。可单击“添加节点”增加agent节点。应用名称选择“Flink 1.12”时需配置。
Master节点
配置集群Master节点。应用名称选择“Hive 3.1”时需配置。
应用执行文件路径
配置应用的执行文件路径,例:/application/hive/bin。
OmniOperator目录
配置OmniOperator目录。应用名称选择“Spark 3.1”时可配置。
Flink Master节点IP
配置Flink的Master节点IP地址。应用名称选择“Flink 1.12”时需配置。
Flink Master节点应用端口
配置Flink的Master节点应用端口。应用名称选择“Flink 1.12”时需配置。
压测工具
选择对应用压测的工具,目前FLink 1.12仅支持Hibench,Hive 3.1和Spark 3.1仅支持Tpc-ds。
测试用例
选择压测工具使用的测试用例。
应用名称选择“Flink1.12”时默认为identity,可选identity、repartition、wordcount和fixwindow。
应用名称选择“Spark 3.1”时默认勾选query1.sql,可勾选query1.sql~query99.sql。
应用名称选择“Hive 3.1”时默认勾选query1.sql,可勾选query1.sql~query99.sql。
调优性能指标
选择应用调优的性能指标。
应用名称选择“Flink1.12”时默认为throughput,可选throughput和latency。
应用名称选择“Spark 3.1”时默认为latency。
应用名称选择“Hive 3.1”时默认为latency。
JAVA_HOME
配置JDK安装目录路径。
数据库
配置压测时使用的数据库名称。应用名称选择“Hive 3.1”或“Spark 3.1”时需配置。
压测工具路径
配置压测工具的文件路径,例:/opt/Hibench-7.0。
说明:应用程序路径建议配置为 “/home”、“/opt”等,请不要配置为“/”、“/dev”、“/sys”、“/boot”等系统目录,否则可能导致系统异常。
吞吐量
配置压测时用例的吞吐量,应用名称选择“Flink 1.12”时需配置。默认为20K,可选20K、40K、60K、80K、100K、200K、300K、400K、500K、600K、700K、800K、900K、1000K、2000K、4000K、6000K、8000K、10000K。
调优迭代次数
选择应用调优的迭代次数,默认为150次,可选20、50、100、150和200。
- 配置完成后,单击“校验并创建”按钮。
- 单击任务名,查看调优。
每一行代表一次调优,可单击“终止调优”中断调优进程。
图2 大数据AI调优分析
- 单击“下载优化后参数集”按钮下载已调优的数据库配置。