25.0.0
更新说明
场景 |
更新说明 |
---|---|
公共&框架 |
新增支持openEuler 24.03 LTS-SP1。 |
应用迁移 |
|
系统迁移 |
|
亲和分析 |
|
应用开发 |
应用开发拓展字典管理中的编译器版本范围,BiSheng Compiler版本范围更新为2.1.0~4.2.0,GCC版本范围更新为4.8.5~12.3.1。 |
编译调试 |
|
系统性能分析 |
|
Java性能分析 |
|
系统诊断 |
|
已解决问题
问题单号 |
DTS2024121703496 |
---|---|
问题描述 |
【CC】【devkit调优】在donau租户通过dsub命令提交devkit容器作业,出现作业卡死,影响devkit支持容器作业的正常采集。 |
严重级别 |
一般 |
解决措施 |
在使用singularity容器执行mpi任务时加上--ipc参数。 |
影响域 |
singularity容器执行devkit MPI分析任务。 |
原因分析 |
在容器化环境中使用OpenMPI(特别是HUCX和HMPI)的UCX(Unified Communication X)上下文中CMA(Cross Memory Attach)。由于CMA支持问题,hpctool节点内部通信失败(从用户角度来看,应用程序在一个节点中启动,但从技术上讲,mpi排序位于容器内不同的临时文件系统中,因此对于mpi而言,这些排序位于不同的节点)。 |
问题单号 |
DTS2024122618065 |
---|---|
问题描述 |
【鲲鹏】【devkit】用户在vscode端以多瑙方式提交大rank调试进程,页面卡住无返回结果。 |
严重级别 |
一般 |
解决措施 |
使用dsub -N 550 -nl [节点名称] mpirun -x PATH -x LD_LIBRARY_PATH -mca btl ^vader,tcp,uct,openib -mca pml ucx进行调试。 |
影响域 |
用户在vscode端以多瑙方式提交大rank调试进程。 |
原因分析 |
rank过大,导致同一时间正在连接的socket数太大,最后导致连接被拒绝,需要将已完成数据收发的闲置socket释放,从而减少同一时间的socket连接数。 |
问题单号 |
DTS2025010211916 |
---|---|
问题描述 |
【系统诊断】【内存使用】【后端 】内存使用(在BCC环境中)诊断时长设置为120s采集HPC应用,3个半小时未结束,应用路径:/opt/test/usr/ompi/bin/mpirun 应用参数:--allow-run-as-root -np 2 -H xx.xx.xx.xx:28 -H xx.xx.xx.xx:28 -wdir /opt/test/lammps/RUN/airebo/ /opt/test/lammps/src/lmp_mpi -in in.tension -v model_name data |
严重级别 |
一般 |
解决措施 |
采用多进程将采集数据分组处理。 |
影响域 |
BCC环境中使用长时间内存诊断。 |
原因分析 |
使用Python实现BCC功能时需调用C库,数据量大时调用耗时长。 |
问题单号 |
DTS2024123106544 |
---|---|
问题描述 |
【源码迁移】由于预处理模块存在缺陷,源码迁移在第一层宏定义使用时,默认不会进行提示,在第二层宏定义使用时才会提示是否进行迁移。 |
严重级别 |
一般 |
解决措施 |
增加分支判断,源码迁移场景使用x86宏进行处理。 |
影响域 |
源码迁移和字节对齐功能。 |
原因分析 |
预处理执行时会从系统上获取当前编译器的架构相关的宏定义,x86和鲲鹏获取到的不一致,处理时,x86有__x86_64__宏,会将__x86_64__宏分支中的代码加到系统宏列表中,但是在aarch64平台上获取不到__x86_64__宏定义,__x86_64__宏分支中的宏没有加到平台宏列表中,使用处这些宏的地方也就没有提示。 |
问题单号 |
DTS2024112909019 |
---|---|
问题描述 |
【数据库】【静态检查】【MySQL】devkit静态检查,大文件(60M以上)执行时间过长,超过10天仍未出结果。 |
严重级别 |
一般 |
解决措施 |
增加跳出机制和超时时间。 |
影响域 |
devkit静态检查大文件。 |
原因分析 |
SVF(Static Value-Flow Analysis Framework)中解析依赖关系逻辑耗时较长。 |
问题单号 |
DTS2024112908199 |
---|---|
问题描述 |
【数据库】【静态检查】【MySQL】devkit静态检查,swap分区未生效,检查报错内存不足。 |
严重级别 |
一般 |
解决措施 |
增加swapfree字段的解析。 |
影响域 |
devkit静态检查swap分区。 |
原因分析 |
静态检查前devkit未判断swap分区。 |
遗留问题
问题单号 |
DTS2025030427370 |
---|---|
问题描述 |
调试2048rank的HPC应用程序,执行MPI_INIT函数后,继续执行调试命令,在程序未运行完的情况下显示“All ranks has exited"。 |
严重级别 |
一般 |
规避和应急措施 |
启动调试任务时指定-e参数添加环境变量"export PMIX_MCA_gds=^ds21"。 |
影响域 |
设置环境变量仅在当次调试任务有效,环境变量通过调试器参数传入,运行结束后即失效,不会对其它任务产生影响,工具的使用方式不会对MPI程序的编译运行以及集群上已有任务的运行造成影响。 |
解决进展 |
向HPC开发部等其它部门协调测试资源,完成全量测试 2025/4/11。 |