开发者
资源
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

PA HCCS带宽监控

通过鲲鹏性能定界工具包中config_pa.yaml配置文件,可以采集PA事件实现服务器上HCCS带宽的持续监控。

  1. 执行如下命令采集PA事件。
    cd /path_to_ksys
    ./ksys collect -i 5 -d 10-c config_pa.yaml -o /data_path
    • “/path_to_ksys”:鲲鹏性能定界工具安装路径。
    • “-o” :指定生成pa_data.json文件的路径,生成的pa_data.json文件可以进一步对接到开源的普罗米修斯看板。
    • “-i” :以5秒采集间隔刷新HCCS监控数据。
    • “-d”:指定采集时间为10秒。若需要一直采集,可去掉-d参数后再执行命令进行采集,采集过程中可使用Ctrl+C停止采集。
    • “-c” :指定config_pa.yaml配置文件。
  2. 查看pa_data.json文件。
    pa_data.json中每个时序数据点格式如下:
    {
        "version": "1.0",
        "name": "hccs_bandwidth",
        "desc": "hccs bandwidth info, unit is 'MB/s'.",
          "timestamp": 1748484451170,
          "data_list": [
            {
                "value": 500.75,
                "label": {
    		"numa": "0",
    		"device": "hisi_sicl2_pa0",
    		"link": "1",
    		"direction": "out", 
    		"path": "P0->P1"
                }
            },
    ……
      ]
    }
    • version:支持该HCCS监控能力的JSON文件版本。
    • name:对应指标名称,hccs_bandwidth表征获取的指标为HCCS带宽。
    • desc:针对指标的进一步描述。
    • timestamp:记录当前文件数据刷新的时间点。
    • data_list:对应各个设备的具体数据,每个元素中的value即一个最小粒度设备的HCCS带宽,单位为desc描述中的MB/s。label为一个可扩展的k-v字典,说明如表1所示。
      表1 label字段说明

      字段名称

      说明

      numa

      当前数据所属NUMA,numa下可以有多个device。

      device

      当前数据所属PA设备,device下可以有多个link。

      link

      当前数据所属link编号,link为数据最小采集的设备粒度。

      direction

      当前数据的流向,取值为out、in。

      • out:从当前CPU Socket流出到另一个CPU Socket。
      • in:从另一个CPU Socket流入到当前CPU Socket。

      path

      当前数据的具体流向路径。

      例如:P0->P1,代表当前为CPU Socket0,流出到另一个CPU Socket1。