采集运行时数据
基于鲲鹏服务器和x86服务器提供K-NET数据采集分析工具压缩包(tracelib-collector-aarch64.tar.gz、tracelib-collector-x86_64.tar.gz),解压目录后在目录下提供动态库librecord.so,在运行应用时使用LD_PRELOAD加载该动态库,通过动态库采集运行时的POSIX函数及参数信息。

- 动态库支持x86和鲲鹏平台上运行,能在Glibc 2.17及以上版本的环境上运行。
- 目前没有针对通用场景下的可变参数函数进行采集,对于兼容性列表中的可变参数函数(fcntl、fcntl64、ioctl ),采集兼容性分析所必须的前三个参数信息。
命令功能
采集运行时的POSIX函数及参数信息。
命令格式

librecord.so运行依赖于包内一同分发的libglib-2.0.so和libgobject-2.0.so,因此运行时需要使能LD_LIBRARY_PATH包含这两个动态库的所在目录,避免使用时由于找不到依赖库出现undefined symbol错误。
LD_LIBRARY_PATH=/directory/of/:$LD_LIBRARY_PATH LD_PRELOAD=/path/to/librecord.so [环境变量1=参数1] ... [环境变量n=参数n] executable args

采集运行时的数据需指定动态库所在路径、配置环境变量以及待采集的二进制文件路径,可配置一个或多个环境变量,RECORD_CONF环境变量为必选参数,多个环境变量之间用空格隔开。
- /directory/of/:librecord.so、libglib-2.0.so、libgobject-2.0.so所在目录。
- /path/to/:librecord.so文件所在路径。
- executable:必选,替换为实际待采集的二进制文件路径。
- args:替换为二进制文件需要的参数。
参数说明
环境变量名 |
数据类型 |
说明 |
---|---|---|
RECORD_CONF |
str |
必选参数,配置文件,指定需要记录的POSIX函数的配置文件路径。 配置文件中未指定pthread_create和fork函数,在采集时也会默认采集pthread_create和fork函数。 |
RECORD_OUT_DIR |
str |
可选参数,指定数据文件的输出目录。若不指定,则在当前目录下创建文件夹(record.data)。 根据RECORD_CONF指定的配置文件采集对应的POSIX函数信息,采集到的数据会存放到RECORD_OUT_DIR指定的输出目录下,不同TID的数据存放到不同的文件里。 |
RECORD_VERBOSE |
int |
可选参数,是否需要打印日志信息,默认为0。
|
RECORD_FUNC_LIMIT |
int |
可选参数,指定单个TID内每个配置函数的最大记录数,若不指定,最大记录数为2^31-1。 |
RECORD_TIMEOUT |
int |
可选参数,指定采集超时时间,单位为秒,若不指定,采集超时时间为2^63-1秒。 若超过指定时间后触发已配置的函数调用,程序将自动退出,退出前采集的数据会保留。 |
配置文件说明
RECORD_CONF指定的配置文件的格式如下:
pthread_create 1 fork 1 socket 1 bind 0
配置文件中每行只包括两列数据,第一列为POSIX函数名称,第二列根据值为0或1表示是否需要记录对应函数调用时的参数信息,其中空格作为分隔符。
采集后存储的数据文件说明
不同线程的数据存放在不同的文件中,对应文件名为record.tid,采集结束后存储的数据文件的格式如下:
1 36149310 3081497 3081497 3081504 3081497 2740656 2 35935130 3081504 3081497 0 bind 36216020 36222800 0 3 4 P1{sin_family:2,sin_port:0,sin_addr:{s_addr:16777343}} 16 0 getsockname 36345480 36347240 0 3 4 P1{sin_family:2,sin_port:5531,sin_addr:{s_addr:16777343}} P1{16} 0 connect 36528690 36600760 -1 3 5 P1{sin_family:2,sin_port:5531,sin_addr:{s_addr:16777343}} 16 16777343 24295 0 select 36703260 36709980 1 5 6 P0 P1 P0 P1{tv_sec:4,tv_usec:999997} 3 413
数据文件中每一行表示一个数据包,数据包的第一位表示数据包的类型,类型描述如下:
- 0:函数信息参数个数和参数数据是否记录取决于配置文件,空格作为分隔符。该类型数据包中的参数主要用于后续的兼容性分析,时间戳和函数名用于时序图绘制。
0 <函数名> <进入时间戳> <离开时间戳> <返回值> [<参数个数> <参数数据1> <参数数据2> ...]
参数数据可以是值或指针,指针类型的参数记录的格式如下:
- 空指针:以P0表示指针为空。
- 整型类型指针:以P1表示指针非空,后跟{}包裹的指针指向的整型值,如P1{16}。
- 结构体类型指针:以P1表示指针非空,后跟指针指向的结构体数据,结构体字段由{}包裹,格式为:{成员名1:成员1的格式化数据,成员名2:成员2的格式化数据...}。如果结构体内成员本身也是结构体的,同样按照此格式进行格式化。
- 1:进程信息
- 2:线程创建信息
- 3:进程的用户态耗时信息
空格作为分隔符,该类型数据包在每个进程的主线程对应数据文件的尾行记录,主要用于为网络I/O特征分析提供统计数据,单位为纳秒(ns)。
3 <进程的用户态耗时>