浅析 QEMU 的调试利器 tracing 工具

本文首发于微信公众号 GTOC 。本文参考 QEMU 的 tracing 文档，相对路径为：docs/devel/tracing.rst

QEMU 有一个很好用的调试工具 tracing，可以用来跟踪 QEMU 内部函数的执行情况，以及性能调优。

比如追踪客户机程序的访存情况，可以将 QEMU 的 memory_region 的读写记录打印出来，只要注册了相应的 trace-event 。

我们先讨论一个最简单的方法，把 tracing 用起来。

一、快速上手。

在 QEMU 的启动选项中，通过增加 trace 参数，来指明要追踪的事件，这里以追踪 memory region 的访存事件为例：

$ qemu-system-riscv64 -M virt --trace "memory_region_ops_*" # *号代表前面的字符作为匹配对象...[email protected]:memory_region_ops_read cpu 0 mr 0x562fdfbb3820 addr 0x3cc value 0x67 size 1[email protected]:memory_region_ops_write cpu 0 mr 0x562fdfbd2f00 addr 0x3d4 value 0x70e size 2

我们可以在 QEMU 源码的 system/trace-events 文件中找到 mr 相关的 trace-event ：

# memory.cmemory_region_ops_read(int cpu_index, void *mr, uint64_t addr, uint64_t value, unsigned size, const char *name) "cpu %d mr %p addr 0x%"PRIx64" value 0x%"PRIx64" size %u name '%s'"memory_region_ops_write(int cpu_index, void *mr, uint64_t addr, uint64_t value, unsigned size, const char *name) "cpu %d mr %p addr 0x%"PRIx64" value 0x%"PRIx64" size %u name '%s'"...

如果要启用多个 trace-event ，只需要在启动选项里追加 --trace name，为了避免参数冗长，可以将需要追踪的 trace-event 记录在一个配置文件，然后加载它：

$ echo "memory_region_ops_*" >/tmp/events$ echo "kvm_*" >>/tmp/events$ qemu-system-riscv64 -M --trace events=/tmp/events ...

同时 tracing 也支持输出到文件，我们修改上面的 QEMU 命令：

$ qemu-system-riscv64 -M --trace events=/tmp/events,file=/tmp/event.log ...

如果不想在 QEMU 启动选项里开启，我们也可以在 QEMU 的 monitor 中动态开启，这样更灵活一些，操作如下：

$ qemu-system-riscv64 -M virt -monitor stdio -S -display none(qemu) trace-event memory_region_ops_read on(qemu) c...memory_region_ops_write cpu 0 mr 0x55a289a24d80 addr 0x10000000 value 0x78 size 1 name 'serial'

在 monitor 中使用 tracing 还有一个好处，你可以通过 tab 按键来补全命令，不必辛苦手动从源码中查阅每个组件支持的 trace-event 。

也可以使用 info trace-events 命令查询支持的 trace 事件。

也可以使用 trace-file 命令将追踪日志输出到文件。

tracing 支持多种 backend，默认使用 QEMU 的 log 作为后端，简单调试的场景，不必手动构建 QEMU ，可以直接使用 Linux 或者 windows 软件仓提供的 QEMU。

二、trace-event 介绍。

在 QEMU 源码的每一级目录，都可以添加 trace-events 文件，只需要在顶层 meson.build 目录里声明它的相对路径，就可以往里面添加自定义的 trace-event ：

if have_system  trace_events_subdirs += [    'accel/kvm',    'backends/tpm',    'ebpf',    'hw/arm',    ...  ]endif

在 QEMU 构建过程中，每个 trace-events 文件将由 tracetool 脚本处理，自动在 [builddir>/trace/ 路径下生成 trace 相关的代码，主要包含以下文件：

trace-[子目录名].c
trace-[subdir].h
trace-dtrace-[subdir].h
trace-dtrace-[subdir].dtrace
trace-dtrace-[subdir].o
trace-ust-[subdir].h

此处 [subdir] 表示将子目录路径中的 '/' 替换为 '_' 。

例如，accel/kvm 变为 accel_kvm ，最终生成的 trace-[subdir].c 文件名即为 trace-accel_kvm.c 。

各个 trace-events 文件会被合并成一个 trace-events-all 文件，同样生成在 [builddir]/trace/ 目录中。

该文件也会被安装到 /usr/share/qemu 目录下。这个合并后的文件将由 QEMU 提供的 simpletrace.py 脚本用于后续分析简单跟踪数据格式的跟踪记录。

源码树中的源文件，不会直接包含构建目录下生成的 trace 源码文件，而是通过 #include 引用本地的 trace.h 文件，且不带任何子目录路径前缀。

例如 io/channel-buffer.c 会这样引用：

#include "trace.h"

另外，我们必须手动创建 io/trace.h 文件，

并在其中包含对应的 trace/trace-[subdir].h 文件，该文件在 [builddir] 中生成：

$ echo '#include "trace/trace-io.h"' > io/trace.h

值得注意的是：虽然可以从源文件所在子目录之外引入 trace.h ，但通常不建议这样做。

强烈建议所有 trace-event，都在使用它们的子目录中直接声明。

唯一的例外是，在顶级目录的 trace-events 文件中定义了一些共享跟踪事件。

顶级目录生成的跟踪文件会带有 trace/trace-root 前缀，而不仅仅是 trace ，这是为了避免当前目录中的 trace.h ，与顶级目录中的文件产生歧义。

三、添加新的 trace-event 。

添加新的 trace-event 只需要两步，首先在相应目录的 trace-events 文件中声明 trace-event，然后在需要调试的目标源码内，添加这个事件的函数调用。

以追踪 QEMU 内存的申请释放为例，trace-event 的格式如下：

qemu_vmalloc(size_t size, void *ptr) "size %zu ptr %p"qemu_vfree(void *ptr) "ptr %p"

每个事件声明将以事件名称开头，然后是参数，最后是一个用于美观打印的格式字符串。

格式字符串应反映跟踪事件中定义的类型。 tracing 只支持基础标量类型（char、int、long），不支持浮点类型（float、double）。

特别注意对 int64_t 和 uint64_t 类型分别使用 PRId64 和 PRIu64，这确保了在 32 位和 64 位平台之间的可移植性。

格式字符串不得以换行符结尾。由后端负责调整行尾以实现正确的日志记录。

定义好 trace-event，直接从目标源码中调用它，示例如下：

#include "trace.h"  /* needed for trace event prototype */void *qemu_vmalloc(size_t size){    void *ptr;    size_t align = QEMU_VMALLOC_ALIGN;    if (size < align) {        align = getpagesize();    }    ptr = qemu_memalign(align, size);    /* 插入 trace-event，格式为：trace_[event-name] */    trace_qemu_vmalloc(size, ptr);    return ptr;}

另外，若一个函数中存在多个跟踪事件，应在名称末尾添加唯一标识符加以区分。

某些情况下可能需要执行相对复杂的计算来生成仅用作跟踪函数参数的值。

此时可以使用下面这个函数来保护这类计算逻辑：

 trace_event_get_state_backends()

当事件在编译时或运行时被禁用时，相关计算将被跳过。若事件在编译阶段已禁用，该检查将不会产生任何性能开销。

示例代码如下。

#include "trace.h"  /* needed for trace event prototype */void *qemu_vmalloc(size_t size){    void *ptr;    size_t align = QEMU_VMALLOC_ALIGN;    if (size < align) {        align = getpagesize();    }    ptr = qemu_memalign(align, size);    if (trace_event_get_state_backends(TRACE_QEMU_VMALLOC)) {        void *complex;        /* some complex computations to produce the 'complex' value */        trace_qemu_vmalloc(size, ptr, complex);    }    return ptr;}

以下几种情况，非常适合使用 tracing 调试：

跟踪代码中的状态变化。代码中的关键点通常涉及状态变更，如启动、停止、分配、释放等。状态变化是理想的跟踪事件，因为它们能帮助理解系统执行过程。
跟踪客户机操作。客户机的 I/O 访问（如读取设备寄存器）是良好的跟踪事件，可用于分析客户机交互行为。
使用关联字段以便理解单行跟踪输出的上下文。例如，跟踪 malloc 返回的指针及其作为 free 参数的使用情况，这样就能匹配 malloc 和 free 操作。缺乏上下文的跟踪事件实用价值有限。

四、 trace backend 介绍。

QEMU 的 tracing 采用前后端分离的设计，支持多种后端，除了上文提到的 log ，还支持更轻量的 simple，以及 ftrace 和 dtrace。

我们还可以通过 tracetool 脚本添加更多 backend 支持。

启用不同的 backend ，可以使用以下 QEMU 编译命令：

$ ./configure --enable-trace-backends=simple,dtrace

通过运行 ./configure --help 查看支持的所有后端，若未显式地选择后端，配置将默认使用 log 后端。

五、分析跟踪文件。

我们以 simple 后端为例，该后端通过独立线程，将二进制追踪日志写入文件，相比 log 后端具有更低的开销。

同时 QEMU 源码仓中提供了离线追踪文件分析的 python 脚本。虽然功能可能不如特定平台或第三方追踪后端强大，但具有可移植性且无需特殊库依赖。

使用 simpletrace.py 脚本进行格式化，需要用到 trace-events-all 文件和二进制跟踪文件：

./scripts/simpletrace.py [trace-events-all] [trace-log]

必须确保使用的 trace-events-all 文件，与构建 QEMU 时的生成的相同，否则跟踪事件声明可能已发生变化，导致输出不一致。

关注公众号 GTOC ，免费使用社区提供的知识库目前已推出：QEMU/GEM5/编译器/Linux 在公众号后台菜单栏即可体验，常用请星标公众号