图形引擎实战:Unity性能分析工具原理介绍

最近在维护一个Unity性能分析工具,类似UPR,客户端采集信息,WEB端显示数据。下面简单介绍下原理。

数据来源

  • Profiler数据 熟悉Unity的同学对Profiler一定不会陌生,我们的性能数据主要来源于它,主要包含函数耗时,GC等等等等
  • 自定义数据 除了Profiler数据外,我们还需要一些其他数据,比如手机温度,PSS大小,lua GC,缓存池的使用情况,等等

一系列你想要,而profiler没有的

数据传输

Unity构建的时候勾选Development Build,在设备上启动后,Profiler就已经启动,并在端口进行监听,我们只需要连接上这个端口就能够和Profiler进行通信,从而获得性能数据,就是平时在Profiler Window看到的那些。

之所以说某个端口,是因为这个端口并不是固定的,在Android和iOS平台,端口以55000开始,55495结束。

下图就是Unity对端口进行扫描,通过建立连接并设置连接超时时间特别短(10ms)来快速判断该端口是否在监听。

虽然端口设置的范围比较大,但一般情况下前面十多个就够用了,从55000开始listen,bind失败换下一个端口。

根据上面的介绍,我们连接Unity Profiler的思路就是,通过短超时连接扫描端口,在能够连接的情况下既确定了监听端口,也连接了Profiler。

连接上Profiler之后,需要给Profiler发送消息,告诉它你要采集信息,它就开始发送茫茫多的消息过来。

把这些消息处理或者直接转发给Web端(根据不同需求定夺)。直接转发数据量巨大,一个正常的游戏峰值可以达到10+M/s的传输。优点是不需要客户端进行处理,不会给CPU带来额外负担,缺点是对发热,耗电,都带来不小的影响,对公司网速也带来不小的影响,单个服务器能够承受的客户端连接也少的可怜。

消息解析

消息头(伪代码),消息头我们都不陌生,一般都包含消息id,消息体大小,这个只是比平常的多了一个magicnumber

struct MessageHeader
{
  UINT32 MagicNumber
  UGUID MessageId
  UINT32 Size
}

MagicNumber 值为 0x67A54E8F

MesasgeId 是一个结构体, 4个INT长,可转化为字符串 ,举个例子 c58d77184f4b4b59b3fffc6f800ae10e

struct UGUID
{
  UINT32 data[4]
}

Size 接下来消息体的大小

下面是一个简单的消息体的结构

LogMessage MessageId "394ada038ba04f26b0011a6cdeb05a62"

struct LogMessage
{
  UINT32 logType
  BYTE[] message
}

Log的消息体比较简单,只包含了log类型,和字符串数组,这两部分就组成了一个完整的消息,log并不是我们关心的消息,接下来就是一个比较复杂的消息了

ProfilerDataMessage  MessageId "c58d77184f4b4b59b3fffc6f800ae10e"

[Header] [[BlockHeader[Message ... Message]BlockFooter] ... [BlockHeader[Message ... Message]BlockFooter]]

这是一个消息体的结构,比较复杂,对涉及到的结构进行简要说明

struct Header
{
  UINT32 signature
  UINT8 isLittleEndian
  UINT8 isAlignedMemoryAccess
  UINT16 platform
  UINT32 version
  UINT64 timeNumerator
  UINT64 timeDenominator
  UINT64 mainThreadId
}

该Head不要和MessgeHead搞混淆,它是属于 ProfilerDataMessage的,并且它在一次连接中,只出现一次,附带了一些初始的信息,其中isLittleEndian与isAlignedMemoryAccess比较重要,对我们后续内容的解析影响比较大。

接下来是Block,Block里又包含了BlockHeader,BlockFooter,在中间又包含了多个Message,这些Message就不包含头和尾了,只包含了消息类型和内容 而处理这些message就是我们的重点了

struct BlockHeader
{
  UINT32 signature
  UINT32 blockId
  UINT64 threadId
  UINT32 length
}
struct BlockFooter
{
  UINT32 nextBlockId
  UINT32 signature
}

这些结构的成员通过命名我们就能理解,这里提一个比较有意思的地方,就是BlockHeader和BlockFooter的signature

BlockHeader 的 signature为0xB10C7EAD

BlockFooter的signature为0xB10CF007

不知道大家看出来了么

threadId,用于标识这个消息是关于哪个线程的,blockid和nextBlockid,是为了判断是否出错的,比如说某一个特定线程上次处理的blockdi 为1,这次处理blockid为3,那说明中间有丢失,就无法继续处理了。

Block中的Message

enum MessageType
{
    ...
    MarkerInfo = 1,
    ...
    GlobalMessagesCount = 32,
    ThreadInfo = GlobalMessagesCount + 1,
    Frame = GlobalMessagesCount + 2,
    ...
    BeginSample = GlobalMessagesCount + 4,
    EndSample = GlobalMessagesCount + 5,
    Sample = GlobalMessagesCount + 6,
    ...
    GCAlloc = GlobalMessagesCount + 20,
    ...

}

由于消息数量比较多,列举了一些比较重要的,其他的就省略了,真实的情况要比下面讲的要复杂的多

  • Session数据解析

BlockHeader的threadId表明了该消息所属的线程,其中有一个GlobalThread,id为-1,它并不是真实纯在的线程,而是标识该数据包含了全局数据。 这些数据对应的消息主要类型有 MarkerInfo , ThreadInfo 等

struct MarkerInfo
  {
    UINT16 messageType
    UINT32 samplerId;
    ...
    STRING name;
    ...
  }

name该采样的名字,一般情况下就是函数名,每个名字对应一个id,方便后面只发送id,不发送名字来减少包体大小。

struct ThreadInfo
  {
    UINT16 messageType
    UINT32 flags;
    STRING group;
    STRING name;
    ULONG startTime;
    ULONG threadID;
  }

线程的信息,主要有Main Thread, Render Thread 等,这些都是全局信息,解析后保存在字典中,方便后面的检索

  • Thread数据解析

全局信息发送完之后就是真实线程的消息了,主要讲解BeginSample和EndSample

struct Sample
  {
    UINT16 messageType
    INT8 flags;
    UINT32 id;
    ULONG Time;
  }

BeginSample和EndSample的结构是一样的,通过messageType来判断是Begin还是End,id就是MarkerInfo的sampleId,可以通过该id查找到函数名,Time是该sample采样的时间。

举一个简单的例子,假设我们有如下函数调用

fun A                // sampleId 100
    B()
  end

  fun B               // sampleId 101
  end

  A()               // main Thread id 1000000

收到BlockerHeader threadid 为 -1的消息,进入Session数据处理阶段,其中包含MarkerInfo, ThreadInfo

struct MarkerInfo
  {
    UINT16 messageType    1
    UINT32 samplerId;     100
    ...
    STRING name;          A
    ...
  }

  struct MarkerInfo
  {
    UINT16 messageType    1
    UINT32 samplerId;     101
    ...
    STRING name;          B
    ...
  }

  struct ThreadInfo
  {
    UINT16 messageType    33
    UINT32 flags;
    STRING group;
    STRING name;          Main Thread
    ULONG startTime;
    ULONG threadID;       1000000
  }

收到BlockHeader threadid 为 1000000的消息,这是一个主线程消息进入线程消息处理阶段,其中包含BeginSample,EndSample

struct Sample
  {
    UINT16 messageType   36
    INT8 flags;
    UINT32 id;           100
    ULONG Time;          0 
  }

  struct Sample
  {
    UINT16 messageType   36
    INT8 flags;
    UINT32 id;           101
    ULONG Time;          10 
  }

  struct Sample
  {
    UINT16 messageType   37
    INT8 flags;
    UINT32 id;           101
    ULONG Time;          20
  }

  struct Sample
  {
    UINT16 messageType   37
    INT8 flags;
    UINT32 id;           100
    ULONG Time;          30 
  }

上面消息的意思是 A 开始,时间0,B开始,时间10, B结束,时间20,A结束 时间30

那我们就可以计算函数的调用时间了,B耗时10 = 20 -10, A耗时 30 = 30-0, A self 耗时 20 = 30(A耗时) - 10(B耗时)

总结

上面简单介绍下性能工具如何通过Profiler获取数据,希望起到抛砖引砖的作用。 通过该工具,在测试人员跑游戏的同时,无感的上传性能数据,

并通过Web的形式展现出来,使得我们能够实时了解游戏的性能状态,及时发现问题,及时解决问题。

欢迎加入我们!

感兴趣的同学可以投递简历至:CYouEngine@cyou-inc.com

#2025届秋招##校招##求职##游戏引擎#
全部评论

相关推荐

不愿透露姓名的神秘牛友
10-12 09:29
点赞 评论 收藏
分享
5 3 评论
分享
牛客网
牛客企业服务