1、Gaze Following 注视跟踪是在场景中跟踪其他人的注视并推断他们看的是哪里。这对于理解人与人之间以及人与物之间的交互行为至关重要。例如,我们可以根据人在人与人互动中的注视点来推断他们的意图。新的零售场景中,我们可以根据消费者与这些产品的眼神交流来推断他们对这些产品的兴趣,并推断出哪种信息(食物的成分,价格,过期数据等)最吸引消费者的注意力。 尽管注视跟踪至关重要,但由于以下原因,它具有极大的挑战性:第一,实际推断注视点需要场景的深度信息,头部姿势和眼球运动,但很难推断单张图像的深度。此外,由于遮挡,头部的姿势和眼球的运动也不容易估计(如图c)。第二,由不同的第三视角观察者...