为研究人员创造了五个基准挑战。
基准测试包括情景记忆,因此您知道何时发生了什么预测,让计算机知道你接下来可能会做什么以及手和物体操作,以了解一个人在视频中正在做什么。最后两个基准是了解谁在视频中说了什么,什么时候说的,以及互动中的合作伙伴是谁。