注视模式的个性化预测(一)

这是我的毕业实习的主题,我希望随着实习进度来记录一下我做研究的过程,由于时间跨度较长,文章可能被分成若干部分,如此我会给题目之后加上序号以示区分。
技能分享
Author

MAO Dongyang

Published

March 3, 2025

Modified

March 4, 2025

注视模式的个性化预测(一)

我的导师Alexandre Bruckert在Internship Offer中就提供了几篇参考文献,我目前正在逐篇阅读。

Individual differences in visual salience vary along semantic dimensions

这篇论文的标题是《视觉显著性的个体差异在语义维度上变化》,由Benjamin de Haas等人撰写,探讨了人类在观看复杂场景时眼动行为的个体差异。以下是论文的主要内容:

研究背景

人类的视觉系统需要不断移动眼睛以聚焦于感兴趣的物体。传统的注意力指导理论认为,图像特征和任务需求主导了眼动行为,而个体之间的差异被视为“噪声上限”,限制了眼动预测的准确性。然而,近期的双胞胎研究表明,眼动轨迹的相似性具有遗传基础,这引发了对个体眼动行为差异的研究兴趣。

个体的差异主要取决于遗传差异,所以建模个体要精确到个人,有遗传差异的个人,而非同一文化背景。“噪声上限”不是噪声,也不是任何扰动或者误差,而是一种个体差异,对于这种个体差异即使同一图片输入也会有“噪声”无法解释的输出差别,所以我们把它叫做“噪声上限”。

研究目的

本研究旨在探讨个体在自由观看复杂场景时,眼动行为在语义维度上的差异。研究假设个体的眼动行为反映了其对不同类型物体的显著性偏好。

这是一个假设,注视即偏好

研究方法

研究对象包括超过100名成年人,他们自由观看了700张包含数千个语义标注物体的复杂场景图像。研究通过分析个体的眼动固视频率,识别了六个语义刺激维度:中性面孔、情绪面孔、文字、被触摸的物体、具有特征味道的物体(如食物和饮料)以及具有隐含运动的物体。

这六个语义非常重要,我们后续的研究可以以此为物体的分割依据

研究发现

  • 个体差异的稳定性:研究发现,个体在这六个语义维度上的眼动行为存在显著且稳定的差异,这些差异在不同图像和时间上都是一致的。
  • 语义维度的重要性:这些语义维度不仅在长时间观看中显著,也在初次眼动中表现出显著差异,这通常被认为是“自底向上”的视觉显著性。
  • 个体显著性模型:研究表明,个体化的眼动预测模型可以显著提高预测准确性,超越了通用模型的“噪声上限”。
  • 跨文化的一致性:这些个体差异在来自三个不同国家的样本中得到了复制,表明它们可能反映了视觉注意的基本生物机制。

无论什么人都会关注到这六个语义而不是其他无语义物体,并且无论是初级还是长时间观看。个体化的眼动预测模型并不是解决了“噪声上限”,个体之间的差别依然存在,但我们现在只针对个体进行预测,这种跨个体差异就不存在了。

研究意义

本研究揭示了视觉显著性不仅仅是图像的特性,还与观察者的特性密切相关。个体在语义维度上的显著性差异具有重要的感知意义,可能与面部识别等技能相关。

个体在语义维度上的显著性差异表示,对于六个语义同时存在的关注度不同,还有关注顺序的不同,同一个人总是会关注相同要素,无论什么图片。但不同的人会关注不同要素,以不同顺序。

结论

研究结果表明,视觉显著性的个体差异在语义维度上是稳定且可预测的,这些差异可能具有生物学基础,并且在不同文化背景下具有普遍性。这为理解人类视觉注意机制提供了新的视角。

这就是说,针对个体的预测是可行的,个体对于语义的关注是一个稳定的模式,所以可以预测。

Curious eyes: Individual differences in personality predict eye movement behavior in scene-viewing

研究背景

视觉探索由环境中的刺激和个体的兴趣与意图共同驱动。传统研究主要关注不同个体之间的共同因素,而忽略了个体差异。本研究则聚焦于个性特质,特别是好奇心,如何影响眼动行为。

这篇文章的重点在于一个人的好奇心(性格因素),对于眼动数据的影响,这个数据不是上篇文章所写的语义要素,而是场景访问区域数量,以及对某一事物的关注时间,等等这些不涉及具体物体的统计规律。如果将不同好奇心的人放在一起分析,可能需要关注眼动数据的标准化,让他们的移动速度变成一致的。

研究目的

研究旨在探讨个体在观看真实场景时的眼动行为是否与好奇心这一性格特质相关。研究假设好奇心较高的人在观看场景时会表现出更多的视觉探索行为。

这是一个很自然的假设,这种好奇心是一种性格,但还有一种好奇心就是某个人对某一特定事物的好奇心。你同样也可以研究,比如喜欢动物的人看到动物图片,和不喜欢动物的人看到动物图片的眼动行为。比如更有价值一点的,关注素食主义者对待特定动物的图片会不会与非素食主义者有什么不同,这样我们就可以根据一个人的眼动数据判断他有多大几率是潜在的素食主义者。

研究方法

  1. 参与者:50名来自不列颠哥伦比亚大学的本科生参与了实验。
  2. 刺激材料:使用了18张不同的建筑、室内和风景场景图片。
  3. 问卷调查:参与者完成了两个问卷,分别是感知好奇心量表(PC)和好奇与探索清单II(CEI II),以评估他们的好奇心水平。
  4. 实验设备:使用SR Research EyeLink II头戴式眼动追踪系统记录眼动数据。
  5. 实验流程:参与者自由观看每张图片15秒,然后完成问卷调查。

这个流程很正常,先看图片再测试,可能是为了避免“霍桑效应”1,避免被测试者知道自己被测试好奇心,从而表现出好奇心。

研究发现

  • 好奇心与眼动行为的关系:研究发现,感知好奇心量表得分与参与者在场景中访问的区域数量之间存在显著正相关,这表明好奇心较高的人倾向于探索更多的区域。
  • 眼动行为的其他特征:访问的区域数量与眼动次数呈正相关,与固视持续时间呈负相关。

第二点是显而易见的,你不可能在规定的时间内,既看了很多东西又看了很长时间。“访问的区域数量与眼动次数呈正相关”,眼动就是为了访问区域,眼动越多访问区域越多。

研究意义

本研究表明,个性特质如好奇心可以预测人们在观看场景时的眼动行为。这一发现为理解视觉注意的个体差异提供了新的视角,并有助于改进眼动行为的计算模型。

你还可以测试好奇心,怜悯心,同情心。但是好奇的人会看很多东西更加直观。

结论

研究结果支持个体的性格特质与其眼动行为之间存在关联,这为未来的眼动控制模型提供了重要参考。

符合日常经验的猜想得到验证

Footnotes

  1. 霍桑效应(Hawthorne Effect)是指当个体知道自己正在被观察或研究时,其行为或表现会发生改变。↩︎