文章

/

约 6,495 字

/

预计 22 分钟阅读

MirrorBot 论文笔记

作者 · Kalopsia

读论文时记下来的笔记

#论文 · #工业设计 · #笔记 · #机器人交互

正文

Attachments

补充材料

1 项

大致浏览

背景与问题引入

Brief eye contact with strangers can foster connection, belonging, and positive affect, yet such moments are often scarce in public spaces.

陌生人之间短暂的眼神接触,可能能带来一些积极的情绪:连接感,归属感。虽然现实中很少发生。

  • 短暂、正面的眼神接触少,但是有社交价值。

研究目标

This paper investigates how a spatially situated robot can reshape the visual field of a shared space to influence how strangers notice and respond to one another.

作者关心的是,机器人能不能通过改变一个空间里的“视觉关系”,来影响陌生人如何注意到彼此,又如何回应彼此。

  • visual field:一个共享空间,人能够看到什么,看见谁,视线如何被组织。
  • spatially situated robot:放在具体空间情景中的机器人,相当于机器人是空间里的一员,不是抽象算法系统。

研究方法 / 作者做了什么

We present MirrorBot, a mobile robot equipped with two actuated mirrors that dynamically redirect reflections to reshape sightlines between people.

作者做了一个移动机器人,上面有被驱动的镜子,可以动态改变人们之间视觉的光路。

  • sightlines:表意是视线,指一个空间里某个位置能看到什么,看见谁,视线有没有被引导和阻挡。
  • 通过这个机器人(控制镜子的朝向)去改变两个陌生人彼此进入对方视野的方式。
  • 操控人与人之间的可见性。

研究流程设计及主要现象结果

In a study with 32 strangers in 16 pairs in a waiting‑room setting, MirrorBot elicited patterns such as low-stakes icebreaking, nonverbal synchrony, joint sensemaking, asymmetric engagement, and avoidance.

  • low-stakes icebreaking:低压力破冰,成本很低的小互动。
  • nonverbal synchrony:非语言同步,一起笑,动作互相跟上等。
  • joint sensemaking:共同猜测/理解,“这个机器人是在干嘛”。
  • asymmetric engagement:非对称参与,一个人很投入,另一个人很冷。
  • avoidance:回避。
  • 这个机器人确实引出了多种陌生人互动模式,有正向的,也有失败的。
  • elicit 这个词用得很好,主要是引出某些模式。

结果进一步提炼

Participants also attributed multiple roles to the robot, such as mediator, observer, magnifier, or disrupter, revealing that its social meaning was fluid and co‑constructed.

参与者并没有把这个机器人稳定理解成一种固定身份。

  • mediator:帮双方建立联系的东西。
  • observer:观察者。
  • magnifier:放大器,放大某种感觉或注意。
  • disrupter:搅局者。
  • 其社会意义是流动的,由参与者共同赋予,不固定。
  • MirrorBot 不是一个固定角色的社交主体,它的角色是在场景中被共同定义的。

全文贡献总结

Our work extends HRI by showing that robots can act not only as conversational partners but also as spatial mediators, curating opportunities for human–human connection through the reconfiguration of spatial relationships.

机器人不一定非要做“和人说话的对象”,它也可以叫做“空间中介”。通过重新安排空间关系,为人与人之间的链接创造机会。

  • spatial mediators:空间中介。
  • curating opportunities:策划、编排,不是强迫发生。
  • 本篇论文想留下的可能是:机器人可以是“空间编导”或者“关系中介”。

总的来说,本篇论文关注了人机交互的一种新方式:不是直接交互,而是让机器人嵌入到人与人社交的交互关系之中。机器人通过影响人与人之间的社交媒介,从而影响了人类之间的社交。而对社交媒介的应用,这个机器人重点关注在了空间和光学上。

  • 社交媒介:太大,更准确的是重构人与人之间的“可见性”和“视线关系”。
  • 关于重点关注:作者真正关心的不是物理反射本身,而是反射怎样改变社交关系。

更改后的总结

这篇论文研究的是一种比较新的 HRI 视角。它关心的不是机器人怎么直接和人交流,而是机器人能不能嵌入人与人之间的互动条件,去间接影响陌生人之间的社交。具体来说,作者让机器人通过可动镜面去改变共享空间中的视线关系和相互可见性,从而创造一些更低压力的 mutual gaze 和社交起点。

为什么说新的 HRI 视角

传统上,人机交互将机器人的角色重点放在会和人说话、社交代理、任务协作、陪伴者等方面。但是本篇论文中,作者不是从这个角度去理解机器人在人类社会里的作用。

作者到底怎么解决“人们不会自然互动,也不想被强行拉去互动”的矛盾?

  1. 平常陌生人之间的状态:坐得近,理论上可以互动。但是盯着看,直接搭话等会显得唐突和冒犯。作者说,保持一种“civil inattention”,大概指的是“礼貌性的互不打扰”。(沉浸在手机里)
  2. 作者的任务:寻找低压力、可试探、可退出的连接方式。
  3. 作者的招数
    • 间接眼神接触。
    • 渐进式升级(对应四种状态的设计 → 逐渐升温)。
    • 设计里内置了“退出权”(为 opt‑out 等设计机制)。
  4. 总结:更像是邀请。更关注那些本来可能发生但没发生的连接。在不冒犯的前提下,创造一个让陌生人有机会彼此试探、注意到的中间层,即 MirrorBot。

引言

引言的任务:问题值得研究,切口有理。作者是怎么把问题搭出来的?

  1. 先关注眼神接触。它是最强的非语言信号。后面一切围绕这一点,因为作者要强调“怎么制造间接对视”。
  2. 作者在强调,研究对象是让社交的火星子有机会冒出来。
  3. social fabric,人与人之间有些非常细微但也很重要的连接结构,而这个东西是有意义、有价值的。
  4. 矛盾:虽然有意义,但是目前的公共空间里很少出现这样的连结。作者探究原因:看手机,社会规范……
    • 到此为止,张力建立:有价值的连接很难自然发生。
  5. 悖论性环境:一些公共场合,物理上人被放到一起,社会上人又是分开的。
  6. 理论切口:空间关系。空间关系怎样影响社交,反过来又怎样被社交塑造。
  7. 陌生人会不会注意到彼此,很大程度上取决于空间布局和视线关系。不过过去很多 HRI 更关注机器人自己的表达行为,而不是去影响环境本身。
  8. 为什么是镜子:镜子的三个特性(设计哲学)
    1. invites self‑awareness:让人先注意到自己。
    2. enables indirect observation:允许间接观察别人。
    3. 没有直接对视的强度和压力,就可以把人轻轻连接起来。
  9. 正式提出研究问题:当镜子不再是固定的,而是可移动、倾斜、决定谁看到谁,会发生什么?也就是机器人驱动的镜子,如何在陌生人之间创造并塑造这样的时刻?

作者为什么觉得这个问题值得研究?为什么选这个切口?

在现实陌生人之间的社交当中,存在一种矛盾:物理意义上提供了社交的前提,但却受制于一些东西(比如“社会规范”),导致一些本可能的社交被掐断。公共空间虽然把陌生人放在一起,但礼貌性的互不打扰和直接对视的压力,让那些本来可能发生的、低门槛的相互注意和轻量互动很难自然出现。而这些社交虽然微小却很有价值。

作者并不是要彻底解决陌生人社交中的张力,而是在寻找一种低压力、可退出的中介机制,让部分原本难以发生的相互注意和互动更容易出现。

作者认为,空间关系是一个很好的切入口,重点关注的是 sightlines 和 visibility。因为它影响人的社交,又实实在在存在。而具体的,利用镜子来切入,是因为镜子能更好地利用空间关系,并能帮助机器人改变环境,其特性符合设计哲学。

作者选镜子,关键不只是它能参与空间重构,而是它允许人先从自我反射进入,再通过间接反射去试探他人的存在和反应,从而降低直接对视带来的社交压力。也就是说,作者尝试利用机器人交互去操纵空间关系,从而尝试解决矛盾。

阶段性总结

  1. 论文的贡献有哪两层?
    • 对社交“矛盾”的一种缓解的尝试。
    • 对人机交互方式的一种新的理解:机器人可以不直接,而是可以通过影响环境与人交互。
  2. 优化后的回答
    • 提出并初步检验了一种通过 mediated mutual gaze 促发陌生人低压力互动的设计路径。
    • 对 HRI 提出了一种更具体的新视角:机器人不只作为直接互动主体,也可以作为 spatial mediator,通过重构共享空间中的 sightlines 和 proxemic relationships,间接塑造人与人之间的互动条件。

到底怎么做

镜子的设计

作者试了五种镜面组织方式,最后发现他们真正需要的,并不是一个比较炫酷的反射装置,而是一个能清楚、平滑、低压力地组织“自己 / 对方 / 两者同时出现”这三种关系的结构。

排除的错误方向

  1. 背对背镜子?
    • 反射不容易进入人的余光,两面镜子之间没有明显的关系感,更适合各自照镜子。
  2. 小镜子嵌在大镜子里
    • 会让“我检查自己”压过“我注意别人”,重心拖回了“照自己”。
  3. 像书本开合一样的镜子
    • 作者尝试一种思路,想看看镜子开合本身能不能成为一种揭示关系的动作。但这种设计可预测性差,运动本身在抢戏。
  4. 交叉的镜面条带
    • 会把脸切碎,这个很是问题。
  5. 空间里随机角度分布的镜子
    • 随机角度镜子太像一个复杂装置,像“来猜猜我能反射出什么”,而不是“它在让我和另一个人产生某种关系”。

正确方向

  1. 平行配置,像眼睛一样。
  2. 相同尺度,两个人在镜子里的大小、地位尽量对等。
  3. 平滑切换。

排除那些会把用户拉回自我检查、让关系意图变模糊、或打碎 face/gaze 连续性的方案,最后收敛到一种能以对等尺度、平滑方式在 self 和 other 之间切换的镜面组织结构。

四种交互状态

四个状态构成了 social choreography,并且是从 curiosity 和 self‑awareness,逐步推进到 moments of mutual recognition。

Voids

先让镜子“存在”,但不建立关系 ——低刺激开场。

在 Voids 状态下,参与者在镜子里只看到周围环境;这个状态主要用在 MirrorBot 导航,或者轻轻晃动镜子吸引注意的时候。

  1. 先建立装置感,再建立关系感。
  2. 低显著度的试探,很轻的镜面点头、摇晃。
  3. 给“退出权”留出空间,除非检测到明确回应(reciprocal cues)否则不升级。
  4. 激发 curiosity。

Dual Self

先把“我”拉进来。

Dual Self 状态下,其中一个参与者会在两面镜子里看到自己的反射,另一个暂时还主要看到环境。机器人会交替这个状态,让两个人都先注意到自己的反射,并借此被邀请进入互动。

  1. 先看到自己,快速将人拉进互动系统。作者做修正的时候发现这一步必须有,是“减压层”。
  2. 为什么是两个镜子都看见自己?防止模糊,清楚表明“我”要和镜子建立关系,可读性强。
  3. 一次只拉一个人,更温和,不瞬间提高社交压力,先建立个体与系统的联系。
  4. 建立 self‑awareness,用户会理解“这个系统在组织视觉关系”。
  5. 潜在风险:让用户过多关注自己,所以一定是过渡态。

Dual Other

“另一个人”的到来。

在 Dual Other 这个状态里,两个人会同时在两面镜子里看到对方。这会创造一种 mutual awareness,甚至是一种 simulated eye contact。

  1. 他人进入。
  2. 为什么两面都看到了对方?尽量清晰,不要模糊,确定当前的关系焦点是“他人”。
  3. 已经最接近“陌生人开始彼此承认”的状态,有了一定社交压力。

Self + Other

同时处理“我”与“你”的关系。

在 Self + Other 状态里,每个参与者一面镜子看到自己,另一面镜子看到对方。而且系统会在两个人之间交替这个配置,保证两边都有平等机会体验。作者说,这创造的是一种 balanced, hybrid view。

  1. 一定程度上减轻了社交压力,给了一半自我空间。
  2. 这个状态会在参与者之间交替,以保证双方有同等的机会。
  3. 满足了自我意识、对他人观察、一定的相互,并避免了直接面对面的社交压力。

隐含批判点:用户需要了解到镜子逻辑,对可读性要求高。

模拟

假设两人:t 和 z。

  1. 初始状态:t 和 z 处于一个物理在一起、社交分隔的共享空间。
  2. 接近:机器人靠近,但只是一个环境/装置的存在感。
  3. 吸引:对应 Voids 状态(镜子细微点头、摇晃)。t 和 z 无论是否注意到都没关系,如果注意到,只会观察到镜面中环境的轻微变化。
  4. 提高好奇心:机器人开始逐步揭露反射(reveal reflection),t 和 z 都进入 Dual Self 模式。此时 t 和 z 可能都知道了这个镜子有一些指向,自身会做一些准备。
  5. 建立连接:t 和 z 进入 Dual Other 模式,如果反应合适会进入 Self + Other。进入一种连接。
  6. 交换/继续/撤退:t 和 z 有可能继续轻互动(机器人多做停留),或者直接交流(机器人退出);t 和 z 没能进入轻互动(双方/单方不回应),机器人尝试几次,失败就撤退。

Figure 4 展示的是一条渐进式的社交介入路径:机器人先进入空间,再用低刺激方式吸引注意,接着先让参与者分别看到自己,再让他们看到彼此,最后进入一种 self 和 other 并置的 mediated mutual gaze。如果人接住了邀请,互动会被短暂延长;如果人已经自然交流,或者根本不想交流,机器人就退出。

定性实验室研究

讲述作者怎么把前面那套设计变成一个能产出可信观察的研究场景。MirrorBot 是一个 design probe,目的是把一些描述性的、现象层面的洞见挖出来,看人们如何注意、解释、回应这种视觉和社交变化。

  • design probe:探针,作者用这个产品去看现实中会冒出什么社会现象(人们怎么理解?哪些互动会被引出来?邀请还是冒犯?)。
  • cover story:采用了假任务,使反应更自然。
  • 陌生人。
  • 样本不大,主要作者观察一些可能的反应(反复出现的模式)。
  • 校园样本意味着“生态有效性有限”。

过程

  • Stage 1:给假任务提高可信度。
  • Stage 2:核心观察,允许自由坐、站、聊、休息。机器人一分钟后再进。实验是“前半标准化 + 后半适应式观察”的设计。不过由于有研究者在背后手控。因此系统的可拓展性和自动化能力并没有在这篇里被真正证明。
  • Stage 3:分开做半结构化访谈。
  • 多人看视频 + 访谈主题分析里归纳,最终总结出 findings。

重点

  1. 现象探索实验,不是效果验证实验。
  2. 同时关注“行为”+“主观解释”。
  3. 缺点:样本代表性有限,空间代表性有限,自动化并未接受考验等。

发现

MirrorBot 没有制造社交,而是在调节社交起点的门槛(降低)。

Catching First Glances

大多数小组第一次真正有社会意义的接触,就是在镜子里完成的。也就是说,镜子确实改变了 gaze management 的规则。MirrorBot 最先带来的是更低压力的相互注意机制。

Testing the Waters

注意到彼此后,没有马上聊天,而是开始用身体/动作试水:身体校准(我这样动,系统会怎么跟?对方会怎么跟?);还有非语言同步:不仅可以促进社交关系,还有判断意愿。MirrorBot 创造的不是直接社交结果,先出现的是一种可被共同调试的互动空间。

Speculating Together

本身已经有了一种连接:共同猜测。此处,ambiguity(模棱两可)也可以作为一种设计资源。

Asymmetric Engagement

这里是失效的情况:只能放大,不能凭空制造(意愿)。

Discomfort, Avoidance

邀请不能变成打扰。谨慎设计是核心设计条件。

Fading into the Ambience

机器人不一定持续主导互动。它有时候是自然退场,有的时候意味着连接本身也没有长出来。

Roles Attributed to MirrorBot

不同人把它看作不同东西:

  • mediator,中介。
  • peripheral presence,边缘存在。
  • quiet listener,安静听众。
  • pet‑like / childlike,像宠物或小孩。
  • magnifier of awareness,放大彼此意识的东西。
  • disruptor,打扰者。

确实,MirrorBot 的社会意义不是固定的,而是在互动中被共同建构出来的。

隐含批判点:joint sensemaking,有多少来自镜面结构本身,有多少来自“有个怪机器人出现了”?

讨论

相比于这个机器人本身,作者更想讨论的可能是 “我们应该怎样重新理解机器人在人类社会里的位置”

机器人角色到底变成了什么

参与者没有给出统一的理解。不过这篇论文则在挑战一个默认前提:机器人要靠表情、语音、模拟社交行为等来获得社会意义。机器人也可以通过改变互动发生的条件来产生社会效果。

此处作者还提到 ambiguity as a design resource,即适度的模糊反而留出了解释空间,会让人开始共同建构意义。

放大可能而不是凭空制造意愿

我觉得,有的时候这个可能也会制造一定的意愿?

设计上必须认真考虑退出。而且对空间也有要求,比如医院候诊区、认知负荷很高或者处于脆弱状态的空间则很危险。

空间是中介

机器人在主动重构空间关系,进而影响人与人怎样彼此看到、彼此靠近、彼此注意。

从“人和机器人”之间的双边关系转向“机器人把空间本身拉进互动机制里”。关于空间:sightlines,proximity,visibility 具体指的很明确,就是人与人之间被重新组织的可见性。

边界

  1. 场景太受控。
  2. 只看了一个空间布局,时间太短。
  3. 系统没有被证明可以依赖自动化。

提出新问题,展示现象方面很强,但是并没有在生态外推、自动化落地方面有很好的表现。

自己的理解

这篇论文到底在研究什么问题?

这篇论文研究了一种新的机器人交互方式:通过影响空间(视线)结构从而尝试引出一定空间结构下(物理接近,社交隔离的场景)人类的社交交互。

为什么这个问题值得研究?

第一,这种机器人的交互方式以前研究少、浅;第二,物理接近、社交隔离的场景本身有一种矛盾,不利于促进人类社交,因此研究这个问题可以给缓解这个矛盾带来一些灵感;第三,这种机器人交互方式可能为人们研究机器人交互提供全新的思路。

作者提出的核心机制是什么?MirrorBot 到底怎样工作?

核心机制就是利用视线关系来引导人类社交。如何工作的:

  1. 通过电机驱动镜子,镜子改变视线关系。
  2. 设计了四种状态,循序渐进引导人们进入与他人的社交。
  3. 强调社交压力:低压力 → 高压力 → 降低压力。
  4. 着重强调了退出机制,整个过程中强调社交分寸感。

实验是怎么做的,为什么这样设计?

具体来说,实验招募了少量样本。样本数量少,空间单一,时间短。强调都是陌生人。作者团队利用了 cover story 来确保反应更自然,发现更准确。

作者团队仔细设计了人、机器人进场时间,他们的权限等。作者团队利用了视频录像与半结构化访谈来整理,归纳发现。

作者观察到了哪些关键现象?

镜子确实是许多人连接的开端,连接开始后不是只有聊天,而是先用身体/动作/非语言等试水,通过适度的模糊意图来让许多人建立共同猜测。有的时候会失效,邀请不能变成打扰,机器人不一定持续在互动中,机器人的定位建立在共同理解之上且不统一。

论文贡献

  1. 贡献了一种新的机器人交互方式与思路:通过改变空间中的视觉关系影响人的社交,让机器人变成关系的编排者。
  2. 对物理接近、社交隔离的矛盾带来一些缓解矛盾的灵感。

以下为优化:

一句话抓核心 这篇论文研究的是:在 waiting room 这类“陌生人物理上共处、社会上分离”的场景里,机器人能不能通过可动镜子重构共享空间中的视线关系,创造一种低压力、可试探、可退出的 mutual recognition。

这篇论文真正想解决什么 作者抓住了一个公共空间里的社交张力:陌生人虽然坐得很近,但由于手机、礼貌性互不打扰以及直接对视本身的压力,那些本来可能发生的轻量互动很难自然出现。而作者认为,这些微小接触其实有真实的社会价值,所以值得研究。

核心机制是什么 作者提出了 MirrorBot,一个带两面可动镜子的移动机器人。它的关键不在“镜子会动”这件事本身,而在于它可以动态安排“谁在什么时候看到谁”。系统通过四种状态逐步改变人与人之间的视觉关系:先是 Voids,只让人看到环境;再是 Dual Self,让人先看到自己;接着是 Dual Other,让两个人看到彼此;最后是 Self + Other,让每个人同时看到自己和对方。整套机制的设计重点,是把社交压力做成渐进变化,而不是一上来就逼陌生人直接对视。系统同时还内置了退出逻辑,避免邀请变成打扰。

实验是怎么做的 作者做的是一个 qualitative lab study,把 MirrorBot 当作 design probe 来观察现象,而不是拿它做严格的效果验证。他们招募了 16 对陌生人,在 waiting room 里用记忆任务作为 cover story,让两个人先进入正常等待状态,再让 MirrorBot 介入。研究材料主要来自视频记录和事后半结构化访谈,因此作者既能看见参与者的行为,也能知道他们如何解释这段经历。

作者观察到了什么 MirrorBot 经常能让陌生人第一次有社交意味的接触发生在镜子里,而不是直接 face-to-face。之后,互动可能发展成非语言同步,比如一起偏头、一起笑、一起试探镜子的反应;也可能发展成 joint sensemaking,也就是两个人一起猜机器人想干嘛。与此同时,这套机制并不总有效。有些时候只会有一方投入,另一方很冷淡;有些人会觉得被盯着、被打扰,从而回避;还有些组在新鲜感过去以后,机器人就退成背景存在。参与者对机器人的角色理解也不统一,有人把它看成中介,有人觉得它像观察者、宠物、放大器,也有人觉得它是 disruptor。

这篇论文的贡献 这篇论文的第一层贡献,是提出并展示了 MirrorBot 这个研究原型,用“可动镜子 + 动态视线编排”的方式去处理中介式 mutual gaze。第二层贡献,是通过定性研究分析了这种机制在陌生人之间可能引发的几类互动轨迹,包括启动、同步、共同理解、失效和回避。最深的一层贡献,是它扩展了 HRI 对机器人角色的理解:机器人不一定只是直接和人互动的对象,也可以作为 spatial mediator,通过重构共享空间中的 sightlines 和 proxemic relationships,去影响 human‑human engagement。