Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • Brief Review
  • Detail Review
    • ์ฃผ์š” ๊ธฐ์—ฌ
    • ๊ธฐ์ˆ ์  ๋ฐฉ๋ฒ•๋ก 
    • ์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ๊ฒฐ๊ณผ ๋ถ„์„
    • ๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต
    • ์‹ค์ œ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ ๋ฐ ํ™œ์šฉ ๋ฐฉ์•ˆ
    • ํ•œ๊ณ„์  ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

๐Ÿ“ƒRoboArena ๋ฆฌ๋ทฐ

vla
dataset
Distributed Real-World Evaluation of Generalist Robot Policies
Published

September 27, 2025

  • Paper Link
  • Homepage
  • Code Link
  1. ๐Ÿค– ์ด ๋…ผ๋ฌธ์€ ํ˜„๋Œ€์˜ ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ ๋กœ๋ด‡ ์ •์ฑ… ํ‰๊ฐ€์—์„œ ๊ธฐ์กด ์ค‘์•™ ์ง‘์ค‘์‹, ํ‘œ์ค€ํ™”๋œ ์ ‘๊ทผ ๋ฐฉ์‹์˜ ํ™•์žฅ์„ฑ๊ณผ ๋‹ค์–‘์„ฑ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด RoboArena๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ถ„์‚ฐํ˜• ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  2. ๐ŸŒ RoboArena๋Š” ๋ถ„์‚ฐ๋œ ํ‰๊ฐ€์ž ๋„คํŠธ์›Œํฌ๊ฐ€ ์ž์œ ๋กญ๊ฒŒ ์„ ํƒํ•œ ๋‹ค์–‘ํ•œ ์‹ค์ œ ํƒœ์Šคํฌ ๋ฐ ํ™˜๊ฒฝ์—์„œ ์ •์ฑ… ์Œ์„ ์ด์ค‘ ๋งน๊ฒ€์œผ๋กœ ๋น„๊ตํ•˜๊ณ , ๊ทธ ์„ ํ˜ธ๋„ ํ”ผ๋“œ๋ฐฑ์„ ์ง‘๊ณ„ํ•˜์—ฌ ์ •์ฑ… ์„ฑ๋Šฅ์˜ ์ „์—ญ ์ˆœ์œ„๋ฅผ ๋„์ถœํ•ฉ๋‹ˆ๋‹ค.
  3. ๐Ÿ“ˆ 7๊ฐœ ๊ธฐ๊ด€์— ๊ฑธ์นœ DROID ๋กœ๋ด‡ ํ”Œ๋žซํผ์—์„œ 600๊ฐœ ์ด์ƒ์˜ ์‹ค์ œ ๋กœ๋ด‡ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด, ์ด ์ ‘๊ทผ ๋ฐฉ์‹์ด ๊ธฐ์กด ์ค‘์•™ ์ง‘์ค‘์‹ ํ‰๊ฐ€๋ณด๋‹ค ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ ์ •์ฑ…์˜ ์ˆœ์œ„๋ฅผ ๋” ์ •ํ™•ํ•˜๊ฒŒ ๋งค๊ธฐ๋ฉด์„œ๋„ ๋” ํ™•์žฅ ๊ฐ€๋Šฅํ•˜๊ณ , ๋ณต์›๋ ฅ์ด ๋›ฐ์–ด๋‚˜๋ฉฐ, ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

Brief Review

๋ณธ ๋…ผ๋ฌธ์€ ํ˜„๋Œ€์˜ ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ ๋กœ๋ด‡ ์ •์ฑ…(generalist robot policies)์„ ํฌ๊ด„์ ์ด๊ณ , ํŽธํ–ฅ๋˜์ง€ ์•Š์œผ๋ฉฐ, ๋น„๊ต ๊ฐ€๋Šฅํ•œ ๋ฐฉ์‹์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๊ณ ์œ ํ•œ ๊ณผ์ œ๋ฅผ ๋‹ค๋ฃจ๊ธฐ ์œ„ํ•ด RoboArena๋ผ๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ๋กœ๋ด‡ ๋ฒค์น˜๋งˆํ‚น ๋ฐฉ์‹์€ ๊ณ ์ •๋œ ํ‰๊ฐ€ ์ž‘์—… ๋ฐ ํ™˜๊ฒฝ ์ง€์ •์ด๋‚˜ ์ค‘์•™ ์ง‘์ค‘์‹ โ€œ๋กœ๋ด‡ ์ฑŒ๋ฆฐ์ง€โ€ ์ฃผ์ตœ๋ฅผ ํ†ตํ•ด ๋†’์€ ํ‘œ์ค€ํ™”์— ์˜์กดํ•˜์—ฌ ๋‹ค์–‘ํ•œ ์ž‘์—… ๋ฐ ํ™˜๊ฒฝ์— ๊ฑธ์นœ ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ ์ •์ฑ… ํ‰๊ฐ€์— ํ™•์žฅํ•˜๊ธฐ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก  (Core Methodology)

RoboArena๋Š” ๋ถ„์‚ฐ๋œ ํ‰๊ฐ€์ž ๋„คํŠธ์›Œํฌ๋ฅผ ํ†ตํ•ด ํ‰๊ฐ€๋ฅผ ํฌ๋ผ์šฐ๋“œ์†Œ์‹ฑ(crowd-source)ํ•˜๋Š” ๋ฐฉ์‹์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ณ ์ •๋œ ์ž‘์—…, ํ™˜๊ฒฝ ๋˜๋Š” ์œ„์น˜๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ํ‰๊ฐ€๋ฅผ ํ‘œ์ค€ํ™”ํ•˜๋Š” ๋Œ€์‹ , ํ‰๊ฐ€์ž๊ฐ€ ํ‰๊ฐ€ํ•  ์ž‘์—…๊ณผ ํ™˜๊ฒฝ์„ ์ž์œ ๋กญ๊ฒŒ ์„ ํƒํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜์—ฌ ๋‹ค์–‘์„ฑ์„ ์‰ฝ๊ฒŒ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ์ ์€ ํ‰๊ฐ€์ž๋“ค์ด ๋‘ ์ •์ฑ… ์Œ์— ๋Œ€ํ•ด ์ด์ค‘ ๋งน๊ฒ€(double-blind) ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ‰๊ฐ€์ž๋Š” ์‹ค์ œ ๋กœ๋ด‡์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‘ ์ •์ฑ…(\pi_A, \pi_B)์„ ๋™์ผํ•œ ์ดˆ๊ธฐ ์กฐ๊ฑด(๊ทธ๋Ÿฌ๋‚˜ ํ‰๊ฐ€ ์„ธ์…˜ ๊ฐ„์—๋Š” ์ž์œ ๋กญ๊ฒŒ ๋ณ€๊ฒฝ ๊ฐ€๋Šฅ)์—์„œ ์ˆœ์ฐจ์ ์œผ๋กœ ์‹คํ–‰ํ•˜๊ณ , ๋‹ค์Œ ์„ธ ๊ฐ€์ง€ ์œ ํ˜•์˜ ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค:

  1. ์—ฐ์† ์ง„ํ–‰ ์ ์ˆ˜ (continuous progress score): [0 \dots 100] ๋ฒ”์œ„๋กœ, ์ •์ฑ…์ด ์ž‘์—…์—์„œ ๋‹ฌ์„ฑํ•œ ์ตœ๋Œ€ ์ง„ํ–‰๋ฅ ์— ๋น„๋ก€ํ•ฉ๋‹ˆ๋‹ค.
  2. ์ด์ง„ ์Œ๋Œ€ ์„ ํ˜ธ๋„ ๋ ˆ์ด๋ธ” (binary, pairwise preference label): ๋‘ ์ •์ฑ… ์ค‘ ํ‰๊ฐ€์ž๊ฐ€ ์–ด๋–ค ์ •์ฑ…์„ ์„ ํ˜ธํ–ˆ๋Š”์ง€ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  3. ์ž์œ  ํ˜•์‹ ์ž์—ฐ์–ด ์„ค๋ช… (free-form, natural language explanation): ์„ ํ˜ธ๋„์— ๋Œ€ํ•œ ์ด์œ ๋ฅผ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ์Œ๋Œ€ ๋น„๊ต๋กœ๋ถ€ํ„ฐ ์–ป์€ ์„ ํ˜ธ๋„ ํ”ผ๋“œ๋ฐฑ์„ ๋‹ค์–‘ํ•œ ์ž‘์—… ๋ฐ ํ™˜๊ฒฝ์— ๊ฑธ์ณ ํ†ตํ•ฉํ•˜์—ฌ ์ •์ฑ… ์ˆœ์œ„๋ฅผ ๋„์ถœํ•ฉ๋‹ˆ๋‹ค.

๊ธ€๋กœ๋ฒŒ ์ •์ฑ… ์ˆœ์œ„ ๊ณ„์‚ฐ (Computing Global Policy Rankings)

์ •์ฑ… ์ˆœ์œ„๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด Bradley-Terry (BT) ๋ชจ๋ธ [60]์„ ํ™•์žฅํ•œ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ํ‘œ์ค€ BT ๋ชจ๋ธ์€ ๋ชจ๋“  ์Œ๋Œ€ ๋น„๊ต๊ฐ€ ๋™์ผํ•œ ์กฐ๊ฑด์—์„œ ์ด๋ฃจ์–ด์ง„๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ง€๋งŒ, RoboArena์˜ ๊ฒฝ์šฐ ์ž‘์—…์ด ๋‹ค์–‘ํ•˜๊ฒŒ ๋ณ€ํ•˜๋ฏ€๋กœ ์ด ๊ฐ€์ •์ด ์ถฉ์กฑ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ โ€œ์ž‘์—… ํšจ๊ณผ(task-effects)โ€๋ฅผ ๊ณ ๋ คํ•˜๊ธฐ ์œ„ํ•ด BT ๋ชจ๋ธ์— ์ถ”๊ฐ€ ํŒŒ๋ผ๋ฏธํ„ฐ๋“ค์„ ๋„์ž…ํ•ฉ๋‹ˆ๋‹ค.

ํ™•์žฅ๋œ BT ๋ชจ๋ธ์€ ์ •์ฑ… \pi_A๊ฐ€ \pi_B๋ณด๋‹ค ์„ ํ˜ธ๋  ํ™•๋ฅ  p(\pi_A > \pi_B)๋ฅผ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋ชจ๋ธ๋งํ•ฉ๋‹ˆ๋‹ค: p(\pi_A > \pi_B) = \sum_{t=1}^{T} \nu_t \cdot \sigma(\theta_A + \psi_{At} - \tau_t) \cdot (1 - \sigma(\theta_B + \psi_{Bt} - \tau_t))

์—ฌ๊ธฐ์„œ:

  • N: ์ •์ฑ…์˜ ์ด ๊ฐœ์ˆ˜
  • \Pi = \{\pi_1, \dots, \pi_N\}: ์ •์ฑ… ์ง‘ํ•ฉ
  • D_p = \{P_{\pi_A, \pi_B}, t\}: ์Œ๋Œ€ ์„ ํ˜ธ๋„ ๋ฐ์ดํ„ฐ์…‹. P_{\pi_A, \pi_B} \in \{0, 1\}๋Š” ์ด์ง„ ์„ ํ˜ธ๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ , t๋Š” A/B ํ‰๊ฐ€๊ฐ€ ์‹คํ–‰๋œ ์ž‘์—…์„ ์‹๋ณ„ํ•ฉ๋‹ˆ๋‹ค.
  • \theta = (\theta_1, \dots, \theta_N): ๊ฐ ์ •์ฑ… \pi_p์˜ ์ „์—ญ โ€œ๋กœ๊ทธ ๋Šฅ๋ ฅ(log-ability)โ€ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ, ์ •์ฑ…์˜ ์ „๋ฐ˜์ ์ธ ๊ฐ•๋„๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  • T: ์ž ์žฌ๋œ ์ž‘์—… ๋ฒ„ํ‚ท(task buckets)์˜ ์ˆ˜ (ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ).
  • \tau = (\tau_1, \dots, \tau_T): ๊ฐ ๋ฒ„ํ‚ท t์˜ ๊ธฐ๋ณธ ๋‚œ์ด๋„ ํŒŒ๋ผ๋ฏธํ„ฐ.
  • \nu = (\nu_1, \dots, \nu_T): ์ž ์žฌ๋œ ๋ฒ„ํ‚ท์˜ ํ•œ๊ณ„ ์ž‘์—… ํ™•๋ฅ ๋กœ, \sum_{t=1}^{T} \nu_t = 1์„ ๋งŒ์กฑํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ฃผ์–ด์ง„ A/B ํ‰๊ฐ€๊ฐ€ ์ž ์žฌ๋œ ๋ฒ„ํ‚ท t์— ์†ํ•  ์‚ฌ์ „ ํ™•๋ฅ ์„ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค.
  • \psi = ((\psi_{11} \dots \psi_{1T}), \dots, (\psi_{N1} \dots \psi_{NT})): ์ •์ฑ…-์ž‘์—… ์˜คํ”„์…‹์œผ๋กœ, ์ •์ฑ…๋ณ„ ์ž‘์—… ๋‚œ์ด๋„๋ฅผ ๋ชจ๋ธ๋งํ•ฉ๋‹ˆ๋‹ค. ๋‘ ์ •์ฑ…์ด ๋‹ค๋ฅธ ์ž‘์—… ํ•˜์œ„ ์ง‘ํ•ฉ์—์„œ ๋‹ค๋ฅธ ์ƒ๋Œ€์  ์„ฑ๋Šฅ ๊ด€๊ณ„๋ฅผ ๋ณด์ผ ์ˆ˜ ์žˆ๋Š” ํšจ๊ณผ๋ฅผ ๋ฐ˜์˜ํ•ฉ๋‹ˆ๋‹ค.
  • \sigma(z) = 1/(1 + e^{-z}): ๋กœ์ง€์Šคํ‹ฑ ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜.

๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ(\theta, \tau, \nu, \psi)๋Š” ์˜ค์ง ์„ ํ˜ธ๋„ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ตœ๋Œ€ ์šฐ๋„ ์ถ”์ •(maximum likelihood estimation, MLE) ๊ณผ์ •์„ ํ†ตํ•ด ํ•™์Šต๋ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ทผ์‚ฌ MLE๋ฅผ ์œ„ํ•œ ๊ธฐ๋Œ€-์ตœ๋Œ€ํ™”(Expectation-Maximization, EM) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ์ˆ˜ํ–‰๋ฉ๋‹ˆ๋‹ค. ์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ํ˜„์žฌ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ ํ•˜์—์„œ ๋ฐ์ดํ„ฐ์˜ ์šฐ๋„๋ฅผ ์ธก์ •ํ•˜๊ณ , ์ด ์šฐ๋„์˜ 1์ฐจ ๋ฐ 2์ฐจ ๋ฏธ๋ถ„์„ ๊ณ„์‚ฐํ•œ ํ›„, ํด๋ฆฌํ•‘๋œ ๋‰ดํ„ด ์—…๋ฐ์ดํŠธ(clipped Newton updates)๋ฅผ ํ†ตํ•ด ์ตœ๋Œ€ํ™” ๋‹จ๊ณ„๋ฅผ ์ˆ˜ํ–‰ํ•˜๊ณ , ์ƒˆ๋กœ์šด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ค‘์•™์— ๋ฐฐ์น˜ํ•˜์—ฌ ์ œ๋กœ ํ‰๊ท ์„ ์œ ์ง€ํ•˜๋Š” ๊ณผ์ •์„ ๋ฐ˜๋ณตํ•ฉ๋‹ˆ๋‹ค. Davidson ํ™•์žฅ [63]์„ ํ†ตํ•ด ๋ฌด์Šน๋ถ€(tie)๋„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ชจ๋ธ๋ง์— ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.

์ •์„ฑ์  ์ •์ฑ… ํŠน์„ฑ ์ถ”์ถœ (Extracting Qualitative Policy Characteristics)

์ •์ฑ…์˜ ์ •์„ฑ์  ํŠน์„ฑ(์˜ˆ: ์–ธ์–ด ์ง€์‹œ ๋”ฐ๋ฅด๊ธฐ ๋Šฅ๋ ฅ, ๋‹ค๋‹จ๊ณ„ ์ž‘์—… ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ)์„ ์ถ”์ถœํ•˜๊ธฐ ์œ„ํ•ด ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLMs) ๋ฐ ์‹œ๊ฐ-์–ธ์–ด ๋ชจ๋ธ(VLMs)์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ํ‰๊ฐ€ ๋น„๋””์˜ค์˜ ์ฒซ ์ด๋ฏธ์ง€์™€ ํ•ด๋‹น ์ž‘์—… ์ง€์‹œ๋ฅผ VLM (OpenAI GPT-4.5)์— ์ „๋‹ฌํ•˜์—ฌ ์ž‘์—… ์œ ํ˜•(์˜ˆ: pick-place vs. open-close)์„ ๋ถ„๋ฅ˜ํ•˜๊ณ  ์žฅ๋ฉด์˜ ์กฐ๋ช…, ๋ณต์žก์„ฑ, ๊ฐ์ฒด ๊ฐ€์‹œ์„ฑ ๋“ฑ์„ ์„ค๋ช…ํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ ๋‹ค์Œ LLM (OpenAI GPT-4o)์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋“  ํ‰๊ฐ€์— ๋Œ€ํ•œ ์„ ํ˜ธ๋„ ์ฃผ์„, ๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ ๋ฐ ์ž์œ  ํ˜•์‹ ํ‰๊ฐ€์ž ํ”ผ๋“œ๋ฐฑ์„ ์š”์•ฝํ•˜์—ฌ ์ •์ฑ… ๋ณด๊ณ ์„œ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. LLM์€ ๋‹ค๋ฅธ ์ •์ฑ…๊ณผ ๋น„๊ตํ•˜์—ฌ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ณ  ์–ธ์–ด ํ”ผ๋“œ๋ฐฑ์—์„œ ์ •์„ฑ์  ํŠน์„ฑ์„ ์ถ”์ถœํ•˜๋„๋ก ์ง€์‹œ๋ฐ›์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, LLM์€ ๋ณด๊ณ ์„œ์˜ ๋ชจ๋“  ์ฃผ์žฅ์— ๋Œ€ํ•œ ์ฆ๊ฑฐ๋กœ ํ‰๊ฐ€ ์—ํ”ผ์†Œ๋“œ๋ฅผ ์ธ์šฉํ•˜๊ณ , ์—ฐ๊ตฌ์ž๊ฐ€ ์ฃผ์žฅ์„ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ด๋‹น ๋กค์•„์›ƒ ๋น„๋””์˜ค์™€ ๋ณด๊ณ ์„œ๋ฅผ ์ž๋™ ์—ฐ๊ฒฐํ•ฉ๋‹ˆ๋‹ค.

DROID-RoboArena ํ‰๊ฐ€ ์‹œ์Šคํ…œ (The DROID-RoboArena Evaluation System)

RoboArena๋Š” Franka Panda 7DoF ๋กœ๋ด‡ ํŒ”, Robotiq 2F-85 ํ‰ํ–‰-ํ„ฑ ๊ทธ๋ฆฌํผ, ZED-mini ์Šคํ…Œ๋ ˆ์˜ค ์†๋ชฉ ์นด๋ฉ”๋ผ ๋ฐ ์—ฌ๋Ÿฌ ์™ธ๋ถ€ ZED 2 ์Šคํ…Œ๋ ˆ์˜ค ์นด๋ฉ”๋ผ๋กœ ๊ตฌ์„ฑ๋œ DROID ๋กœ๋ด‡ ํ”Œ๋žซํผ [1]์— ๊ตฌํ˜„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์‹œ์Šคํ…œ์€ ์ •์ฑ… ์ถ”๋ก  ์„œ๋ฒ„(policy inference servers), ํ‰๊ฐ€ ํด๋ผ์ด์–ธํŠธ(evaluation clients), ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค(evaluation database), ์ค‘์•™ ํ‰๊ฐ€ ์„œ๋ฒ„(central evaluation server)์˜ ๋„ค ๊ฐ€์ง€ ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ์Šต๋‹ˆ๋‹ค. ์ •์ฑ… ์ถ”๋ก  ์„œ๋ฒ„๋Š” ๋ชจ๋“  ์ •์ฑ…์„ ์›๊ฒฉ์œผ๋กœ ํ˜ธ์ŠคํŒ…ํ•˜์—ฌ ์—ฌ๋Ÿฌ ํ‰๊ฐ€์ž๊ฐ€ ์ž์›์„ ๊ณต์œ ํ•˜๊ณ  ํด๋ผ์ด์–ธํŠธ ์ธก ๊ณ„์‚ฐ ๋ถ€๋‹ด์„ ์ค„์ž…๋‹ˆ๋‹ค. ํ‰๊ฐ€ ํด๋ผ์ด์–ธํŠธ๋Š” ์ค‘์•™ ์„œ๋ฒ„ ๋ฐ ์ •์ฑ… ์„œ๋ฒ„์™€ ํ†ต์‹ ํ•˜๋ฉฐ ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ์„ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค. ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋Š” ๋ชจ๋“  ํ‰๊ฐ€ ๊ฒฐ๊ณผ์™€ ๋กค์•„์›ƒ ๋น„๋””์˜ค๋ฅผ ์ €์žฅํ•ฉ๋‹ˆ๋‹ค. ์ค‘์•™ ํ‰๊ฐ€ ์„œ๋ฒ„๋Š” ํ‰๊ฐ€์ž์—๊ฒŒ ์ •์ฑ…์„ ํ• ๋‹นํ•˜๊ณ , ์ •์ฑ… ํ’€์˜ ์‹ ๊ทœ ๋˜๋Š” ํ๊ธฐ ์ •์ฑ…์„ ์ถ”์ ํ•˜๋ฉฐ, ์‹œ๊ฐ„ ์ดˆ๊ณผ ์‹œ ํ‰๊ฐ€๋ฅผ ์ทจ์†Œํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ (Experiments)

7๊ฐœ์˜ ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ DROID ์ •์ฑ…(PaliGemma ๋˜๋Š” \pi_0 ๊ธฐ๋ฐ˜ ๋ชจ๋ธ)์„ ์‚ฌ์šฉํ•˜์—ฌ ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. โ€œ์˜ค๋ผํด(oracle)โ€ ์ •์ฑ… ์ˆœ์œ„๋Š” ๋ชจ๋“  ์ •์ฑ…์„ ๋ชจ๋“  ํ…Œ์ŠคํŠธ๋œ ์ž‘์—…์— ๋Œ€ํ•ด ์ฒ ์ €ํžˆ ํ‰๊ฐ€ํ•˜๊ณ  ํ‰๊ท  ์ง„ํ–‰ ์ ์ˆ˜๋ฅผ ๋น„๊ตํ•˜์—ฌ ์„ค์ •๋˜์—ˆ์œผ๋ฉฐ, ์ด 4284๊ฐœ์˜ ํ‰๊ฐ€๊ฐ€ ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. RoboArena๋Š” ๊ธฐ์กด์˜ ๋กœ๋ด‡ ํ‰๊ฐ€ ์ ‘๊ทผ ๋ฐฉ์‹(Pertsch et al. [5]์—์„œ ์‚ฌ์šฉ๋œ DROID ํ‰๊ฐ€ ์ ˆ์ฐจ)๊ณผ ๋น„๊ต๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  1. ์ •ํ™•์„ฑ: RoboArena์˜ ์Œ๋Œ€ ๋น„๊ต ๊ธฐ๋ฐ˜ ์ •์ฑ… ์ˆœ์œ„๋Š” Pearson ์ƒ๊ด€ ๊ณ„์ˆ˜(r) ๋ฐ MMRV (Mean Maximum Rank Violation) ์ง€ํ‘œ์—์„œ ๊ธฐ์กด ๋กœ๋ด‡ ํ‰๊ฐ€ ๋ฐฉ์‹(โ€œRegularโ€)๋ณด๋‹ค ์˜ค๋ผํด ์ˆœ์œ„์™€ ํ›จ์”ฌ ๋” ๋†’์€ ์ƒ๊ด€ ๊ด€๊ณ„๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์ œ์•ˆ๋œ ์ž‘์—… ์ธ์ง€ ์ˆœ์œ„ ์ ‘๊ทผ ๋ฐฉ์‹(โ€œTASKโ€)์ด ํ‘œ์ค€ Elo [61] ๋˜๋Š” Bradley-Terry (โ€œBTโ€) ๋ชจ๋ธ๋ณด๋‹ค ๊ฐ€์žฅ ์ •ํ™•ํ•œ ์ˆœ์œ„๋ฅผ ์ œ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. ์ง„ํ–‰ ์ ์ˆ˜(โ€œPROGโ€)๋ฅผ ์‚ฌ์šฉํ•œ ์ˆœ์œ„๋„ ํšจ๊ณผ์ ์ด์—ˆ์ง€๋งŒ, ์ •์ฑ… ์„ฑ๋Šฅ์— ๋Œ€ํ•œ ๋ฏธ๋ฌ˜ํ•œ ํ”ผ๋“œ๋ฐฑ(์˜ˆ: ๋™์ผํ•œ ์ง„ํ–‰ ์ ์ˆ˜๋ผ๋„ ๋” ์‹ ์†ํ•˜๊ฑฐ๋‚˜ ์ž์‹ ๊ฐ ์žˆ๋Š” ๋™์ž‘)์„ ๋†“์น  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ (Sample Efficiency): RoboArena๋Š” ๋ถˆ๊ณผ 100๊ฐœ์˜ ์Œ๋Œ€ ๋น„๊ต ๋‚ด์—์„œ ๊ณ ํ’ˆ์งˆ ์ˆœ์œ„์— ์ˆ˜๋ ดํ•˜๋ฉฐ, ์ด๋Š” ๊ธฐ์กด ๋กœ๋ด‡ ํ‰๊ฐ€ ๋ฐฉ์‹๊ณผ ์œ ์‚ฌํ•œ ์ˆ˜๋ ด ์†๋„๋ฅผ ๋ณด์ด๋ฉด์„œ๋„ ํ›จ์”ฌ ๋” ์ •ํ™•ํ•œ ์ˆœ์œ„๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋” ๋งŽ์€ ๋น„๊ต๊ฐ€ ์ˆ˜์ง‘๋ ์ˆ˜๋ก ์ˆœ์œ„์˜ ํ’ˆ์งˆ์€ ๋”์šฑ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.
  3. ์ •์„ฑ์  ํ†ต์ฐฐ๋ ฅ ์ถ”์ถœ: VLM์„ ํ†ตํ•œ ์ž‘์—… ๋ถ„๋ฅ˜๋Š” ์•ฝ 95%์˜ ์ •ํ™•๋„๋ฅผ ๋ณด์˜€์œผ๋ฉฐ, LLM ์ง€์› ๋ถ„์„ ๋„๊ตฌ๊ฐ€ ์ƒ์„ฑํ•œ ์ •์ฑ… ๋ณด๊ณ ์„œ์˜ ๋น„๊ต ์ฃผ์žฅ์€ ์‹ค์ œ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์˜ ์Šน๋ฅ ๊ณผ ์ผ์น˜ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค.

์ผ๋ฐ˜ํ™”๋œ ์ •์ฑ…์˜ ๊ฐ•์  ๋ฐ ์•ฝ์  (Strengths and Weaknesses of Generalist Policies)

RoboArena๋ฅผ ํ†ตํ•œ ๊ด‘๋ฒ”์œ„ํ•œ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ํ˜„์žฌ ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ ์ •์ฑ…๋“ค์˜ ์ผ๊ด€๋œ ํ–‰๋™ ํŒจํ„ด๊ณผ ์‹คํŒจ ๋ชจ๋“œ๊ฐ€ ํ™•์ธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์š” ๊ฐ•์ ์€ ๋‹ค์–‘ํ•œ ์‹œ์ , ์กฐ๋ช… ์กฐ๊ฑด ๋ฐ ๋ฐฐ๊ฒฝ์—์„œ ์ž‘๋™ํ•˜๋Š” ๋Šฅ๋ ฅ์ž…๋‹ˆ๋‹ค. ์ง์ ‘์ ์ธ ๊ฐ์ฒด ์กฐ์ž‘(์˜ˆ: ์ง‘์–ด์„œ ๋†“๊ธฐ, ๋ฐ€๊ธฐ, ๋„˜์–ด๋œจ๋ฆฌ๊ธฐ, ๊ฐ„๋‹จํ•œ ์—ด๊ณ  ๋‹ซ๊ธฐ)๊ณผ ๊ด€๋ จ๋œ ์ž‘์—…์€ ๋„๊ตฌ ์‚ฌ์šฉ, ์ฒœ ์กฐ์ž‘ ๋˜๋Š” ๋ณต์žกํ•œ ์˜๋ฏธ๋ก ์  ์ดํ•ด๋ฅผ ์š”๊ตฌํ•˜๋Š” ์ž‘์—…๋ณด๋‹ค ๋” ์•ˆ์ •์ ์œผ๋กœ ํ•ด๊ฒฐ๋ฉ๋‹ˆ๋‹ค. ํŠนํžˆ, ์ •์ฑ…๋“ค์€ ๋ชฉํ‘œ๊ฐ€ ๊ฐ„๋‹จํ•˜๊ณ  ์‹œ๊ฐ์ ์œผ๋กœ ๊ธฐ๋ฐ˜์„ ๋‘˜ ๋•Œ ๋” ์ž˜ ์ˆ˜ํ–‰๋˜์ง€๋งŒ, ์ •๋ฐ€ํ•œ ์ •๋ ฌ, ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก  ๋˜๋Š” ํŠน์ • ์†์„ฑ(๊ฐ์ฒด ํด๋ž˜์Šค, ์ƒ‰์ƒ) ์ธ์‹์ด ํ•„์š”ํ•  ๋•Œ๋Š” ์–ด๋ ค์›€์„ ๊ฒช์Šต๋‹ˆ๋‹ค. ๋ณ€ํ˜• ๊ฐ€๋Šฅํ•œ ๊ฐ์ฒด(์˜ˆ: ์ ‘๊ธฐ, ๋ฎ๊ธฐ) ๋ฐ ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋™์ž‘(์˜ˆ: ๋‹ฆ๊ธฐ, ํผ๋‚ด๊ธฐ)๊ณผ ๊ด€๋ จ๋œ ์ž‘์—…์€ ์—ฌ์ „ํžˆ ์ฃผ์š” ๋„์ „ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค.

์ •์ฑ… ๊ณ„์—ด์„ ๋น„๊ตํ•  ๋•Œ, ์ž๋™ ํšŒ๊ท€ ์ •์ฑ…(autoregressive policies, ์˜ˆ: PG-FAST-DROID, PG-FAST+-DROID, \pi_0-FAST-DROID)์€ ๋” ์ •ํ™•ํ•œ ์–ธ์–ด ์ง€์‹œ ๋”ฐ๋ฅด๊ธฐ ๋Šฅ๋ ฅ ๋•๋ถ„์— ์ง‘์–ด์„œ ๋†“๊ธฐ, ์Œ“๊ธฐ ๋ฐ ๋ถ„๋ฅ˜ ์ž‘์—…์—์„œ ๋” ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํ™•์‚ฐ ๊ธฐ๋ฐ˜ ์ •์ฑ…(diffusion-based policies, ์˜ˆ: PG-flow-DROID, \pi_0-flow-DROID)์€ ๋ฏธ๋„๋Ÿฌ๋œจ๋ฆฌ๊ธฐ ๋ฐ ๋‹ฆ๊ธฐ์™€ ๊ฐ™์€ ์œ ์—ฐํ•˜๊ฑฐ๋‚˜ ์—ฐ์†์ ์ธ ๋™์ž‘ ์ž‘์—…์—์„œ ์ž˜ ์ˆ˜ํ–‰๋˜์ง€๋งŒ, ์ •๋ฐ€ํ•œ ์–ธ์–ด ์ง€์‹œ๊ฐ€ ํ•„์š”ํ•œ ์ž‘์—…์—์„œ๋Š” ๋’ค์ฒ˜์ง€๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋น„๋‹(binning) ์ •์ฑ…(์˜ˆ: PG-Bin-DROID)์€ ๊ฑฐ์˜ ๋ชจ๋“  ์ž‘์—…์—์„œ ์ง€์†์ ์œผ๋กœ ์ €์กฐํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

๊ฒฐ๋ก  (Conclusion)

RoboArena๋Š” ๋ถ„์‚ฐ๋œ ํ‰๊ฐ€์ž ๋„คํŠธ์›Œํฌ๋ฅผ ํ†ตํ•ด ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ ๋กœ๋ด‡ ์ •์ฑ…์„ ํ‰๊ฐ€ํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ถ„์‚ฐํ˜• ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ธฐ์กด ์ค‘์•™ ์ง‘์ค‘์‹ ํ‰๊ฐ€ ๋ฐฉ์‹๋ณด๋‹ค ๋” ์ •ํ™•ํ•œ ์ •์ฑ… ์„ฑ๋Šฅ ์ˆœ์œ„๋ฅผ ์ƒ์„ฑํ•˜๋ฉด์„œ๋„ ๋†’์€ ํ‰๊ฐ€ ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, LLM ์ง€์› ๋ถ„์„ ๋„๊ตฌ๋ฅผ ํ†ตํ•ด ํ‰๊ฐ€ ๊ฒฐ๊ณผ์—์„œ ์ •์„ฑ์  ํ†ต์ฐฐ๋ ฅ์„ ์ถ”์ถœํ•˜๋Š” ๋ฐฉ๋ฒ•๋„ ์†Œ๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. RoboArena ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ์— ๊ณต๊ฐœ๋  ์˜ˆ์ •์ด๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์ œ๋„ˆ๋Ÿด๋ฆฌ์ŠคํŠธ ๋กœ๋ด‡ ์ •์ฑ…์˜ ๋น„๊ต ๊ฐ€๋Šฅ์„ฑ์„ ๋†’์ผ ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.


Detail Review

RoboArena: ๋ฒ”์šฉ ๋กœ๋ด‡ ์ •์ฑ…์˜ ๋ถ„์‚ฐ ์‹ค์„ธ๊ณ„ ํ‰๊ฐ€

์ฃผ์š” ๊ธฐ์—ฌ

์ด ๋…ผ๋ฌธ์€ RoboArena๋ผ๋Š” ๋ถ„์‚ฐํ˜• ์‹ค์„ธ๊ณ„ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, ๊ธฐ์กด์˜ ์ค‘์•™์ง‘์ค‘์‹ ๋ฐฉ์‹์ด ์•„๋‹Œ ํฌ๋ผ์šฐ๋“œ์†Œ์‹ฑ์— ๊ธฐ๋ฐ˜ํ•œ ๋กœ๋ด‡ ์ •์ฑ… ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•œ๋‹ค. RoboArena์—์„œ๋Š” ํ‰๊ฐ€์ž๊ฐ€ ํŠน์ • ํ™˜๊ฒฝ๊ณผ ๊ณผ์ œ๋ฅผ ์ž์œ ๋กญ๊ฒŒ ์„ ํƒํ•˜๊ณ , ๋‘ ๊ฐœ์˜ ์ •์ฑ…์„ ๋ธ”๋ผ์ธ๋“œ๋กœ ๋น„๊ต ํ‰๊ฐ€(A/B ์Œ๋น„๊ต)ํ•˜์—ฌ ์–ด๋–ค ์ •์ฑ…์ด ๋” ์šฐ์ˆ˜ํ•œ์ง€ ์„ ํ˜ธ๋„๋ฅผ ๊ธฐ๋กํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ๋ชจ์ธ ์„ ํ˜ธ๋„ ํ”ผ๋“œ๋ฐฑ์„ Bradley-Terry ๋ชจ๋ธ๊ณผ ๊ฐ™์€ ํ†ต๊ณ„์  ์ˆœ์œ„ ๋ชจํ˜•์œผ๋กœ ์ข…ํ•ฉํ•˜์—ฌ ์ •์ฑ…์˜ ์ „์—ญ ์ˆœ์œ„๋ฅผ ์ถ”์ •ํ•œ๋‹ค. ์ด ๋ฐฉ์‹์˜ ํ•ต์‹ฌ์€ ๊ณ ์ •๋œ ์ž‘์—…์ด๋‚˜ ํ™˜๊ฒฝ์— ์–ฝ๋งค์ด์ง€ ์•Š๊ณ  ํ‰๊ฐ€ ๋‹ค์–‘์„ฑ์„ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์ฒ˜๋Ÿผ ๊ณผ์ œ๋‚˜ ํ™˜๊ฒฝ์„ ํ‘œ์ค€ํ™”ํ•˜์ง€ ์•Š๊ณ , ์—ฌ๋Ÿฌ ํ‰๊ฐ€์ž๊ฐ€ ์„œ๋กœ ๋‹ค๋ฅธ ์กฐ๊ฑด์—์„œ ํ‰๊ฐ€์— ์ฐธ์—ฌํ•˜๋„๋ก ํ•จ์œผ๋กœ์จ, ๊ด‘๋ฒ”์œ„ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ํฌ์šฉํ•˜๋ฉด์„œ๋„ ๊ฒฐ๊ณผ์˜ ๊ณต์ •์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ์„ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ๋‹ค. ํŠนํžˆ RoboArena๋Š” ๋‹จ์ˆœ ์‹คํ—˜ ๊ฒฐ๊ณผ์˜ ์ˆœ์œ„ํ™”๋ฟ ์•„๋‹ˆ๋ผ, ์–ธ์–ดํ˜• ํ”ผ๋“œ๋ฐฑ์„ ๋ถ„์„ํ•ด ๊ฐ ์ •์ฑ…์˜ ์ •์„ฑ์  ๊ฐ•์•ฝ์ ๋„ ๋„์ถœํ•œ๋‹ค. ์‹ค์ œ 7๊ฐœ ๊ธฐ๊ด€์˜ DROID ๋กœ๋ด‡ ํ”Œ๋žซํผ์„ ํ™œ์šฉํ•ด 600ํšŒ ์ด์ƒ์˜ ์Œ๋น„๊ต(์ด 4284 ์—ํ”ผ์†Œ๋“œ)๋ฅผ ์ˆ˜ํ–‰ํ•œ ๊ฒฐ๊ณผ, RoboArena๋Š” ๊ธฐ์กด ์ค‘์•™์ง‘์ค‘์‹ ํ‰๊ฐ€๋ณด๋‹ค ๋ฒ”์šฉ ์ •์ฑ…๋“ค์˜ ์„ฑ๋Šฅ์„ ๋” ์ •ํ™•ํžˆ ์ˆœ์œ„ํ™”ํ•จ์„ ๋ณด์˜€๋‹ค. ์ด ํ‰๊ฐ€ ๋„คํŠธ์›Œํฌ์™€ DROID ํ”Œ๋žซํผ์„ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ•˜์—ฌ, ๋ˆ„๊ตฌ๋‚˜ ์ •์ฑ…์„ ์ œ์ถœํ•˜๊ณ  ํ‰๊ฐ€์— ์ฐธ์—ฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜๋Š” ๊ฒƒ๋„ ์ค‘์š”ํ•œ ๊ธฐ์—ฌ์ด๋‹ค.

๊ธฐ์ˆ ์  ๋ฐฉ๋ฒ•๋ก 

RoboArena์˜ ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ์€ ์ค‘์•™์„œ๋ฒ„์™€ ๋ถ„์‚ฐํ˜• ํ‰๊ฐ€์ž(Client)๋กœ ๊ตฌ์„ฑ๋œ๋‹ค. ํ‰๊ฐ€์ž๋Š” ์ค‘์•™ ์„œ๋ฒ„์—์„œ ๋ฌด์ž‘์œ„๋กœ ๋‘ ์ •์ฑ…์„ ํ• ๋‹น๋ฐ›์•„ ๋กœ๋ด‡์—๊ฒŒ ๋™์ž‘์„ ์‹คํ–‰์‹œํ‚ค๋ฉฐ, ์ •์ฑ…์˜ ์ด๋ฆ„ ๋“ฑ์€ ์•Œ ์ˆ˜ ์—†๊ฒŒ ๋ธ”๋ผ์ธ๋“œ๋กœ ์ง„ํ–‰๋œ๋‹ค. ์ด๋•Œ ํ‰๊ฐ€์ž๋Š” ์žฅ๋ฉด์„ ์žฌ๋ฐฐ์น˜ํ•˜๊ณ (์˜ˆ: ๋กœ๋ด‡๊ณผ ๋ฌผ์ฒด์˜ ์œ„์น˜ ์กฐ์ •) ์–ธ์–ด ์ง€์‹œ๋ฌธ์œผ๋กœ ์ƒˆ๋กœ์šด ๊ณผ์ œ๋ฅผ ์ •์˜ํ•˜์—ฌ, ๋‘ ์ •์ฑ…์„ ์ฐจ๋ก€๋กœ ์‹คํ–‰ํ•œ๋‹ค. ์‹คํ–‰ ํ›„ ํ‰๊ฐ€์ž๋Š” ์„ธ ๊ฐ€์ง€ ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ•œ๋‹ค: (1) ๊ณผ์ œ ์ˆ˜ํ–‰ ์ •๋„์— ๋”ฐ๋ฅธ ์ง„ํ–‰๋„ ์ ์ˆ˜(progress score), (2) ๋‘ ์ •์ฑ… ์ค‘ ๋” ๋‚˜์€ ์ •์ฑ…์„ ์„ ํƒํ•˜๋Š” ์„ ํ˜ธ๋„(Preference), (3) ์„ ํƒ ์ด์œ ๋ฅผ ์„ค๋ช…ํ•˜๋Š” ์ž์œ  ์„œ์ˆ ํ˜• ์–ธ์–ด ํ”ผ๋“œ๋ฐฑ. ์Œ๋น„๊ต ๋ฐ์ดํ„ฐ๋Š” Bradley-Terry(BT) ๋ชจ๋ธ์ด๋‚˜ Elo ๋ชจ๋ธ๋กœ ํ†ตํ•ฉ ์ˆœ์œ„๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐ ํ™œ์šฉ๋œ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ํ‘œ์ค€ BT/Elo ๊ธฐ๋ฐ˜์˜ ์ˆœ์œ„ ์‚ฐ์ถœ๊ณผ, ์ž‘์—… ํŠน์„ฑ์„ ๋ฐ˜์˜ํ•˜๋Š” Task-aware ์ˆœ์œ„๊ธฐ๋ฒ•์„ ๋น„๊ตํ•œ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ์ž‘์—…๋ณ„ ํŠน์„ฑ ๊ณ ๋ คํ•˜๋Š” ๋ฐฉ๋ฒ•(TASK)์ด ๊ฐ€์žฅ ์ •ํ™•ํ•œ ์ˆœ์œ„๋ฅผ ๋‚ธ๋‹ค. ๋˜ํ•œ ๋‹จ์ˆœํžˆ ์ง„ํ–‰๋„ ํ‰๊ท ์œผ๋กœ ์ˆœ์œ„ ๋งค๊ธฐ๊ธฐ(PROG)๋„ ๊ฝค ํšจ๊ณผ์ ์ด๋‚˜, ์ •์ฑ… ๊ฐ„ ๋ฏธ์„ธํ•œ ์ฐจ์ด๋ฅผ ๋†“์น  ์ˆ˜ ์žˆ์–ด ์„ ํ˜ธ๋„์™€ ํ•จ๊ป˜ ๋ณ‘ํ–‰ ๋ณด๊ณ ํ•  ๊ฒƒ์„ ์ œ์•ˆํ•œ๋‹ค. ํ‰๊ฐ€ ์‹œ์Šคํ…œ์€ ์›๊ฒฉ ํ˜ธ์ŠคํŒ… ์ •์ฑ… ์„œ๋ฒ„์™€ ํด๋ผ์ด์–ธํŠธ, ์ค‘์•™ ์„œ๋ฒ„, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋กœ ๊ตฌ์„ฑ๋œ๋‹ค. ์ •์ฑ… ์„œ๋ฒ„์—๋Š” ์ œ์ถœ๋œ ์ •์ฑ…์ด ์˜ฌ๋ผ๊ฐ€ ์žˆ์œผ๋ฉฐ, ์—ฌ๋Ÿฌ ํ‰๊ฐ€์ž๊ฐ€ ๋™์‹œ์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ํ‰๊ฐ€ ํด๋ผ์ด์–ธํŠธ๋Š” ๋กœ๋ด‡์— ์—ฐ๊ฒฐ๋œ ์ปดํ“จํ„ฐ๋กœ, ์ค‘์•™ ์„œ๋ฒ„์™€ ํ†ต์‹ ํ•˜๋ฉด์„œ ํ‰๊ฐ€ ์ง„ํ–‰ ๊ณผ์ •์„ ์•ˆ๋‚ดํ•œ๋‹ค. ๋กœ๋ด‡ ํ˜„์žฅ์—๋Š” ๋ณ„๋„์˜ ์ถ”๋ก  ์—ฐ์‚ฐ์ด ํ•„์š” ์—†์œผ๋ฏ€๋กœ, ํ‰๊ฐ€์ž๊ฐ€ ๋กœ๋ด‡์ด ์žˆ๋Š” ์‹คํ—˜์‹ค๋งŒ ์žˆ์œผ๋ฉด ์‰ฝ๊ฒŒ ์ฐธ์—ฌํ•  ์ˆ˜ ์žˆ๋‹ค. ์ค‘์•™ ์„œ๋ฒ„๋Š” ํ‰๊ฐ€ ๊ณผ์ œ ๋ฐฐ์ • ๋ฐ ๋ฐ์ดํ„ฐ ์ €์žฅ์„ ๊ด€๋ฆฌํ•˜๋ฉฐ, ์‹œ๊ฐ„์ดˆ๊ณผ๋œ ์‹คํ—˜์„ ์ž๋™ ์ข…๋ฃŒํ•œ๋‹ค.

์ •์„ฑ์  ๋ถ„์„์„ ์œ„ํ•ด ๋…ผ๋ฌธ์€ ๋น„์ „ยท์–ธ์–ด ๋ชจ๋ธ(VLM)๊ณผ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•œ๋‹ค. ๋จผ์ € ํ‰๊ฐ€ ๋™์˜์ƒ์˜ ์ฒซ ํ”„๋ ˆ์ž„๊ณผ ์–ธ์–ด ์ง€์‹œ๋ฌธ์„ GPT-4o ๊ฐ™์€ VLM์— ์ž…๋ ฅํ•ด ๊ณผ์ œ ๋ฒ”์ฃผ(์˜ˆ: ์ง‘๊ธฐ, ์—ด๊ธฐ ๋“ฑ) ๋ฐ ์žฅ๋ฉด ํŠน์„ฑ(์กฐ๋ช…, ๋‚œ์ด๋„ ๋“ฑ)์„ ๋ถ„๋ฅ˜ํ•œ๋‹ค. ์ด์–ด ๊ฐ ์ •์ฑ…์— ๋Œ€ํ•ด ์ˆ˜์ง‘๋œ ์„ ํ˜ธ๋„์™€ ํ”ผ๋“œ๋ฐฑ, ๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ๋ฅผ GPT-3.5o LLM์œผ๋กœ ์š”์•ฝ ๋ณด๊ณ ์„œ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค. ์ด ๋ณด๊ณ ์„œ๋Š” โ€œ์–ด๋–ค ์ƒํ™ฉ์—์„œ ์ •์ฑ… A๊ฐ€ B๋ณด๋‹ค ๋‚ซ๋‹ค/๋ชปํ•˜๋‹คโ€์™€ ๊ฐ™์€ ๋‚ด์šฉ์„ ์—ํ”ผ์†Œ๋“œ ์ฆ๊ฑฐ์™€ ํ•จ๊ป˜ ๊ธฐ์ˆ ํ•˜๋ฉฐ, ๊ฐ ์ฃผ์žฅ์˜ ๊ทผ๊ฑฐ๊ฐ€ ๋˜๋Š” ์‹คํ—˜ ์˜์ƒ์„ ์ฐธ์กฐ๋กœ ๋‹ฌ์•„ ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค.

์‹คํ—˜์— ์‚ฌ์šฉ๋œ ์ •์ฑ…๋“ค์€ DROID ๋ฐ์ดํ„ฐ์…‹์— ๋งž์ถฐ ๋ฏธ๋ฆฌ ํ•™์Šต๋œ ๋ฒ”์šฉ ๋น„์ „-์–ธ์–ด-ํ–‰๋™ ๋ชจ๋ธ๋“ค์ด๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ PaliGemma ๊ธฐ๋ฐ˜ ๋˜๋Š” GPT-VLM ๊ธฐ๋ฐ˜์˜ ์—ฌ๋Ÿฌ ๋ณ€์ข…(VLA Flow, FAST ๋“ฑ)์„ DROID ๋ฐ์ดํ„ฐ๋กœ ๋ฏธ์„ธ์กฐ์ •ํ•˜์—ฌ ์‚ฌ์šฉํ•œ๋‹ค. ์ด๋“ค์€ ๋ชจ๋‘ out-of-the-box ๋กœ ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ๊ณผ ๊ณผ์ œ์—์„œ ์ž‘๋™ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ๋‹ค.

์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ๊ฒฐ๊ณผ ๋ถ„์„

์‹คํ—˜์—๋Š” 7๊ฐœ ๊ธฐ๊ด€์˜ DROID ๋กœ๋ด‡ ํ”Œ๋žซํผ(Frank Panda 7-DoF ํŒ”+2F-85 ๊ทธ๋ฆฌํผ)์—์„œ ์ด 7๊ฐœ ์ •์ฑ…์„ ํ‰๊ฐ€ํ–ˆ๋‹ค. ๊ฐ์ •์ฑ…์€ PaliGemma ๋˜๋Š” GPT-4o ๊ธฐ๋ฐ˜์˜ ์‚ฌ์ „ํ•™์Šต ๋ชจ๋ธ์„ DROID ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๋ฏธ์„ธ์กฐ์ •ํ•œ ๊ฒƒ์œผ๋กœ, ๋Œ€ํ‘œ์ ์œผ๋กœ flow-DROID, FAST-DROID, PG-FAST-DROID, PG-FSQ-DROID ๋“ฑ ๋‹ค์–‘ํ•œ ์•ก์…˜ ํ‘œํ˜„์„ ์‚ฌ์šฉํ•œ๋‹ค. ์‹คํ—˜ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์—๋Š” ์ด 612ํšŒ์˜ ์Œ๋น„๊ต๊ฐ€ ์ˆ˜ํ–‰๋˜์—ˆ๊ณ , ํ‰๊ฐ€ ๊ณผ์ •์—์„œ์˜ ๊ฐœ๋ณ„ ์ •์ฑ… ์‹คํ–‰(๋กค์•„์›ƒ)์€ ์ด 4284ํšŒ์— ๋‹ฌํ•œ๋‹ค. ๋น„๊ต ๊ธฐ์ค€์œผ๋กœ โ€œ์˜ค๋ผํด ์ˆœ์œ„โ€๋ฅผ ์ •์˜ํ–ˆ๋‹ค. ์ด๋Š” ๋ชจ๋“  ์ •์ฑ…์„ ๋ชจ๋“  ๊ณผ์ œ์—์„œ ํ‰๊ฐ€ํ•œ ํ›„ ํ‰๊ท  ์ง„ํ–‰๋„ ์ ์ˆ˜๋กœ ์–ป์€ ์ˆœ์œ„๋กœ, ์‹ค์ œ ์™„์ „ ํƒ์ƒ‰ ๊ธฐ์ค€์˜ ์ˆœ์œ„๋ผ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์˜ค๋ผํด์„ ์–ป๊ธฐ ์œ„ํ•ด ๊ฐ ์Œ๋น„๊ต๊ฐ€ ๋๋‚  ๋•Œ๋งˆ๋‹ค ๋‚˜๋จธ์ง€ ์ •์ฑ…๋“ค๋„ ๋™์ผ ์กฐ๊ฑด์—์„œ ์‹คํ–‰ํ•ด ์ด 4284ํšŒ์˜ ์„ฑ๋Šฅ ์ ์ˆ˜๋ฅผ ๋ชจ์•˜๋‹ค. ๊ธฐ์กด ๋ฐฉ์‹์ธ ์ค‘์•™์ง‘์ค‘์‹ ํ‰๊ฐ€๋Š” Pertsch et al.์˜ 17๊ฐœ ๊ณ ์ • ๊ณผ์ œ ํ‰๊ฐ€ ์ ˆ ์ฐจ(์ •์ œ๋œ ํ™˜๊ฒฝ, ์ •์ฑ…๋‹น 44 ์—ํ”ผ์†Œ๋“œ)๋ฅผ ์‚ฌ์šฉํ–ˆ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ, RoboArena์˜ ๋ถ„์‚ฐ ์Œ๋น„๊ต ๋ฐฉ์‹์ด ์˜ค๋ผํด ์ˆœ์œ„์™€์˜ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๊ธฐ์กด ํ‰๊ฐ€๋ณด๋‹ค ์œ ์˜๋ฏธํ•˜๊ฒŒ ๋†’์•˜๋‹ค. ๊ทธ๋ฆผ 6์— ๋”ฐ๋ฅด๋ฉด, ์ผ๋ฐ˜ ํ‰๊ฐ€(Regular)๋Š” ์ƒ๊ด€๊ณ„์ˆ˜๊ฐ€ ๋‚ฎ๊ฒŒ ๋‚˜์˜จ ๋ฐ˜๋ฉด, RoboArena(BT, Elo, TASK) ๋ชจ๋‘ ํ›จ์”ฌ ๋†’์€ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๋ณด์˜€๋‹ค. ํŠนํžˆ Task-aware ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•œ ์ˆœ์œ„ ๊ณ„์‚ฐ์ด ๊ฐ€์žฅ ์ •ํ™•ํ–ˆ์œผ๋ฉฐ, ๊ธฐ๋ณธ BT๋‚˜ Elo์— ๋น„ํ•ด ์ •์ฑ… ๊ฐ„ ์„ธ๋ถ€ ์„ฑ๋Šฅ ์ฐจ์ด๋ฅผ ์ž˜ ๋ฐ˜์˜ํ–ˆ๋‹ค. ์ด ๊ฒฐ๊ณผ๋Š” ํ‘œํ˜„๋ ฅ์ด ํ’๋ถ€ํ•œ ์•ก์…˜ ํ‘œํ˜„(flow, FAST ๋“ฑ)์ด ๋‹จ์ˆœ ํ† ํฌ๋‚˜์ด์ œ์ด์…˜๋ณด๋‹ค ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•œ ๊ธฐ์กด ์—ฐ๊ตฌ ๊ฒฐ๊ณผ์™€ ์ผ์น˜ํ•œ๋‹ค.

๋˜ ๋‹ค๋ฅธ ๊ฒฐ๊ณผ๋กœ, ์ง„ํ–‰๋„ ๊ธฐ๋ฐ˜ ์ˆœ์œ„(PROG)๋„ ์ƒ๋‹นํžˆ ํšจ๊ณผ์ ์ด์—ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‹คํ—˜์„ ํ†ตํ•ด ํ‰๊ฐ€์ž๋Š” ๋‘ ์ •์ฑ…์— ๋™์ผํ•œ ์ง„ํ–‰๋„ ์ ์ˆ˜๋ฅผ ์ค„ ๋•Œ๋„ ๋ช…๋ฐฑํžˆ ํ•˜๋‚˜๋ฅผ ์„ ํ˜ธํ•  ์ˆ˜ ์žˆ์Œ์ด ๊ด€์ฐฐ๋๋‹ค(์˜ˆ: ๋” ๋น ๋ฅด๊ฑฐ๋‚˜ ์ž์‹ ๊ฐ ์žˆ๊ฒŒ ํ–‰๋™ํ•˜๋Š” ์ •์ฑ…). ๋”ฐ๋ผ์„œ RoboArena๋Š” ์ง„ํ–‰๋„ ์ ์ˆ˜์™€ ์„ ํ˜ธ๋„ ๋ชจ๋‘๋ฅผ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์ „์ฒด์  ์ •์ฑ… ๋น„๊ต์— ์œ ์šฉํ•จ์„ ์‹œ์‚ฌํ•œ๋‹ค. ํ•œํŽธ ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ ๋ถ„์„์—์„œ๋Š” RoboArena๊ฐ€ ์•ฝ 100ํšŒ์˜ ์Œ๋น„๊ต๋งŒ์œผ๋กœ๋„ ๊ณ ํ’ˆ์งˆ ์ˆœ์œ„์— ์ˆ˜๋ ดํ•จ์„ ํ™•์ธํ–ˆ๋‹ค. ์ด๋Š” ๊ธฐ์กด ์ค‘์•™์ง‘์ค‘์‹ ํ‰๊ฐ€๊ฐ€ ์ •์ฑ…๋‹น 44์—ํ”ผ์†Œ๋“œ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐ ์†Œ์š”๋˜๋Š” ์ •๋„์™€ ์œ ์‚ฌํ•œ ์ˆ˜์ค€์ด๋‹ค. ์ฆ‰, ๋ถ„์‚ฐ ํ‰๊ฐ€๋ผ๋„ ์ด ์‹คํ—˜ ์ˆ˜๋Š” ๋น„์Šทํ•˜์ง€๋งŒ ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์œผ๋กœ ๋ถ„์‚ฐ๋˜๋ฏ€๋กœ ์ˆœ์œ„ ์ •ํ™•๋„๊ฐ€ ๋” ๋†’์•„์ง„๋‹ค. ์Œ๋น„๊ต ํšŸ์ˆ˜๊ฐ€ ๋งŽ์•„์งˆ์ˆ˜๋ก ์ˆœ์œ„์˜ ํ’ˆ์งˆ๋„ ๊ณ„์† ํ–ฅ์ƒ๋˜์—ˆ์œผ๋ฉฐ , ์ด๋Š” RoboArena๊ฐ€ ๋งŽ์€ ๊ธฐ์—ฌ์ž๊ฐ€ ์ฐธ์—ฌํ• ์ˆ˜๋ก ๋”์šฑ ์ •๋ฐ€ํ•œ ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.

์ •์„ฑ ๋ถ„์„ ํ‰๊ฐ€๋„ ์ง„ํ–‰ํ–ˆ๋‹ค. VLM(์˜ˆ: GPT-4o)์„ ์ด์šฉํ•œ ๊ณผ์ œ ๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ๋Š” ์ „๋ฌธ๊ฐ€ ์ˆ˜๋™ ๋ถ„๋ฅ˜์™€ 95% ์ผ์น˜ํ•  ์ •๋„๋กœ ์ •ํ™•ํ–ˆ๋‹ค. ๋˜ํ•œ LLM์„ ํ†ตํ•ด ์ž‘์„ฑ๋œ ์ •์ฑ… ๋ณด๊ณ ์„œ์—๋Š” ๊ฐ ์ •์ฑ…์˜ ๊ฐ•ยท์•ฝ์ ์ด ๋ช…ํ™•ํžˆ ๊ธฐ์ˆ ๋˜์—ˆ๊ณ , ๊ทธ ๊ทผ๊ฑฐ๊ฐ€ ๋˜๋Š” ์‹ค์ œ ์—ํ”ผ์†Œ๋“œ ๋น„๋””์˜ค ์ฐธ์กฐ๋„ ํฌํ•จ๋˜์–ด ์žˆ์—ˆ๋‹ค. ์ „๋ฐ˜์ ์œผ๋กœ RoboArena ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ๋Š” ์ •์ฑ… ์„ฑ๋Šฅ์„ ์ •ํ™•ํžˆ ๋ฐ˜์˜ํ–ˆ์œผ๋ฉฐ, ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ •์ฑ… ๊ฐœ๋ฐœ์ž์—๊ฒŒ ์œ ์šฉํ•œ ํ†ต์ฐฐ์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์˜€๋‹ค.

๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต

์ „ํ†ต์ ์ธ ๋กœ๋ด‡ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋“ค์€ ์ œํ•œ๋œ ๊ณผ์ œ์™€ ํ™˜๊ฒฝ์— ๋Œ€ํ•œ ๊ณ ๋„๋กœ ํ‘œ์ค€ํ™”๋œ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๊ณผ์ œ ๋ชฉ๋ก๊ณผ ์žฅ๋ฉด์„ ๋ฏธ๋ฆฌ ์ •์˜ํ•˜๊ณ , ์กฐ๋ช…, ์นด๋ฉ”๋ผ ์œ„์น˜, ๋ฌผ์ฒด ์ดˆ๊ธฐ ์œ„์น˜๊นŒ์ง€ ์—„๋ฐ€ํžˆ ํ†ต์ œํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์ ‘๊ทผ์€ ์†Œ์ˆ˜์˜ ์ •์ฑ…์„ ์†Œ์ˆ˜์˜ ํ™˜๊ฒฝ์—์„œ ๋น„๊ตํ•˜๋Š” ๋ฐ๋Š” ์œ ๋ฆฌํ•˜์ง€๋งŒ, ๋ฒ”์šฉ ์ •์ฑ…์ฒ˜๋Ÿผ ๋‹ค์–‘ํ•œ ์ƒํ™ฉ์—์„œ ์ž‘๋™ํ•ด์•ผ ํ•˜๋Š” ๋ชจ๋ธ์˜ ํ‰๊ฐ€์—๋Š” ๋ถ€์ ํ•ฉํ•˜๋‹ค. Dasari ๋“ฑ์€ ์—ฌ๋Ÿฌ ๊ธฐ๊ด€์˜ ๊ฒฐ๊ณผ๋ฅผ ๋ชจ์•„ ์ข…ํ•ฉ ํ‰๊ฐ€๋ฅผ ์‹œ๋„ํ–ˆ์ง€๋งŒ, ๊ฐ ๊ธฐ๊ด€์—์„œ ์ •์ฑ…์„ ๋ณ„๋„๋กœ ์žฌํ•™์Šตํ•ด์•ผ ํ–ˆ๊ณ  ์ ์šฉ ํ™˜๊ฒฝ์ด ์ œํ•œ์ ์ด์—ˆ๋‹ค.

๋ฐ˜๋ฉด RoboArena๋Š” ๊ณผ์ œ๋‚˜ ํ™˜๊ฒฝ์„ ๊ณ ์ •ํ•˜์ง€ ์•Š๊ณ  ๋ถ„์‚ฐ ์Œ๋น„๊ต๋กœ ์ˆœ์œ„๋ฅผ ๋งค๊ธด๋‹ค. ์ด๋Š” ๋‹ค์–‘ํ•œ ์žฅ๋ฉด๊ณผ ๊ณผ์ œ๋ฅผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋‹ค๋ฃจ์–ด ๊ฒ€์ฆ์˜ ํฌ์šฉ์„ฑ์„ ๋†’์ด๊ณ , ์‹คํ—˜ ์กฐ๊ฑด์˜ ์™„์ „ ์ผ์น˜๋ฅผ ๊ฐ•์ œํ•˜์ง€ ์•Š์•„ ๋กœ๋ด‡ ์ œ์กฐ ์ฐจ์ด๋‚˜ ํ™˜๊ฒฝ ์ฐจ์ด์˜ ์˜ํ–ฅ์„ ์ค„์ธ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์˜ ์‹คํ—˜์—์„œ ํ™•์ธํ–ˆ๋“ฏ, ์ „ํ†ต์  ํ‰๊ฐ€ ๋ฐฉ์‹(โ€œRegularโ€)์€ ์˜ค๋ผํด ์ˆœ์œ„์™€์˜ ์ƒ๊ด€์ด ๋‚ฎ์•„ ์ผ๋ฐ˜ํ™”๋œ ์ •์ฑ… ์„ฑ๋Šฅ์„ ์‹ ๋ขฐ๋„ ์žˆ๊ฒŒ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ–ˆ๋‹ค. ๋”ฐ๋ผ์„œ RoboArena์˜ ๋ถ„์‚ฐ ํ‰๊ฐ€๊ฐ€ ๋ฒ”์šฉ ์ •์ฑ… ๋น„๊ต์— ๋” ์ ํ•ฉํ•จ์„ ์ œ์•ˆํ•œ๋‹ค.

ํ•œํŽธ OpenX-Embodiment ๊ฐ™์€ ์—ฐ๊ตฌ ๋Š” ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ”Œ๋žซํผ์—์„œ ์ˆ˜์ง‘ํ•œ ๋Œ€๊ทœ๋ชจ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉํ•ด ๋ฒ”์šฉ ์ •์ฑ… ํ•™์Šต์„ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค. ์˜ˆ์ปจ๋Œ€ RT-X๋Š” ์—ฌ์„ฏ ๊ฐœ ์ด์ƒ์˜ ๋กœ๋ด‡ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์•„ ํ•™์Šตํ•˜๋ฉฐ, ๋‹ค๋ฅธ ๋กœ๋ด‡์— ๊ธ์ •์  ์ „์ด(positive transfer)๊ฐ€ ์žˆ์Œ์„ ๋ณด์˜€๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Ÿฌํ•œ ์—ฐ๊ตฌ๋“ค์€ ์ •์ฑ…์˜ ํ•™์Šต๊ณผ ๊ด€๋ จ๋œ ๊ฒƒ์œผ๋กœ, ๋กœ๋ด‡ ์ •์ฑ…์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค๋ฃจ์ง€๋Š” ์•Š์•˜๋‹ค. RoboArena๋Š” ์ด๋ฏธ ํ•™์Šต๋œ ๋ฒ”์šฉ ์ •์ฑ…์„ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์ข…ํ•ฉ ๋น„๊ตํ•˜๋Š” ๋ฐ ์ง‘์ค‘ํ•œ๋‹ค๋Š” ์ ์—์„œ ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค. ์ฆ‰, OpenX๋‚˜ RT-X๊ฐ€ ์ •์ฑ… ํ•™์Šต์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ์™€ ๋ชจ๋ธ์„ ์ œ๊ณตํ–ˆ๋‹ค๋ฉด, RoboArena๋Š” ์ด๋“ค ์ •์ฑ…์˜ ์‹ค์งˆ์  ์„ฑ๋Šฅ ๊ฒ€์ฆ์„ ์œ„ํ•œ ์ธํ”„๋ผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

๋˜ํ•œ ์ตœ๊ทผ ๋ฐœํ‘œ๋œ AutoEval(์ž์œจ ํ‰๊ฐ€ ์‹œ์Šคํ…œ) ์—ฐ๊ตฌ๋Š” ์‚ฌ๋žŒ์˜ ๊ฐœ์ž…์„ ์ตœ์†Œํ™”ํ•œ ์ž๋™ ํ‰๊ฐ€๋ฅผ ์ œ์•ˆํ•œ๋‹ค. AutoEval์€ ํŠน์ • ๋กœ๋ด‡(์˜ˆ: WidowX)์—์„œ 24์‹œ๊ฐ„ ์ž๋™์œผ๋กœ ํ‰๊ฐ€ ์ž‘์—…์„ ๋Œ๋ ค, ์ธ๊ฐ„์ด ์ฑ„์ ํ•˜๋Š” ์ „ํ†ต์  ๋ฐฉ๋ฒ•๊ณผ ์œ ์‚ฌํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป์—ˆ๋‹ค๊ณ  ํ•œ๋‹ค. RoboArena๋Š” ๋ฐ˜๋Œ€๋กœ ์‚ฌ๋žŒ ํ‰๊ฐ€์ž๋ฅผ ํ†ตํ•ด ์œ ์—ฐ์„ฑ์„ ํ™•๋ณดํ•œ๋‹ค. AutoEval์ด ์„ค์ •๋œ ํ™˜๊ฒฝ์—์„œ ์™„์ „ ์ž๋™ํ™”๋ฅผ ์ถ”๊ตฌํ•œ๋‹ค๋ฉด, RoboArena๋Š” ์—ฌ๋Ÿฌ ๊ธฐ๊ด€์˜ ์‚ฌ๋žŒ์ด ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์„ ์ฐฝ์˜์ ์œผ๋กœ ํ™œ์šฉํ•˜๋„๋ก ์žฅ๋ คํ•œ๋‹ค๋Š” ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค.

์ข…ํ•ฉํ•˜๋ฉด, RoboArena๋Š” ๊ธฐ์กด์˜ ์ค‘์•™์ง‘์ค‘ํ˜• ๋ฒค์น˜๋งˆํฌ ๋ฐฉ์‹๊ณผ Open-X, AutoEval ๋“ฑ์˜ ์—ฐ๊ตฌ์— ๋น„ํ•ด ํ‰๊ฐ€์˜ ๋ฒ”์šฉ์„ฑยทํ™•์žฅ์„ฑยท์‹ ๋ขฐ์„ฑ ์ธก๋ฉด์—์„œ ์ƒˆ๋กœ์šด ๋Œ€์•ˆ์„ ์ œ์‹œํ•œ๋‹ค. ํŠนํžˆ ๋ฒ”์šฉ ๋กœ๋ด‡ ์ •์ฑ…์˜ ์„ฑ๋Šฅ์„ ์‹ค์ œ ํ™˜๊ฒฝ์˜ ๋‹ค์–‘์„ฑ ์†์—์„œ ๊ฐ๊ด€์ ์œผ๋กœ ๋น„๊ตํ•˜๊ณ ์ž ํ•  ๋•Œ, RoboArena ๋ฐฉ์‹์ด ์ ํ•ฉํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค.

์‹ค์ œ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ ๋ฐ ํ™œ์šฉ ๋ฐฉ์•ˆ

RoboArena๋Š” ๋กœ๋ด‡ ๊ณตํ•™ ์ปค๋ฎค๋‹ˆํ‹ฐ์— ๊ณต์šฉ ํ‰๊ฐ€ ํ”Œ๋žซํผ์„ ์ œ๊ณตํ•จ์œผ๋กœ์จ ์—ฐ๊ตฌ ๋ฐ ์‚ฐ์—…์—์„œ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ƒˆ๋กœ์šด ๋ฒ”์šฉ ๊ฐ•ํ™”ํ•™์Šต ์ •์ฑ…์ด๋‚˜ ๋Œ€ํ™”ํ˜• ๋กœ๋ด‡ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๋Š” ์—ฐ๊ตฌ์ž๋Š”, ์ž์‹ ์˜ ์ •์ฑ…์„ RoboArena ๋„คํŠธ์›Œํฌ์— ์ถ”๊ฐ€ํ•ด ๊ธฐ์กด ๋ชจ๋ธ๋“ค๊ณผ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ํŠน์ • ์—ฐ๊ตฌํŒ€ ๋กœ์ปฌ ํ™˜๊ฒฝ์— ํ•œ์ •๋œ ๊ฒ€์ฆ์„ ๋„˜์–ด, ๋‹ค์–‘ํ•œ ์‹ค์ œ ์‹คํ—˜์‹ค ํ™˜๊ฒฝ์—์„œ์˜ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•˜๊ฒŒ ๋œ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์‹ค์ œ ๋กœ๋ด‡ ์ œํ’ˆ ๊ฐœ๋ฐœ์—์„œ๋„ ์–ด๋А ์ •๋„ ์ค€๋น„๋œ ์ •์ฑ…์ธ์ง€๋ฅผ ํŒ๋‹จํ• ์ˆ˜ ์žˆ๋Š” ์ฒ™๋„๊ฐ€ ๋œ๋‹ค.

๋˜ํ•œ RoboArena๋Š” ๋กœ๋ด‡ ์ œ์–ด ๋ฐ ๊ฐ•ํ™”ํ•™์Šต ๋ถ„์•ผ์˜ ๋ฒค์น˜๋งˆํฌ ์—ญํ• ์„ ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋กœ๋ด‡ ์ œ์–ด๊ธฐ ๊ฐœ๋ฐœ์ž๋“ค์€ RoboArena๋กœ๋ถ€ํ„ฐ ์–ป์€ ์ˆœ์œ„์™€ ํ”ผ๋“œ๋ฐฑ์„ ํ™œ์šฉํ•ด ์–ด๋–ค ์ •์ฑ… ๊ตฌ์กฐ(์˜ˆ: ์•ก์…˜ ํ‘œํ˜„)์™€ ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ ๋” ์ผ๋ฐ˜ํ™”์— ์œ ๋ฆฌํ•œ์ง€ ํŒ๋‹จํ•  ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ๋ณธ ๋…ผ๋ฌธ์—์„œ ์‹œ์‚ฌํ•˜๋“ฏ ๋ณต์žกํ•œ ํ† ํฌ๋‚˜์ด์ œ์ด์…˜ ๋ชจ๋ธ์ด ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋‹ค ์šฐ์ˆ˜ํ•˜๋‹ค๋Š” ์ธ์‚ฌ์ดํŠธ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Š” ํ•™์Šต ๋ฐฉ์‹ ๊ฐœ์„ ์ด๋‚˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์„ธ๊ณ„ ์ „์ด ๊ธฐ๋ฒ• ๊ฐœ๋ฐœ์—๋„ ์ค‘์š”ํ•œ ์ •๋ณด๋ฅผ ์ค€๋‹ค.

์ปค๋ฎค๋‹ˆํ‹ฐ ์ฐธ์—ฌ์„ฑ ์ธก๋ฉด์—์„œ, DROID-RoboArena๋Š” ๋กœ๋ด‡์ด ์—†๋Š” ์—ฐ๊ตฌ์ž๋“ค๋„ ์‹ค์„ธ๊ณ„ ์ •์ฑ… ํ‰๊ฐ€์— ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค€๋‹ค. DROID ๋ฐ์ดํ„ฐ์…‹๊ณผ ์†Œํ”„ํŠธ์›จ์–ด ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ๊ณต๊ฐœ๋˜์–ด ์žˆ์œผ๋ฏ€๋กœ, ๋ฉ€ํ‹ฐ๋กœ๋ด‡ ๋ฐ์ดํ„ฐ๋กœ ์ •์ฑ…์„ ํ›ˆ๋ จ์‹œํ‚จ ํ›„ RoboArena๋ฅผ ํ†ตํ•ด ์‹ค์ œ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ์˜ ๊ฐ•ํ™”ํ•™์Šต ์—ฐ๊ตฌ์™€ ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ ์‚ฌ์ด์˜ ๊ฐ„๊ทน์„ ์ค„์ด๋Š” ๋งค๊ฐœ์ฒด ์—ญํ• ์„ ํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ฒŒ๋‹ค๊ฐ€ RoboArena์˜ ํ‰๊ฐ€ ๋ฆฌํฌํŠธ(LLM ๊ธฐ๋ฐ˜ ์•ฝ์  ๋ถ„์„ ๋“ฑ)๋Š” ๋กœ๋ด‡ ์—ฐ๊ตฌ์ž๋“ค์—๊ฒŒ ๊ตฌ์ฒด์  ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ•œ๋‹ค. ๋‹จ์ˆœํžˆ ์„ฑ๊ณต๋ฅ ๋งŒ ์•Œ๋ ค์ฃผ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ โ€œ์ด ์ •์ฑ…์€ A ๊ณผ์ œ์—์„œ๋Š” ์ž˜ ์ˆ˜ํ–‰ํ•˜์ง€๋งŒ B ๊ณผ์ œ์—์„œ๋Š” ๋ฏธ์ˆ™ํ•˜๋‹คโ€๋Š” ์‹์œผ๋กœ ์„ค๋ช…ํ•จ์œผ๋กœ์จ, ์ •์ฑ… ๊ฐœ์„  ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•œ๋‹ค. ์ด๋Ÿฐ ์งˆ์  ์ •๋ณด๋Š” ์˜ˆ๋ฅผ ๋“ค์–ด ์ž˜๋ชป๋œ ๋™์ž‘ ํŒจํ„ด ๊ฐœ์„ , ํ•™์Šต ๋ฐ์ดํ„ฐ ๋ณด๊ฐ•, ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ ํƒ ๋“ฑ์— ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.

์š”์•ฝํ•˜๋ฉด, RoboArena๋Š” ๋ฒ”์šฉ ๋กœ๋ด‡ ์ •์ฑ… ํ‰๊ฐ€์˜ ํ‘œ์ค€ ์ธํ”„๋ผ๋กœ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์ •์ฑ… ๊ฐœ๋ฐœ์ž๋Š” ํ˜„์‹ค ์„ธ๊ณ„์—์„œ์˜ ์„ฑ๋Šฅ๊ณผ ํ•œ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ํŒŒ์•…ํ•˜์—ฌ ๋” ๋‚˜์€ ์ œ์–ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์„ค๊ณ„ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋˜ํ•œ ์‚ฐ์—…๊ณ„์—์„œ๋„ ์•ˆ์ „ยทํšจ์œจ์ ์ธ ๋กœ๋ด‡ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์„ ์œ„ํ•ด RoboArena ๊ฒฐ๊ณผ๋ฅผ ๋ฒค์น˜๋งˆํ‚น ์ž๋ฃŒ๋กœ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋‹ค.

ํ•œ๊ณ„์  ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

RoboArena๋Š” ๋ถ„์‚ฐํ˜• ํ‰๊ฐ€๋ผ๋Š” ๊ฐ•์ ์„ ์ง€๋‹ˆ์ง€๋งŒ, ๋ณธ ์—ฐ๊ตฌ์—๋Š” ๋ช‡ ๊ฐ€์ง€ ํ•œ๊ณ„๋„ ์žˆ๋‹ค. ์šฐ์„  ํ”Œ๋žซํผ ์ œ์•ฝ์ด๋‹ค. ํ˜„์žฌ ์‹คํ—˜์€ ๋ชจ๋‘ DROID ๋กœ๋ด‡ ํ”Œ๋žซํผ(Franka Panda arm)์— ๊ธฐ๋ฐ˜ํ•˜์˜€๊ธฐ ๋•Œ๋ฌธ์—, ๋‹ค๋ฅธ ๋กœ๋ด‡ ํ˜•ํƒœ(cross-embodiment)์˜ ์ •์ฑ…๊นŒ์ง€ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์€ ๋ณ„๋„ ์ž‘์—…์ด ํ•„์š”ํ•˜๋‹ค. ์˜ˆ์ปจ๋Œ€ ๋กœ๋ด‡ ์†์˜ ๊ด€์ ˆ์ˆ˜๋‚˜ ๊ฐ๊ฐ์žฅ์น˜๊ฐ€ ํฌ๊ฒŒ ๋‹ค๋ฅธ ๊ฒฝ์šฐ, ๋™์ผํ•œ ์ •์ฑ…์„ ์‹คํ–‰ํ•  ์ˆ˜ ์—†๊ฑฐ๋‚˜ ํ‰๊ฐ€ ๊ธฐ์ค€ ์ž์ฒด๊ฐ€ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์‹œ์Šคํ…œ(์˜ˆ: ๋ชจ๋ฐ”์ผ ๋กœ๋ด‡, ๋“œ๋ก , ํœด๋จธ๋…ธ์ด๋“œ ๋“ฑ)์œผ๋กœ ํ‰๊ฐ€ ๋„คํŠธ์›Œํฌ๋ฅผ ํ™•์žฅํ•˜๊ณ , ๋กœ๋ด‡ ๊ฐ„ ๋น„๊ต ๋ฐฉ๋ฒ•์„ ๊ณ ์•ˆํ•ด์•ผ ํ•œ๋‹ค.

๋˜ํ•œ ์‹คํ—˜ ์ œ์–ด ๋ฌธ์ œ๋„ ์žˆ๋‹ค. RoboArena๋Š” ์˜๋„์ ์œผ๋กœ ํ™˜๊ฒฝ ํ†ต์ œ๋ฅผ ์™„ํ™”ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์—, ๊ฐœ๋ณ„ ๋ณ€์ˆ˜(์˜ˆ: ์กฐ๋ช…, ์นด๋ฉ”๋ผ ๊ฐ๋„)๋งŒ ๋…๋ฆฝ์ ์œผ๋กœ ๋ถ„์„ํ•˜๊ธฐ ํž˜๋“ค๋‹ค. ์ด๋Ÿฌํ•œ ์ ์€ ์ •์ฑ…์˜ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๋ณด๊ธฐ์—๋Š” ์ด์ ์ด๋‚˜, ํŠน์ • ์กฐ๊ฑด ๋ณ€ํ™”์— ๋”ฐ๋ฅธ ๋ฏผ๊ฐ๋„๋ฅผ ์—ฐ๊ตฌํ•˜๊ธฐ์—๋Š” ๋ถ€์ ์ ˆํ•  ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ RoboArena ํ‰๊ฐ€ ๊ฒฐ๊ณผ๋Š” ๊ธฐ์กด์˜ ํ‘œ์ค€ํ™”๋œ ๋ฒค์น˜๋งˆํฌ ์‹คํ—˜๊ณผ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ์‚ฌ์šฉ๋˜์–ด์•ผ ํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋จผ์ € RoboArena๋กœ ์ •์ฑ…๋“ค์„ ๋งฅ๋ฝ ์—†์ด ๋น„๊ตํ•œ ๋’ค, ์„ฑ๋Šฅ์ด ๋ชจ์ž๋ž€ ๋ถ€๋ถ„์— ๋Œ€ํ•ด ๋ณ„๋„์˜ ํ†ต์ œ๋œ ์‹คํ—˜์œผ๋กœ ์ƒ์„ธ ๋ถ„์„ํ•˜๋Š” ์ ‘๊ทผ์ด ๋ฐ”๋žŒ์งํ•˜๋‹ค.

๋ณด์•ˆ ์ธก๋ฉด์œผ๋กœ๋Š” ํ‰๊ฐ€์ž ์•…์˜์  ํ–‰์œ„ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ๋‹ค. ๋ถ„์‚ฐ๋œ ์ฐธ์—ฌ์ž๊ฐ€ ๋งŽ์•„์ง€๋ฉด ์ผ๋ถ€๊ฐ€ ๊ณ ์˜๋กœ ๋ฌด์ž‘์œ„ ํ‰์ ์„ ์ฃผ๊ฑฐ๋‚˜ ์ž˜๋ชป๋œ ํ”ผ๋“œ๋ฐฑ์„ ์ค„ ์ˆ˜ ์žˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” RoboArena์˜ ์ด์ค‘๋งน๊ฒ€ ์„ค๊ณ„๊ฐ€ ์ผ๋ถ€ ์˜ํ–ฅ๋ ฅ์„ ์ œํ•œํ•œ๋‹ค๊ณ  ์„ค๋ช…ํ•˜์ง€๋งŒ, ์‹ค์ œ ์•…์˜์ ์ธ ๊ณต๊ฒฉ์— ๋Œ€ํ•œ ์‹คํ—˜์€ ์ด๋ฃจ์–ด์ง€์ง€ ์•Š์•˜๋‹ค. ํ–ฅํ›„์—๋Š” ํ‰๊ฐ€์ž์˜ ์‹ ๋ขฐ๋„๋ฅผ ๊ฒ€์ฆํ•˜๊ฑฐ๋‚˜ ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ๋ฅผ ์ž๋™ ๊ฐ์ง€ํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋„์ž…ํ•˜์—ฌ, ๋ฐ์ดํ„ฐ ์™œ๊ณก์— ๊ฐ•ํ•œ ํ‰๊ฐ€ ์‹œ์Šคํ…œ์œผ๋กœ ๋ฐœ์ „์‹œํ‚ฌ ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ ์ธก์ • ๊ธฐ์ค€์˜ ์ตœ์ ํ™” ๋ฌธ์ œ(Goodhartโ€™s Law)๋„ ๊ณ ๋ฏผ๊ฑฐ๋ฆฌ๋‹ค. ์ผ๋ฐ˜์ง€๋Šฅ ๋ฒค์น˜๋งˆํฌ์—์„œ ์ง€ํ‘œ๊ฐ€ ์—ฐ๊ตฌ์˜ ๋ชฉํ‘œ๊ฐ€ ๋˜๋ฉด ์ƒ๊ธฐ๋Š” ๊ฒƒ๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, RoboArena ์ˆœ์œ„ ์ž์ฒด๊ฐ€ ์—ฐ๊ตฌ์ž๋“ค์—๊ฒŒ ์ตœ์ ํ™” ๋Œ€์ƒ์ด ๋  ์ˆ˜ ์žˆ๋‹ค. ์‹ค์ œ๋กœ ๋ชจ๋ธ ๊ฐœ์„ ๋ณด๋‹ค๋Š” ์ˆœ์œ„ ์กฐ์ž‘์„ ์‹œ๋„ํ•  ์œ ์ธ์ด ์ด๋ก ์ƒ ์กด์žฌํ•œ๋‹ค. ํ˜„์žฌ๋กœ์„œ๋Š” ๋ฒ”์šฉ ์ •์ฑ…๋“ค์˜ ์„ฑ๋Šฅ์ด ์•„์ง ์ œํ•œ์ ์ด์–ด์„œ ๊ฑฑ์ •์ด ๋œํ•˜์ง€๋งŒ, ์ •์ฑ… ๊ธฐ์ˆ ์ด ๋ฐœ์ „ํ• ์ˆ˜๋ก ์ด ๋ฌธ์ œ๋„ ์ค‘์š”ํ•ด์ง„๋‹ค. ์ด๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ํ–ฅํ›„์—๋Š” ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ์„ ์ฃผ๊ธฐ์ ์œผ๋กœ ๊ฐฑ์‹ ํ•˜๊ฑฐ๋‚˜ ์ƒˆ๋กœ์šด ๋ฌด์ž‘์œ„ ๊ฒ€์ฆ ๋‹จ๊ณ„๋ฅผ ๋„์ž…ํ•˜๋Š” ๋“ฑ ๋Œ€์ฑ… ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

์ด๋Ÿฌํ•œ ํ•œ๊ณ„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , RoboArena๋Š” ๋ฒ”์šฉ ์ •์ฑ… ์‹œ๋Œ€์˜ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•œ๋‹ค. ํ›„์† ์—ฐ๊ตฌ๋Š” ๋‹ค๋ฅธ ๋กœ๋ด‡ ํ”Œ๋žซํผ์—์˜ ์ ์šฉ, ํ‰๊ฐ€ ๋ณด์•ˆ ๊ฐ•ํ™”, ๊ทธ๋ฆฌ๊ณ  ํ‰๊ฐ€ ์ง€ํ‘œ ์ž์ฒด์˜ ๊ฒฌ๊ณ ์„ฑ ํ™•๋ณด ๋“ฑ์„ ํ†ตํ•ด RoboArena๋ฅผ ๋”์šฑ ๋ฐœ์ „์‹œํ‚ฌ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋‹ค.

Copyright 2024, Jung Yeon Lee