๐RoboArena ๋ฆฌ๋ทฐ
- ๐ค ์ด ๋ ผ๋ฌธ์ ํ๋์ ์ ๋๋ด๋ฆฌ์คํธ ๋ก๋ด ์ ์ฑ ํ๊ฐ์์ ๊ธฐ์กด ์ค์ ์ง์ค์, ํ์คํ๋ ์ ๊ทผ ๋ฐฉ์์ ํ์ฅ์ฑ๊ณผ ๋ค์์ฑ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด RoboArena๋ผ๋ ์๋ก์ด ๋ถ์ฐํ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
- ๐ RoboArena๋ ๋ถ์ฐ๋ ํ๊ฐ์ ๋คํธ์ํฌ๊ฐ ์์ ๋กญ๊ฒ ์ ํํ ๋ค์ํ ์ค์ ํ์คํฌ ๋ฐ ํ๊ฒฝ์์ ์ ์ฑ ์์ ์ด์ค ๋งน๊ฒ์ผ๋ก ๋น๊ตํ๊ณ , ๊ทธ ์ ํธ๋ ํผ๋๋ฐฑ์ ์ง๊ณํ์ฌ ์ ์ฑ ์ฑ๋ฅ์ ์ ์ญ ์์๋ฅผ ๋์ถํฉ๋๋ค.
- ๐ 7๊ฐ ๊ธฐ๊ด์ ๊ฑธ์น DROID ๋ก๋ด ํ๋ซํผ์์ 600๊ฐ ์ด์์ ์ค์ ๋ก๋ด ํ๊ฐ๋ฅผ ํตํด, ์ด ์ ๊ทผ ๋ฐฉ์์ด ๊ธฐ์กด ์ค์ ์ง์ค์ ํ๊ฐ๋ณด๋ค ์ ๋๋ด๋ฆฌ์คํธ ์ ์ฑ ์ ์์๋ฅผ ๋ ์ ํํ๊ฒ ๋งค๊ธฐ๋ฉด์๋ ๋ ํ์ฅ ๊ฐ๋ฅํ๊ณ , ๋ณต์๋ ฅ์ด ๋ฐ์ด๋๋ฉฐ, ์ ๋ขฐํ ์ ์์์ ์ ์ฆํ์ต๋๋ค.
Brief Review
๋ณธ ๋ ผ๋ฌธ์ ํ๋์ ์ ๋๋ด๋ฆฌ์คํธ ๋ก๋ด ์ ์ฑ (generalist robot policies)์ ํฌ๊ด์ ์ด๊ณ , ํธํฅ๋์ง ์์ผ๋ฉฐ, ๋น๊ต ๊ฐ๋ฅํ ๋ฐฉ์์ผ๋ก ํ๊ฐํ๋ ๊ณ ์ ํ ๊ณผ์ ๋ฅผ ๋ค๋ฃจ๊ธฐ ์ํด RoboArena๋ผ๋ ์๋ก์ด ์ ๊ทผ ๋ฐฉ์์ ์ ์ํฉ๋๋ค. ๊ธฐ์กด ๋ก๋ด ๋ฒค์น๋งํน ๋ฐฉ์์ ๊ณ ์ ๋ ํ๊ฐ ์์ ๋ฐ ํ๊ฒฝ ์ง์ ์ด๋ ์ค์ ์ง์ค์ โ๋ก๋ด ์ฑ๋ฆฐ์งโ ์ฃผ์ต๋ฅผ ํตํด ๋์ ํ์คํ์ ์์กดํ์ฌ ๋ค์ํ ์์ ๋ฐ ํ๊ฒฝ์ ๊ฑธ์น ์ ๋๋ด๋ฆฌ์คํธ ์ ์ฑ ํ๊ฐ์ ํ์ฅํ๊ธฐ ์ด๋ ค์ ์ต๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก (Core Methodology)
RoboArena๋ ๋ถ์ฐ๋ ํ๊ฐ์ ๋คํธ์ํฌ๋ฅผ ํตํด ํ๊ฐ๋ฅผ ํฌ๋ผ์ฐ๋์์ฑ(crowd-source)ํ๋ ๋ฐฉ์์ ์ ์ํฉ๋๋ค. ์ด๋ ๊ณ ์ ๋ ์์ , ํ๊ฒฝ ๋๋ ์์น๋ฅผ ์ค์ฌ์ผ๋ก ํ๊ฐ๋ฅผ ํ์คํํ๋ ๋์ , ํ๊ฐ์๊ฐ ํ๊ฐํ ์์ ๊ณผ ํ๊ฒฝ์ ์์ ๋กญ๊ฒ ์ ํํ ์ ์๊ฒ ํ์ฌ ๋ค์์ฑ์ ์ฝ๊ฒ ํ์ฅํ ์ ์๋๋ก ํฉ๋๋ค. ์ค์ํ ์ ์ ํ๊ฐ์๋ค์ด ๋ ์ ์ฑ ์์ ๋ํด ์ด์ค ๋งน๊ฒ(double-blind) ํ๊ฐ๋ฅผ ์ํํด์ผ ํ๋ค๋ ๊ฒ์ ๋๋ค. ํ๊ฐ์๋ ์ค์ ๋ก๋ด์ ์ฌ์ฉํ์ฌ ๋ ์ ์ฑ (\pi_A, \pi_B)์ ๋์ผํ ์ด๊ธฐ ์กฐ๊ฑด(๊ทธ๋ฌ๋ ํ๊ฐ ์ธ์ ๊ฐ์๋ ์์ ๋กญ๊ฒ ๋ณ๊ฒฝ ๊ฐ๋ฅ)์์ ์์ฐจ์ ์ผ๋ก ์คํํ๊ณ , ๋ค์ ์ธ ๊ฐ์ง ์ ํ์ ํผ๋๋ฐฑ์ ์ ๊ณตํฉ๋๋ค:
- ์ฐ์ ์งํ ์ ์ (continuous progress score): [0 \dots 100] ๋ฒ์๋ก, ์ ์ฑ ์ด ์์ ์์ ๋ฌ์ฑํ ์ต๋ ์งํ๋ฅ ์ ๋น๋กํฉ๋๋ค.
- ์ด์ง ์๋ ์ ํธ๋ ๋ ์ด๋ธ (binary, pairwise preference label): ๋ ์ ์ฑ ์ค ํ๊ฐ์๊ฐ ์ด๋ค ์ ์ฑ ์ ์ ํธํ๋์ง ๋ํ๋ ๋๋ค.
- ์์ ํ์ ์์ฐ์ด ์ค๋ช (free-form, natural language explanation): ์ ํธ๋์ ๋ํ ์ด์ ๋ฅผ ์ค๋ช ํฉ๋๋ค.
์ด๋ฌํ ์๋ ๋น๊ต๋ก๋ถํฐ ์ป์ ์ ํธ๋ ํผ๋๋ฐฑ์ ๋ค์ํ ์์ ๋ฐ ํ๊ฒฝ์ ๊ฑธ์ณ ํตํฉํ์ฌ ์ ์ฑ ์์๋ฅผ ๋์ถํฉ๋๋ค.
๊ธ๋ก๋ฒ ์ ์ฑ ์์ ๊ณ์ฐ (Computing Global Policy Rankings)
์ ์ฑ ์์๋ฅผ ๊ณ์ฐํ๊ธฐ ์ํด Bradley-Terry (BT) ๋ชจ๋ธ [60]์ ํ์ฅํ ๋ฐฉ๋ฒ์ ์ฌ์ฉํฉ๋๋ค. ํ์ค BT ๋ชจ๋ธ์ ๋ชจ๋ ์๋ ๋น๊ต๊ฐ ๋์ผํ ์กฐ๊ฑด์์ ์ด๋ฃจ์ด์ง๋ค๊ณ ๊ฐ์ ํ์ง๋ง, RoboArena์ ๊ฒฝ์ฐ ์์ ์ด ๋ค์ํ๊ฒ ๋ณํ๋ฏ๋ก ์ด ๊ฐ์ ์ด ์ถฉ์กฑ๋์ง ์์ต๋๋ค. ๋ฐ๋ผ์ โ์์ ํจ๊ณผ(task-effects)โ๋ฅผ ๊ณ ๋ คํ๊ธฐ ์ํด BT ๋ชจ๋ธ์ ์ถ๊ฐ ํ๋ผ๋ฏธํฐ๋ค์ ๋์ ํฉ๋๋ค.
ํ์ฅ๋ BT ๋ชจ๋ธ์ ์ ์ฑ \pi_A๊ฐ \pi_B๋ณด๋ค ์ ํธ๋ ํ๋ฅ p(\pi_A > \pi_B)๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ๋ชจ๋ธ๋งํฉ๋๋ค: p(\pi_A > \pi_B) = \sum_{t=1}^{T} \nu_t \cdot \sigma(\theta_A + \psi_{At} - \tau_t) \cdot (1 - \sigma(\theta_B + \psi_{Bt} - \tau_t))
์ฌ๊ธฐ์:
- N: ์ ์ฑ ์ ์ด ๊ฐ์
- \Pi = \{\pi_1, \dots, \pi_N\}: ์ ์ฑ ์งํฉ
- D_p = \{P_{\pi_A, \pi_B}, t\}: ์๋ ์ ํธ๋ ๋ฐ์ดํฐ์ . P_{\pi_A, \pi_B} \in \{0, 1\}๋ ์ด์ง ์ ํธ๋๋ฅผ ๋ํ๋ด๊ณ , t๋ A/B ํ๊ฐ๊ฐ ์คํ๋ ์์ ์ ์๋ณํฉ๋๋ค.
- \theta = (\theta_1, \dots, \theta_N): ๊ฐ ์ ์ฑ \pi_p์ ์ ์ญ โ๋ก๊ทธ ๋ฅ๋ ฅ(log-ability)โ ํ๋ผ๋ฏธํฐ๋ก, ์ ์ฑ ์ ์ ๋ฐ์ ์ธ ๊ฐ๋๋ฅผ ๋ํ๋ ๋๋ค.
- T: ์ ์ฌ๋ ์์ ๋ฒํท(task buckets)์ ์ (ํ์ดํผํ๋ผ๋ฏธํฐ).
- \tau = (\tau_1, \dots, \tau_T): ๊ฐ ๋ฒํท t์ ๊ธฐ๋ณธ ๋์ด๋ ํ๋ผ๋ฏธํฐ.
- \nu = (\nu_1, \dots, \nu_T): ์ ์ฌ๋ ๋ฒํท์ ํ๊ณ ์์ ํ๋ฅ ๋ก, \sum_{t=1}^{T} \nu_t = 1์ ๋ง์กฑํฉ๋๋ค. ์ด๋ ์ฃผ์ด์ง A/B ํ๊ฐ๊ฐ ์ ์ฌ๋ ๋ฒํท t์ ์ํ ์ฌ์ ํ๋ฅ ์ ์ ์ํฉ๋๋ค.
- \psi = ((\psi_{11} \dots \psi_{1T}), \dots, (\psi_{N1} \dots \psi_{NT})): ์ ์ฑ -์์ ์คํ์ ์ผ๋ก, ์ ์ฑ ๋ณ ์์ ๋์ด๋๋ฅผ ๋ชจ๋ธ๋งํฉ๋๋ค. ๋ ์ ์ฑ ์ด ๋ค๋ฅธ ์์ ํ์ ์งํฉ์์ ๋ค๋ฅธ ์๋์ ์ฑ๋ฅ ๊ด๊ณ๋ฅผ ๋ณด์ผ ์ ์๋ ํจ๊ณผ๋ฅผ ๋ฐ์ํฉ๋๋ค.
- \sigma(z) = 1/(1 + e^{-z}): ๋ก์ง์คํฑ ์๊ทธ๋ชจ์ด๋ ํจ์.
๋ชจ๋ ํ๋ผ๋ฏธํฐ(\theta, \tau, \nu, \psi)๋ ์ค์ง ์ ํธ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ต๋ ์ฐ๋ ์ถ์ (maximum likelihood estimation, MLE) ๊ณผ์ ์ ํตํด ํ์ต๋ฉ๋๋ค. ์ด๋ ๊ทผ์ฌ MLE๋ฅผ ์ํ ๊ธฐ๋-์ต๋ํ(Expectation-Maximization, EM) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ์ํ๋ฉ๋๋ค. ์ด ์๊ณ ๋ฆฌ์ฆ์ ํ์ฌ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ํ์์ ๋ฐ์ดํฐ์ ์ฐ๋๋ฅผ ์ธก์ ํ๊ณ , ์ด ์ฐ๋์ 1์ฐจ ๋ฐ 2์ฐจ ๋ฏธ๋ถ์ ๊ณ์ฐํ ํ, ํด๋ฆฌํ๋ ๋ดํด ์ ๋ฐ์ดํธ(clipped Newton updates)๋ฅผ ํตํด ์ต๋ํ ๋จ๊ณ๋ฅผ ์ํํ๊ณ , ์๋ก์ด ํ๋ผ๋ฏธํฐ๋ฅผ ์ค์์ ๋ฐฐ์นํ์ฌ ์ ๋ก ํ๊ท ์ ์ ์งํ๋ ๊ณผ์ ์ ๋ฐ๋ณตํฉ๋๋ค. Davidson ํ์ฅ [63]์ ํตํด ๋ฌด์น๋ถ(tie)๋ ์ฒ๋ฆฌํ ์ ์๋๋ก ๋ชจ๋ธ๋ง์ ํฌํจ๋ฉ๋๋ค.
์ ์ฑ์ ์ ์ฑ ํน์ฑ ์ถ์ถ (Extracting Qualitative Policy Characteristics)
์ ์ฑ ์ ์ ์ฑ์ ํน์ฑ(์: ์ธ์ด ์ง์ ๋ฐ๋ฅด๊ธฐ ๋ฅ๋ ฅ, ๋ค๋จ๊ณ ์์ ์ํ ๋ฅ๋ ฅ)์ ์ถ์ถํ๊ธฐ ์ํด ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLMs) ๋ฐ ์๊ฐ-์ธ์ด ๋ชจ๋ธ(VLMs)์ ํ์ฉํฉ๋๋ค. ํ๊ฐ ๋น๋์ค์ ์ฒซ ์ด๋ฏธ์ง์ ํด๋น ์์ ์ง์๋ฅผ VLM (OpenAI GPT-4.5)์ ์ ๋ฌํ์ฌ ์์ ์ ํ(์: pick-place vs. open-close)์ ๋ถ๋ฅํ๊ณ ์ฅ๋ฉด์ ์กฐ๋ช , ๋ณต์ก์ฑ, ๊ฐ์ฒด ๊ฐ์์ฑ ๋ฑ์ ์ค๋ช ํ๋๋ก ํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ LLM (OpenAI GPT-4o)์ ์ฌ์ฉํ์ฌ ๋ชจ๋ ํ๊ฐ์ ๋ํ ์ ํธ๋ ์ฃผ์, ๋ถ๋ฅ ๊ฒฐ๊ณผ ๋ฐ ์์ ํ์ ํ๊ฐ์ ํผ๋๋ฐฑ์ ์์ฝํ์ฌ ์ ์ฑ ๋ณด๊ณ ์๋ฅผ ์์ฑํฉ๋๋ค. LLM์ ๋ค๋ฅธ ์ ์ฑ ๊ณผ ๋น๊ตํ์ฌ ์ฑ๋ฅ์ ํ๊ฐํ๊ณ ์ธ์ด ํผ๋๋ฐฑ์์ ์ ์ฑ์ ํน์ฑ์ ์ถ์ถํ๋๋ก ์ง์๋ฐ์ต๋๋ค. ํนํ, LLM์ ๋ณด๊ณ ์์ ๋ชจ๋ ์ฃผ์ฅ์ ๋ํ ์ฆ๊ฑฐ๋ก ํ๊ฐ ์ํผ์๋๋ฅผ ์ธ์ฉํ๊ณ , ์ฐ๊ตฌ์๊ฐ ์ฃผ์ฅ์ ๊ฒ์ฆํ ์ ์๋๋ก ํด๋น ๋กค์์ ๋น๋์ค์ ๋ณด๊ณ ์๋ฅผ ์๋ ์ฐ๊ฒฐํฉ๋๋ค.
DROID-RoboArena ํ๊ฐ ์์คํ (The DROID-RoboArena Evaluation System)
RoboArena๋ Franka Panda 7DoF ๋ก๋ด ํ, Robotiq 2F-85 ํํ-ํฑ ๊ทธ๋ฆฌํผ, ZED-mini ์คํ ๋ ์ค ์๋ชฉ ์นด๋ฉ๋ผ ๋ฐ ์ฌ๋ฌ ์ธ๋ถ ZED 2 ์คํ ๋ ์ค ์นด๋ฉ๋ผ๋ก ๊ตฌ์ฑ๋ DROID ๋ก๋ด ํ๋ซํผ [1]์ ๊ตฌํ๋์์ต๋๋ค. ์์คํ ์ ์ ์ฑ ์ถ๋ก ์๋ฒ(policy inference servers), ํ๊ฐ ํด๋ผ์ด์ธํธ(evaluation clients), ํ๊ฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค(evaluation database), ์ค์ ํ๊ฐ ์๋ฒ(central evaluation server)์ ๋ค ๊ฐ์ง ํต์ฌ ๊ตฌ์ฑ ์์๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค. ์ ์ฑ ์ถ๋ก ์๋ฒ๋ ๋ชจ๋ ์ ์ฑ ์ ์๊ฒฉ์ผ๋ก ํธ์คํ ํ์ฌ ์ฌ๋ฌ ํ๊ฐ์๊ฐ ์์์ ๊ณต์ ํ๊ณ ํด๋ผ์ด์ธํธ ์ธก ๊ณ์ฐ ๋ถ๋ด์ ์ค์ ๋๋ค. ํ๊ฐ ํด๋ผ์ด์ธํธ๋ ์ค์ ์๋ฒ ๋ฐ ์ ์ฑ ์๋ฒ์ ํต์ ํ๋ฉฐ ํ๊ฐ ํ๋กํ ์ฝ์ ์๋ดํฉ๋๋ค. ํ๊ฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋ชจ๋ ํ๊ฐ ๊ฒฐ๊ณผ์ ๋กค์์ ๋น๋์ค๋ฅผ ์ ์ฅํฉ๋๋ค. ์ค์ ํ๊ฐ ์๋ฒ๋ ํ๊ฐ์์๊ฒ ์ ์ฑ ์ ํ ๋นํ๊ณ , ์ ์ฑ ํ์ ์ ๊ท ๋๋ ํ๊ธฐ ์ ์ฑ ์ ์ถ์ ํ๋ฉฐ, ์๊ฐ ์ด๊ณผ ์ ํ๊ฐ๋ฅผ ์ทจ์ํฉ๋๋ค.
์คํ ๊ฒฐ๊ณผ (Experiments)
7๊ฐ์ ์ ๋๋ด๋ฆฌ์คํธ DROID ์ ์ฑ (PaliGemma ๋๋ \pi_0 ๊ธฐ๋ฐ ๋ชจ๋ธ)์ ์ฌ์ฉํ์ฌ ํ๊ฐ๋ฅผ ์ํํ์ต๋๋ค. โ์ค๋ผํด(oracle)โ ์ ์ฑ ์์๋ ๋ชจ๋ ์ ์ฑ ์ ๋ชจ๋ ํ ์คํธ๋ ์์ ์ ๋ํด ์ฒ ์ ํ ํ๊ฐํ๊ณ ํ๊ท ์งํ ์ ์๋ฅผ ๋น๊ตํ์ฌ ์ค์ ๋์์ผ๋ฉฐ, ์ด 4284๊ฐ์ ํ๊ฐ๊ฐ ์ฌ์ฉ๋์์ต๋๋ค. RoboArena๋ ๊ธฐ์กด์ ๋ก๋ด ํ๊ฐ ์ ๊ทผ ๋ฐฉ์(Pertsch et al. [5]์์ ์ฌ์ฉ๋ DROID ํ๊ฐ ์ ์ฐจ)๊ณผ ๋น๊ต๋์์ต๋๋ค.
๊ฒฐ๊ณผ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ์ ํ์ฑ: RoboArena์ ์๋ ๋น๊ต ๊ธฐ๋ฐ ์ ์ฑ ์์๋ Pearson ์๊ด ๊ณ์(r) ๋ฐ MMRV (Mean Maximum Rank Violation) ์งํ์์ ๊ธฐ์กด ๋ก๋ด ํ๊ฐ ๋ฐฉ์(โRegularโ)๋ณด๋ค ์ค๋ผํด ์์์ ํจ์ฌ ๋ ๋์ ์๊ด ๊ด๊ณ๋ฅผ ๋ณด์์ต๋๋ค. ํนํ, ์ ์๋ ์์ ์ธ์ง ์์ ์ ๊ทผ ๋ฐฉ์(โTASKโ)์ด ํ์ค Elo [61] ๋๋ Bradley-Terry (โBTโ) ๋ชจ๋ธ๋ณด๋ค ๊ฐ์ฅ ์ ํํ ์์๋ฅผ ์ ๊ณตํ์ต๋๋ค. ์งํ ์ ์(โPROGโ)๋ฅผ ์ฌ์ฉํ ์์๋ ํจ๊ณผ์ ์ด์์ง๋ง, ์ ์ฑ ์ฑ๋ฅ์ ๋ํ ๋ฏธ๋ฌํ ํผ๋๋ฐฑ(์: ๋์ผํ ์งํ ์ ์๋ผ๋ ๋ ์ ์ํ๊ฑฐ๋ ์์ ๊ฐ ์๋ ๋์)์ ๋์น ์ ์์ต๋๋ค.
- ์ํ ํจ์จ์ฑ (Sample Efficiency): RoboArena๋ ๋ถ๊ณผ 100๊ฐ์ ์๋ ๋น๊ต ๋ด์์ ๊ณ ํ์ง ์์์ ์๋ ดํ๋ฉฐ, ์ด๋ ๊ธฐ์กด ๋ก๋ด ํ๊ฐ ๋ฐฉ์๊ณผ ์ ์ฌํ ์๋ ด ์๋๋ฅผ ๋ณด์ด๋ฉด์๋ ํจ์ฌ ๋ ์ ํํ ์์๋ฅผ ์ ๊ณตํฉ๋๋ค. ๋ ๋ง์ ๋น๊ต๊ฐ ์์ง๋ ์๋ก ์์์ ํ์ง์ ๋์ฑ ํฅ์๋ฉ๋๋ค.
- ์ ์ฑ์ ํต์ฐฐ๋ ฅ ์ถ์ถ: VLM์ ํตํ ์์ ๋ถ๋ฅ๋ ์ฝ 95%์ ์ ํ๋๋ฅผ ๋ณด์์ผ๋ฉฐ, LLM ์ง์ ๋ถ์ ๋๊ตฌ๊ฐ ์์ฑํ ์ ์ฑ ๋ณด๊ณ ์์ ๋น๊ต ์ฃผ์ฅ์ ์ค์ ํ๊ฐ ๋ฐ์ดํฐ์ ์น๋ฅ ๊ณผ ์ผ์นํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค.
์ผ๋ฐํ๋ ์ ์ฑ ์ ๊ฐ์ ๋ฐ ์ฝ์ (Strengths and Weaknesses of Generalist Policies)
RoboArena๋ฅผ ํตํ ๊ด๋ฒ์ํ ํ๊ฐ๋ฅผ ํตํด ํ์ฌ ์ ๋๋ด๋ฆฌ์คํธ ์ ์ฑ ๋ค์ ์ผ๊ด๋ ํ๋ ํจํด๊ณผ ์คํจ ๋ชจ๋๊ฐ ํ์ธ๋์์ต๋๋ค. ์ฃผ์ ๊ฐ์ ์ ๋ค์ํ ์์ , ์กฐ๋ช ์กฐ๊ฑด ๋ฐ ๋ฐฐ๊ฒฝ์์ ์๋ํ๋ ๋ฅ๋ ฅ์ ๋๋ค. ์ง์ ์ ์ธ ๊ฐ์ฒด ์กฐ์(์: ์ง์ด์ ๋๊ธฐ, ๋ฐ๊ธฐ, ๋์ด๋จ๋ฆฌ๊ธฐ, ๊ฐ๋จํ ์ด๊ณ ๋ซ๊ธฐ)๊ณผ ๊ด๋ จ๋ ์์ ์ ๋๊ตฌ ์ฌ์ฉ, ์ฒ ์กฐ์ ๋๋ ๋ณต์กํ ์๋ฏธ๋ก ์ ์ดํด๋ฅผ ์๊ตฌํ๋ ์์ ๋ณด๋ค ๋ ์์ ์ ์ผ๋ก ํด๊ฒฐ๋ฉ๋๋ค. ํนํ, ์ ์ฑ ๋ค์ ๋ชฉํ๊ฐ ๊ฐ๋จํ๊ณ ์๊ฐ์ ์ผ๋ก ๊ธฐ๋ฐ์ ๋ ๋ ๋ ์ ์ํ๋์ง๋ง, ์ ๋ฐํ ์ ๋ ฌ, ๋ค๋จ๊ณ ์ถ๋ก ๋๋ ํน์ ์์ฑ(๊ฐ์ฒด ํด๋์ค, ์์) ์ธ์์ด ํ์ํ ๋๋ ์ด๋ ค์์ ๊ฒช์ต๋๋ค. ๋ณํ ๊ฐ๋ฅํ ๊ฐ์ฒด(์: ์ ๊ธฐ, ๋ฎ๊ธฐ) ๋ฐ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ ๋์(์: ๋ฆ๊ธฐ, ํผ๋ด๊ธฐ)๊ณผ ๊ด๋ จ๋ ์์ ์ ์ฌ์ ํ ์ฃผ์ ๋์ ๊ณผ์ ์ ๋๋ค.
์ ์ฑ ๊ณ์ด์ ๋น๊ตํ ๋, ์๋ ํ๊ท ์ ์ฑ (autoregressive policies, ์: PG-FAST-DROID, PG-FAST+-DROID, \pi_0-FAST-DROID)์ ๋ ์ ํํ ์ธ์ด ์ง์ ๋ฐ๋ฅด๊ธฐ ๋ฅ๋ ฅ ๋๋ถ์ ์ง์ด์ ๋๊ธฐ, ์๊ธฐ ๋ฐ ๋ถ๋ฅ ์์ ์์ ๋ ๋์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ต๋๋ค. ํ์ฐ ๊ธฐ๋ฐ ์ ์ฑ (diffusion-based policies, ์: PG-flow-DROID, \pi_0-flow-DROID)์ ๋ฏธ๋๋ฌ๋จ๋ฆฌ๊ธฐ ๋ฐ ๋ฆ๊ธฐ์ ๊ฐ์ ์ ์ฐํ๊ฑฐ๋ ์ฐ์์ ์ธ ๋์ ์์ ์์ ์ ์ํ๋์ง๋ง, ์ ๋ฐํ ์ธ์ด ์ง์๊ฐ ํ์ํ ์์ ์์๋ ๋ค์ฒ์ง๋ ๊ฒฝํฅ์ด ์์ต๋๋ค. ๋น๋(binning) ์ ์ฑ (์: PG-Bin-DROID)์ ๊ฑฐ์ ๋ชจ๋ ์์ ์์ ์ง์์ ์ผ๋ก ์ ์กฐํ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค.
๊ฒฐ๋ก (Conclusion)
RoboArena๋ ๋ถ์ฐ๋ ํ๊ฐ์ ๋คํธ์ํฌ๋ฅผ ํตํด ์ ๋๋ด๋ฆฌ์คํธ ๋ก๋ด ์ ์ฑ ์ ํ๊ฐํ๋ ์๋ก์ด ๋ถ์ฐํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. ์ด๋ ๊ธฐ์กด ์ค์ ์ง์ค์ ํ๊ฐ ๋ฐฉ์๋ณด๋ค ๋ ์ ํํ ์ ์ฑ ์ฑ๋ฅ ์์๋ฅผ ์์ฑํ๋ฉด์๋ ๋์ ํ๊ฐ ์ํ ํจ์จ์ฑ์ ์ ์งํ ์ ์์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ๋ํ, LLM ์ง์ ๋ถ์ ๋๊ตฌ๋ฅผ ํตํด ํ๊ฐ ๊ฒฐ๊ณผ์์ ์ ์ฑ์ ํต์ฐฐ๋ ฅ์ ์ถ์ถํ๋ ๋ฐฉ๋ฒ๋ ์๊ฐํ์ต๋๋ค. RoboArena ํ๊ฐ ํ๋ ์์ํฌ๋ ์ปค๋ฎค๋ํฐ์ ๊ณต๊ฐ๋ ์์ ์ด๋ฉฐ, ์ด๋ฅผ ํตํด ์ ๋๋ด๋ฆฌ์คํธ ๋ก๋ด ์ ์ฑ ์ ๋น๊ต ๊ฐ๋ฅ์ฑ์ ๋์ผ ์ ์์ ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค.
Detail Review
RoboArena: ๋ฒ์ฉ ๋ก๋ด ์ ์ฑ ์ ๋ถ์ฐ ์ค์ธ๊ณ ํ๊ฐ
์ฃผ์ ๊ธฐ์ฌ
์ด ๋ ผ๋ฌธ์ RoboArena๋ผ๋ ๋ถ์ฐํ ์ค์ธ๊ณ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ์ฌ, ๊ธฐ์กด์ ์ค์์ง์ค์ ๋ฐฉ์์ด ์๋ ํฌ๋ผ์ฐ๋์์ฑ์ ๊ธฐ๋ฐํ ๋ก๋ด ์ ์ฑ ํ๊ฐ ๋ฐฉ๋ฒ์ ์๊ฐํ๋ค. RoboArena์์๋ ํ๊ฐ์๊ฐ ํน์ ํ๊ฒฝ๊ณผ ๊ณผ์ ๋ฅผ ์์ ๋กญ๊ฒ ์ ํํ๊ณ , ๋ ๊ฐ์ ์ ์ฑ ์ ๋ธ๋ผ์ธ๋๋ก ๋น๊ต ํ๊ฐ(A/B ์๋น๊ต)ํ์ฌ ์ด๋ค ์ ์ฑ ์ด ๋ ์ฐ์ํ์ง ์ ํธ๋๋ฅผ ๊ธฐ๋กํ๋ค. ์ด๋ ๊ฒ ๋ชจ์ธ ์ ํธ๋ ํผ๋๋ฐฑ์ Bradley-Terry ๋ชจ๋ธ๊ณผ ๊ฐ์ ํต๊ณ์ ์์ ๋ชจํ์ผ๋ก ์ข ํฉํ์ฌ ์ ์ฑ ์ ์ ์ญ ์์๋ฅผ ์ถ์ ํ๋ค. ์ด ๋ฐฉ์์ ํต์ฌ์ ๊ณ ์ ๋ ์์ ์ด๋ ํ๊ฒฝ์ ์ฝ๋งค์ด์ง ์๊ณ ํ๊ฐ ๋ค์์ฑ์ ๊ทน๋ํํ๋ ๊ฒ์ด๋ค. ๊ธฐ์กด ๋ฒค์น๋งํฌ์ฒ๋ผ ๊ณผ์ ๋ ํ๊ฒฝ์ ํ์คํํ์ง ์๊ณ , ์ฌ๋ฌ ํ๊ฐ์๊ฐ ์๋ก ๋ค๋ฅธ ์กฐ๊ฑด์์ ํ๊ฐ์ ์ฐธ์ฌํ๋๋ก ํจ์ผ๋ก์จ, ๊ด๋ฒ์ํ ์๋๋ฆฌ์ค๋ฅผ ํฌ์ฉํ๋ฉด์๋ ๊ฒฐ๊ณผ์ ๊ณต์ ์ฑ๊ณผ ์ ๋ขฐ์ฑ์ ํ๋ณดํ ์ ์๋ค. ํนํ RoboArena๋ ๋จ์ ์คํ ๊ฒฐ๊ณผ์ ์์ํ๋ฟ ์๋๋ผ, ์ธ์ดํ ํผ๋๋ฐฑ์ ๋ถ์ํด ๊ฐ ์ ์ฑ ์ ์ ์ฑ์ ๊ฐ์ฝ์ ๋ ๋์ถํ๋ค. ์ค์ 7๊ฐ ๊ธฐ๊ด์ DROID ๋ก๋ด ํ๋ซํผ์ ํ์ฉํด 600ํ ์ด์์ ์๋น๊ต(์ด 4284 ์ํผ์๋)๋ฅผ ์ํํ ๊ฒฐ๊ณผ, RoboArena๋ ๊ธฐ์กด ์ค์์ง์ค์ ํ๊ฐ๋ณด๋ค ๋ฒ์ฉ ์ ์ฑ ๋ค์ ์ฑ๋ฅ์ ๋ ์ ํํ ์์ํํจ์ ๋ณด์๋ค. ์ด ํ๊ฐ ๋คํธ์ํฌ์ DROID ํ๋ซํผ์ ์คํ์์ค๋ก ๊ณต๊ฐํ์ฌ, ๋๊ตฌ๋ ์ ์ฑ ์ ์ ์ถํ๊ณ ํ๊ฐ์ ์ฐธ์ฌํ ์ ์๊ฒ ํ๋ ๊ฒ๋ ์ค์ํ ๊ธฐ์ฌ์ด๋ค.

๊ธฐ์ ์ ๋ฐฉ๋ฒ๋ก
RoboArena์ ํ๊ฐ ํ๋กํ ์ฝ์ ์ค์์๋ฒ์ ๋ถ์ฐํ ํ๊ฐ์(Client)๋ก ๊ตฌ์ฑ๋๋ค. ํ๊ฐ์๋ ์ค์ ์๋ฒ์์ ๋ฌด์์๋ก ๋ ์ ์ฑ ์ ํ ๋น๋ฐ์ ๋ก๋ด์๊ฒ ๋์์ ์คํ์ํค๋ฉฐ, ์ ์ฑ ์ ์ด๋ฆ ๋ฑ์ ์ ์ ์๊ฒ ๋ธ๋ผ์ธ๋๋ก ์งํ๋๋ค. ์ด๋ ํ๊ฐ์๋ ์ฅ๋ฉด์ ์ฌ๋ฐฐ์นํ๊ณ (์: ๋ก๋ด๊ณผ ๋ฌผ์ฒด์ ์์น ์กฐ์ ) ์ธ์ด ์ง์๋ฌธ์ผ๋ก ์๋ก์ด ๊ณผ์ ๋ฅผ ์ ์ํ์ฌ, ๋ ์ ์ฑ ์ ์ฐจ๋ก๋ก ์คํํ๋ค. ์คํ ํ ํ๊ฐ์๋ ์ธ ๊ฐ์ง ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ค: (1) ๊ณผ์ ์ํ ์ ๋์ ๋ฐ๋ฅธ ์งํ๋ ์ ์(progress score), (2) ๋ ์ ์ฑ ์ค ๋ ๋์ ์ ์ฑ ์ ์ ํํ๋ ์ ํธ๋(Preference), (3) ์ ํ ์ด์ ๋ฅผ ์ค๋ช ํ๋ ์์ ์์ ํ ์ธ์ด ํผ๋๋ฐฑ. ์๋น๊ต ๋ฐ์ดํฐ๋ Bradley-Terry(BT) ๋ชจ๋ธ์ด๋ Elo ๋ชจ๋ธ๋ก ํตํฉ ์์๋ฅผ ๊ณ์ฐํ๋ ๋ฐ ํ์ฉ๋๋ค. ๋ ผ๋ฌธ์์๋ ํ์ค BT/Elo ๊ธฐ๋ฐ์ ์์ ์ฐ์ถ๊ณผ, ์์ ํน์ฑ์ ๋ฐ์ํ๋ Task-aware ์์๊ธฐ๋ฒ์ ๋น๊ตํ๋ค. ๊ทธ ๊ฒฐ๊ณผ ์์ ๋ณ ํน์ฑ ๊ณ ๋ คํ๋ ๋ฐฉ๋ฒ(TASK)์ด ๊ฐ์ฅ ์ ํํ ์์๋ฅผ ๋ธ๋ค. ๋ํ ๋จ์ํ ์งํ๋ ํ๊ท ์ผ๋ก ์์ ๋งค๊ธฐ๊ธฐ(PROG)๋ ๊ฝค ํจ๊ณผ์ ์ด๋, ์ ์ฑ ๊ฐ ๋ฏธ์ธํ ์ฐจ์ด๋ฅผ ๋์น ์ ์์ด ์ ํธ๋์ ํจ๊ป ๋ณํ ๋ณด๊ณ ํ ๊ฒ์ ์ ์ํ๋ค. ํ๊ฐ ์์คํ ์ ์๊ฒฉ ํธ์คํ ์ ์ฑ ์๋ฒ์ ํด๋ผ์ด์ธํธ, ์ค์ ์๋ฒ, ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ก ๊ตฌ์ฑ๋๋ค. ์ ์ฑ ์๋ฒ์๋ ์ ์ถ๋ ์ ์ฑ ์ด ์ฌ๋ผ๊ฐ ์์ผ๋ฉฐ, ์ฌ๋ฌ ํ๊ฐ์๊ฐ ๋์์ ์ฌ์ฉํ ์ ์๋ค. ํ๊ฐ ํด๋ผ์ด์ธํธ๋ ๋ก๋ด์ ์ฐ๊ฒฐ๋ ์ปดํจํฐ๋ก, ์ค์ ์๋ฒ์ ํต์ ํ๋ฉด์ ํ๊ฐ ์งํ ๊ณผ์ ์ ์๋ดํ๋ค. ๋ก๋ด ํ์ฅ์๋ ๋ณ๋์ ์ถ๋ก ์ฐ์ฐ์ด ํ์ ์์ผ๋ฏ๋ก, ํ๊ฐ์๊ฐ ๋ก๋ด์ด ์๋ ์คํ์ค๋ง ์์ผ๋ฉด ์ฝ๊ฒ ์ฐธ์ฌํ ์ ์๋ค. ์ค์ ์๋ฒ๋ ํ๊ฐ ๊ณผ์ ๋ฐฐ์ ๋ฐ ๋ฐ์ดํฐ ์ ์ฅ์ ๊ด๋ฆฌํ๋ฉฐ, ์๊ฐ์ด๊ณผ๋ ์คํ์ ์๋ ์ข ๋ฃํ๋ค.
์ ์ฑ์ ๋ถ์์ ์ํด ๋ ผ๋ฌธ์ ๋น์ ยท์ธ์ด ๋ชจ๋ธ(VLM)๊ณผ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํ์ฉํ๋ค. ๋จผ์ ํ๊ฐ ๋์์์ ์ฒซ ํ๋ ์๊ณผ ์ธ์ด ์ง์๋ฌธ์ GPT-4o ๊ฐ์ VLM์ ์ ๋ ฅํด ๊ณผ์ ๋ฒ์ฃผ(์: ์ง๊ธฐ, ์ด๊ธฐ ๋ฑ) ๋ฐ ์ฅ๋ฉด ํน์ฑ(์กฐ๋ช , ๋์ด๋ ๋ฑ)์ ๋ถ๋ฅํ๋ค. ์ด์ด ๊ฐ ์ ์ฑ ์ ๋ํด ์์ง๋ ์ ํธ๋์ ํผ๋๋ฐฑ, ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ฅผ GPT-3.5o LLM์ผ๋ก ์์ฝ ๋ณด๊ณ ์๋ฅผ ์์ฑํ๋ค. ์ด ๋ณด๊ณ ์๋ โ์ด๋ค ์ํฉ์์ ์ ์ฑ A๊ฐ B๋ณด๋ค ๋ซ๋ค/๋ชปํ๋คโ์ ๊ฐ์ ๋ด์ฉ์ ์ํผ์๋ ์ฆ๊ฑฐ์ ํจ๊ป ๊ธฐ์ ํ๋ฉฐ, ๊ฐ ์ฃผ์ฅ์ ๊ทผ๊ฑฐ๊ฐ ๋๋ ์คํ ์์์ ์ฐธ์กฐ๋ก ๋ฌ์ ๊ฒ์ฆ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
์คํ์ ์ฌ์ฉ๋ ์ ์ฑ ๋ค์ DROID ๋ฐ์ดํฐ์ ์ ๋ง์ถฐ ๋ฏธ๋ฆฌ ํ์ต๋ ๋ฒ์ฉ ๋น์ -์ธ์ด-ํ๋ ๋ชจ๋ธ๋ค์ด๋ค. ๊ตฌ์ฒด์ ์ผ๋ก PaliGemma ๊ธฐ๋ฐ ๋๋ GPT-VLM ๊ธฐ๋ฐ์ ์ฌ๋ฌ ๋ณ์ข (VLA Flow, FAST ๋ฑ)์ DROID ๋ฐ์ดํฐ๋ก ๋ฏธ์ธ์กฐ์ ํ์ฌ ์ฌ์ฉํ๋ค. ์ด๋ค์ ๋ชจ๋ out-of-the-box ๋ก ์๋ก์ด ํ๊ฒฝ๊ณผ ๊ณผ์ ์์ ์๋ํ๋๋ก ์ค๊ณ๋์๋ค.
์คํ ์ค๊ณ ๋ฐ ๊ฒฐ๊ณผ ๋ถ์
์คํ์๋ 7๊ฐ ๊ธฐ๊ด์ DROID ๋ก๋ด ํ๋ซํผ(Frank Panda 7-DoF ํ+2F-85 ๊ทธ๋ฆฌํผ)์์ ์ด 7๊ฐ ์ ์ฑ ์ ํ๊ฐํ๋ค. ๊ฐ์ ์ฑ ์ PaliGemma ๋๋ GPT-4o ๊ธฐ๋ฐ์ ์ฌ์ ํ์ต ๋ชจ๋ธ์ DROID ๋ฐ์ดํฐ์ ์ผ๋ก ๋ฏธ์ธ์กฐ์ ํ ๊ฒ์ผ๋ก, ๋ํ์ ์ผ๋ก flow-DROID, FAST-DROID, PG-FAST-DROID, PG-FSQ-DROID ๋ฑ ๋ค์ํ ์ก์ ํํ์ ์ฌ์ฉํ๋ค. ์คํ ๋ฐ์ดํฐ ์์ง์๋ ์ด 612ํ์ ์๋น๊ต๊ฐ ์ํ๋์๊ณ , ํ๊ฐ ๊ณผ์ ์์์ ๊ฐ๋ณ ์ ์ฑ ์คํ(๋กค์์)์ ์ด 4284ํ์ ๋ฌํ๋ค. ๋น๊ต ๊ธฐ์ค์ผ๋ก โ์ค๋ผํด ์์โ๋ฅผ ์ ์ํ๋ค. ์ด๋ ๋ชจ๋ ์ ์ฑ ์ ๋ชจ๋ ๊ณผ์ ์์ ํ๊ฐํ ํ ํ๊ท ์งํ๋ ์ ์๋ก ์ป์ ์์๋ก, ์ค์ ์์ ํ์ ๊ธฐ์ค์ ์์๋ผ ๋ณผ ์ ์๋ค. ์ค๋ผํด์ ์ป๊ธฐ ์ํด ๊ฐ ์๋น๊ต๊ฐ ๋๋ ๋๋ง๋ค ๋๋จธ์ง ์ ์ฑ ๋ค๋ ๋์ผ ์กฐ๊ฑด์์ ์คํํด ์ด 4284ํ์ ์ฑ๋ฅ ์ ์๋ฅผ ๋ชจ์๋ค. ๊ธฐ์กด ๋ฐฉ์์ธ ์ค์์ง์ค์ ํ๊ฐ๋ Pertsch et al.์ 17๊ฐ ๊ณ ์ ๊ณผ์ ํ๊ฐ ์ ์ฐจ(์ ์ ๋ ํ๊ฒฝ, ์ ์ฑ ๋น 44 ์ํผ์๋)๋ฅผ ์ฌ์ฉํ๋ค.
์คํ ๊ฒฐ๊ณผ, RoboArena์ ๋ถ์ฐ ์๋น๊ต ๋ฐฉ์์ด ์ค๋ผํด ์์์์ ์๊ด๊ด๊ณ๊ฐ ๊ธฐ์กด ํ๊ฐ๋ณด๋ค ์ ์๋ฏธํ๊ฒ ๋์๋ค. ๊ทธ๋ฆผ 6์ ๋ฐ๋ฅด๋ฉด, ์ผ๋ฐ ํ๊ฐ(Regular)๋ ์๊ด๊ณ์๊ฐ ๋ฎ๊ฒ ๋์จ ๋ฐ๋ฉด, RoboArena(BT, Elo, TASK) ๋ชจ๋ ํจ์ฌ ๋์ ์๊ด๊ด๊ณ๋ฅผ ๋ณด์๋ค. ํนํ Task-aware ๋ฐฉ์์ ์ฌ์ฉํ ์์ ๊ณ์ฐ์ด ๊ฐ์ฅ ์ ํํ์ผ๋ฉฐ, ๊ธฐ๋ณธ BT๋ Elo์ ๋นํด ์ ์ฑ ๊ฐ ์ธ๋ถ ์ฑ๋ฅ ์ฐจ์ด๋ฅผ ์ ๋ฐ์ํ๋ค. ์ด ๊ฒฐ๊ณผ๋ ํํ๋ ฅ์ด ํ๋ถํ ์ก์ ํํ(flow, FAST ๋ฑ)์ด ๋จ์ ํ ํฌ๋์ด์ ์ด์ ๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ฐํํ ๊ธฐ์กด ์ฐ๊ตฌ ๊ฒฐ๊ณผ์ ์ผ์นํ๋ค.
๋ ๋ค๋ฅธ ๊ฒฐ๊ณผ๋ก, ์งํ๋ ๊ธฐ๋ฐ ์์(PROG)๋ ์๋นํ ํจ๊ณผ์ ์ด์๋ค. ํ์ง๋ง ์คํ์ ํตํด ํ๊ฐ์๋ ๋ ์ ์ฑ ์ ๋์ผํ ์งํ๋ ์ ์๋ฅผ ์ค ๋๋ ๋ช ๋ฐฑํ ํ๋๋ฅผ ์ ํธํ ์ ์์์ด ๊ด์ฐฐ๋๋ค(์: ๋ ๋น ๋ฅด๊ฑฐ๋ ์์ ๊ฐ ์๊ฒ ํ๋ํ๋ ์ ์ฑ ). ๋ฐ๋ผ์ RoboArena๋ ์งํ๋ ์ ์์ ์ ํธ๋ ๋ชจ๋๋ฅผ ํจ๊ป ์ฌ์ฉํ๋ ๊ฒ์ด ์ ์ฒด์ ์ ์ฑ ๋น๊ต์ ์ ์ฉํจ์ ์์ฌํ๋ค. ํํธ ์ํ ํจ์จ์ฑ ๋ถ์์์๋ RoboArena๊ฐ ์ฝ 100ํ์ ์๋น๊ต๋ง์ผ๋ก๋ ๊ณ ํ์ง ์์์ ์๋ ดํจ์ ํ์ธํ๋ค. ์ด๋ ๊ธฐ์กด ์ค์์ง์ค์ ํ๊ฐ๊ฐ ์ ์ฑ ๋น 44์ํผ์๋ ์ํํ๋ ๋ฐ ์์๋๋ ์ ๋์ ์ ์ฌํ ์์ค์ด๋ค. ์ฆ, ๋ถ์ฐ ํ๊ฐ๋ผ๋ ์ด ์คํ ์๋ ๋น์ทํ์ง๋ง ๋ค์ํ ํ๊ฒฝ์ผ๋ก ๋ถ์ฐ๋๋ฏ๋ก ์์ ์ ํ๋๊ฐ ๋ ๋์์ง๋ค. ์๋น๊ต ํ์๊ฐ ๋ง์์ง์๋ก ์์์ ํ์ง๋ ๊ณ์ ํฅ์๋์์ผ๋ฉฐ , ์ด๋ RoboArena๊ฐ ๋ง์ ๊ธฐ์ฌ์๊ฐ ์ฐธ์ฌํ ์๋ก ๋์ฑ ์ ๋ฐํ ํ๊ฐ๊ฐ ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ์๋ฏธํ๋ค.
์ ์ฑ ๋ถ์ ํ๊ฐ๋ ์งํํ๋ค. VLM(์: GPT-4o)์ ์ด์ฉํ ๊ณผ์ ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ ์ ๋ฌธ๊ฐ ์๋ ๋ถ๋ฅ์ 95% ์ผ์นํ ์ ๋๋ก ์ ํํ๋ค. ๋ํ LLM์ ํตํด ์์ฑ๋ ์ ์ฑ ๋ณด๊ณ ์์๋ ๊ฐ ์ ์ฑ ์ ๊ฐยท์ฝ์ ์ด ๋ช ํํ ๊ธฐ์ ๋์๊ณ , ๊ทธ ๊ทผ๊ฑฐ๊ฐ ๋๋ ์ค์ ์ํผ์๋ ๋น๋์ค ์ฐธ์กฐ๋ ํฌํจ๋์ด ์์๋ค. ์ ๋ฐ์ ์ผ๋ก RoboArena ํ๊ฐ ๋ฐ์ดํฐ๋ ์ ์ฑ ์ฑ๋ฅ์ ์ ํํ ๋ฐ์ํ์ผ๋ฉฐ, ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ ์ฑ ๊ฐ๋ฐ์์๊ฒ ์ ์ฉํ ํต์ฐฐ์ ์ ๊ณตํ ์ ์์์ ๋ณด์๋ค.
๊ธฐ์กด ์ฐ๊ตฌ์์ ๋น๊ต
์ ํต์ ์ธ ๋ก๋ด ํ๊ฐ ๋ฐฉ๋ฒ๋ค์ ์ ํ๋ ๊ณผ์ ์ ํ๊ฒฝ์ ๋ํ ๊ณ ๋๋ก ํ์คํ๋ ์คํ์ ์ํํ๋ค. ์๋ฅผ ๋ค์ด ๊ณผ์ ๋ชฉ๋ก๊ณผ ์ฅ๋ฉด์ ๋ฏธ๋ฆฌ ์ ์ํ๊ณ , ์กฐ๋ช , ์นด๋ฉ๋ผ ์์น, ๋ฌผ์ฒด ์ด๊ธฐ ์์น๊น์ง ์๋ฐํ ํต์ ํ๋ค. ์ด๋ฌํ ์ ๊ทผ์ ์์์ ์ ์ฑ ์ ์์์ ํ๊ฒฝ์์ ๋น๊ตํ๋ ๋ฐ๋ ์ ๋ฆฌํ์ง๋ง, ๋ฒ์ฉ ์ ์ฑ ์ฒ๋ผ ๋ค์ํ ์ํฉ์์ ์๋ํด์ผ ํ๋ ๋ชจ๋ธ์ ํ๊ฐ์๋ ๋ถ์ ํฉํ๋ค. Dasari ๋ฑ์ ์ฌ๋ฌ ๊ธฐ๊ด์ ๊ฒฐ๊ณผ๋ฅผ ๋ชจ์ ์ข ํฉ ํ๊ฐ๋ฅผ ์๋ํ์ง๋ง, ๊ฐ ๊ธฐ๊ด์์ ์ ์ฑ ์ ๋ณ๋๋ก ์ฌํ์ตํด์ผ ํ๊ณ ์ ์ฉ ํ๊ฒฝ์ด ์ ํ์ ์ด์๋ค.
๋ฐ๋ฉด RoboArena๋ ๊ณผ์ ๋ ํ๊ฒฝ์ ๊ณ ์ ํ์ง ์๊ณ ๋ถ์ฐ ์๋น๊ต๋ก ์์๋ฅผ ๋งค๊ธด๋ค. ์ด๋ ๋ค์ํ ์ฅ๋ฉด๊ณผ ๊ณผ์ ๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ๋ค๋ฃจ์ด ๊ฒ์ฆ์ ํฌ์ฉ์ฑ์ ๋์ด๊ณ , ์คํ ์กฐ๊ฑด์ ์์ ์ผ์น๋ฅผ ๊ฐ์ ํ์ง ์์ ๋ก๋ด ์ ์กฐ ์ฐจ์ด๋ ํ๊ฒฝ ์ฐจ์ด์ ์ํฅ์ ์ค์ธ๋ค. ๋ณธ ๋ ผ๋ฌธ์ ์คํ์์ ํ์ธํ๋ฏ, ์ ํต์ ํ๊ฐ ๋ฐฉ์(โRegularโ)์ ์ค๋ผํด ์์์์ ์๊ด์ด ๋ฎ์ ์ผ๋ฐํ๋ ์ ์ฑ ์ฑ๋ฅ์ ์ ๋ขฐ๋ ์๊ฒ ๋ฐ์ํ์ง ๋ชปํ๋ค. ๋ฐ๋ผ์ RoboArena์ ๋ถ์ฐ ํ๊ฐ๊ฐ ๋ฒ์ฉ ์ ์ฑ ๋น๊ต์ ๋ ์ ํฉํจ์ ์ ์ํ๋ค.
ํํธ OpenX-Embodiment ๊ฐ์ ์ฐ๊ตฌ ๋ ๋ค์ํ ๋ก๋ด ํ๋ซํผ์์ ์์งํ ๋๊ท๋ชจ ์์ฐ ๋ฐ์ดํฐ๋ฅผ ํตํฉํด ๋ฒ์ฉ ์ ์ฑ ํ์ต์ ๋ชฉํ๋ก ํ๋ค. ์์ปจ๋ RT-X๋ ์ฌ์ฏ ๊ฐ ์ด์์ ๋ก๋ด ๋ฐ์ดํฐ๋ฅผ ๋ชจ์ ํ์ตํ๋ฉฐ, ๋ค๋ฅธ ๋ก๋ด์ ๊ธ์ ์ ์ ์ด(positive transfer)๊ฐ ์์์ ๋ณด์๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ์ฐ๊ตฌ๋ค์ ์ ์ฑ ์ ํ์ต๊ณผ ๊ด๋ จ๋ ๊ฒ์ผ๋ก, ๋ก๋ด ์ ์ฑ ์ ์ฑ๋ฅ ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ์ง๋ ์์๋ค. RoboArena๋ ์ด๋ฏธ ํ์ต๋ ๋ฒ์ฉ ์ ์ฑ ์ ์ค์ ํ๊ฒฝ์์ ์ข ํฉ ๋น๊ตํ๋ ๋ฐ ์ง์คํ๋ค๋ ์ ์์ ์ฐจ์ด๊ฐ ์๋ค. ์ฆ, OpenX๋ RT-X๊ฐ ์ ์ฑ ํ์ต์ ์ํ ๋ฐ์ดํฐ์ ๋ชจ๋ธ์ ์ ๊ณตํ๋ค๋ฉด, RoboArena๋ ์ด๋ค ์ ์ฑ ์ ์ค์ง์ ์ฑ๋ฅ ๊ฒ์ฆ์ ์ํ ์ธํ๋ผ๋ฅผ ์ ๊ณตํ๋ค๊ณ ๋ณผ ์ ์๋ค.
๋ํ ์ต๊ทผ ๋ฐํ๋ AutoEval(์์จ ํ๊ฐ ์์คํ ) ์ฐ๊ตฌ๋ ์ฌ๋์ ๊ฐ์ ์ ์ต์ํํ ์๋ ํ๊ฐ๋ฅผ ์ ์ํ๋ค. AutoEval์ ํน์ ๋ก๋ด(์: WidowX)์์ 24์๊ฐ ์๋์ผ๋ก ํ๊ฐ ์์ ์ ๋๋ ค, ์ธ๊ฐ์ด ์ฑ์ ํ๋ ์ ํต์ ๋ฐฉ๋ฒ๊ณผ ์ ์ฌํ ๊ฒฐ๊ณผ๋ฅผ ์ป์๋ค๊ณ ํ๋ค. RoboArena๋ ๋ฐ๋๋ก ์ฌ๋ ํ๊ฐ์๋ฅผ ํตํด ์ ์ฐ์ฑ์ ํ๋ณดํ๋ค. AutoEval์ด ์ค์ ๋ ํ๊ฒฝ์์ ์์ ์๋ํ๋ฅผ ์ถ๊ตฌํ๋ค๋ฉด, RoboArena๋ ์ฌ๋ฌ ๊ธฐ๊ด์ ์ฌ๋์ด ๋ค์ํ ํ๊ฒฝ์ ์ฐฝ์์ ์ผ๋ก ํ์ฉํ๋๋ก ์ฅ๋ คํ๋ค๋ ์ฐจ์ด๊ฐ ์๋ค.
์ข ํฉํ๋ฉด, RoboArena๋ ๊ธฐ์กด์ ์ค์์ง์คํ ๋ฒค์น๋งํฌ ๋ฐฉ์๊ณผ Open-X, AutoEval ๋ฑ์ ์ฐ๊ตฌ์ ๋นํด ํ๊ฐ์ ๋ฒ์ฉ์ฑยทํ์ฅ์ฑยท์ ๋ขฐ์ฑ ์ธก๋ฉด์์ ์๋ก์ด ๋์์ ์ ์ํ๋ค. ํนํ ๋ฒ์ฉ ๋ก๋ด ์ ์ฑ ์ ์ฑ๋ฅ์ ์ค์ ํ๊ฒฝ์ ๋ค์์ฑ ์์์ ๊ฐ๊ด์ ์ผ๋ก ๋น๊ตํ๊ณ ์ ํ ๋, RoboArena ๋ฐฉ์์ด ์ ํฉํจ์ ๋ณด์ฌ์ค๋ค.
์ค์ ์ ์ฉ ๊ฐ๋ฅ์ฑ ๋ฐ ํ์ฉ ๋ฐฉ์
RoboArena๋ ๋ก๋ด ๊ณตํ ์ปค๋ฎค๋ํฐ์ ๊ณต์ฉ ํ๊ฐ ํ๋ซํผ์ ์ ๊ณตํจ์ผ๋ก์จ ์ฐ๊ตฌ ๋ฐ ์ฐ์ ์์ ํ์ฉ๋ ์ ์๋ค. ์๋ฅผ ๋ค์ด ์๋ก์ด ๋ฒ์ฉ ๊ฐํํ์ต ์ ์ฑ ์ด๋ ๋ํํ ๋ก๋ด ๋ชจ๋ธ์ ๊ฐ๋ฐํ๋ ์ฐ๊ตฌ์๋, ์์ ์ ์ ์ฑ ์ RoboArena ๋คํธ์ํฌ์ ์ถ๊ฐํด ๊ธฐ์กด ๋ชจ๋ธ๋ค๊ณผ ์ฑ๋ฅ์ ๋น๊ตํ ์ ์๋ค. ์ด๋ ๊ฒ ํ๋ฉด ํน์ ์ฐ๊ตฌํ ๋ก์ปฌ ํ๊ฒฝ์ ํ์ ๋ ๊ฒ์ฆ์ ๋์ด, ๋ค์ํ ์ค์ ์คํ์ค ํ๊ฒฝ์์์ ์ฑ๋ฅ์ ๊ฒ์ฆํ๊ฒ ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ์ค์ ๋ก๋ด ์ ํ ๊ฐ๋ฐ์์๋ ์ด๋ ์ ๋ ์ค๋น๋ ์ ์ฑ ์ธ์ง๋ฅผ ํ๋จํ ์ ์๋ ์ฒ๋๊ฐ ๋๋ค.
๋ํ RoboArena๋ ๋ก๋ด ์ ์ด ๋ฐ ๊ฐํํ์ต ๋ถ์ผ์ ๋ฒค์น๋งํฌ ์ญํ ์ ํ ์ ์๋ค. ๋ก๋ด ์ ์ด๊ธฐ ๊ฐ๋ฐ์๋ค์ RoboArena๋ก๋ถํฐ ์ป์ ์์์ ํผ๋๋ฐฑ์ ํ์ฉํด ์ด๋ค ์ ์ฑ ๊ตฌ์กฐ(์: ์ก์ ํํ)์ ํ์ต ๋ฐ์ดํฐ๊ฐ ๋ ์ผ๋ฐํ์ ์ ๋ฆฌํ์ง ํ๋จํ ์ ์๋ค. ์์ปจ๋ ๋ณธ ๋ ผ๋ฌธ์์ ์์ฌํ๋ฏ ๋ณต์กํ ํ ํฌ๋์ด์ ์ด์ ๋ชจ๋ธ์ด ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋ค ์ฐ์ํ๋ค๋ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ ์ ์๋ค. ์ด๋ ํ์ต ๋ฐฉ์ ๊ฐ์ ์ด๋ ์๋ฎฌ๋ ์ด์ -์ค์ธ๊ณ ์ ์ด ๊ธฐ๋ฒ ๊ฐ๋ฐ์๋ ์ค์ํ ์ ๋ณด๋ฅผ ์ค๋ค.
์ปค๋ฎค๋ํฐ ์ฐธ์ฌ์ฑ ์ธก๋ฉด์์, DROID-RoboArena๋ ๋ก๋ด์ด ์๋ ์ฐ๊ตฌ์๋ค๋ ์ค์ธ๊ณ ์ ์ฑ ํ๊ฐ์ ๊ธฐ์ฌํ ์ ์๊ฒ ํด์ค๋ค. DROID ๋ฐ์ดํฐ์ ๊ณผ ์ํํธ์จ์ด ํ๋ ์์ํฌ๊ฐ ๊ณต๊ฐ๋์ด ์์ผ๋ฏ๋ก, ๋ฉํฐ๋ก๋ด ๋ฐ์ดํฐ๋ก ์ ์ฑ ์ ํ๋ จ์ํจ ํ RoboArena๋ฅผ ํตํด ์ค์ ์ฑ๋ฅ์ ๊ฒ์ฆํ ์ ์๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ๋ฐ์ดํฐ ์ค์ฌ์ ๊ฐํํ์ต ์ฐ๊ตฌ์ ์ค์ ๋ก๋ด ์ ์ฉ ์ฌ์ด์ ๊ฐ๊ทน์ ์ค์ด๋ ๋งค๊ฐ์ฒด ์ญํ ์ ํ ์ ์๋ค. ๊ฒ๋ค๊ฐ RoboArena์ ํ๊ฐ ๋ฆฌํฌํธ(LLM ๊ธฐ๋ฐ ์ฝ์ ๋ถ์ ๋ฑ)๋ ๋ก๋ด ์ฐ๊ตฌ์๋ค์๊ฒ ๊ตฌ์ฒด์ ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ค. ๋จ์ํ ์ฑ๊ณต๋ฅ ๋ง ์๋ ค์ฃผ๋ ๊ฒ์ด ์๋๋ผ โ์ด ์ ์ฑ ์ A ๊ณผ์ ์์๋ ์ ์ํํ์ง๋ง B ๊ณผ์ ์์๋ ๋ฏธ์ํ๋คโ๋ ์์ผ๋ก ์ค๋ช ํจ์ผ๋ก์จ, ์ ์ฑ ๊ฐ์ ๋ฐฉํฅ์ ์ ์ํ๋ค. ์ด๋ฐ ์ง์ ์ ๋ณด๋ ์๋ฅผ ๋ค์ด ์๋ชป๋ ๋์ ํจํด ๊ฐ์ , ํ์ต ๋ฐ์ดํฐ ๋ณด๊ฐ, ์๊ณ ๋ฆฌ์ฆ ์ ํ ๋ฑ์ ํ์ฉ๋ ์ ์๋ค.
์์ฝํ๋ฉด, RoboArena๋ ๋ฒ์ฉ ๋ก๋ด ์ ์ฑ ํ๊ฐ์ ํ์ค ์ธํ๋ผ๋ก ์ฌ์ฉ๋ ์ ์์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ์ ์ฑ ๊ฐ๋ฐ์๋ ํ์ค ์ธ๊ณ์์์ ์ฑ๋ฅ๊ณผ ํ๊ณ๋ฅผ ๋ช ํํ ํ์ ํ์ฌ ๋ ๋์ ์ ์ด ์๊ณ ๋ฆฌ์ฆ์ ์ค๊ณํ ์ ์๋ค. ๋ํ ์ฐ์ ๊ณ์์๋ ์์ ยทํจ์จ์ ์ธ ๋ก๋ด ์์คํ ๊ฐ๋ฐ์ ์ํด RoboArena ๊ฒฐ๊ณผ๋ฅผ ๋ฒค์น๋งํน ์๋ฃ๋ก ํ์ฉํ ์ ์์ ๊ฒ์ด๋ค.
ํ๊ณ์ ๋ฐ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
RoboArena๋ ๋ถ์ฐํ ํ๊ฐ๋ผ๋ ๊ฐ์ ์ ์ง๋์ง๋ง, ๋ณธ ์ฐ๊ตฌ์๋ ๋ช ๊ฐ์ง ํ๊ณ๋ ์๋ค. ์ฐ์ ํ๋ซํผ ์ ์ฝ์ด๋ค. ํ์ฌ ์คํ์ ๋ชจ๋ DROID ๋ก๋ด ํ๋ซํผ(Franka Panda arm)์ ๊ธฐ๋ฐํ์๊ธฐ ๋๋ฌธ์, ๋ค๋ฅธ ๋ก๋ด ํํ(cross-embodiment)์ ์ ์ฑ ๊น์ง ํ๊ฐํ๋ ๊ฒ์ ๋ณ๋ ์์ ์ด ํ์ํ๋ค. ์์ปจ๋ ๋ก๋ด ์์ ๊ด์ ์๋ ๊ฐ๊ฐ์ฅ์น๊ฐ ํฌ๊ฒ ๋ค๋ฅธ ๊ฒฝ์ฐ, ๋์ผํ ์ ์ฑ ์ ์คํํ ์ ์๊ฑฐ๋ ํ๊ฐ ๊ธฐ์ค ์์ฒด๊ฐ ๋ฌ๋ผ์ง ์ ์๋ค. ๋ฐ๋ผ์ ํฅํ ์ฐ๊ตฌ์์๋ ๋ค์ํ ๋ก๋ด ์์คํ (์: ๋ชจ๋ฐ์ผ ๋ก๋ด, ๋๋ก , ํด๋จธ๋ ธ์ด๋ ๋ฑ)์ผ๋ก ํ๊ฐ ๋คํธ์ํฌ๋ฅผ ํ์ฅํ๊ณ , ๋ก๋ด ๊ฐ ๋น๊ต ๋ฐฉ๋ฒ์ ๊ณ ์ํด์ผ ํ๋ค.
๋ํ ์คํ ์ ์ด ๋ฌธ์ ๋ ์๋ค. RoboArena๋ ์๋์ ์ผ๋ก ํ๊ฒฝ ํต์ ๋ฅผ ์ํํ๊ธฐ ๋๋ฌธ์, ๊ฐ๋ณ ๋ณ์(์: ์กฐ๋ช , ์นด๋ฉ๋ผ ๊ฐ๋)๋ง ๋ ๋ฆฝ์ ์ผ๋ก ๋ถ์ํ๊ธฐ ํ๋ค๋ค. ์ด๋ฌํ ์ ์ ์ ์ฑ ์ ์ผ๋ฐํ ์ฑ๋ฅ์ ์ข ํฉ์ ์ผ๋ก ๋ณด๊ธฐ์๋ ์ด์ ์ด๋, ํน์ ์กฐ๊ฑด ๋ณํ์ ๋ฐ๋ฅธ ๋ฏผ๊ฐ๋๋ฅผ ์ฐ๊ตฌํ๊ธฐ์๋ ๋ถ์ ์ ํ ์ ์๋ค. ๋ฐ๋ผ์ RoboArena ํ๊ฐ ๊ฒฐ๊ณผ๋ ๊ธฐ์กด์ ํ์คํ๋ ๋ฒค์น๋งํฌ ์คํ๊ณผ ์ํธ ๋ณด์์ ์ผ๋ก ์ฌ์ฉ๋์ด์ผ ํ๋ค. ์๋ฅผ ๋ค์ด ๋จผ์ RoboArena๋ก ์ ์ฑ ๋ค์ ๋งฅ๋ฝ ์์ด ๋น๊ตํ ๋ค, ์ฑ๋ฅ์ด ๋ชจ์๋ ๋ถ๋ถ์ ๋ํด ๋ณ๋์ ํต์ ๋ ์คํ์ผ๋ก ์์ธ ๋ถ์ํ๋ ์ ๊ทผ์ด ๋ฐ๋์งํ๋ค.
๋ณด์ ์ธก๋ฉด์ผ๋ก๋ ํ๊ฐ์ ์ ์์ ํ์ ๊ฐ๋ฅ์ฑ์ด ์๋ค. ๋ถ์ฐ๋ ์ฐธ์ฌ์๊ฐ ๋ง์์ง๋ฉด ์ผ๋ถ๊ฐ ๊ณ ์๋ก ๋ฌด์์ ํ์ ์ ์ฃผ๊ฑฐ๋ ์๋ชป๋ ํผ๋๋ฐฑ์ ์ค ์ ์๋ค. ๋ ผ๋ฌธ์์๋ RoboArena์ ์ด์ค๋งน๊ฒ ์ค๊ณ๊ฐ ์ผ๋ถ ์ํฅ๋ ฅ์ ์ ํํ๋ค๊ณ ์ค๋ช ํ์ง๋ง, ์ค์ ์ ์์ ์ธ ๊ณต๊ฒฉ์ ๋ํ ์คํ์ ์ด๋ฃจ์ด์ง์ง ์์๋ค. ํฅํ์๋ ํ๊ฐ์์ ์ ๋ขฐ๋๋ฅผ ๊ฒ์ฆํ๊ฑฐ๋ ๋น์ ์ ๋ฐ์ดํฐ๋ฅผ ์๋ ๊ฐ์งํ๋ ๋ฉ์ปค๋์ฆ์ ๋์ ํ์ฌ, ๋ฐ์ดํฐ ์๊ณก์ ๊ฐํ ํ๊ฐ ์์คํ ์ผ๋ก ๋ฐ์ ์ํฌ ํ์๊ฐ ์๋ค.
๋ง์ง๋ง์ผ๋ก ์ธก์ ๊ธฐ์ค์ ์ต์ ํ ๋ฌธ์ (Goodhartโs Law)๋ ๊ณ ๋ฏผ๊ฑฐ๋ฆฌ๋ค. ์ผ๋ฐ์ง๋ฅ ๋ฒค์น๋งํฌ์์ ์งํ๊ฐ ์ฐ๊ตฌ์ ๋ชฉํ๊ฐ ๋๋ฉด ์๊ธฐ๋ ๊ฒ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก, RoboArena ์์ ์์ฒด๊ฐ ์ฐ๊ตฌ์๋ค์๊ฒ ์ต์ ํ ๋์์ด ๋ ์ ์๋ค. ์ค์ ๋ก ๋ชจ๋ธ ๊ฐ์ ๋ณด๋ค๋ ์์ ์กฐ์์ ์๋ํ ์ ์ธ์ด ์ด๋ก ์ ์กด์ฌํ๋ค. ํ์ฌ๋ก์๋ ๋ฒ์ฉ ์ ์ฑ ๋ค์ ์ฑ๋ฅ์ด ์์ง ์ ํ์ ์ด์ด์ ๊ฑฑ์ ์ด ๋ํ์ง๋ง, ์ ์ฑ ๊ธฐ์ ์ด ๋ฐ์ ํ ์๋ก ์ด ๋ฌธ์ ๋ ์ค์ํด์ง๋ค. ์ด๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด ํฅํ์๋ ํ๊ฐ ํ๋กํ ์ฝ์ ์ฃผ๊ธฐ์ ์ผ๋ก ๊ฐฑ์ ํ๊ฑฐ๋ ์๋ก์ด ๋ฌด์์ ๊ฒ์ฆ ๋จ๊ณ๋ฅผ ๋์ ํ๋ ๋ฑ ๋์ฑ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
์ด๋ฌํ ํ๊ณ์๋ ๋ถ๊ตฌํ๊ณ , RoboArena๋ ๋ฒ์ฉ ์ ์ฑ ์๋์ ์๋ก์ด ํ๊ฐ ํจ๋ฌ๋ค์์ ์ ์ํ๋ค. ํ์ ์ฐ๊ตฌ๋ ๋ค๋ฅธ ๋ก๋ด ํ๋ซํผ์์ ์ ์ฉ, ํ๊ฐ ๋ณด์ ๊ฐํ, ๊ทธ๋ฆฌ๊ณ ํ๊ฐ ์งํ ์์ฒด์ ๊ฒฌ๊ณ ์ฑ ํ๋ณด ๋ฑ์ ํตํด RoboArena๋ฅผ ๋์ฑ ๋ฐ์ ์ํฌ ์ ์์ ๊ฒ์ด๋ค.