Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • 1 Brief Review
  • 2 Detail Review
    • 2.1 ๋ฐฐ๊ฒฝ: ์ธ๊ฐ„ ์‹œ์—ฐ์„ ํ™œ์šฉํ•œ ๋กœ๋ด‡ ํ•™์Šต์˜ ๋„์ „
    • 2.2 Human2Sim2Robot ํ”„๋ ˆ์ž„์›Œํฌ: ํ•œ ๊ฐœ ์‹œ์—ฐ์œผ๋กœ Sim-to-Real ์ •์ฑ… ํ•™์Šต
      • 2.2.1 ์ธ๊ฐ„ ์‹œ์—ฐ ์ฒ˜๋ฆฌ: ๊ฐ์ฒด ๊ถค์  ์ถ”์ถœ๊ณผ ์† ํฌ์ฆˆ ์žฌํ˜„
      • 2.2.2 ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ์˜ ์ •์ฑ… ํ•™์Šต๊ณผ ๋ณด์ƒ ์„ค๊ณ„
      • 2.2.3 Zero-Shot Sim-to-Real: ํ•™์Šต๋œ ์ •์ฑ…์˜ ์‹คํ™˜๊ฒฝ ์ˆ˜ํ–‰
      • 2.2.4 ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ๊ณผ์ œ์—์„œ์˜ ์‹คํ—˜ ๊ฒฐ๊ณผ
    • 2.3 ๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต ๋ฐ ์ฐจ๋ณ„์ 
    • 2.4 ๊ธฐ์—ฌ ๋ฐ ์˜์˜: ๋กœ๋ด‡๊ณตํ•™๊ณผ ๊ฐ•ํ™”ํ•™์Šต ๋ถ„์•ผ์—์„œ์˜ ๊ฐ€๋Šฅ์„ฑ

๐Ÿ“ƒHuman2Sim2Robot ๋ฆฌ๋ทฐ

real2sim
sim2real
rl
Crossing the Human-Robot Embodiment Gap with Sim-to-Real RL using One Human Demonstration
Published

September 11, 2025

  • Paper Link
  • Homepage
  • Code Link
  1. ๋กœ๋ด‡์˜ ์ˆ™๋ จ๋œ ์กฐ์ž‘ ๊ธฐ์ˆ  ํ•™์Šต์„ ์œ„ํ•ด ๋‹จ ํ•˜๋‚˜์˜ RGB-D ์ธ๊ฐ„ ์‹œ์—ฐ ์˜์ƒ์„ ํ™œ์šฉํ•˜๋Š” real-to-sim-to-real RL ํ”„๋ ˆ์ž„์›Œํฌ์ธ HUMAN2SIM2ROBOT์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  2. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์‹œ์—ฐ ์˜์ƒ์—์„œ ๊ฐ์ฒด ํฌ์ฆˆ ๊ถค์ ์„ ์ถ”์ถœํ•ด ๊ฐ์ฒด ์ค‘์‹ฌ์ ์ด๊ณ  embodiment-agnosticํ•œ ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ์ •์˜ํ•˜๊ณ , ์กฐ์ž‘ ์ „ ์† ํฌ์ฆˆ๋กœ RL ํ›ˆ๋ จ์˜ ํšจ์œจ์ ์ธ ์ดˆ๊ธฐํ™” ๋ฐ ํƒ์ƒ‰์„ ์•ˆ๋‚ดํ•˜์—ฌ human-robot embodiment gap์„ ๊ทน๋ณตํ•ฉ๋‹ˆ๋‹ค.
  3. HUMAN2SIM2ROBOT์€ ๋‹จ์ผ ์ธ๊ฐ„ ์‹œ์—ฐ ํ™˜๊ฒฝ์—์„œ grasping, non-prehensile manipulation, multi-step tasks๋ฅผ ํฌํ•จํ•œ ๋‹ค์–‘ํ•œ ์‹ค์ œ ์ž‘์—…์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ• ๋Œ€๋น„ 55%์—์„œ 68% ์ด์ƒ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ๋ณ„๋„์˜ reward tuning ์—†์ด zero-shot sim-to-real ์ „์ด๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

1 Brief Review

์ด ๋…ผ๋ฌธ์€ ๋กœ๋ด‡์ด ๋Šฅ์ˆ™ํ•œ ์กฐ์ž‘ ๊ธฐ์ˆ (dexterous manipulation skill)์„ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•ด ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ก ๋“ค์˜ ํ•œ๊ณ„๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” HUMAN2SIM2ROBOT๋ผ๋Š” ์ƒˆ๋กœ์šด real-to-sim-to-real ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด์—๋Š” ๋กœ๋ด‡ ์กฐ์ž‘ ๊ธฐ์ˆ ์„ ๊ฐ€๋ฅด์น˜๊ธฐ ์œ„ํ•ด ์ˆ˜๋ฐฑ ๊ฐœ์˜ ์‹œ์—ฐ(demonstration) ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ–ˆ์œผ๋ฉฐ, ์ด๋Š” ์›จ์–ด๋Ÿฌ๋ธ” ์„ผ์„œ(wearable sensor)๋‚˜ ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜(teleoperation)์„ ํ†ตํ•ด ์ˆ˜์ง‘๋˜์–ด ๋น„์šฉ์ด ๋งŽ์ด ๋“ค๊ณ  ํ™•์žฅํ•˜๊ธฐ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„-๊ฐ์ฒด ์ƒํ˜ธ์ž‘์šฉ(human-object interaction) ๋น„๋””์˜ค๋Š” ์‰ฝ๊ฒŒ ์ˆ˜์ง‘ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ช…์‹œ์ ์ธ ๋กœ๋ด‡ ์•ก์…˜ ๋ผ๋ฒจ(action label)์ด ๋ถ€์กฑํ•˜๊ณ  ์ธ๊ฐ„-๋กœ๋ด‡ ๊ฐ„ ์‹ ์ฒด์  ๊ตฌํ˜„ ์ฐจ์ด(embodiment gap)๋กœ ์ธํ•ด ์ง์ ‘ ๋กœ๋ด‡ ํ•™์Šต์— ํ™œ์šฉํ•˜๊ธฐ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ๋‹จ ํ•˜๋‚˜์˜ RGB-D ์ธ๊ฐ„ ์‹œ์—ฐ ๋น„๋””์˜ค๋งŒ์œผ๋กœ ๊ฐ•๊ฑดํ•œ ๋กœ๋ด‡ ์ •์ฑ…(robot policy)์„ ํ•™์Šตํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•˜๋ฉฐ, ํŠนํžˆ ๋ณต์žกํ•œ ๋ณด์ƒ ์„ค๊ณ„(reward engineering)๋‚˜ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์—†์ด๋„ ์ธ๊ฐ„-๋กœ๋ด‡ ๊ฐ„์˜ ์‹ ์ฒด์  ๊ตฌํ˜„ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ•˜๋Š” ๋ฐ ์ค‘์ ์„ ๋‘ก๋‹ˆ๋‹ค.

์ œ์•ˆํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์˜ ํ•ต์‹ฌ์€ ๋‹จ์ผ ์ธ๊ฐ„ ์‹œ์—ฐ ๋น„๋””์˜ค์—์„œ ๋‘ ๊ฐ€์ง€ ์ฃผ์š” ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ์ถ”์ถœํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ฒซ์งธ, ๊ฐ์ฒด 6D ์ž์„ธ ๊ถค์ (object 6D pose trajectory)์ž…๋‹ˆ๋‹ค. ์ด๋Š” FoundationPose ๋ชจ๋ธ๊ณผ Segment Anything Model 2 (SAM 2)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋น„๋””์˜ค ํ”„๋ ˆ์ž„๋ณ„๋กœ ๊ฐ์ฒด์˜ ์ž์„ธ๋ฅผ ์ถ”์ •ํ•˜์—ฌ ์–ป์–ด์ง‘๋‹ˆ๋‹ค. ์ด ๊ฐ์ฒด ์ž์„ธ ๊ถค์ ์€ ๋กœ๋ด‡์˜ ์‹ ์ฒด์  ํŠน์ง•์— ๊ตฌ์• ๋ฐ›์ง€ ์•Š๋Š”(embodiment-agnostic) ๊ฐ์ฒด ์ค‘์‹ฌ ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ์ •์˜ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๋ณด์ƒ ํ•จ์ˆ˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋ฉ๋‹ˆ๋‹ค: r_{obj_t} = \exp^{-\alpha d(T^{target}_{\tau + t}, T^{obj}_t)}, ์—ฌ๊ธฐ์„œ d(T_1, T_2) = \sum^{N_{anchor}}_{i=1} \|T_1 k_i - T_2 k_i\|๋Š” ๋‘ ๊ฐ์ฒด ์ž์„ธ T_1, T_2 ์‚ฌ์ด์˜ ์ƒ๋Œ€์ ์ธ ์ž์„ธ ๊ฑฐ๋ฆฌ๋ฅผ ์•ต์ปค ํฌ์ธํŠธ(anchor point) k_i๋ฅผ ์ด์šฉํ•˜์—ฌ ์ธก์ •ํ•˜๋ฉฐ, \alpha=10์€ ์Šค์ผ€์ผ๋ง ๊ณ„์ˆ˜์ž…๋‹ˆ๋‹ค. ์ด ๋ณด์ƒ์€ ๋กœ๋ด‡์ด ๋ชฉํ‘œ ๊ฐ์ฒด ์ž์„ธ ๊ถค์ ์„ ์ •ํ™•ํ•˜๊ฒŒ ๋”ฐ๋ผ๊ฐ€๋„๋ก ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค.

๋‘˜์งธ, ๋‹จ์ผ ์กฐ์ž‘ ์ „(pre-manipulation) ์† ์ž์„ธ(hand pose)์ž…๋‹ˆ๋‹ค. ์ด ์ž์„ธ๋Š” ๊ฐ์ฒด๊ฐ€ ์›€์ง์ด๊ธฐ ์‹œ์ž‘ํ•˜๋Š” ์‹œ์ (t_0)์—์„œ ์•ฝ๊ฐ„ ์•ž์„  ์‹œ์ (\tau = t_0 - t_{offset})์˜ ์ธ๊ฐ„ ์† ์ž์„ธ๋ฅผ ์ถ”์ถœํ•˜์—ฌ ์–ป์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„ ์† ์ž์„ธ๋Š” HaMeR ๋ชจ๋ธ๋กœ ์ถ”์ •๋œ MANO ํŒŒ๋ผ๋ฏธํ„ฐ(\theta_t, \beta_t)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ๊นŠ์ด ์ •๋ณด(depth information)์™€ ICP ๋“ฑ๋ก(registration)์„ ํ†ตํ•ด 3D ์ •ํ™•๋„๋ฅผ ๋†’์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์ถ”์ถœ๋œ ์ธ๊ฐ„ ์† ์ž์„ธ๋Š” cuRobo๋ฅผ ์ด์šฉํ•œ 2๋‹จ๊ณ„ ์—ญ์šด๋™ํ•™(Inverse Kinematics, IK) ์ ˆ์ฐจ๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์˜ ์† ์ž์„ธ๋กœ ๋ฆฌํƒ€๊ฒŒํŒ…(retargeting)๋ฉ๋‹ˆ๋‹ค. 1๋‹จ๊ณ„์—์„œ๋Š” ๋กœ๋ด‡ ํŒ”์˜ ๊ด€์ ˆ ๊ฐ๋„๋ฅผ ์กฐ์ ˆํ•˜์—ฌ ๋กœ๋ด‡ ์†์˜ ์ค‘๊ฐ„ ๋„ˆํด(middle knuckle) ์œ„์น˜์™€ ๋ฐฉํ–ฅ์„ ์ธ๊ฐ„ ์†์˜ ์ค‘๊ฐ„ ๋„ˆํด์— ์ •๋ ฌํ•˜๊ณ , 2๋‹จ๊ณ„์—์„œ๋Š” ๋กœ๋ด‡ ์†์˜ ๊ด€์ ˆ ๊ฐ๋„๋ฅผ ์กฐ์ ˆํ•˜์—ฌ ๋กœ๋ด‡ ์†๊ฐ€๋ฝ ๋(fingertip) ์œ„์น˜๋ฅผ ์ธ๊ฐ„ ์†๊ฐ€๋ฝ ๋์— ์ •๋ ฌํ•ฉ๋‹ˆ๋‹ค. ์ด ์กฐ์ž‘ ์ „ ์† ์ž์„ธ๋Š” ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning, RL) ํ›ˆ๋ จ ์‹œ ์ด์ ์„ ์ฃผ๋Š” ์ดˆ๊ธฐ ์ƒํƒœ(initial state)๋ฅผ ์ œ๊ณตํ•˜์—ฌ ํƒ์ƒ‰(exploration) ํšจ์œจ์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

์ •์ฑ… ํ•™์Šต์€ IsaacGym ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ Proximal Policy Optimization (PPO) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ์ง„ํ–‰๋ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ KUKA LBR iiwa 14 ํŒ”์— Allegro Hand๊ฐ€ ์žฅ์ฐฉ๋œ ์…‹์—…์„ ์‚ฌ์šฉํ•˜๋ฉฐ, ์ œ์–ด ์•ก์…˜์€ ๊ธฐํ•˜ํ•™์  ํŒจ๋ธŒ๋ฆญ ์ปจํŠธ๋กค๋Ÿฌ(geometric fabric controller)์™€ PCA ๊ธฐ๋ฐ˜ ์† ์•ก์…˜ ๊ณต๊ฐ„($x_{palm-target_t}, r_{palm-target_t}, x_{pca-target_t}$)์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์‹ค์ œ ํ™˜๊ฒฝ์œผ๋กœ์˜ ์ œ๋กœ์ƒท(zero-shot) ์ „์ด๋ฅผ ์œ„ํ•ด ๋„๋ฉ”์ธ ๋ฌด์ž‘์œ„ํ™”(domain randomization)๋ฅผ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์ ์šฉํ•˜๊ณ , LSTM ๊ธฐ๋ฐ˜ ์ •์ฑ…(policy)์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ถ€๋ถ„์  ๊ด€์ธก์„ฑ(partial observability)๊ณผ ๋…ธ์ด์ฆˆ๊ฐ€ ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ, HUMAN2SIM2ROBOT์€ ๋‹จ์ผ ์ธ๊ฐ„ ์‹œ์—ฐ๋งŒ์œผ๋กœ๋„ ๋กœ๋ด‡ ์กฐ์ž‘ ๊ณผ์ œ์—์„œ ๊ธฐ์กด ๋ฒ ์ด์Šค๋ผ์ธ(replay, object-aware replay, behavior cloning)๋ณด๋‹ค 55%์—์„œ 68% ์ด์ƒ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ๊ฐ์ฒด ์ž์„ธ ๊ถค์ ์„ ํ™œ์šฉํ•œ ๋ฐ€์ง‘ ๋ณด์ƒ(dense reward)๊ณผ ์กฐ์ž‘ ์ „ ์† ์ž์„ธ๋ฅผ ํ™œ์šฉํ•œ ์ดˆ๊ธฐํ™”๋Š” RL ์ •์ฑ… ํ•™์Šต์˜ ์†๋„์™€ ์•ˆ์ •์„ฑ, ์ตœ์ข… ์„ฑ๋Šฅ์— ๊ฒฐ์ •์ ์ธ ์—ญํ• ์„ ํ•จ์ด ์ž…์ฆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์žก๊ธฐ(grasping), ๋น„์žก๊ธฐ ์กฐ์ž‘(non-prehensile manipulation), ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘(multi-step tasks) ๋“ฑ ๋‹ค์–‘ํ•œ ์‹ค์ œ ๋กœ๋ด‡ ์กฐ์ž‘ ๊ณผ์ œ์—์„œ ํšจ๊ณผ์ ์ธ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.


2 Detail Review

์ธ๊ฐ„-๋กœ๋ด‡ ์ฒดํ™” ๊ฐ„๊ทน์„ ๋„˜์–ด์„œ: ํ•œ ๋ฒˆ์˜ ์ธ๊ฐ„ ์‹œ์—ฐ์œผ๋กœ Sim-to-Real ๊ฐ•ํ™”ํ•™์Šต

2.1 ๋ฐฐ๊ฒฝ: ์ธ๊ฐ„ ์‹œ์—ฐ์„ ํ™œ์šฉํ•œ ๋กœ๋ด‡ ํ•™์Šต์˜ ๋„์ „

๋กœ๋ด‡์—๊ฒŒ ์„ฌ์„ธํ•œ ๋ฌผ์ฒด ์กฐ์ž‘(dexterous manipulation)์„ ๊ฐ€๋ฅด์น˜๋Š” ์ „ํ†ต์ ์ธ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜๋Š” ๋ชจ๋ฐฉ ํ•™์Šต(imitation learning, IL)์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํšจ๊ณผ์ ์ธ ๋ชจ๋ฐฉ ํ•™์Šต์„ ์œ„ํ•ด์„œ๋Š” ์‚ฌ๋žŒ์ด ๋กœ๋ด‡์„ ์ง์ ‘ ์กฐ์ข…(ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜)ํ•˜๊ฑฐ๋‚˜ ํŠน์ˆ˜ ์žฅ๋น„(์˜ˆ: ์„ผ์„œ ์žฅ๊ฐ‘, VR ์žฅ์น˜ ๋“ฑ)๋ฅผ ์ฐฉ์šฉํ•ด ๋‹ค์ˆ˜์˜ ๊ณ ํ’ˆ์งˆ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•ด์•ผ ํ•˜๋Š”๋ฐ, ์ด๋Ÿฌํ•œ ๊ณผ์ •์€ ๋งค์šฐ ๋งŽ์€ ๋…ธ๋ ฅ๊ณผ ์‹œ๊ฐ„์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ ์—ฐ๊ตฌ ์‚ฌ๋ก€๋“ค์„ ๋ณด๋ฉด, ํ•˜๋‚˜์˜ ์ž‘์—…์— ์ˆ˜๋ฐฑ์—์„œ ์ˆ˜์ฒœ ๊ฐœ์— ์ด๋ฅด๋Š” ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๊ฐ€ ์š”๊ตฌ๋˜์—ˆ์œผ๋ฉฐ, ์ด๋Š” ๋กœ๋ด‡ ํ•™์Šต์˜ ํ™•์žฅ์„ฑ ์ธก๋ฉด์—์„œ ํฐ ๊ฑธ๋ฆผ๋Œ์ด์—ˆ์Šต๋‹ˆ๋‹ค.

ํ•œํŽธ, ์‚ฌ๋žŒ์ด ๋งจ์†์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๋Š” ์˜์ƒ์€ ๋น„๊ต์  ์‰ฝ๊ฒŒ ์–ป์„ ์ˆ˜ ์žˆ๊ณ , ์ผ๋ฐ˜์ธ๋„ ์ง๊ด€์ ์œผ๋กœ ์‹œ์—ฐํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์Šค๋งˆํŠธํฐ ์นด๋ฉ”๋ผ๋กœ ์ผ์ƒ ๋™์ž‘์„ ๋…นํ™”ํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋„ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Ÿฌํ•œ ์ธ๊ฐ„-๊ฐ์ฒด ์ƒํ˜ธ์ž‘์šฉ ๋น„๋””์˜ค๋ฅผ ๋กœ๋ด‡ ํ•™์Šต์— ์ง์ ‘ ํ™œ์šฉํ•˜๊ธฐ๋Š” ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ํฐ ์ด์œ ๋Š”, ๋น„๋””์˜ค์—๋Š” ๋กœ๋ด‡์ด ๋”ฐ๋ผ ํ•  ๋ช…์‹œ์ ์ธ ํ–‰๋™ ๋ ˆ์ด๋ธ”(์–ด๋–ค ๋กœ๋ด‡ ๋ช…๋ น์„ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋Š”์ง€)์ด ์—†์œผ๋ฉฐ, ๋”๊ตฌ๋‚˜ ์ธ๊ฐ„ ์†๊ณผ ๋กœ๋ด‡ ์†์˜ ํ˜•ํƒœ ์ฐจ์ด(embodiment gap) ๋•Œ๋ฌธ์— ์‚ฌ๋žŒ ์†๋™์ž‘์„ ๋กœ๋ด‡์— ๊ทธ๋Œ€๋กœ ๋งคํ•‘ํ•˜๊ธฐ๋„ ํž˜๋“ค๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์‚ฌ๋žŒ ์†์— ๋น„ํ•ด ๋กœ๋ด‡ ์†์€ ๊ด€์ ˆ ๊ตฌ์„ฑ๊ณผ ์šด๋™ ํ•œ๊ณ„๊ฐ€ ๋‹ค๋ฅด๋ฏ€๋กœ, ์‚ฌ๋žŒ์˜ ๋™์ž‘์„ ๋˜‘๊ฐ™์ด ํ‰๋‚ด ๋‚ด๋Š” ๊ฒƒ์€ ์ข…์ข… ๋ถˆ๊ฐ€๋Šฅํ•˜๊ฑฐ๋‚˜ ๋น„ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค.

๊ธฐ์กด ์ ‘๊ทผ๋ฒ• ์ค‘ ํ•˜๋‚˜๋กœ, ์ธ๊ฐ„ ์† ํฌ์ฆˆ ์ถ”์ • ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•ด ๋น„๋””์˜ค์˜ ๋งค ํ”„๋ ˆ์ž„๋งˆ๋‹ค ์‚ฌ๋žŒ ์†์˜ 3D ๊ด€์ ˆ๊ฐ์„ ์ถ”์ถœํ•˜๊ณ , ์ด๋ฅผ ๋กœ๋ด‡ ์†์˜ ๊ด€์ ˆ๊ฐ์œผ๋กœ ์žฌํƒ€๊ฒŸํŒ…(retargeting)ํ•˜์—ฌ ๋กœ๋ด‡ ํ–‰๋™์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋ ค๋Š” ์‹œ๋„๊ฐ€ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ๋ฒ•์€ ๋‘ ๊ฐ€์ง€ ํฐ ๋ฌธ์ œ์— ์ง๋ฉดํ•ฉ๋‹ˆ๋‹ค. ์ฒซ์งธ, ์ตœ๊ทผ 3D ์† ์ถ”์  ๊ธฐ๋ฒ•๋“ค์ด ๋ฐœ์ „ํ–ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์ผ๋ฐ˜ RGB-D ์˜์ƒ์—์„œ๋Š” ์†๊ฐ€๋ฝ์ด ๋ฌผ์ฒด์— ๊ฐ€๋ ค์ง€๊ฑฐ๋‚˜ ์„ผ์„œ ๋…ธ์ด์ฆˆ๊ฐ€ ์กด์žฌํ•˜์—ฌ ์™„๋ฒฝํ•œ ์ถ”์ •์„ ๋ณด์žฅํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋ฏธ์„ธํ•œ ์ถ”์ • ์˜ค๋ฅ˜๋„ ๋ˆ„์ ๋˜๋ฉด ๋กœ๋ด‡ ์†๊ฐ€๋ฝ ๋์˜ ๋ชฉํ‘œ ์œ„์น˜๊ฐ€ ์–ด๊ธ‹๋‚˜๊ฒŒ ๋˜๊ณ , ๋กœ๋ด‡ ๊ด€์ ˆ ๋ช…๋ น์œผ๋กœ ๋ณ€ํ™˜ํ•  ๋•Œ ๋ถ€์ •ํ™•ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ดˆ๋ž˜ํ•ฉ๋‹ˆ๋‹ค. ๋‘˜์งธ, ์„ค๋ น ์ธ๊ฐ„ ์†์˜ ํฌ์ฆˆ๋ฅผ ์ •ํ™•ํžˆ ์•Œ์•„๋‚ด๋”๋ผ๋„, ์‚ฌ๋žŒ๊ณผ ๋กœ๋ด‡์˜ ํ˜•ํƒœ ์ฐจ์ด ๋•Œ๋ฌธ์— ํ•ด๋‹น ํฌ์ฆˆ๋ฅผ ๋กœ๋ด‡ ์†์œผ๋กœ ๊ตฌํ˜„ํ•˜์ง€ ๋ชปํ•˜๊ฑฐ๋‚˜(์—ญ๊ธฐ๊ตฌํ•™ ํ•ด๊ฐ€ ์—†์Œ) ๊ทธ ์ž‘์—…์— ๋ถ€์ ์ ˆํ•œ ๋กœ๋ด‡ ์ž์„ธ๊ฐ€ ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์—ฌ๋Ÿฌ ์†๊ฐ€๋ฝ์œผ๋กœ ๋™์‹œ์— ํž˜์„ ๊ฐ€ํ•˜๋Š” ๋‹ค์ง€(ๅคšๆŒ‡) ์กฐ์ž‘์—์„œ๋Š”, ๋ถ€์ •ํ™•ํ•˜๊ฑฐ๋‚˜ ๋ถˆ์•ˆ์ •ํ•œ ์žฌํƒ€๊ฒŸํŒ… ๋™์ž‘์ด ์ ‘์ด‰ ํž˜ ๋ถˆ๊ท ํ˜•์„ ์ผ์œผ์ผœ ์ž‘์—… ์ˆ˜ํ–‰์„ ์–ด๋ ต๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€, ์ธ๊ฐ„ ์‹œ์—ฐ๊ณผ ๋กœ๋ด‡ ํ–‰๋™ ๊ฐ„์— ์ •ํ™•ํ•œ 1:1 ๋Œ€์‘์„ ๊ฐ•์š”ํ•˜๋Š” ๊ธฐ์กด ๋ชจ๋ฐฉ ํ•™์Šต ๋ฐฉ์‹์œผ๋กœ๋Š” ์‚ฌ๋žŒ-๋กœ๋ด‡ ์ฒดํ™” ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์–ด๋ ต๊ณ , ํ•œ๋‘ ๊ฐœ์˜ ์‹œ์—ฐ์œผ๋กœ๋Š” ์„ฑ๊ณต ํ™•๋ฅ ์ด ๋งค์šฐ ๋‚ฎ์•˜์Šต๋‹ˆ๋‹ค.

๊ฐ•ํ™”ํ•™์Šต(Reinforcement Learning, RL)์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ๋Œ€์•ˆ์œผ๋กœ ์ฃผ๋ชฉ๋ฐ›์•„ ์™”์Šต๋‹ˆ๋‹ค. RL์€ ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ๊ฒช์œผ๋ฉฐ ์ž๊ธฐ ๋ชธ์ฒด์— ๋งž๋Š” ์ตœ์ ์˜ ํ–‰๋™์„ ํ•™์Šตํ•˜๋„๋ก ํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ์ธ๊ฐ„๊ณผ ๋กœ๋ด‡์˜ ์ฐจ์ด๋ฅผ ์ง์ ‘ ๋ฉ”์šฐ๋Š” ๋Œ€์‹  ๋กœ๋ด‡ ๊ณ ์œ ์˜ ์ •์ฑ…์„ ์ฐพ์•„๋‚ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ RL ์—ญ์‹œ ํ˜„์‹ค ๋กœ๋ด‡์— ๋ฐ”๋กœ ์ ์šฉํ•˜๊ธฐ์—” ๋‚œ๊ด€์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์›ํ•˜๋Š” ์ž‘์—…๋งˆ๋‹ค ์ ์ ˆํ•œ ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ์„ค๊ณ„ํ•ด์•ผ ํ•˜๊ณ , ๋งŽ์€ ์‹œํ–‰ํšŸ์ˆ˜๊ฐ€ ํ•„์š”ํ•ด ๋ฌผ๋ฆฌ ๋กœ๋ด‡์œผ๋กœ ์‹œ๋„ํ•˜๊ธฐ์—” ๋น„ํ˜„์‹ค์ ์ด์ฃ . ์ด๋ฅผ ์œ„ํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ํ•™์Šตํ•˜๊ณ  ์‹ค์ œ์— ์˜ฎ๊ธฐ๋Š” Sim-to-Real ๊ธฐ๋ฒ•์ด ๋ฐœ์ „ํ•ด ์™”์ง€๋งŒ, ๋ณด์ƒ ์„ค๊ณ„์˜ ์–ด๋ ค์›€๊ณผ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค ๊ฐ„ ์ฐจ์ด๋ฅผ ์ค„์ด๋Š” ๋ฌธ์ œ ๋“ฑ์ด ๋‚จ์•„์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋ฐฐ๊ฒฝ์—์„œ 2025๋…„ ๋ฐœํ‘œ๋œ โ€œCrossing the Human-Robot Embodiment Gap with Sim-to-Real RL using One Human Demonstrationโ€ ๋…ผ๋ฌธ์€, ์ธ๊ฐ„ ์‹œ์—ฐ ํ•œ ๊ฐœ๋งŒ์œผ๋กœ ๋กœ๋ด‡์˜ ๋‹ค์ง€ ์กฐ์ž‘ ์ •์ฑ…์„ ํ•™์Šต์‹œํ‚ค๋Š” ํ˜์‹ ์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ Human2Sim2Robot์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ํ•œ ๋ฒˆ์˜ ์ธ๊ฐ„ RGB-D ๋น„๋””์˜ค ์‹œ์—ฐ์œผ๋กœ๋ถ€ํ„ฐ ํ•ต์‹ฌ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ RL๋กœ ์ •์ฑ…์„ ํ•™์Šตํ•˜๊ณ , ์ด๋ฅผ ์ œ๋กœ์ƒท(zero-shot)์œผ๋กœ ์‹คํ™˜๊ฒฝ์— ์ด์ „ํ•จ์œผ๋กœ์จ ์‚ฌ๋žŒ-๋กœ๋ด‡ ์ฒดํ™” ๊ฐ„๊ทน์„ ๊ทน๋ณตํ•ฉ๋‹ˆ๋‹ค. ๋†€๋ž๊ฒŒ๋„ ์ด ๊ณผ์ •์—์„œ ๋ณ„๋„์˜ ์›จ์–ด๋Ÿฌ๋ธ” ์žฅ์น˜๋‚˜ ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ, ์ˆ˜์‹ญ ๊ฐœ์˜ ์‹œ์—ฐ ๋ชจ์Œ์ด ์ „ํ˜€ ํ•„์š”ํ•˜์ง€ ์•Š์œผ๋ฉฐ, ์ž‘์—…๋ณ„๋กœ ๋ณด์ƒ์„ ์ผ์ผ์ด ํŠœ๋‹ํ•  ํ•„์š”๋„ ์—†์Šต๋‹ˆ๋‹ค. ๋ณธ ๋ฆฌ๋ทฐ์—์„œ๋Š” Human2Sim2Robot์˜ ํ•ต์‹ฌ ๊ธฐ์ˆ  ๋‚ด์šฉ์„ ๊นŠ์ด ์žˆ๊ฒŒ ์„ค๋ช…ํ•˜๊ณ , ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค๊ณผ์˜ ์ฐจ๋ณ„์ ์„ ๋น„๊ตํ•˜๋ฉฐ, ์ด ์ ‘๊ทผ๋ฒ•์˜ ๊ธฐ์—ฌ์™€ ํ–ฅํ›„ ๋กœ๋ด‡๊ณตํ•™/๊ฐ•ํ™”ํ•™์Šต ๋ถ„์•ผ์— ์ฃผ๋Š” ์˜๋ฏธ๋ฅผ ๋ถ„์„ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

2.2 Human2Sim2Robot ํ”„๋ ˆ์ž„์›Œํฌ: ํ•œ ๊ฐœ ์‹œ์—ฐ์œผ๋กœ Sim-to-Real ์ •์ฑ… ํ•™์Šต

Human2Sim2Robot ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ์š”. ์ด ์‹œ์Šคํ…œ์€ ํ˜„์‹ค-์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค(real-to-sim-to-real)๋กœ ์ด์–ด์ง€๋Š” RL ํ•™์Šต ๊ณผ์ •์„ ํ†ตํ•ด, ์ธ๊ฐ„ ์‹œ์—ฐ ํ•˜๋‚˜๋งŒ์œผ๋กœ๋„ ๋กœ๋ด‡ ๋‹ค์ง€ ์กฐ์ž‘ ์ •์ฑ…์„ ๋ฐฐ์›๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์˜ RGB-D ์‹œ์—ฐ ์˜์ƒ์—์„œ (1) ๋ฌผ์ฒด์˜ 6-์ž์œ ๋„(6-DoF) ์ž์„ธ ๊ถค์ ๊ณผ (2) ์กฐ์ž‘ ์‹œ์ž‘ ์ง์ „์˜ ์† ์ž์„ธ๋ฅผ ์ถ”์ถœํ•˜์—ฌ, ์ด๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฐ•ํ™”ํ•™์Šต์— ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์•ˆ์—์„œ ๋กœ๋ด‡์€ ํ•ด๋‹น ๋ฌผ์ฒด ๊ถค์ ์„ ๋”ฐ๋ผ๊ฐ€๋„๋ก ํ›ˆ๋ จ๋˜๋ฉฐ(๋ณด์ƒ ์„ค๊ณ„), ์ดˆ๋ฐ˜ ํƒ์ƒ‰ ๋‹จ๊ณ„์—์„œ๋Š” ์ธ๊ฐ„ ์‹œ์—ฐ์—์„œ ์–ป์€ ์†์˜ ์ดˆ๊ธฐ ์ž์„ธ๋ฅผ ์‚ฌ์šฉํ•ด ํšจ์œจ์„ ๋†’์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•™์Šต๋œ ์ •์ฑ…์€ ๋„๋ฉ”์ธ ๋žœ๋คํ™” ๋“ฑ์„ ํ†ตํ•ด ํ˜„์‹ค์— ๋ฐ”๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋„๋ก ์ผ๋ฐ˜ํ™”๋˜์–ด ์žˆ์œผ๋ฉฐ, ์‹ค์ œ Kuka 7์ž์œ ๋„ ๋กœ๋ด‡ํŒ”๊ณผ Allegro ๋‹ค์ง€ ๋กœ๋ด‡์†์œผ๋กœ ๊ตฌ์„ฑ๋œ ์‹œ์Šคํ…œ์—์„œ ์ถ”๊ฐ€ ํŠœ๋‹ ์—†์ด ๊ณง๋ฐ”๋กœ ์„ฑ๊ณต์ ์œผ๋กœ ๋™์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜์—์„œ๋Š” ์ด ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ฐ ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ๋‹จ๊ณ„๋ณ„๋กœ ์ž์„ธํžˆ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

2.2.1 ์ธ๊ฐ„ ์‹œ์—ฐ ์ฒ˜๋ฆฌ: ๊ฐ์ฒด ๊ถค์  ์ถ”์ถœ๊ณผ ์† ํฌ์ฆˆ ์žฌํ˜„

Human2Sim2Robot์˜ ์ฒซ ๋‹จ๊ณ„๋Š” ๋‹จ ํ•˜๋‚˜์˜ ์ธ๊ฐ„ ์‹œ์—ฐ ์˜์ƒ์„ ๊ธฐ๊ณ„๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ํ˜•ํƒœ๋กœ ๊ฐ€๊ณตํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” RGB-D ์นด๋ฉ”๋ผ(๊นŠ์ด ์ •๋ณด๋ฅผ ํฌํ•จํ•œ ์นด๋ฉ”๋ผ)๋ฅผ ์ด์šฉํ•ด ํ…Œ์ด๋ธ” ์œ„์—์„œ ์‚ฌ๋žŒ์ด ๋ชฉํ‘œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋‹จ์ผ ์‹œ์—ฐ์„ ๋…นํ™”ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด๋•Œ ์นด๋ฉ”๋ผ๋Š” ๋‚ด๋ถ€ ํŒŒ๋ผ๋ฏธํ„ฐ(intrinsics)์™€ ์œ„์น˜๊ฐ€ ๋ฏธ๋ฆฌ ๋ณด์ •(calibration)๋˜์–ด ์žˆ์–ด, ์˜์ƒ ํ”ฝ์…€ ์ขŒํ‘œ๋ฅผ ๋ฌผ๋ฆฌ ์ขŒํ‘œ๋กœ ์ •ํ™•ํžˆ ๋ณ€ํ™˜ํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํƒœ์ž…๋‹ˆ๋‹ค.

  1. ๋””์ง€ํ„ธ ํŠธ์œˆ ํ™˜๊ฒฝ ๊ตฌ์„ฑ: ์‹œ์—ฐ ์˜์ƒ์„ ๋ถ„์„ํ•˜๊ธฐ์— ์•ž์„œ, ์—ฐ๊ตฌํŒ€์€ ๋กœ๋ด‡์ด ํ•™์Šตํ•  ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์„ ํ˜„์‹ค๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ์ž‘์—…์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ํœด๋Œ€์šฉ 3D ์Šค์บ๋‹ ์•ฑ(์˜ˆ: Kiri Engine, 3D Scanner App)์„ ์ด์šฉํ•˜์—ฌ ์ž‘์—…์— ์‚ฌ์šฉ๋˜๋Š” ๋ฌผ์ฒด์™€ ์žฅ๋ฉด(ํ™˜๊ฒฝ)์˜ ์ •๋ฐ€ํ•œ 3D ๋ฉ”์‰ฌ(mesh) ๋ชจ๋ธ์„ ์–ป์—ˆ์Šต๋‹ˆ๋‹ค. ๋‹จ ๋ช‡ ๋ถ„ ์ •๋„์˜ ์Šค์บ” ๋…ธ๋ ฅ์œผ๋กœ, ํ…Œ์ด๋ธ” ์œ„ ์ •์  ํ™˜๊ฒฝ(๋ฐ•์Šค, ๋ƒ„๋น„, ๊ฑด์กฐ๋Œ€ ๋“ฑ)๊ณผ ๋Œ€์ƒ ๋ฌผ์ฒด(์˜ˆ: ์ƒ์ž, ๋ฌผ์ปต, ์ ‘์‹œ)์˜ ํ˜•์ƒ์„ ๋ชจ๋‘ ๋ณต์ œํ•œ ๋””์ง€ํ„ธ ํŠธ์œˆ์„ ๊ตฌ์ถ•ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•ด๋‘๋ฉด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ํ˜„์‹ค๊ณผ ๋™์ผํ•œ ์ง€์˜ค๋ฉ”ํŠธ๋ฆฌ๋กœ ํ•™์Šต์‹œํ‚ฌ ์ˆ˜ ์žˆ์–ด, Sim-to-Real ๊ฐ„ ์ฐจ์ด๋ฅผ ์ค„์ด๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

  2. ๋ฌผ์ฒด 6D ์ž์„ธ ๊ถค์  ์ถ”์ถœ: ์‹œ์—ฐ ์˜์ƒ์œผ๋กœ๋ถ€ํ„ฐ ๊ฐ์ฒด์˜ ์›€์ง์ž„ ๊ฒฝ๋กœ๋ฅผ ์ •ํ™•ํžˆ ์•Œ์•„๋‚ด๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์ด๋ฅผ ์œ„ํ•ด FoundationPose๋ผ๋Š” ์‚ฌ์ „ ํ•™์Šต๋œ ๊ฐ์ฒด ์ž์„ธ ์ถ”์ • ๋ชจ๋ธ์„ ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ž…๋ ฅ์œผ๋กœ๋Š” ์•ž์„œ ํš๋“ํ•œ ๋ฌผ์ฒด์˜ 3D ๋ฉ”์‰ฌ ๋ชจ๋ธ๊ณผ, ์˜์ƒ ๊ฐ ํ”„๋ ˆ์ž„์—์„œ์˜ ๋ฌผ์ฒด ๋งˆ์Šคํฌ(๋ฌผ์ฒด๊ฐ€ ์ฐจ์ง€ํ•˜๋Š” ํ”ฝ์…€ ์˜์—ญ)๊ฐ€ ์ฃผ์–ด์ง‘๋‹ˆ๋‹ค. ๋ฌผ์ฒด ๋งˆ์Šคํฌ๋Š” ์ตœ์‹  ๋ถ„ํ•  ๋ชจ๋ธ์ธ SAM (Segment Anything Model) 2๋ฅผ ์ด์šฉํ•ด ์ž๋™์œผ๋กœ ์–ป์—ˆ์Šต๋‹ˆ๋‹ค. FoundationPose๋Š” ์ด๋Ÿฌํ•œ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ, ์‹œ์—ฐ ๋‚ด๋‚ด ๋ฌผ์ฒด์˜ 6-์ž์œ ๋„(ํ‰๋ฉด ์œ„์น˜ x-y, ๋†’์ด z, ๋กค-ํ”ผ์น˜-์š” ๊ฐ๋„) ์ž์„ธ๋ฅผ ์ถ”์ ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๊ฐ ์‹œ๊ฐ„ ์Šคํ…๋งˆ๋‹ค ๋ฌผ์ฒด์˜ ์œ„์น˜์™€ ๋ฐฉํ–ฅ์œผ๋กœ ์ด๋ฃจ์–ด์ง„ ๊ถค์  {O}_{1:T}๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค (T๋Š” ์‹œ์—ฐ ๊ธธ์ด). ์ด ๊ฐ์ฒด ์ž์„ธ ๊ถค์ ์€ ์‚ฌ๋žŒ์ด ์ด ์ž‘์—…์—์„œ ๋ฌผ์ฒด๋ฅผ ์–ด๋–ป๊ฒŒ ์ด๋™์‹œ์ผฐ๋Š”์ง€์— ๋Œ€ํ•œ ๋ชฉํ‘œ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ์ •์˜ํ•ด์ฃผ๋ฉฐ, ๋กœ๋ด‡์—๊ฒŒ๋Š” ๋ฌด์—‡์„ ํ•ด์•ผ ํ•˜๋Š”์ง€ ์•Œ๋ ค์ฃผ๋Š” ์—ญํ• ์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

  3. ์ธ๊ฐ„ ์† ์กฐ์ž‘ ์ดˆ๊ธฐ ์ž์„ธ ์ถ”์ถœ: ๋‹ค์Œ์œผ๋กœ, ํ•œ ๋ฒˆ์˜ ์‹œ์—ฐ ์ค‘์—์„œ โ€œ์กฐ์ž‘ ์ง์ „โ€์˜ ์ธ๊ฐ„ ์† ๋ชจ์–‘๊ณผ ์œ„์น˜๋ฅผ ํฌ์ฐฉํ•ฉ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ HaMeR๋ฅผ ์‚ฌ์šฉํ•ด ๋งค ํ”„๋ ˆ์ž„์˜ ์ธ๊ฐ„ ์† 3D ํฌ์ฆˆ(์†๊ฐ€๋ฝ ๊ด€์ ˆ ๊ฐ๋„ ๋ฐ ์†๋ฐ”๋‹ฅ ์œ„์น˜)๋ฅผ ์ถ”์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. HaMeR๋Š” RGB ์˜์ƒ์œผ๋กœ๋ถ€ํ„ฐ ์† ๊ด€์ ˆ์„ ์ถ”์ •ํ•˜๋Š” ๋ชจ๋ธ์ธ๋ฐ, ๋” ์ •ํ™•๋„๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด ๊นŠ์ด ์˜์ƒ ์ •๋ณด๋„ ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ๊ฐ ํ”„๋ ˆ์ž„์˜ RGB๋กœ ์ถ”์ •ํ•œ ์† ๋ชจ๋ธ์„ ICP (Iterative Closest Point) ์ •ํ•ฉ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•ด๋‹น ๊นŠ์ด ์ ๋“ค๊ณผ ์ •๊ตํ•˜๊ฒŒ ๋งž์ถ”์–ด, ์†๊ฐ€๋ฝ ์œ„์น˜๋ฅผ ๋ณด์ •ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์–ป์€ ์ธ๊ฐ„ ์† ํฌ์ฆˆ ์‹œํ€€์Šค {H}_{1:T} (MANO ์† ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ ํ˜•ํƒœ๋กœ ํ‘œํ˜„๋จ)์—์„œ, ๋…ผ๋ฌธ์€ ํŠน๋ณ„ํžˆ pre-manipulation hand pose, ์ฆ‰ ์กฐ์ž‘ ์‹œ์ž‘ ์ง์ „ ์† ์ž์„ธ๋ฅผ ์ฐพ์•„๋ƒ…๋‹ˆ๋‹ค. โ€œ์กฐ์ž‘ ์‹œ์ž‘โ€ ์‹œ์ ์„ ์ฐพ๊ธฐ ์œ„ํ•ด ๋ฌผ์ฒด ๊ถค์ ์„ ํ™œ์šฉํ•˜๋Š”๋ฐ, ๋ฌผ์ฒด์˜ ์†๋„๊ฐ€ ์ฒ˜์Œ์œผ๋กœ ์ผ์ • ์ž„๊ณ„๊ฐ’์„ ๋„˜๋Š” ์‹œ์  t์„ ์ฐพ๊ณ , ๊ทธ๋ณด๋‹ค ์•ฝ๊ฐ„ ์ด์ „ ์‹œ๊ฐ„ t-\Delta (์˜ˆ์ปจ๋Œ€ ๋ช‡ ํ”„๋ ˆ์ž„ ์ „)์„ ์กฐ์ž‘ ์ง์ „ ์ˆœ๊ฐ„์œผ๋กœ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ์‹œ์ ์—๋Š” ์†์ด ๋ง‰ ๋ฌผ์ฒด๋ฅผ ์žก๊ธฐ ์‹œ์ž‘ํ•˜๊ธฐ ๋ฐ”๋กœ ์ง์ „์˜ ์ƒํƒœ์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•ด๋‹น ํ”„๋ ˆ์ž„์—์„œ์˜ ์ธ๊ฐ„ ์† ๊ด€์ ˆ ๊ฐ๋„๋“ค๊ณผ, ์†๋ฐ”๋‹ฅ์˜ ๊ธฐ์ค€์ (๋…ผ๋ฌธ์—์„œ๋Š” ์ค‘์ง€์˜ ์ฒซ ๋งˆ๋”” ๊ด€์ ˆ ๋ถ€๋ถ„)์„ ์ถ”์ถœํ•˜๋ฉด ์ด๊ฒƒ์ด ์ธ๊ฐ„์˜ ์กฐ์ž‘ ์‹œ์ž‘ ์ž์„ธ์ž…๋‹ˆ๋‹ค. ๋‹ค์‹œ ๋งํ•ด, ์‚ฌ๋žŒ์ด ๋ฌผ์ฒด์— ์ ‘์ด‰ํ•˜๊ธฐ ์ง์ „ ์–ด๋–ป๊ฒŒ ์†๊ฐ€๋ฝ์„ ๋ฒŒ๋ฆฌ๊ณ  ์–ด๋–ค ์œ„์น˜์— ์†์„ ๋†“์•˜๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

  4. ๋กœ๋ด‡ ์†์œผ๋กœ ์ดˆ๊ธฐ ์ž์„ธ ์žฌํƒ€๊ฒŸํŒ…: ์ด์ œ ์ถ”์ถœ๋œ ์ธ๊ฐ„ ์†์˜ pre-manipulation ์ž์„ธ๋ฅผ ๋กœ๋ด‡ ์†์˜ ์ดˆ๊ธฐ ์ž์„ธ๋กœ ์˜ฎ๊ฒจ์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ๋žŒ๊ณผ ๋กœ๋ด‡์˜ ์†์€ ํ˜•ํƒœ๊ฐ€ ๋‹ค๋ฅด๋ฏ€๋กœ ๋‹จ์ˆœ ์ผ๋Œ€์ผ ๋Œ€์‘์œผ๋กœ๋Š” ํž˜๋“ญ๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์ด๋ฅผ ์œ„ํ•ด ๋‘ ๋‹จ๊ณ„ IK(์—ญ๊ธฐ๊ตฌํ•™) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ์„ , ์ธ๊ฐ„ ์†์—์„œ ๋ฝ‘์€ ์ค‘์ง€(knuckle) ๊ด€์ ˆ์˜ ์œ„์น˜์™€ ๋ฐฉํ–ฅ์— ์ตœ๋Œ€ํ•œ ๋งž๋„๋ก ๋กœ๋ด‡ํŒ”๊ณผ ์†๋ชฉ์„ ์ด๋™์‹œํ‚ต๋‹ˆ๋‹ค. KUKA ํŒ”์˜ ๊ด€์ ˆ๋“ค์„ ์›€์ง์—ฌ ๋กœ๋ด‡ ์†์˜ ์ค‘์ง€ ๊ด€์ ˆ์ด ์ธ๊ฐ„ ์† ์ค‘์ง€ ๊ด€์ ˆ ์œ„์น˜๋กœ ์˜ค๊ฒŒ ํ•˜๊ณ , ์†๋ฐ”๋‹ฅ ๋ฉด์˜ ๋ฐฉํ–ฅ๋„ ์ •๋ ฌ์‹œํ‚ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค (์•„์ฃผ ์•ฝ๊ฐ„์˜ ์˜คํ”„์…‹์€ ๊ณ ๋ คํ–ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค). ๋‹ค์Œ์œผ๋กœ, ๋กœ๋ด‡ ์†๊ฐ€๋ฝ ๊ด€์ ˆ๋“ค์„ ์›€์ง์—ฌ ๋กœ๋ด‡ ์†๊ฐ€๋ฝ ๋์ด ์ธ๊ฐ„ ์†๊ฐ€๋ฝ ๋ ํฌ์ธํŠธ์™€ ๊ฐ๊ฐ ์ตœ๋Œ€ํ•œ ๊ฒน์น˜๋„๋ก ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ธ๊ฐ„์˜ ์—„์ง€, ๊ฒ€์ง€, ์ค‘์ง€ ๋ ์œ„์น˜์— ๋กœ๋ด‡์˜ ํ•ด๋‹น ์†๊ฐ€๋ฝ ๋์ด ์˜ค๋„๋ก ๋กœ๋ด‡ ์†์˜ ๊ฐ๋„๋ฅผ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ 2๋‹จ๊ณ„ IK๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์˜ pre-manipulation ์† ์ž์„ธ๋ฅผ ๊ตฌํ•˜๊ฒŒ ๋˜๋Š”๋ฐ, ์ด๋Š” ๋กœ๋ด‡ํŒ”์˜ ์†๋ชฉ ์œ„์น˜/์ž์„ธ์™€ ๋กœ๋ด‡์†์˜ ๊ด€์ ˆ๊ฐ ์ „์ฒด๋ฅผ ํฌํ•จํ•˜๋Š” ๊ตฌ์„ฑ์ž…๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋น„๊ต์  ๊ฐ„๋‹จํ•œ ์ ˆ์ฐจ์ด์ง€๋งŒ, ์ธ๊ฐ„ ์†์˜ ์ดˆ๊ธฐ ํฌ์ฆˆ๋ฅผ ๋กœ๋ด‡์— ์ถฉ๋ถ„ํžˆ ๊ทผ์‚ฌํ•˜๊ฒŒ ์˜ฎ๊ฒจ์ฃผ์–ด ๋กœ๋ด‡ ์ž…์žฅ์—์„œ ์ž์—ฐ์Šค๋Ÿฌ์šด ์ดˆ๊ธฐ ์กฐ๊ฑด์„ ๋งŒ๋“ค์–ด๋ƒ…๋‹ˆ๋‹ค. ๋”์šฑ์ด ์ด ๊ณผ์ •์€ ํ•œ ์ˆœ๊ฐ„์˜ ์ž์„ธ๋งŒ ๋งž์ถ”๋ฉด ๋˜๋ฏ€๋กœ, ์•ž์„œ ๋งํ•œ ํ”„๋ ˆ์ž„๋ณ„ ์žฌํƒ€๊ฒŸํŒ…์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋ˆ„์  ์˜ค๋ฅ˜ ๋ฌธ์ œ๋ฅผ ํ”ผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  5. ๋‘ ๊ฐ€์ง€ ํ•ต์‹ฌ ์ถ”์ƒํ™”: ์š”์•ฝํ•˜๋ฉด, Human2Sim2Robot์€ ํ•œ ๊ฐœ์˜ ์ธ๊ฐ„ ์‹œ์—ฐ์—์„œ (1) ๋ฌผ์ฒด์˜ ๋ชฉํ‘œ ์ด๋™ ๊ฒฝ๋กœ์™€ (2) ๋กœ๋ด‡์˜ ์ดˆ๊นƒ์ž์„ธ๋ผ๋Š” ๋‘ ๊ฐ€์ง€ ํ•ต์‹ฌ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋“ค์€ ์‚ฌ๋žŒ ์‹œ์—ฐ์˜ ๋ณต์žกํ•œ ์‹œ๊ณต๊ฐ„ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋ด‡ ํ•™์Šต์— ์œ ์šฉํ•œ ๋ฐฉ์‹์œผ๋กœ ์ถ”์ƒํ™”ํ•œ ๊ฒƒ์ด๋ผ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฌผ์ฒด ์ž์„ธ ๊ถค์ ์€ ์ž‘์—…์— ๋Œ€ํ•œ ๊ฐ์ฒด ์ค‘์‹ฌ์˜ ๋ชฉํ‘œ๋ฅผ ์ •์˜ํ•ด ์ฃผ๋ฉฐ, ์ด๋Š” ๋กœ๋ด‡๊ณผ ์ธ๊ฐ„ ์†์˜ ์ฐจ์ด์— ๋…๋ฆฝ์ (embodiment-agnostic)์ธ ๋ชฉํ‘œ๋กœ์„œ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ฆ‰, ๋กœ๋ด‡์ด ์‚ฌ๋žŒ๊ณผ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์›€์ง์ด๋”๋ผ๋„, ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ด ๊ถค์ ๋Œ€๋กœ ๋ฌผ์ฒด๋ฅผ ์˜ฎ๊ธฐ๊ธฐ๋งŒ ํ•˜๋ฉด ์ž‘์—…์„ ์„ฑ๊ณตํ•œ ๊ฒƒ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๋œป์ž…๋‹ˆ๋‹ค. ํ•œํŽธ pre-manipulation ๋กœ๋ด‡ ์† ์ž์„ธ๋Š” ํ•™์Šต ๊ณผ์ •์—์„œ ๋กœ๋ด‡์—๊ฒŒ ์œ ๋ฆฌํ•œ ์ดˆ๊ธฐ ์กฐ๊ฑด์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์€ ํƒ์ƒ‰ ์ดˆ๊ธฐ๋ถ€ํ„ฐ ์ธ๊ฐ„์ด ์‚ฌ์šฉํ•œ ์œ ์‚ฌํ•œ ๋ฌผ์ฒด ํŒŒ์ง€(grasp) ์ž์„ธ์—์„œ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ๊ณ , ๋”ฐ๋ผ์„œ ํ•™์Šต ์ •์ฑ…์ด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์‹œ์—ฐ๊ณผ ๋น„์Šทํ•œ ์ „๋žต์œผ๋กœ ์ˆ˜๋ ดํ•˜๋„๋ก ๋•์Šต๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ์ ์€ ์ด ๋‘ ๊ฐ€์ง€ ์ •๋ณด๊ฐ€ ์ง€์นจ(guidance) ์—ญํ• ์„ ํ•  ๋ฟ, ์šฐ๋ฆฌ๊ฐ€ ๋กœ๋ด‡์—๊ฒŒ ์ธ๊ฐ„์˜ ๋งค ์ˆœ๊ฐ„ ๋™์ž‘์„ ๊ฐ•์š”ํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์˜ ํ‘œํ˜„์— ๋”ฐ๋ฅด๋ฉด, ์‹œ์—ฐ์€ โ€œ๊ณผ์—… ๋ช…์„ธ์™€ ์ง€๋„ (task specification and guidance)โ€๋กœ๋งŒ ์‚ฌ์šฉ๋˜๊ณ , ๋กœ๋ด‡์€ ์ธ๊ฐ„์ฒ˜๋Ÿผ ํ–‰๋™ํ•˜๋Š” ๊ฒƒ์ด ์œ ๋ฆฌํ•  ๋•Œ๋Š” ๊ทธ๋ ‡๊ฒŒ ํ•˜๋„๋ก ์œ ๋„๋˜์ง€๋งŒ, ๋กœ๋ด‡ ์ž์‹ ์˜ ํ˜•์ƒ์— ๋งž์ง€ ์•Š์„ ๋•Œ๋Š” ๊ณผ๊ฐํžˆ ๋‹ค๋ฅธ ๋™์ž‘์œผ๋กœ ์šฐํšŒํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ—ˆ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์„ค๊ณ„ ์ฒ ํ•™ ๋•๋ถ„์—, ์‚ฌ๋žŒ-๋กœ๋ด‡ ์ฒดํ™” ์ฐจ์ด๊ฐ€ ํฐ ๊ฒฝ์šฐ์—๋„ ๋กœ๋ด‡์ด ๋…์ž์ ์œผ๋กœ ์ตœ์  ํ–‰๋™์„ ์ฐพ๋Š” ์ž์œ ๋„๊ฐ€ ๋ณด์žฅ๋ฉ๋‹ˆ๋‹ค.

2.2.2 ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ์˜ ์ •์ฑ… ํ•™์Šต๊ณผ ๋ณด์ƒ ์„ค๊ณ„

์ด์ œ ์ค€๋น„๋œ ๋””์ง€ํ„ธ ํŠธ์œˆ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๊ฐ•ํ™”ํ•™์Šต์„ ํ†ตํ•ด ๋กœ๋ด‡ ์กฐ์ž‘ ์ •์ฑ…(policy)์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ํ•™์Šต์—๋Š” NVIDIA์˜ IsaacGym ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ–ˆ์œผ๋ฉฐ, ์•ž์„œ ์Šค์บ”ํ•œ ์žฅ๋ฉด ๋ฉ”์‰ฌ(ํ…Œ์ด๋ธ” ๋ฐ ๊ณ ์ • ๋ฐฐ๊ฒฝ)์™€ ๋ฌผ์ฒด ๋ฉ”์‰ฌ๋ฅผ ๋ถˆ๋Ÿฌ์™€ ํ˜„์‹ค๊ณผ ๋™์ผํ•œ ๋ฌผ๋ฆฌ ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡ ๋ชจ๋ธ ์—ญ์‹œ ์‹ค์ œ์™€ ๋™์ผํ•œ 7-์ž์œ ๋„ KUKA ํŒ”๊ณผ 16-์ž์œ ๋„ Allegro ๋กœ๋ด‡ ์†์œผ๋กœ ์„ค์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค[30]. ์š”์•ฝํ•˜๋ฉด, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์†์— ํ˜„์‹ค ์‹คํ—˜์‹ค์˜ ์ถ•์†ŒํŒ์„ ๋งŒ๋“  ์…ˆ์ž…๋‹ˆ๋‹ค (๊ทธ๋ฆผ 6 ์ฐธ์กฐ).

  1. ๊ฐ•ํ™”ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜: ์ •์ฑ… ํ•™์Šต์—๋Š” Proximal Policy Optimization (PPO) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ™œ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡ ์ •์ฑ…์€ ๋ฐ˜๋ณต์ ์ธ ์—ํ”ผ์†Œ๋“œ ํ›ˆ๋ จ์„ ๊ฑฐ์ณ ์—…๋ฐ์ดํŠธ๋˜๋ฉฐ, ์ตœ์ข…์ ์œผ๋กœ ๋กœ๋ด‡ ๊ด€์ ˆ ์ œ์–ด ๋ช…๋ น์„ ์ถœ๋ ฅํ•˜๋Š” ์‹ ๊ฒฝ๋ง์œผ๋กœ ์–ป์–ด์ง‘๋‹ˆ๋‹ค. ์ •์ฑ…์˜ ๊ด€์ฐฐ ์ƒํƒœ๋กœ๋Š” ๋กœ๋ด‡ ์ž์ฒด์˜ ๊ด€์ ˆ ์ƒํƒœ(ํ”„๋กœํ”„๋ฆฌ์˜ค์…‰์…˜)์™€ ์‹ค์‹œ๊ฐ„ ๋ฌผ์ฒด์˜ 6D ์ž์„ธ๊ฐ€ ์ฃผ์–ด์ง‘๋‹ˆ๋‹ค. ์ด๋Š” ์‹ค์ œ ๋ฐฐ์น˜ ์‹œ์™€ ๋™์ผํ•˜๊ฒŒ, ์นด๋ฉ”๋ผ๋ฅผ ํ†ตํ•ด ์ถ”์ •๋œ ๋ฌผ์ฒด์˜ ์œ„์น˜/์ž์„ธ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•จ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ดˆ๊ธฐ ํ•™์Šต ์‹œ์—๋Š” ์—ํ”ผ์†Œ๋“œ๋งˆ๋‹ค ๋กœ๋ด‡์˜ ์ดˆ๊ธฐ ์ž์„ธ๋ฅผ ์•ž์„œ ๊ตฌํ•œ pre-manipulation ๋กœ๋ด‡ ์† ์ž์„ธ๋กœ ๋ฆฌ์…‹(reset)ํ•˜์—ฌ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ๋กœ๋ด‡์ด ์ดˆ๋ฐ˜๋ถ€ํ„ฐ ๋ฌผ์ฒด๋ฅผ ์žก์„ ์ค€๋น„๊ฐ€ ๋œ ์ƒํƒœ์—์„œ ํƒ์ƒ‰์„ ์‹œ์ž‘ํ•˜๋ฏ€๋กœ, ๋งจ ์ฒ˜์Œ๋ถ€ํ„ฐ ์—‰๋šฑํ•œ ๊ณณ์„ ํƒ์ƒ‰ํ•˜๋А๋ผ ์‹œ๊ฐ„์„ ํ—ˆ๋น„ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์— ๋”ฐ๋ฅด๋ฉด ์ด ์ดˆ๊ธฐํ™” ์ „๋žต์ด RL ํ•™์Šต์˜ ์•ˆ์ •์„ฑ๊ณผ ์†๋„๋ฅผ ๋†’์—ฌ์ฃผ๋ฉฐ, ํ›„์— ๋น„๊ต ์‹คํ—˜์—์„œ๋„ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
  2. ๋ณด์ƒ ํ•จ์ˆ˜ ์„ค๊ณ„: Human2Sim2Robot์˜ ์ค‘์š”ํ•œ ํŠน์ง• ์ค‘ ํ•˜๋‚˜๋Š” ์ž‘์—…๋ณ„ ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ์ถ”๊ฐ€๋กœ ์„ค๊ณ„/ํŠœ๋‹ํ•˜์ง€ ์•Š์•˜๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋Œ€์‹  ํ•˜๋‚˜์˜ ์ผ๋ฐ˜์  ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ๋ชจ๋“  ์ž‘์—…์— ์‚ฌ์šฉํ–ˆ๋Š”๋ฐ, ๊ทธ๊ฒƒ์ด ๋ฐ”๋กœ โ€œ๊ฐ์ฒด ๊ถค์  ์ถ”์  ๋ณด์ƒโ€์ž…๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ๋งค ์‹œ์ ์˜ ๋ณด์ƒ r_t๋ฅผ ๋กœ๋ด‡์ด ๋ฌผ์ฒด๋ฅผ ๋ชฉํ‘œ ๊ถค์ ์— ์–ผ๋งˆ๋‚˜ ์ž˜ ๋งž๊ฒŒ ๋”ฐ๋ผ๊ฐ€๊ณ  ์žˆ๋Š”๊ฐ€๋กœ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. ์ˆ˜์‹์œผ๋กœ๋Š” ๋ฌผ์ฒด์˜ ํ˜„์žฌ ์ž์„ธ์™€ ์ธ๊ฐ„ ์‹œ์—ฐ์—์„œ ๊ทธ ์‹œ์ ์— ํ•ด๋‹นํ•˜๋Š” ๋ชฉํ‘œ ์ž์„ธ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ(distance)๋ฅผ ์ธก์ •ํ•˜์—ฌ, ๊ฑฐ๋ฆฌ๊ฐ€ ์ž‘์„์ˆ˜๋ก ๋†’์€ ๋ณด์ƒ์„ ์ฃผ๋Š” ํ˜•์‹์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ๊ฑฐ๋ฆฌ๋ž€ ๋‹จ์ˆœํ•œ ์œ ํด๋ฆฌ๋“œ ๊ฑฐ๋ฆฌ ๊ฐœ๋…์„ ๋„˜์–ด์„œ, ๋ฌผ์ฒด์˜ ์œ„์น˜์™€ ๋ฐฉํ–ฅ ์˜ค์ฐจ๋ฅผ ๋™์‹œ์— ๋ฐ˜์˜ํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ณ ์•ˆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ๋ฌผ์ฒด์˜ ๋‚ด๋ถ€ ๊ธฐ์ค€ ํ”„๋ ˆ์ž„์— ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ธฐ์ค€ ์ (anchor point)์„ ๋‘๊ณ , ํ˜„์žฌ ๋ฌผ์ฒด์™€ ๋ชฉํ‘œ ๋ฌผ์ฒด ์‚ฌ์ด ๊ฐ ๊ธฐ์ค€์ ์˜ ์ƒ๋Œ€ ์œ„์น˜ ์ฐจ๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ์‹์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋ฌผ์ฒด์˜ ํ‘œ๋ฉด ๋ชจ์„œ๋ฆฌ๋‚˜ ์ค‘์‹ฌ ๋“ฑ์— ์ ์„ ์ฐ์–ด๋‘๊ณ , ๋กœ๋ด‡์ด ๋ฌผ์ฒด๋ฅผ ๋“ค๊ณ  ์›€์ง์ผ ๋•Œ ์ด ์ ๋“ค์ด ๋ชฉํ‘œ ์œ„์น˜์— ์–ผ๋งˆ๋‚˜ ๊ฐ€๊นŒ์ด ๊ฐ”๋Š”์ง€๋กœ ๋ณด์ƒ์„ ์ฃผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ๋ฌผ์ฒด์˜ ํšŒ์ „ ์˜ค์ฐจ๋„ ์ ๋“ค์˜ ๋ฐฐ์น˜์— ๋”ฐ๋ผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๊ฑฐ๋ฆฌ๋กœ ๋ฐ˜์˜๋ฉ๋‹ˆ๋‹ค. ๋งŒ์•ฝ ์–ด๋–ค ์ถ•์œผ๋กœ ํšŒ์ „์ด ์ค‘์š”ํ•œ ๋ฌผ์ฒด๋ผ๋ฉด ๊ทธ ์ถ• ๋ฐฉํ–ฅ์œผ๋กœ ๊ฑฐ๋ฆฌ๋ฅผ ํฌ๊ฒŒ ๋А๊ปด์ง€๋„๋ก ์ ์„ ๋ฐฐ์น˜ํ•˜๊ณ , ๋ฐ˜๋Œ€๋กœ ํšŒ์ „ ๋Œ€์นญ์ ์ธ ๋ฌผ์ฒด๋ผ๋ฉด ๋ถˆํ•„์š”ํ•œ ๋ฐฉํ–ฅ ์˜ค์ฐจ๋Š” ๋ฌด์‹œํ•˜๋„๋ก ์ ์„ ๋ฐฐ์น˜ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ธฐ์ค€์  ์„ค์ •์€ ๋ฌผ์ฒด ์œ ํ˜•์— ๋”ฐ๋ผ ํ•œ ๋ฒˆ ์ •ํ•ด์ฃผ๋ฉด ๋˜๊ณ , ๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์ž‘์—…์—์„œ ๋™์ผํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํŠน๋ณ„ํ•œ ๋ณด์ƒ ํŠœ๋‹ ์—†์ด๋„ ์ž˜ ๋™์ž‘ํ•จ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 4์—์„œ๋Š” ์ด ๊ฐ์ฒด ๊ถค์  ์ถ”์  ๋ณด์ƒ์˜ ๊ฐœ๋…๋„๋ฅผ ์‹œ๊ฐํ™”ํ•˜๊ณ  ์žˆ๋Š”๋ฐ, ๊ฐ„๋‹จํžˆ ๋งํ•ด ๋ฌผ์ฒด์˜ ํ˜„์žฌ ์ž์„ธ๊ฐ€ ์‹œ์—ฐ ๊ถค์  ์–ด๋”” ์ฏค ์™€ ์žˆ๋Š”์ง€๋ฅผ ์ธก์ •ํ•˜์—ฌ ๊ทธ์— ๋”ฐ๋ผ ๋ณด์ƒ์„ ์ฃผ๋Š” ์ฒด๊ณ„์ž…๋‹ˆ๋‹ค. ์ด ๋ณด์ƒ ์„ค๊ณ„์˜ ์žฅ์ ์€ RL ์—ฐ๊ตฌ์—์„œ ํ”ํžˆ ๊ฒช๋Š” ๊ณผ์—…๋ณ„ ๋ณด์ƒ ์„ค๊ณ„์˜ ์–ด๋ ค์›€์„ ํฌ๊ฒŒ ์ค„์˜€๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ โ€œํŠน์ • ๋ฌผ์ฒด๊ฐ€ ํšŒ์ „ ๋Œ€์นญ์ธ ๊ฒฝ์šฐ๋ฅผ ์ œ์™ธํ•˜๊ณ ๋Š”, ๋‹จ ํ•˜๋‚˜์˜ ๋ณด์ƒ ๊ณต์‹๊ณผ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ๋งค์šฐ ๋‹ค์–‘ํ•œ ์ž‘์—…๋“ค์„ ๋ชจ๋‘ ํ•™์Šต์‹œํ‚ฌ ์ˆ˜ ์žˆ์—ˆ๋‹คโ€๋ผ๊ณ  ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ณธ ๋ฐฉ๋ฒ•์˜ ๋ฒ”์šฉ์„ฑ์„ ๋ณด์—ฌ์ฃผ๋Š” ๋Œ€๋ชฉ์œผ๋กœ, ์ƒˆ๋กœ์šด ์ž‘์—…๋งˆ๋‹ค ๋ณด์ƒ์„ ์ƒˆ๋กœ ๋งŒ๋“ค ํ•„์š” ์—†์ด ์ธ๊ฐ„ ์‹œ์—ฐ ๊ถค์ ๋งŒ ์žˆ์œผ๋ฉด ๋™์ผํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•™์Šต ๊ฐ€๋Šฅํ•จ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ๋…ผ๋ฌธ์—์„œ ์‹คํ—˜ํ•œ ์ž‘์—…๋“ค(์•„๋ž˜ ์„ค๋ช…๋  ์ ‘์‹œ ๊ฝ‚๊ธฐ, ์ƒ์ž ํ”ผ๋ฒ— ๋“ฑ)์— ๋Œ€ํ•ด ์ถ”๊ฐ€์ ์ธ ๋ณด์ƒ ์กฐ์ • ์—†์ด๋„ ๋ชจ๋‘ ์„ฑ๊ณต์ ์ธ ์ •์ฑ…์„ ์–ป์„ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.
  3. ์ธ๊ฐ„ ์‹œ์—ฐ์„ ํ†ตํ•œ ๊ฐ„์ ‘ ํ•™์Šต: ์•ž์„œ ์–ธ๊ธ‰ํ–ˆ๋“ฏ, ์ด RL ํ•™์Šต์€ ์ธ๊ฐ„์˜ ์‹œ์—ฐ ๋™์ž‘ ์ž์ฒด๋ฅผ ๋ชจ๋ฐฉํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์‹œ์—ฐ์„ ํ†ตํ•ด ์ •์˜๋œ ๋ชฉํ‘œ(๋ฌผ์ฒด ๊ถค์ )๋ฅผ ๋กœ๋ด‡ ๋ฐฉ์‹์œผ๋กœ ๋‹ฌ์„ฑํ•˜๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‚ฌ๋žŒ๊ณผ ๋กœ๋ด‡์˜ ์›€์ง์ž„์€ ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์ง€๋งŒ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋ฌผ์ฒด๊ฐ€ ๋™์ผํ•œ ๊ฒฝ๋กœ๋ฅผ ๋”ฐ๋ผ ์›€์ง์ด๋ฉด ์„ฑ๊ณต์œผ๋กœ ๊ฐ„์ฃผ๋ฉ๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ โ€œ์šฐ๋ฆฌ๋Š” ์ธ๊ฐ„ ์‹œ์—ฐ ํ–‰๋™์„ ํ‰๋‚ด ๋‚ด๊ธฐ๋ณด๋‹ค, ๋ฌผ์ฒด์˜ ์›€์ง์ž„์— ๊ด€์‹ฌ์„ ๋‘”๋‹คโ€๋ผ๊ณ  ๋ช…์‹œํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„์˜ pre-manipulation ํฌ์ฆˆ๋Š” ์ดˆ๊ธฐ์— ๋Œ€๋žต์ ์ธ ๊ฐ€์ด๋“œ๋กœ๋งŒ ์“ฐ์ด๊ณ , ์ตœ์ข… ์ •์ฑ…์€ ๋กœ๋ด‡์˜ ์ฒดํ˜•์— ๋งž๊ฒŒ ์ž์œจ์ ์œผ๋กœ ์ตœ์ ํ™”๋ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์‚ฌ๋žŒ์ด ๋ฌผ์ฒด๋ฅผ ์žก์„ ๋•Œ ์˜ค๋ฅธ์†์œผ๋กœ ์ง‘์—ˆ๋‹ค๊ณ  ํ•ด์„œ ๋กœ๋ด‡๋„ ๊ผญ ๊ฐ™์€ ๋ฐฉํ–ฅ, ๊ฐ™์€ ์†๊ฐ€๋ฝ ์ˆœ์„œ๋กœ ์žก์•„์•ผ ํ•˜๋Š” ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ ์ž๊ธฐ ๊ด€์ ˆ ๊ตฌ์กฐ์ƒ ๋” ํŽธ๋ฆฌํ•œ ๋ฐฉ์‹์ด ์žˆ๋‹ค๋ฉด ๊ทธ๋ ‡๊ฒŒ ํ•ด๋„ ์ข‹๊ณ , ๋Œ€์‹  ๋ฌผ์ฒด ๊ฒฝ๋กœ๋งŒ ๋งž์ถ”๋ฉด ๋˜๋Š” ๊ฒƒ์ด์ฃ . ์ด๋ ‡๋“ฏ ์ธ๊ฐ„ ์‹œๆผ”์€ ๊ฒฐ๊ณผ ์ค‘์‹ฌ์˜ ์Šค์ผ€์น˜ ์—ญํ• ๋งŒ ํ•˜๊ณ , ๊ตฌ์ฒด์ ์ธ ํ–‰๋™ ๊ตฌํ˜„์€ RL์ด ์•Œ์•„์„œ ์ฐพ์•„๋‚ด๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด Human2Sim2Robot์˜ ์ฒ ํ•™์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์ธ๊ฐ„-๋กœ๋ด‡ ํ˜•ํƒœ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ•˜๋Š” ํ•ต์‹ฌ ์•„์ด๋””์–ด๋กœ, ์‚ฌ๋žŒ ์ „๋žต์„ ๋งน๋ชฉ์ ์œผ๋กœ ๋”ฐ๋ผํ•˜๊ธฐ๋ณด๋‹ค ์ฐธ๊ณ ๋งŒ ํ•จ์œผ๋กœ์จ, ์˜คํžˆ๋ ค ์„ฑ๊ณต๋ฅ  ๋†’์€ ์ „๋žต์„ ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ๋ฐœ๊ฒฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค.
  4. ๋„๋ฉ”์ธ ๋žœ๋คํ™”์™€ ๊ฐ•์ธํ•œ ํ•™์Šต: ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์„ ํ˜„์‹ค์— ๋ฐ”๋กœ ์ ์šฉํ•˜๋ ค๋ฉด, ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„ ๊ฐญ(์ฐจ์ด)์„ ์ค„์—ฌ์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋…ผ๋ฌธ์€ ํ•™์Šต ์ค‘ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ๋žœ๋คํ™”(domain randomization) ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์ผ์ • ๋‹จ๊ณ„๋งˆ๋‹ค ๋ฌด์ž‘์œ„๋กœ ํ™˜๊ฒฝ๊ณผ ๋กœ๋ด‡์˜ ๋ฌผ๋ฆฌ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋ณ€ํ™”์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ค‘๋ ฅ ๊ฐ’์„ ์•ฝ๊ฐ„์”ฉ ๋ฐ”๊พธ๊ฑฐ๋‚˜, ๋งˆ์ฐฐ ๊ณ„์ˆ˜๋‚˜ ๋ฌผ์ฒด ๋ฌด๊ฒŒ๋ฅผ ์ž„์˜๋กœ ์กฐ์ •ํ•˜๊ณ , ๋กœ๋ด‡ ๊ด€์ ˆ์˜ ์งˆ๋Ÿ‰/๊ฐ์‡ /๊ฐ•์„ฑ ๋“ฑ์˜ ๋ชจ์ˆ˜๋ฅผ ๋ฌด์ž‘์œ„ ์Šค์ผ€์ผ๋งํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋งค ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์Šคํ…๋งˆ๋‹ค 5% ํ™•๋ฅ ๋กœ ๋ฌผ์ฒด์— ์ž‘์€ ๋ฌด์ž‘์œ„ ํž˜(์™ธ๋ถ€ ์ถฉ๊ฒฉ)์„ ๊ฐ€ํ•˜์—ฌ, ์˜ˆ๊ธฐ์น˜ ์•Š์€ ๋ฐฉํ•ด๊ฐ€ ์ƒ๊ธฐ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ด€์ฐฐ๋˜๋Š” ๋ฌผ์ฒด ์ž์„ธ์™€ ๋กœ๋ด‡ ์ƒํƒœ, ๊ทธ๋ฆฌ๊ณ  ๋กœ๋ด‡์˜ ์ถœ๋ ฅ ์•ก์…˜์—๋„ ์„ผ์„œ ๋…ธ์ด์ฆˆ์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ€์šฐ์‹œ์•ˆ ์žก์Œ์„ ์ถ”๊ฐ€ํ•˜์—ฌ, ์นด๋ฉ”๋ผ ์˜ค์ฐจ๋‚˜ ์ œ์–ด ์‹ ํ˜ธ ์˜ค์ฐจ๋„ ๊ฒฌ๋”œ ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ๊ด‘๋ฒ”์œ„ํ•œ ๋žœ๋คํ™”๋ฅผ ์ฃผ๋ฉด, ์ •์ฑ…์€ ๋‹ค์–‘ํ•œ ์กฐ๊ฑด์—์„œ ๋ฌผ์ฒด๋ฅผ ๊ถค์ ๋Œ€๋กœ ์˜ฎ๊ธฐ๋Š” ์—ฐ์Šต์„ ํ•˜๊ฒŒ ๋˜๋ฏ€๋กœ ํ˜„์‹ค์—์„œ ๋งˆ์ฃผ์น  ๋ณ€๋™์—๋„ ๊ฐ•๊ฑดํ•ด์ง‘๋‹ˆ๋‹ค. ์‹ค์ œ ๋…ผ๋ฌธ์—์„œ๋„ ์ด๋Ÿฌํ•œ ๋žœ๋คํ™”์™€ ํ•จ๊ป˜, ์ด๋ฏธ์ง€ ๋Œ€์‹  6D ํฌ์ฆˆ๋ฅผ ๊ด€์ฐฐ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๋‚ฎ์€ ์ฐจ์›์˜ ์ƒํƒœ ํ‘œํ˜„ ๋“ฑ์ด ํ•ฉ์ณ์ ธ ๋กœ๋ด‡ ์ •์ฑ…์˜ ์ ์‘์„ฑ๊ณผ ๊ฐ•์ธ์„ฑ์ด ํ–ฅ์ƒ๋˜์–ด ์ œ๋กœ์ƒท ์‹คํ™˜๊ฒฝ ์ด์ „์ด ๊ฐ€๋Šฅํ–ˆ๋‹ค๊ณ  ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.

2.2.3 Zero-Shot Sim-to-Real: ํ•™์Šต๋œ ์ •์ฑ…์˜ ์‹คํ™˜๊ฒฝ ์ˆ˜ํ–‰

์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์ถฉ๋ถ„ํžˆ ํ•™์Šต์„ ๋งˆ์นœ ์ •์ฑ…์€ ๋ณ„๋„ ๋ฏธ์„ธ์กฐ์ •(fine-tuning) ์—†์ด ๊ทธ๋Œ€๋กœ ์‹ค์ œ ๋กœ๋ด‡์— ์ด์‹๋˜์–ด ํ…Œ์ŠคํŠธ๋ฉ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ํ•™์Šต๋œ ์ •์ฑ…์„ ๋ฌผ๋ฆฌ ๋กœ๋ด‡์— ๋ฐฐ์น˜ํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ œ์–ด ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค:

  • ์šฐ์„ , ์‹คํ—˜ ํ™˜๊ฒฝ์— ZED stereo camera(๊นŠ์ด ์นด๋ฉ”๋ผ)๋ฅผ ์„ค์น˜ํ•˜์—ฌ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋ฌผ์ฒด์˜ 6D ์ž์„ธ๋ฅผ 30Hz๋กœ ์ถ”์ ํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋„ ํ•™์Šต ๋•Œ์™€ ๋™์ผํ•œ FoundationPose ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ, ๋ฌผ์ฒด์˜ ์‹ค์ œ ์œ„์น˜์™€ ๋ฐฉํ–ฅ์„ ์ง€์†์ ์œผ๋กœ ์ถ”์ •ํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ๋กœ๋ด‡ ์ •์ฑ…(์‹ ๊ฒฝ๋ง)์€ ์ด ๋ฌผ์ฒด์˜ ํ˜„์žฌ ์ž์„ธ์™€ ๋กœ๋ด‡์˜ ๊ด€์ ˆ ์ƒํƒœ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„๋“ค์—ฌ, 15Hz์˜ ์ฃผ๊ธฐ๋กœ ๋‹ค์Œ ํ–‰๋™์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์ •์ฑ…์˜ ์ถœ๋ ฅ ํ–‰๋™์€ ์ถ”์ƒ์ ์ธ ๋ช…๋ น(์˜ˆ: ์›ํ•˜๋Š” ์†๋„๋‚˜ ๊ฐ€์ƒ ๋ชฉํ‘œ ์œ„์น˜ ๋“ฑ)์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ด ์ถœ๋ ฅ์€ ๋ฐ”๋กœ ๋กœ๋ด‡ ๊ด€์ ˆ๋กœ ๋ณด๋‚ด๋Š” ๋Œ€์‹ , Geometric Fabric Controller๋ผ๋Š” ์ค‘๊ฐ„ ์ œ์–ด๊ธฐ๋กœ ์ „๋‹ฌ๋ฉ๋‹ˆ๋‹ค. Geometric Fabrics๋Š” ๋กœ๋ด‡ ์šด๋™์„ ๋งค๋„๋Ÿฝ๊ณ  ์•ˆ์ •์ ์œผ๋กœ ์ œ์–ดํ•˜๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ, ์ •์ฑ…์ด ๋‚ด๋ฆฐ ๋ช…๋ น์„ ๋ฐ›์•„ 60Hz๋กœ ๋กœ๋ด‡ ๊ด€์ ˆ์˜ ๋ชฉํ‘œ ์œ„์น˜/์†๋„ (PD ํƒ€๊ฒŸ)๋ฅผ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„๋Š” ๋กœ๋ด‡์˜ ๋™์—ญํ•™์„ ๊ณ ๋ คํ•˜์—ฌ ๋ถ€๋“œ๋Ÿฌ์šด ๊ฒฝ๋กœ๋ฅผ ์ƒ์„ฑํ•จ์œผ๋กœ์จ, RL ์ •์ฑ…์ด ๋ฐ”๋กœ ํ† ํฌ๋ฅผ ๋‚ด๋ณด๋‚ด๋Š” ๊ฒƒ๋ณด๋‹ค ์•ˆ์ „ํ•˜๊ณ  ํ˜„์‹ค์ ์ด๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค.
  • ๋งˆ์ง€๋ง‰์œผ๋กœ, ๋กœ๋ด‡ ๋‚ด์žฅ ์ €์ธต PD ์ œ์–ด๊ธฐ๊ฐ€ 200Hz์˜ ๊ณ ์ฃผํŒŒ์ˆ˜๋กœ ์ด๋Ÿฌํ•œ ๋ชฉํ‘œ ๊ฐ’์— ๋งž๊ฒŒ ๊ฐ ๊ด€์ ˆ ๋ชจํ„ฐ์— ์ œ์–ด๋ฅผ ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์š”์•ฝํ•˜๋ฉด, ์ •์ฑ…์€ ๊ณ ์ˆ˜์ค€ ์˜์‚ฌ๊ฒฐ์ •์„ ํ•˜๊ณ , ์ค‘๊ฐ„ ์ปจํŠธ๋กค๋Ÿฌ๊ฐ€ ์ด๋ฅผ ๊ตฌ์ฒด์ ์ธ ๊ด€์ ˆ ๋ช…๋ น์œผ๋กœ ๋ฐ”๊พธ์–ด ์‹ค์ œ ๋กœ๋ด‡์„ ๊ตฌ๋™ํ•˜๋Š” ์ฒด๊ณ„์ž…๋‹ˆ๋‹ค.

Human2Sim2Robot์˜ ๊ฒฐ๊ณผ ์ค‘ ์ฃผ๋ชฉํ•  ์ ์€, ์ด๋ ‡๊ฒŒ ์ด์‹๋œ ์ •์ฑ…์ด ํ•œ ๋ฒˆ๋„ ๋กœ๋ด‡ ์‹ค๋ฌผ๋กœ ์—ฐ์Šตํ•ด๋ณด์ง€ ์•Š๊ณ ๋„ (zero-shot) ์„ฑ๊ณต์ ์œผ๋กœ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ–ˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์•ž์„œ ๋งํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋„๋ฉ”์ธ ๋žœ๋คํ™” ๋•๋ถ„์— ์ •์ฑ…์ด ํ˜„์‹ค ๋ฌผ๋ฆฌ์˜ ๋ณ€๋™์„ฑ๊นŒ์ง€ ํฌ๊ด„ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ž์ฒด๋ฅผ ์‹ค์ œ์™€ ๋งค์šฐ ๊ฐ€๊น๊ฒŒ (์Šค์บ”๋œ ํ™˜๊ฒฝ, ์ •ํ™•ํ•œ ๋ฌผ์ฒด ๋ชจ๋ธ, ์‹ค์ œ์™€ ๋™์ผํ•œ ๋กœ๋ด‡ ๋งค๋‹ˆํ“ฐ๋ ˆ์ดํ„ฐ ๋ชจ๋ธ) ๊ตฌ์„ฑํ•œ ๊ฒƒ๋„ ์ฃผํšจํ–ˆ์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ KUKA LBR iiwa 14 ํŒ”๊ณผ Allegro Hand๋กœ ์ด๋ฃจ์–ด์ง„ ์‹ค์ œ ๋กœ๋ด‡ ์‹œ์Šคํ…œ์—์„œ, ํ•™์Šต๋œ ์ •์ฑ…์„ ๋ฐ”๋กœ ์‹คํ–‰ํ•˜์—ฌ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ์–ป์—ˆ์Œ์„ ๋ณด๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡๊ณตํ•™์—์„œ ์‚ฌ๋žŒ์ด ํ•œ ๋ฒˆ ์‹œ์—ฐํ•œ ๊ฒƒ์„ ๋ณด๊ณ  (์ถ”๊ฐ€ ๋ณด์ • ์—†์ด) ๋กœ๋ด‡์ด ๋”ฐ๋ผ ํ•ด๋‚ด๋Š” ํ•™์Šต๋œ ํ–‰๋™์˜ ์‹ค์ฆ์ ์ธ ์‚ฌ๋ก€๋กœ์„œ ํฐ ์˜๋ฏธ๋ฅผ ๊ฐ–์Šต๋‹ˆ๋‹ค. ์•„๋ž˜์—์„œ๋Š” ๊ตฌ์ฒด์ ์œผ๋กœ ์–ด๋–ค ์ž‘์—…๋“ค์„ ์‹คํ—˜ํ–ˆ๊ณ  ์–ด๋–ค ์„ฑ๊ณผ๊ฐ€ ์žˆ์—ˆ๋Š”์ง€ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

2.2.4 ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ๊ณผ์ œ์—์„œ์˜ ์‹คํ—˜ ๊ฒฐ๊ณผ

์—ฐ๊ตฌ์—์„œ๋Š” Human2Sim2Robot์˜ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ๋ฌผ์ฒด ์กฐ์ž‘ ์ž‘์—…์— ๋Œ€ํ•ด ์‹คํ—˜์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹คํ—˜ ํ™˜๊ฒฝ์€ ํ…Œ์ด๋ธ” ์œ„์— ์ •์ ์ธ ์žฅ์• ๋ฌผ(์ƒ์ž, ํฐ ๋ƒ„๋น„, ์ ‘์‹œ ๊ฑด์กฐ๋Œ€ ๋“ฑ)์„ ๋ฐฐ์น˜ํ•˜๊ณ , ์„ธ ๊ฐ€์ง€ ์ด๋™ ๋ฌผ์ฒด(์Šค๋‚ต ๋ฐ•์Šค, ์ฃผ์ „์ž/ํ”ผ์ฒ˜, ์ ‘์‹œ)๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ํ™˜๊ฒฝ์€ ๊ฐ€์ •์ด๋‚˜ ์ผ์ƒ์—์„œ ์žˆ์„ ๋ฒ•ํ•œ ์ƒํ™ฉ๋“ค์„ ์ถ•์†Œ ๋ชจ์‚ฌํ•œ ๊ฒƒ์œผ๋กœ, ํ…Œ์ด๋ธ” ์œ„์—์„œ ๋ฌผ์ฒด๋ฅผ ์ง‘์–ด ๋“ค์–ด ์˜ฌ๋ฆฌ๊ฑฐ๋‚˜, ๋ฐ€๊ฑฐ๋‚˜, ์ –ํ˜€์„œ ์„ธ์šฐ๊ฑฐ๋‚˜, ๋‹ค๋ฅธ ์šฉ๊ธฐ์— ๋„ฃ๋Š” ๋“ฑ์˜ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.

๋‹จ์ผ ์Šคํ‚ฌ ๊ณผ์ œ: ์šฐ์„  ๊ธฐ๋ณธ ์กฐ์ž‘ ๊ธฐ์ˆ  ๋‹จ์œ„์˜ ๊ณผ์ œ๋“ค๋กœ ํŒŒ์ง€/์ด๋™(grasping), ๋น„ํŒŒ์ง€ ์กฐ์ž‘(non-prehensile manipulation), ์™ธ๋ ฅ ํ™œ์šฉ ์กฐ์ž‘(extrinsic manipulation) ๋“ฑ์˜ ์‚ฌ๋ก€๊ฐ€ ์„ ์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

  • ์˜ˆ 1: ์Šค๋‚ต๋ฐ•์Šค ๋ฐ€๊ธฐ(push) โ€“ ์–‡์€ ์ง์‚ฌ๊ฐํ˜• ์ƒ์ž๋ฅผ ์˜†์˜ ๊ณ ์ •๋œ ๋ฐ•์Šค ์ชฝ์œผ๋กœ ๋ฐ€์–ด์„œ ์ ‘์ด‰์‹œํ‚ค๋Š” ๊ณผ์ œ (๋ฐ€๊ธฐ: non-prehensile).
  • ์˜ˆ 2: ์Šค๋‚ต๋ฐ•์Šค ํ”ผ๋ฒ—(pivot) โ€“ ์ƒ์ž๋ฅผ ์„ธ์›Œ ์„ธ์šฐ๊ธฐ ํž˜๋“œ๋‹ˆ, ๊ณ ์ •๋œ ๋ฐ•์Šค ๋ชจ์„œ๋ฆฌ๋ฅผ ์ง€๋ ›๋Œ€ ์‚ผ์•„ ์Šค๋‚ต๋ฐ•์Šค๋ฅผ ์˜†์œผ๋กœ ๊ธฐ์šธ์—ฌ ์„ธ์šฐ๋Š” ๊ณผ์ œ (extrinsic manipulation, ํ™˜๊ฒฝ์„ ํ™œ์šฉ).
  • ์˜ˆ 3: ํ”ผ์ฒ˜(์ฃผ์ „์ž) ์ง‘์–ด ์˜ฌ๋ฆฌ๊ธฐ โ€“ ์†์žก์ด๋ฅผ ์žก๊ณ  ๋“ค์–ด์˜ฌ๋ ค ์˜† ๋ƒ„๋น„ ์œ„๋กœ ์˜ฎ๊ฒจ ๋ฌผ ๋”ฐ๋ฅด๋“ฏ์ด ์œ„์น˜์‹œํ‚ค๋Š” ๊ณผ์ œ (prehensile grasp + ์ด๋™).
  • ์˜ˆ 4: ์ ‘์‹œ ๋“ค์–ด์˜ฌ๋ฆฌ๊ธฐ โ€“ ๋‚ฉ์ž‘ํ•œ ์ ‘์‹œ๋ฅผ ํ‰๋ฉด์—์„œ ์žก์•„ ๋“ค์–ด์˜ฌ๋ฆฌ๋Š” ๊ณผ์ œ (prehensile, ๋‚œ์ด๋„ ๋†’์€ ํŒŒ์ง€).
  • ๊ทธ ์™ธ์—๋„ ์ ‘์‹œ ๋ฐ€๊ธฐ, ์ ‘์‹œ ์„ธ์šฐ๊ธฐ ๋“ฑ ๋‹ค์–‘ํ•œ ๋‹จ์ผ ์Šคํ‚ฌ ์ž‘์—…์ด ํฌํ•จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋‹ค์ค‘ ๋‹จ๊ณ„ ๊ณผ์ œ: ๋” ๋‚˜์•„๊ฐ€, ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ๊ธฐ๋ณธ ๊ธฐ์ˆ ์„ ์—ฐ์†์ ์œผ๋กœ ๋‘์„ธ ๊ฐœ ์กฐํ•ฉํ•ด์•ผ ํ•˜๋Š” ๋ณตํ•ฉ ์ž‘์—…์—๋„ ๋„์ „ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ์˜ˆ 5: ์Šค๋‚ต๋ฐ•์Šค ํ‘ธ์‹œ-ํ”ผ๋ฒ— โ€“ ์ƒ์ž๋ฅผ ๋จผ์ € ๋ฐ€์–ด ๋ฐ•์Šค์— ๋ถ™์ธ ํ›„, ์ด์–ด์„œ ํ”ผ๋ฒ— ๋™์ž‘์œผ๋กœ ์„ธ์šฐ๋Š” 2๋‹จ๊ณ„ ์ž‘์—….
  • ์˜ˆ 6: ์ ‘์‹œ ํ”ผ๋ฒ—-๋ฆฌํ”„ํŠธ-๋ž™ โ€“ ํ…Œ์ด๋ธ”์— ๋†“์ธ ๋‚ฉ์ž‘ํ•œ ์ ‘์‹œ๋ฅผ ๋จผ์ € ๋ฒฝ(๋ฐ•์Šค)์— ๊ธฐ๋Œ€ ์„ธ์šด ํ›„, ์žก์•„์„œ ๋“ค์–ด์˜ฌ๋ฆฌ๊ณ , ์ตœ์ข…์ ์œผ๋กœ ๊ฑด์กฐ๋Œ€ ํ‹€ ์‚ฌ์ด์— ๋ผ์›Œ ์„ธ์›Œ ๋‘๋Š” 3๋‹จ๊ณ„ ์ž‘์—…. ์ด๋Š” ์ ‘์‹œ ์„ธ์šฐ๊ธฐ โ†’ ์ ‘์‹œ ๋“ค์–ด์˜ฌ๋ฆฌ๊ธฐ โ†’ ์ ‘์‹œ ๊ฝ‚๊ธฐ ์ˆœ์„œ์˜ ๋ณตํ•ฉ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค.
  • ์˜ˆ 7: ์ ‘์‹œ ๋ฆฌํ”„ํŠธ-๋ž™ โ€“ ์ ‘์‹œ๋ฅผ ๋ฐ”๋กœ ๋“ค์–ด์˜ฌ๋ ค ๊ฑด์กฐ๋Œ€์— ๊ฝ‚๋Š” 2๋‹จ๊ณ„ ์ž‘์—… (์„ธ์šฐ์ง€ ์•Š๊ณ  ๋ฐ”๋กœ ๋“ค์–ด์˜ฌ๋ ค ๊ฝ‚๊ธฐ).

์ด๋Ÿฌํ•œ ๋ณตํ•ฉ ์‹œ๋‚˜๋ฆฌ์˜ค๋Š” ์ธ๊ฐ„์—๊ฒŒ๋„ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„์˜ ์‚ฌ๊ณ ๊ฐ€ ํ•„์š”ํ•œ ๋น„๊ต์  ๋ณต์žกํ•œ ์ž‘์—…์ž…๋‹ˆ๋‹ค. Human2Sim2Robot์—์„œ๋Š” ๊ฐ ๋ณตํ•ฉ ์ž‘์—… ์—ญ์‹œ ๋‹จ ํ•˜๋‚˜์˜ ์ธ๊ฐ„ ์‹œ์—ฐ ์˜์ƒ์œผ๋กœ๋ถ€ํ„ฐ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์ ‘์‹œ pivot-lift-rack ์ž‘์—…์˜ ๊ฒฝ์šฐ, ์‚ฌ๋žŒ์ด ์ฒ˜์Œ๋ถ€ํ„ฐ ๋๊นŒ์ง€ ์ ‘์‹œ๋ฅผ ์„ธ์›Œ ์žก์•„ ์˜ฎ๊ฒจ ๊ฝ‚๋Š” ์ผ๋ จ์˜ ๋™์ž‘์„ ํ•œ๋ฒˆ ๋ณด์—ฌ์ค€ ๊ฒƒ์ด๊ณ , ๋กœ๋ด‡์€ ๊ทธ ์‹œ์—ฐ์˜ ๋ฌผ์ฒด ๊ถค์  (์ ‘์‹œ์˜ ์›€์ง์ž„ ๊ฒฝ๋กœ)์— ๋งž์ถฐ 3๋‹จ๊ณ„ ํ–‰๋™์„ ๋ชจ๋‘ ํ•ด๋‚ด์•ผ ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํŠนํžˆ ์ ‘์‹œ์ฒ˜๋Ÿผ ๋„“๊ณ  ์–‡์€ ๋ฌผ์ฒด๋Š” ๋ฐ”๋‹ฅ์— ๋†“์ธ ์ƒํƒœ๋กœ๋Š” ์ง‘๊ธฐ ์–ด๋ ค์›Œ ๋จผ์ € ์„ธ์›Œ์•ผ ํ•˜๊ณ , ๊ฑด์กฐ๋Œ€์— ๋ผ์šธ ๋•Œ ๊ฐ๋„๋ฅผ ์ž˜ ์œ ์ง€ํ•ด์•ผ ํ•˜๋Š” ๋“ฑ ์ •๊ตํ•œ ์ œ์–ด๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณต์žกํ•œ ์ž‘์—…์„ ํ•œ ๋ฒˆ์˜ ์‹œ์—ฐ์œผ๋กœ ๋ฐฐ์šฐ๊ฒŒ ํ•œ ๊ฒƒ์€ ๋ณธ ์—ฐ๊ตฌ์˜ ๋‚œ์ด๋„ ๋†’์€ ๋„์ „์ด์—ˆ์Šต๋‹ˆ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ: ์ €์ž๋“ค์€ Human2Sim2Robot์œผ๋กœ ํ•™์Šตํ•œ RL ์ •์ฑ…์„ ์œ„ 7๊ฐ€์ง€ ์‹ค์ œ ์ž‘์—…์— ๋Œ€ํ•ด ์‹คํ–‰ํ•˜๊ณ , ์„ฑ๊ณต๋ฅ ์„ ์ธก์ •ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๊ฐ ์ž‘์—…๋งˆ๋‹ค 10ํšŒ์˜ ๋…๋ฆฝ ์‹คํ–‰์„ ์‹œํ—˜ํ•œ ๊ฒฐ๊ณผ, ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์ด ๋งค์šฐ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Œ์„ ๋ณด๊ณ ํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์ธ ์ˆ˜์น˜๋Š” ์ž‘์—…๋ณ„๋กœ ์ œ์‹œ๋˜์ง„ ์•Š์•˜์ง€๋งŒ, ๋ชจ๋“  ์ž‘์—…์„ ํ‰๊ท ํ•˜์—ฌ ๋ณผ ๋•Œ Human2Sim2Robot ์ •์ฑ…์€ ๋Œ€๋ถ€๋ถ„์˜ ์‹œ๋„๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ๊ด€์‹ฌ์€ Human2Sim2Robot์ด ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ์–ผ๋งˆ๋‚˜ ์šฐ์ˆ˜ํ•œ๊ฐ€์ด๋ฏ€๋กœ, ์„ธ ๊ฐ€์ง€ ๋Œ€ํ‘œ์ ์ธ ๊ธฐ์กด ์ ‘๊ทผ๋ฒ•๊ณผ ๋น„๊ต ์‹คํ—˜์ด ์ด๋ฃจ์–ด์กŒ์Šต๋‹ˆ๋‹ค. ๋น„๊ต ๋Œ€์ƒ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • Replay (์˜คํ”ˆ๋ฃจํ”„ ์žฌ์ƒ): ์ธ๊ฐ„ ์‹œ์—ฐ ์˜์ƒ์˜ ๋ชจ๋“  ํ”„๋ ˆ์ž„๋งˆ๋‹ค ์† ์ถ”์ •์„ ํ•˜๊ณ  ๋กœ๋ด‡ ํฌ์ฆˆ๋กœ ์žฌํƒ€๊ฒŸํŒ…ํ•˜์—ฌ ์–ป์€ ๋กœ๋ด‡์˜ ์ „์ฒด ๊ด€์ ˆ ๊ถค์ ์„ ๊ทธ๋Œ€๋กœ ๋”ฐ๋ผ ์žฌ์ƒํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์ผ์ข…์˜ open-loop(ํ”ผ๋“œ๋ฐฑ ์—†์Œ) ์‹คํ–‰์œผ๋กœ, ์‚ฌ๋žŒ์ด ํ–ˆ๋˜ ๊ทธ๋Œ€๋กœ ๋กœ๋ด‡์ด ํ•ด๋ณด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
  • Object-Aware Replay (๊ฐ์ฒด ์œ„์น˜ ๋ณด์ • ์žฌ์ƒ): ์ƒ๊ธฐ Replay์™€ ๋™์ผํ•˜๋‚˜, ํ˜„์‹ค์—์„œ ์ดˆ๊ธฐ ๋ฌผ์ฒด์˜ ์œ„์น˜๊ฐ€ ์‹œ์—ฐ ๋•Œ์™€ ์•ฝ๊ฐ„ ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, ๋ฌผ์ฒด์˜ ์ดˆ๊ธฐ ๋ณ€ํ™˜ ์ฐจ์ด๋ฅผ ๋ณด์ •ํ•˜์—ฌ ๋กœ๋ด‡ ๊ถค์ ์„ ์•ฝ๊ฐ„ ์ด๋™/ํšŒ์ „์‹œํ‚ค๋Š” ๊ฐœ์„ ๋œ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๊ธฐ์กด ์—ฐ๊ตฌ์ธ PEP์ด๋‚˜ OKAMI ๋“ฑ์˜ ์•„์ด๋””์–ด๋ฅผ ์ฐธ๊ณ ํ•œ ๊ฒƒ์œผ๋กœ, ์‹œ์—ฐ ๋Œ€๋น„ ๋ฌผ์ฒด ์œ„์น˜๊ฐ€ ์–ด๊ธ‹๋‚˜๋„ ๋กœ๋ด‡์ด ๊ถค์ ์„ ๋”ฐ๋ผ๊ฐˆ ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.
  • Behavior Cloning (ํ–‰๋™ ๋ณต์ œ): ํ๋ฃจํ”„ ์ •์ฑ…์ด๊ธด ํ•˜๋‚˜, RL์ด ์•„๋‹Œ ์ง€๋„ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ชจ๋ฐฉํ•™์Šต์œผ๋กœ ์ •์ฑ…์„ ํ•™์Šตํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ํ•œ ๊ฐœ์˜ ์‹œ์—ฐ๋งŒ์œผ๋กœ๋Š” ํ•™์Šต์ด ์–ด๋ ค์šฐ๋‹ˆ, ์ œ์•ˆ ๋ฐฉ์‹์— ๋งž์ถ”์–ด ์‹œ์—ฐ ํ•˜๋‚˜๋ฅผ ์ฆ๊ฐ•ํ•˜์—ฌ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฌผ์ฒด ์ดˆ๊ธฐ ์œ„์น˜๋ฅผ ์—ฌ๋Ÿฌ ๋ฐฉ์‹์œผ๋กœ ๋ฌด์ž‘์œ„ ์ƒ˜ํ”Œ๋งํ•˜๊ณ , ๊ทธ ์ƒํ™ฉ์—์„œ Object-Aware Replay๋ฅผ ์‹คํ–‰ํ•˜์—ฌ 30๊ฐœ์˜ ๋กœ๋ด‡ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๊ฒƒ์„ ์ •์ฑ… ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ๋กœ ์‚ผ์•„, Diffusion policy์™€ ๊ฐ™์€ IL ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํ–‰๋™ ๋ณต์ œ ํ•™์Šต์„ ํ•œ ๊ฒƒ์ด BC baseline์ž…๋‹ˆ๋‹ค. ์‰ฝ๊ฒŒ ๋งํ•ด, ํ•œ ๊ฐœ ์‹œ์—ฐ์„ ์—ฌ๋Ÿฌ ๋ฒˆ ์žฌ๋ฐฐ์น˜ํ•ด๊ฐ€๋ฉฐ ๋ฐ์ดํ„ฐ๋กœ ๋ถ€ํ’€๋ฆฐ ํ›„, ์ „ํ†ต์  ๋ชจ๋ฐฉํ•™์Šต์„ ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋น„๊ต ๊ฒฐ๊ณผ, Human2Sim2Robot์˜ RL ์ •์ฑ…์€ ์ด๋“ค ๋ชจ๋“  ๊ธฐ์ค€์„ ๋ณด๋‹ค ํ˜„์ €ํžˆ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. ํ‰๊ท ์ ์œผ๋กœ ๋ณผ ๋•Œ, Human2Sim2Robot์€ ๊ฐ์ฒด-์ธ์‹ ์˜คํ”ˆ๋ฃจํ”„ ์žฌ์ƒ๋ณด๋‹ค 55%ํฌ์ธํŠธ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๊ณ , ํ–‰๋™ ๋ณต์ œ๋ณด๋‹ค 68%ํฌ์ธํŠธ ๋†’์•˜์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๋‹จ์ˆœํ•œ Replay์™€ ๋น„๊ตํ•˜๋ฉด ๋ฌด๋ ค 67%ํฌ์ธํŠธ๋‚˜ ํ–ฅ์ƒ๋˜์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 8์˜ ์‹คํ—˜ ๊ฒฐ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ณด๋ฉด, ๊ฑฐ์˜ ๋ชจ๋“  ์ž‘์—…์—์„œ RL ์ •์ฑ…์ด ์••๋„์ ์œผ๋กœ ๋†’์€ ์„ฑ๊ณต ๋น„์œจ์„ ๋‹ฌ์„ฑํ–ˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ํฐ ์„ฑ๋Šฅ ์ฐจ์ด์˜ ์ด์œ ์— ๋Œ€ํ•ด ์ €์ž๋“ค์€ ์ƒ์„ธํ•œ ๋ถ„์„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์šฐ์„  Replay์˜ ๊ฒฝ์šฐ, ์˜คํ”ˆ๋ฃจํ”„๋กœ ์‚ฌ์ „์— ๋…นํ™”๋œ ๊ถค์ ์„ ๊ทธ๋Œ€๋กœ ๋”ฐ๋ผ๊ฐ€๊ธฐ ๋•Œ๋ฌธ์— ํ˜„์‹ค์—์„œ๋Š” ์—ฌ๋Ÿฌ ์‹คํŒจ ์š”์ธ์ด ๋ฐœ์ƒํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹œ์—ฐ ์‹œ์™€ ์ดˆ๊ธฐ ์กฐ๊ฑด์ด ์กฐ๊ธˆ๋งŒ ๋‹ฌ๋ผ๋„ (์˜ˆ: ๋ฌผ์ฒด ์œ„์น˜ ์˜ค์ฐจ, ๋งˆ์ฐฐ ์ฐจ์ด ๋“ฑ) ๋ณด์ •์ด ์—†์œผ๋ฉด ๋กœ๋ด‡ ๋™์ž‘์€ ๋น—๋‚˜๊ฐ€๊ฒŒ ๋งˆ๋ จ์ด๊ณ , ํ•œ๋ฒˆ ์–ด๊ธ‹๋‚˜๋ฉด ํ”ผ๋“œ๋ฐฑ์ด ์—†์–ด ๋๊นŒ์ง€ ์‹คํŒจํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. Object-Aware Replay๋Š” ์ดˆ๊ธฐ ์œ„์น˜๋Š” ๋ณด์ •ํ–ˆ์ง€๋งŒ ์—ฌ์ „ํžˆ ๊ฐœ์„ ๋˜์ง€ ์•Š์€ ์„ธ ๊ฐ€์ง€ ๋ฌธ์ œ๋ฅผ ๊ฒช์—ˆ์Šต๋‹ˆ๋‹ค: (1) ์•ž์„œ ๋…ผํ•œ ์† ์ถ”์ • ๋ฐ ์žฌํƒ€๊ฒŸํŒ… ์˜ค๋ฅ˜๊ฐ€ ๋ˆ„์ ๋˜์–ด ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์ง€๊ณ , (2) ๊ทผ๋ณธ์ ์ธ ์‚ฌ๋žŒ-๋กœ๋ด‡ ํ˜•์ƒ ์ฐจ์ด๋กœ ์ธํ•œ ๋ถ€์กฐํ™”๊ฐ€ ์žˆ๊ณ , (3) ํ”ผ๋“œ๋ฐฑ์ด ์—†์–ด ์ค‘๊ฐ„์— ์ˆ˜์ •๋˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ๊ทธ๋‚˜๋งˆ ์ด ๋ฐฉ๋ฒ•์€ ๋ฌผ์ฒด ์œ„์น˜ ์ •๋„๋Š” ๋ฐ˜์˜ํ–ˆ๊ธฐ์—, ์ •๋ฐ€๋„๊ฐ€ ํฌ๊ฒŒ ์š”๊ตฌ๋˜์ง€ ์•Š๋Š” ์ž‘์—…(์˜ˆ: ์ƒ์ž๋ฅผ ๋Œ€๋žต ๋ฐ€์–ด์„ธ์šฐ๋Š” ์ •๋„)์—์„œ๋Š” ๋ถ€๋ถ„ ์„ฑ๊ณต์„ ๋ณด์ด๊ธฐ๋„ ํ–ˆ์ง€๋งŒ, ์กฐ๊ธˆ ๋ณต์žกํ•œ ์ž‘์—…๋ถ€ํ„ฐ๋Š” ์‹คํŒจํ–ˆ์Šต๋‹ˆ๋‹ค.

Behavior Cloning(BC)์˜ ๊ฒฝ์šฐ, ๋ฐ์ดํ„ฐ 30๊ฐœ๋กœ ํ๋ฃจํ”„ ์ •์ฑ…์„ ํ•™์Šตํ–ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๊ฒฐ๊ณผ๊ฐ€ ์ €์กฐํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ ์ž์ฒด๊ฐ€ ์žฌํƒ€๊ฒŸํŒ…์„ ํ†ตํ•ด ์ƒ์„ฑ๋œ ๊ฒƒ์ด๋ผ ํ’ˆ์งˆ์ด ๋‚ฎ๊ณ , ๊ฐœ์ˆ˜๋„ ์ถฉ๋ถ„์น˜ ์•Š๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡ ํ–‰๋™์˜ ํ•™์Šต์ด ๋ˆ„์  ์˜ค์ฐจ์— ์ทจ์•ฝํ•˜์—ฌ, ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์—์„œ ์กฐ๊ธˆ๋งŒ ๋ฒ—์–ด๋‚˜๋ฉด ๊ธˆ์„ธ ์ž˜๋ชป๋œ ๋™์ž‘์œผ๋กœ ์ด์–ด์ง€๋Š” ๊ณผ์ ํ•ฉ ํ˜„์ƒ์ด ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€, ์‹œ์—ฐ ํ•œ๋‘ ๊ฐœ๋กœ ํ–‰๋™์„ ๋ชจ๋ฐฉ ํ•™์Šตํ•˜๋Š” ๋ฐ์—๋Š” ๊ทผ๋ณธ์ ์ธ ํ•œ๊ณ„๊ฐ€ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ํ•œํŽธ Human2Sim2Robot์˜ RL ์ •์ฑ…์€ ์‹œ์—ฐ์„ ๋ชจ๋ฐฉํ•˜์ง€ ์•Š๊ณ  ๊ณผ์—… ๋ชฉํ‘œ๋ฅผ ์„ฑ์ทจํ•˜๋„๋ก ํ•™์Šต๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ค‘๊ฐ„ ์ƒํ™ฉ์ด ๋‹ฌ๋ผ์ ธ๋„ ๋ชฉํ‘œ ์ง€ํ–ฅ์ ์œผ๋กœ ์ ์‘ํ•˜๋ฉฐ ๊ณผ์—…์„ ์™„์ˆ˜ํ•  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์ ‘์‹œ ์„ธ์šฐ๊ธฐ-๊ฝ‚๊ธฐ์™€ ๊ฐ™์€ ๋ณต์žกํ•œ ์ž‘์—…์—์„œ, ๋ชจ๋ฐฉ ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์€ ์‹œ์—ฐ ๋•Œ์™€ ์กฐ๊ธˆ๋งŒ ๋‹ฌ๋ผ์ ธ๋„ ์‹คํŒจํ–ˆ์ง€๋งŒ, RL ์ •์ฑ…์€ ์‚ฌ๋žŒ ์‹œ์—ฐ์˜ ์ „๋žต์„ ์‘์šฉํ•˜๋˜ ๋กœ๋ด‡ ๋‚˜๋ฆ„๋Œ€๋กœ ์„ธ๋ถ„ํ™”ํ•˜์—ฌ ์ ‘์‹œ๋ฅผ ๋๊นŒ์ง€ ๊ฝ‚์•„๋„ฃ๋Š” ๋ฐ ์„ฑ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 9๋Š” ์ด๋Ÿฌํ•œ ์˜ˆ์‹œ๋กœ, ์ ‘์‹œ pivot-lift-rack ์ž‘์—…์—์„œ ๋กœ๋ด‡์ด ์ธ๊ฐ„ ์‹œ์—ฐ์„ ์ฐธ๊ณ ํ•˜๋ฉด์„œ๋„ ์ž๊ธฐ ์†์— ๋งž๊ฒŒ ๋ณ€ํ˜•๋œ ์ „๋žต์œผ๋กœ ๊ณผ์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ Human2Sim2Robot์€ ์ธ๊ฐ„์ฒ˜๋Ÿผ ํ–‰๋™ํ•˜๋„๋ก ๊ฐ•์š”ํ•˜๊ธฐ๋ณด๋‹ค, ์ธ๊ฐ„์˜ ํžŒํŠธ๋ฅผ ์ด์šฉํ•ด ๋กœ๋ด‡ ์Šค์Šค๋กœ ํ•™์Šตํ•˜๊ฒŒ ํ•จ์œผ๋กœ์จ ํ›จ์”ฌ ๋†’์€ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ์Œ์„ ์ฆ๋ช…ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋˜ํ•œ ์ €์ž๋“ค์€ ๊ฐ ๊ตฌ์„ฑ ์š”์†Œ์˜ ๊ธฐ์—ฌ๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•œ ์ถ”๊ฐ€ ์‹คํ—˜(Ablation)๋„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ฐ์ฒด ๊ถค์  ๋ณด์ƒ ๋Œ€์‹  ๋‹จ์ˆœํžˆ ์ตœ์ข… ๋ชฉํ‘œ ์œ„์น˜๊นŒ์ง€๋งŒ ๊ฐ€๋„๋ก ํ•˜๊ฑฐ๋‚˜, ๊ถค์ ์„ ํฌ๋ฏธํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๋ณ€ํ˜•๋“ค์„ ๋น„๊ตํ–ˆ๋Š”๋ฐ, ๊ทธ ๊ฒฐ๊ณผ ๋ณธ๋ž˜์˜ ์„ธ๋ฐ€ํ•œ ๊ถค์  ๋ณด์ƒ์ด ํ•™์Šต์„ ๊ฐ€์žฅ ๋น ๋ฅด๊ณ  ์•ˆ์ •์ ์œผ๋กœ ๋งŒ๋“ค๊ณ  ์„ฑ๊ณต๋„ ๋†’์˜€๋‹ค๊ณ  ๋ณด๊ณ ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ์ ‘์‹œ์™€ ๊ฐ™์ด ์ค‘๊ฐ„ ๋‹จ๊ณ„๋ฅผ ํ•„์š”๋กœ ํ•˜๋Š” ์ž‘์—…์—์„œ, ์ตœ์ข… ๋ชฉํ‘œ๋งŒ ์ฃผ์—ˆ์„ ๊ฒฝ์šฐ ๋กœ๋ด‡์€ ์ง€๋ฆ„๊ธธ์„ ํƒํ•˜๋ ค๋‹ค๊ฐ€ (์ ‘์‹œ๋ฅผ ๋ฐ”๋กœ ๋“ค์–ด์˜ฌ๋ฆฌ๋ ค๋‹ค) ์‹คํŒจํ–ˆ์ง€๋งŒ, ์ธ๊ฐ„ ์‹œ์—ฐ์˜ ์ „์ฒด ๊ฒฝ๋กœ๋ฅผ ๋ณด์ƒ์œผ๋กœ ์ œ์‹œํ–ˆ์„ ๋•Œ ๋น„๋กœ์†Œ ํ”ผ๋ฒ— ํ›„ ์ง‘๊ธฐ๋ผ๋Š” ํ•ด๋ฒ•์„ ์ฐพ์•„๋ƒˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ธ๊ฐ„ ์‹œ์—ฐ์ด ๋‹จ์ˆœํžˆ ๊ฒฐ๊ณผ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๊ณผ์ •์ƒ์˜ ์ค‘์š”ํ•œ ํžŒํŠธ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, RL์ด ๊ทธ๊ฒƒ์„ ์ž˜ ํ™œ์šฉํ•˜๊ณ  ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ์ดˆ๊ธฐ ์† ์ž์„ธ ์•ˆ๋‚ด๊ฐ€ ์—†์„ ๋•Œ์™€ ์žˆ์„ ๋•Œ๋„ ๋น„๊ตํ•œ ๊ฒฐ๊ณผ, ์ดˆ๊ธฐ ์•ˆ๋‚ด๊ฐ€ ์žˆ์œผ๋ฉด ํ•™์Šต ์ดˆ๊ธฐ ์„ฑ๋Šฅ๊ณผ ์ˆ˜๋ ด ์†๋„๊ฐ€ ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜๊ณ  ๋” ๋‚˜์€ ์ตœ์ข… ์„ฑ๊ณผ๋ฅผ ์–ป์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‹คํ—˜๋“ค์€ Human2Sim2Robot ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ตฌ์„ฑ ์š”์†Œ๋“ค์ด ๊ฐ๊ฐ ์œ ์˜๋ฏธํ•œ ์—ญํ• ์„ ํ•˜๊ณ  ์žˆ์Œ์„ ๋’ท๋ฐ›์นจํ•ฉ๋‹ˆ๋‹ค.

2.3 ๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต ๋ฐ ์ฐจ๋ณ„์ 

Human2Sim2Robot์€ โ€œํ•œ ๊ฐœ์˜ ์ธ๊ฐ„ ์‹œ์—ฐ์œผ๋กœ ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡์† ์ •์ฑ…์„ ํ•™์Šตโ€ํ–ˆ๋‹ค๋Š” ์ ์—์„œ ๋งค์šฐ ๋„์ „์ ์ธ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•œ ์ตœ์ดˆ์˜ ์‚ฌ๋ก€๋กœ ๊ผฝํž™๋‹ˆ๋‹ค. ์ €์ž๋“ค์˜ ์ฃผ์žฅ์— ๋”ฐ๋ฅด๋ฉด, ์ด๋ ‡๊ฒŒ ์ ์€ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋กœ ์‹ค์ œ ๋กœ๋ด‡์— ๋ฐ”๋กœ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ํ๋ฃจํ”„ ์ •์ฑ…์„ ๋งŒ๋“  ๊ฒƒ์€ ๋ณธ ์—ฐ๊ตฌ๊ฐ€ ์ฒ˜์Œ์ž…๋‹ˆ๋‹ค. ๊ฐœ๋ณ„ ๊ตฌ์„ฑ์š”์†Œ ์ฐจ์›์—์„œ๋Š” ์ด์ „์—๋„ ์œ ์‚ฌํ•œ ์‹œ๋„๊ฐ€ ์—†์—ˆ๋˜ ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ฐ์ฒด ์ค‘์‹ฌ ๋ณด์ƒ์„ ์‚ฌ์šฉํ•œ ๋กœ๋ด‡ ํ•™์Šต์ด๋‚˜, ์ธ๊ฐ„-๋กœ๋ด‡ ํฌ์ฆˆ ์žฌ๋งคํ•‘์„ ์‹œ๋„ํ•œ ์—ฐ๊ตฌ๋“ค์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋“ค ๊ธฐ์กด ์—ฐ๊ตฌ๋Š” ๋Œ€๊ฐœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์•ˆ์— ๊ตญํ•œ๋˜์—ˆ๊ฑฐ๋‚˜, ํ˜น์€ ์ •์ฑ…์ด ์•„๋‹Œ ์˜คํ”ˆ๋ฃจํ”„ ์ œ์–ด ์ˆ˜์ค€์— ๋จธ๋ฌผ๋ €์œผ๋ฉฐ, ๋” ๋‚˜์•„๊ฐ€ ๋‹ค์ˆ˜์˜ ์‹œ์—ฐ์ด ํ•„์š”ํ•˜๊ฑฐ๋‚˜ ๋‹จ์ˆœ ํŒŒ์ง€ ๋™์ž‘์—๋งŒ ๊ตญํ•œ๋˜๋Š” ๋“ฑ ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๋ณธ ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ์š”์†Œ๋“ค์„ ํ†ตํ•ฉํ•˜๋ฉด์„œ๋„ ์‹คํ™˜๊ฒฝ ํ๋ฃจํ”„ ์ œ์–ด๊นŒ์ง€ ๊ตฌํ˜„ํ•˜๊ณ , ๋น„ํŒŒ์ง€ ๋ฐ ๋‹ค๋‹จ๊ณ„ ์ž‘์—…์œผ๋กœ ๋ฒ”์œ„๋ฅผ ๋„“ํ˜”๋‹ค๋Š” ๋ฐ ํฐ ์ฐจ๋ณ„์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

๋ชจ๋ฐฉํ•™์Šต(IL) vs. Human2Sim2Robot: ์ „ํ†ต์ ์ธ IL์€ ์•ž์„œ ์„ค๋ช…ํ–ˆ๋“ฏ, ์ธ๊ฐ„ ์‹œ์—ฐ๊ณผ ๋กœ๋ด‡ ํ–‰๋™ ๊ฐ„ ์—„๊ฒฉํ•œ ๋งคํ•‘์ด ์ „์ œ๋ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ๊ณ  ์กฐ๊ฑด์ด ์ž˜ ๋งž์œผ๋ฉด ํšจ๊ณผ์ ์ด์ง€๋งŒ, Human2Sim2Robot์ด ๋‹ค๋ฃจ๋Š” ์‹œ์—ฐ 1๊ฐœ, ์ธ๊ฐ„-๋กœ๋ด‡ ํ˜•ํƒœ ์ƒ์ด ์ƒํ™ฉ์—์„œ๋Š” ์ ์šฉ์ด ์‚ฌ์‹ค์ƒ ๋ถˆ๊ฐ€๋Šฅํ–ˆ์Šต๋‹ˆ๋‹ค. IL์„ ์–ต์ง€๋กœ ์ ์šฉํ•˜๋ ค ํ•œ baseline ์‹คํ—˜(Replay, BC ๋“ฑ)์€ ๋ชจ๋‘ ๋‚ฎ์€ ์„ฑ๊ณต๋ฅ ๋กœ ์ด๋ฅผ ๋ฐฉ์ฆํ•ฉ๋‹ˆ๋‹ค. Human2Sim2Robot์€ โ€œ์‹œ์—ฐ ๋”ฐ๋ผํ•˜๊ธฐโ€ ๋Œ€์‹  โ€œ์‹œ์—ฐ ์ฐธ๊ณ ํ•˜์—ฌ RL๋กœ ๋ฐฐ์šฐ๊ธฐโ€๋ผ๋Š” ํŒจ๋Ÿฌ๋‹ค์ž„ ์ „ํ™˜์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ํŠนํžˆ ์‚ฌ๋žŒ์ด ์†๊ฐ€๋ฝ ํ•˜๋‚˜ํ•˜๋‚˜ ์–ด๋–ป๊ฒŒ ์›€์ง์˜€๋Š”์ง€๊นŒ์ง€ ๋ฒ ๋ผ๋ ค ํ•˜์ง€ ์•Š๊ณ , ๊ฒฐ๊ณผ์ ์ธ ๊ฐ์ฒด ์›€์ง์ž„๋งŒ ํ•™์Šต ๋ชฉํ‘œ๋กœ ์‚ผ์€ ์ ์€ ์‚ฌ๋žŒ-๋กœ๋ด‡ ๊ฐ„๊ทน์„ ์šฐํšŒ์ ์œผ๋กœ ํ•ด์†Œํ•œ ๋›ฐ์–ด๋‚œ ์•„์ด๋””์–ด์ž…๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ์‚ฌ๋žŒ์˜ ์ „๋žต์„ ๋ถ€๋ถ„์ ์œผ๋กœ ๋ชจ๋ฐฉํ•˜๋˜ ๋กœ๋ด‡ ์Šค์Šค๋กœ ์ตœ์  ํ–‰๋™์„ ์ฐพ๊ฒŒ ํ•จ์œผ๋กœ์จ, IL ๋ฐฉ์‹์ด ๊ฒช๋Š” ์˜ค๋ฅ˜ ๋ˆ„์ ๊ณผ ์‹คํŒจ๋ฅผ ํ”ผํ•  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ IL์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๋งŽ์€ ์‹œ์—ฐ์ด ์žˆ์–ด์•ผ ์•ˆ์ •์ ์ธ๋ฐ, ๋ณธ ๋ฐฉ๋ฒ•์€ ํ•˜๋‚˜์˜ ์‹œ์—ฐ์œผ๋กœ๋„ ์ถฉ๋ถ„ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ๋‹ค๋Š” ์ ์—์„œ ํ˜„์‹ค์ ์ธ ์žฅ์ ์„ ๊ฐ–์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ํ˜„์žฅ์—์„œ ๋กœ๋ด‡์—๊ฒŒ ์ƒˆ ์ž‘์—…์„ ๊ฐ€๋ฅด์น  ๋•Œ, ์ˆ˜์‹ญ ๋ฒˆ ํ…”๋ ˆ์˜ต์œผ๋กœ ๋ฐ˜๋ณตํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ํ•œ ๋ฒˆ ์‹œ๋ฒ”์„ ๋ณด์—ฌ์ฃผ๋Š” ๊ฒƒ์ด ํ›จ์”ฌ ์ˆ˜์›”ํ•  ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

์œ ์‚ฌ ์—ฐ๊ตฌ๋“ค๊ณผ์˜ ๋น„๊ต: ์ตœ๊ทผ ์ธ๊ฐ„ ๋น„๋””์˜ค๋ฅผ ํ™œ์šฉํ•ด ๋กœ๋ด‡ ๋‹ค์ง€ ์กฐ์ž‘์„ ๋ฐฐ์šฐ๋ ค๋Š” ์—ฐ๊ตฌ๋“ค์ด ๋ช‡ ๊ฐ€์ง€ ๋“ฑ์žฅํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด 2024๋…„์˜ HuDOR (Human-to-Dexterous-Object-Rewards) ๋ฐฉ๋ฒ•์€ ํ•œ ๊ฐœ์˜ ์ธ๊ฐ„ ์˜์ƒ์œผ๋กœ๋ถ€ํ„ฐ ๋ฌผ์ฒด ์›€์ง์ž„์„ ์ถ”์ ํ•˜์—ฌ ๊ฐ์ฒด-์ง€ํ–ฅ ๋ณด์ƒ์„ ๋งŒ๋“ค๊ณ , ์ด๋ฅผ ์ด์šฉํ•ด ์‹ค์ œ ๋กœ๋ด‡์—์„œ ์˜จ๋ผ์ธ RL ํŒŒ์ธํŠœ๋‹์„ ์ˆ˜ํ–‰ํ•œ ๋ฐ” ์žˆ์Šต๋‹ˆ๋‹ค. HuDOR ์—ญ์‹œ ์‚ฌ๋žŒ-๋กœ๋ด‡ ํ˜•ํƒœ ์ฐจ์ด ๋ฌธ์ œ๋ฅผ ์ธ์ง€ํ•˜๊ณ , ๋ฌผ์ฒด ์›€์ง์ž„์— ์ง‘์ค‘ํ•œ ๋ณด์ƒ์œผ๋กœ RL์„ ํ•œ ์ ์€ ์œ ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ HuDOR๋Š” ์‹ค์ œ ๋กœ๋ด‡์„ 1์‹œ๊ฐ„ ๊ฐ€๋Ÿ‰ ์ง์ ‘ ํ•™์Šต์‹œ์ผœ์•ผ ํ–ˆ๊ณ , ๋‹ค๋ฃจ๋Š” ์ž‘์—…๋„ ๋‹จ์ผ ๋‹จ๊ณ„ ๋™์ž‘ ์œ„์ฃผ์˜€์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด Human2Sim2Robot์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒ์—์„œ ์ถฉ๋ถ„ํžˆ ํ•™์Šตํ•˜๊ณ  ํ˜„์‹ค์— ์ œ๋กœ์ƒท ํˆฌ์ž…ํ•จ์œผ๋กœ์จ, ์‹ค์ œ ๋กœ๋ด‡์˜ ๊ณ ๋œ ์˜จ๋ผ์ธ ํ•™์Šต์„ ํ”ผํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋” ๋‹ค์–‘ํ•œ ์ž‘์—… (ํ›จ์”ฌ ๋ณต์žกํ•œ ๋‹ค๋‹จ๊ณ„ ์ž‘์—… ํฌํ•จ)์—์„œ ๊ฒ€์ฆ๋˜์—ˆ๋‹ค๋Š” ์ ์—์„œ๋„ ์•ž์„  ๊ฒฐ๊ณผ๋ผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๋ฐ–์— From One Hand to Multiple Hands (2022)๋ผ๋Š” ์—ฐ๊ตฌ๋Š” ๋‹จ์ผ ์‚ฌ๋žŒ์˜ ์‹œ์—ฐ์„ ์—ฌ๋Ÿฌ ๋กœ๋ด‡ ์†์— ์ผ๋ฐ˜ํ™”ํ•˜๋Š” ๋ชจ๋ฐฉํ•™์Šต์„ ๋‹ค๋ค˜์ง€๋งŒ, ์ด๊ฒƒ์€ ํ…”๋ ˆ์˜ต์œผ๋กœ ์ˆ˜์ง‘๋œ ๋‹ค์ˆ˜์˜ ์‹œ์—ฐ์„ ์ „์ œํ•˜์˜€๊ณ  Human2Sim2Robot์ฒ˜๋Ÿผ RL์„ ํ™œ์šฉํ•˜์ง€๋Š” ์•Š์•˜์Šต๋‹ˆ๋‹ค. X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real (2025) ๋“ฑ์˜ ๋™์‹œ๋Œ€ ์—ฐ๊ตฌ๋“ค๋„ ์ฒดํ™” ์ฐจ์ด ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๊ณ  ์žˆ์œผ๋‚˜, Human2Sim2Robot๋งŒํผ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ์˜ ๊ทน๋‹จ์  ์ถ•์†Œ (1๊ฐœ)์™€ ์‹คํ™˜๊ฒฝ ๊ฒ€์ฆ์„ ๋ชจ๋‘ ๋ณด์—ฌ์ค€ ์‚ฌ๋ก€๋Š” ๋“œ๋ญ…๋‹ˆ๋‹ค.

๋ฒ ์ด์Šค๋ผ์ธ ๊ธฐ๋ฒ•๊ณผ์˜ ์ฐจ๋ณ„์ : ์•ž ์ ˆ์˜ ๋น„๊ต์‹คํ—˜ ๊ฒฐ๊ณผ๊ฐ€ ์ž˜ ๋ณด์—ฌ์ฃผ์—ˆ๋“ฏ, Human2Sim2Robot์˜ RL ์ •์ฑ…์€ ํ๋ฃจํ”„ ์ œ์–ด๋กœ ํ™˜๊ฒฝ ๋ณ€ํ™”์— ๋Œ€์‘ํ•œ๋‹ค๋Š” ์ ์—์„œ ์˜คํ”ˆ๋ฃจํ”„ ์žฌ์ƒ(Replay)๊ณผ ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ๋˜ํ•œ ์‚ฌ๋žŒ ์‹œ์—ฐ์„ ํ•™์Šต์˜ ํ˜•ํƒœ๋กœ ํ™œ์šฉํ•œ๋‹ค๋Š” ์ ์—์„œ, ๋‹จ์ˆœํžˆ ์‹œ์—ฐ ๊ถค์ ์„ ์กฐ์ •ํ•ด ์‚ฌ์šฉํ•˜๋Š” Object-Aware Replay์™€๋„ ์ฐจ๋ณ„ํ™”๋ฉ๋‹ˆ๋‹ค. Behavior Cloning๊ณผ ๋น„๊ตํ•˜๋ฉด, ๊ฐ™์€ ๋ฐ์ดํ„ฐ๋ผ๋„ ๊ฐ•ํ™”ํ•™์Šต์„ ํ†ตํ•ด ์„ฑ๋Šฅ์„ ๋Œ์–ด์˜ฌ๋ฆฌ๊ณ  ์˜ค์ฐจ ๋ˆ„์  ๋ฌธ์ œ๋ฅผ ํ•ด์†Œํ–ˆ๋‹ค๋Š” ์ ์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€, Human2Sim2Robot์€ โ€œ์‹œ์—ฐ โ†’ ๋ฐ์ดํ„ฐ โ†’ ๋ชจ๋ฐฉโ€์˜ ๊ธฐ์กด ํ‹€์„ โ€œ์‹œ์—ฐ โ†’ ๋ชฉํ‘œ ์ถ”์ถœ โ†’ RL ํ•™์Šตโ€์œผ๋กœ ๋ฐ”๊พธ์–ด ์„ฑ๋Šฅ๊ณผ ๋ฒ”์šฉ์„ฑ์„ ๋ชจ๋‘ ์–ป์€ ๊ฒƒ์ด๋ฉฐ, ์ด๋Š” ๋กœ๋ด‡ ํ•™์Šต ์ปค๋ฎค๋‹ˆํ‹ฐ์— ์ƒˆ๋กœ์šด ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, Human2Sim2Robot์ด ํŠน๋ณ„ํ•œ ์žฅ๋น„์— ์˜์กดํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ์‹ค์šฉ์  ๊ฐ•์ ๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ณผ๊ฑฐ์—๋Š” ๋ชจ์…˜ ์บก์ณ ์‹œ์Šคํ…œ์ด๋‚˜ ํŠน์ˆ˜ ์„ผ์„œ ์žฅ๊ฐ‘ ๋“ฑ ์ •๋ฐ€ํ•œ ์žฅ๋น„๋กœ ์‚ฌ๋žŒ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณค ํ–ˆ์ง€๋งŒ, ๋ณธ ๋…ผ๋ฌธ์€ ๊ทธ๋ƒฅ RGB-D ์นด๋ฉ”๋ผ๋กœ ์ดฌ์˜ํ•œ ์˜์ƒ๋งŒ์œผ๋กœ๋„ ์ถฉ๋ถ„ํžˆ ํ•™์Šต์ด ๊ฐ€๋Šฅํ•จ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋น„์šฉ์„ ํฌ๊ฒŒ ๋‚ฎ์ถ”๊ณ , ๋น„์ „๋ฌธ๊ฐ€๋„ ๋กœ๋ด‡ ํ•™์Šต์— ์ฐธ์—ฌํ•  ์ˆ˜ ์žˆ๋Š” ๊ธธ์„ ์—ด์–ด์ค๋‹ˆ๋‹ค. ๋˜ํ•œ ์‹œ์—ฐ ์˜์ƒ์„ ํ†ตํ•œ ํ•™์Šต์ด ์„ฑ๊ณตํ•˜๋ ค๋ฉด ์ปดํ“จํ„ฐ๋น„์ „ ๊ธฐ์ˆ  (๋ฌผ์ฒด ์ถ”์ , ์† ์ถ”์ )์ด ํ•„์ˆ˜์ ์ธ๋ฐ, ์ตœ๊ทผ ๋ช‡ ๋…„๊ฐ„ ํ•ด๋‹น ๋ถ„์•ผ๊ฐ€ ํฌ๊ฒŒ ๋ฐœ์ „ํ–ˆ๊ธฐ์— (SAM, FoundationPose, HaMeR ๋“ฑ) ๊ฐ€๋Šฅํ•ด์ง„ ๊ฒƒ์ด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. Human2Sim2Robot์€ ์ตœ์‹  CV ๊ธฐ์ˆ ๊ณผ RL์„ๅทงๅฆ™ํ•˜๊ฒŒ ๊ฒฐํ•ฉํ•˜์—ฌ ์–ป์€ ๊ฒฐ๊ณผ๋กœ, ์„œ๋กœ ๋‹ค๋ฅธ AI ํ•˜์œ„ ๋ถ„์•ผ์˜ ์‹œ๋„ˆ์ง€๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ์‚ฌ๋ก€๋ผ๊ณ ๋„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2.4 ๊ธฐ์—ฌ ๋ฐ ์˜์˜: ๋กœ๋ด‡๊ณตํ•™๊ณผ ๊ฐ•ํ™”ํ•™์Šต ๋ถ„์•ผ์—์„œ์˜ ๊ฐ€๋Šฅ์„ฑ

Human2Sim2Robot์˜ ๊ธฐ์—ฌ๋Š” ์—ฌ๋Ÿฌ ์ธก๋ฉด์—์„œ ์ฃผ๋ชฉํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค. ์šฐ์„ , ๋กœ๋ด‡ ํ•™์Šต ๋ฐฉ์‹์˜ ๊ฐ„์†Œํ™”์™€ ์ธ๊ฐ„ ์นœํ™”์  ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์ž…๋‹ˆ๋‹ค. ์˜ค์ง ํ•˜๋‚˜์˜ ์‹œ์—ฐ ์˜์ƒ์œผ๋กœ ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡์†์˜ ๋ณต์žกํ•œ ์กฐ์ž‘์„ ์ตํž ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์€, ๋กœ๋ด‡์—๊ฒŒ ์ƒˆ ๊ธฐ์ˆ ์„ ๊ฐ€๋ฅด์น˜๋Š” ์ง„์ž…์žฅ๋ฒฝ์„ ํฌ๊ฒŒ ๋‚ฎ์ถฅ๋‹ˆ๋‹ค. ์ด์ œ๊นŒ์ง€๋Š” ์ „๋ฌธ๊ฐ€๊ฐ€ ๊ธด ์‹œ๊ฐ„ ๊ณต๋“ค์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์•„์•ผ ํ–ˆ๋‹ค๋ฉด, ์•ž์œผ๋กœ๋Š” ์ผ๋ฐ˜ ์‚ฌ๋žŒ์ด ํœด๋Œ€ํฐ์œผ๋กœ ์‹œ๋ฒ”์„ ํ•˜๋‚˜ ๋ณด์—ฌ์ฃผ๊ณ ๋„ ๋กœ๋ด‡์„ ํ•™์Šต์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋‚˜์•„๊ฐˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡์˜ ํ•™์Šต ๋น„์šฉ ์ ˆ๊ฐ๊ณผ ์ ์‘๋ ฅ ํ–ฅ์ƒ์œผ๋กœ ์ด์–ด์ ธ, ๊ฐ€์ •์šฉ ์„œ๋น„์Šค ๋กœ๋ด‡์ด๋‚˜ ์ž‘์—…์žฅ ํ˜‘๋™ ๋กœ๋ด‡ ๋“ฑ์—์„œ ์ƒˆ๋กœ์šด ์ž‘์—…์„ ๋น ๋ฅด๊ฒŒ ๊ฐ€๋ฅด์น˜๋Š” ๋ฐ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ง‘์•ˆ์ผ์ฒ˜๋Ÿผ ์‚ฌ๋žŒ์€ ์‰ฝ๊ฒŒ ์‹œ์—ฐํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ๋กœ๋ด‡์— ์ผ์ผ์ด ํ”„๋กœ๊ทธ๋ž˜๋ฐํ•˜๊ธฐ ์–ด๋ ค์šด ์ž‘์—…๋“ค(์˜ˆ: ์‹๊ธฐ ์„ธ์ฒ™๊ธฐ ์ ์žฌ, ์˜ท ๊ฐœ์–ด๋„ฃ๊ธฐ ๋“ฑ)์— ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์ด ์‹œ์—ฐํ•œ ์˜์ƒ์„ ํ†ตํ•ด ๋กœ๋ด‡์ด ์ž์œจ์ ์œผ๋กœ ๊ทธ ๊ณผ์—…์„ ํ„ฐ๋“ํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด, ๋กœ๋ด‡ ํ™œ์šฉ ๋ฒ”์œ„๋Š” ๋น„์•ฝ์ ์œผ๋กœ ๋„“์–ด์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋‘˜์งธ๋กœ, ์ด ๋…ผ๋ฌธ์€ ๊ฐ•ํ™”ํ•™์Šต๊ณผ ๋ชจ๋ฐฉํ•™์Šต์˜ ์žฅ์ ์„ ๊ฒฐํ•ฉํ•œ ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์—๋Š” ์‹œ์—ฐ์„ ์ด์šฉํ•˜๋ฉด ์ฃผ๋กœ BC๊ฐ™์€ ๋ชจ๋ฐฉํ•™์Šต์„ ํ•˜๊ณ , ๊ฐ•ํ™”ํ•™์Šต์€ ๋ณ„๋„๋กœ ๋ฐฉ๋Œ€ํ•œ ์ƒํ˜ธ์ž‘์šฉ์„ ํ†ตํ•ด ๋ฐฐ์šฐ๋Š” ์‹์ด์—ˆ์Šต๋‹ˆ๋‹ค. Human2Sim2Robot์€ ์‹œๆผ”์œผ๋กœ๋ถ€ํ„ฐ ๋ณด์ƒ๊ณผ ์ดˆ๊ธฐ์กฐ๊ฑด์„ ๊ตฌ์„ฑํ•˜์—ฌ RL์— ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋…น์—ฌ๋ƒ„์œผ๋กœ์จ, ์ ์€ ์‹œ์—ฐ๋ฐ์ดํ„ฐ + ๊ฐ•ํ™”ํ•™์Šต์˜ ๊ฐ•์ธํ•จ์ด๋ผ๋Š” ๋‘ ๋งˆ๋ฆฌ ํ† ๋ผ๋ฅผ ์žก์•˜์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ฐ•ํ™”ํ•™์Šต ๋ถ„์•ผ์—์„œ๋„ ํฅ๋ฏธ๋กœ์šด ์„ฑ๊ณผ๋กœ, ํ–ฅํ›„ ๋‹ค๋ฅธ ํ˜•ํƒœ์˜ ์ธ๊ฐ„ ํžŒํŠธ(์˜ˆ: ์–ธ์–ด์„ค๋ช…, ์‹œ์—ฐ ๋ช‡ ๊ฐœ ๋“ฑ)๋ฅผ ๋ณด์ƒ ์„ค๊ณ„๋‚˜ ํƒ์ƒ‰ ๊ฐ€์ด๋“œ๋กœ ํ™œ์šฉํ•˜๋Š” ์—ฐ๊ตฌ๋“ค์— ์˜๊ฐ์„ ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ณด์ƒ ์—”์ง€๋‹ˆ์–ด๋ง ์—†์ด ์‹œ์—ฐ์œผ๋กœ ๊ณผ์—…์„ ๋ช…์„ธํ•˜๋Š” ๊ธฐ๋ฒ•์€, ๋ณด์ƒ ์„ค๊ณ„๊ฐ€ ๋‚œํ•ดํ•œ ๋ฌธ์ œ๋“ค(์˜ˆ: ์ฐฝ์˜์  ๋™์ž‘, ์‚ฌํšŒ์  ์ƒํ˜ธ์ž‘์šฉ ๋“ฑ)์„ ํ’€ ๋•Œ ์œ ์šฉํ•œ ๋ฐฉํ–ฅ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์…‹์งธ, ์‹ค์„ธ๊ณ„ ๋ณต์žกํ•œ ์ž‘์—…์—์„œ์˜ ์„ฑ๊ณต์  Sim-to-Real์„ ์‹œ์—ฐํ•ด ๋ณด์˜€๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ํŠนํžˆ ๋‹ค์ˆ˜์˜ ๋น„๊ฐ„๋‹จํ•œ ์กฐ์ž‘(๋น„ํŒŒ์ง€, ํ™˜๊ฒฝ ํ™œ์šฉ)๊ณผ ๋‹ค๋‹จ๊ณ„ ์ž‘์—…์„ ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๋ชจ๋‘ ํ•ด๊ฒฐํ•œ ๊ฒƒ์€ ๋†€๋ผ์šด ๊ฒฐ๊ณผ์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡์ด ๋‹จ์ˆœ ์žก๊ธฐ๋ฟ ์•„๋‹ˆ๋ผ ๋ฒฝ์„ ํ™œ์šฉํ•ด ๋ฌผ์ฒด๋ฅผ ์„ธ์šฐ๊ณ , ์—ฌ๋Ÿฌ ๋™์ž‘์„ ์—ฐ๋‹ฌ์•„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ˆ˜์ค€๊นŒ์ง€ ๋„๋‹ฌํ•œ ๊ฒƒ์€, ๋ฒ”์šฉ์ ์ธ ์กฐ์ž‘ ๋Šฅ๋ ฅ์— ํ•œ ๊ฑธ์Œ ๋‹ค๊ฐ€๊ฐ„ ๊ฒƒ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํ–ฅํ›„ ๋กœ๋ด‡์ด ์‚ฌ๋žŒ๊ณผ ๊ฐ™์ด ์ฃผ๋ณ€ ํ™˜๊ฒฝ์„ ํ™œ์šฉํ•˜๊ณ , ์—ฐ์†๋œ ์—…๋ฌด๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ณตํ•ฉ ์Šคํ‚ฌ ํ•™์Šต์—๋„ ๋ณธ ๋ฐฉ๋ฒ•์„ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ ๋…ผ๋ฌธ์—์„œ๋„ โ€œ์ฃผ์ „์ž๋กœ ์•ก์ฒด ๋ถ“๊ธฐ, ์ƒ์ž๋ฅผ ๋ฒฝ์— ๊ธฐ๋Œ€ ๊ธฐ์šธ์ด๊ธฐ, ์ ‘์‹œ๋ฅผ ๊ฑด์กฐ๋Œ€์— ๊ฝ‚๊ธฐโ€ ๋“ฑ ๋‹ค์–‘ํ•œ ์‹ค์ œ ๊ณผ์—…์„ ์˜ˆ๋กœ ๋“ค๋ฉฐ, Human2Sim2Robot ์ •์ฑ…์˜ ๋ฒ”์šฉ์  ์‹คํ–‰ ๋Šฅ๋ ฅ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์„ฑ๊ณผ๋Š” ๋กœ๋ด‡๊ณตํ•™ ์ปค๋ฎค๋‹ˆํ‹ฐ์— Sim-to-Real ๊ฐ•ํ™”ํ•™์Šต์˜ ๊ฐ€๋Šฅ์„ฑ์„ ํ•œ์ธต ํ™•์‹ ์‹œ์ผœ์ค๋‹ˆ๋‹ค. ๊ณผ๊ฑฐ์—๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ๋ฐฐ์šด ๋ณต์žกํ•œ ๋‹ค์ง€ ๋™์ž‘์ด ์‹ค์ œ์—์„œ ๊ณผ์—ฐ ๋ ๊นŒ ํšŒ์˜์ ์ด์—ˆ์œผ๋‚˜, ์ด ๋…ผ๋ฌธ์€ ์ ์ ˆํ•œ ๋ฐฉ๋ฒ•์„ ์“ฐ๋ฉด ๊ฐ€๋Šฅํ•จ์„ ๋ณด์—ฌ์ค€ ๊ฒƒ์ด์ฃ .

๋„ท์งธ, Human2Sim2Robot์€ ๋กœ๋ด‡์˜ ์ฒดํ™”(embodiment)๋ฅผ ์ ๊ทน ๊ณ ๋ คํ•œ ํ•™์Šต์˜ ์ค‘์š”์„ฑ์„ ๋ถ€๊ฐ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์“ฐ๋ฉด์„œ๋„ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ์›€์ง์ด๊ฒŒ ํ•˜์ง€ ์•Š๊ณ , ๋กœ๋ด‡ ๊ณ ์œ ์˜ ํ•ด๊ฒฐ์ฑ…์„ ์ฐพ๊ฒŒ ํ•œ ๊ฒƒ์ด ์ฃผํšจํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋‹ค๋ฅธ ํ˜•ํƒœ์˜ ๋กœ๋ด‡ (์˜ˆ: ๋‹ค๋ฆฌ๊ฐ€ ์žˆ๋Š” ๋กœ๋ด‡ vs ์‚ฌ๋žŒ ๊ฑท๊ธฐ ์˜์ƒ) ๊ฐ„์—๋„ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ์ผ๋ฐ˜ ๊ฐœ๋…์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ธ๊ฐ„์˜ ๊ฑท๋Š” ์˜์ƒ์„ ๋„ค ๋ฐœ ๋กœ๋ด‡์— ๊ฐ€๋ฅด์นœ๋‹ค๋ฉด, ๋‹ค๋ฆฌ๋ฅผ ๋‘ ๊ฐœ๋งŒ ์“ฐ๋Š” ๋Œ€์‹  ๋„ค ๊ฐœ๋ฅผ ๋‹ค ์‚ฌ์šฉํ•˜๋„๋ก ์œ ๋„ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์‘์šฉํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, Cross-Embodiment Learning์˜ ํ•œ ์‚ฌ๋ก€๋กœ์„œ, ์ด ๋…ผ๋ฌธ์€ ์‹œ์—ฐ ํ–‰๋™์˜ ๊ฒฐ๊ณผ(๋ชฉํ‘œ)์— ์ง‘์ค‘ํ•˜๊ณ  ๊ตฌ์ฒด์  ๊ตฌํ˜„์€ ๋กœ๋ด‡์—๊ฒŒ ๋งก๊ธฐ๋Š” ์ ‘๊ทผ์ด ์„ฑ๊ณผ๊ฐ€ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

๋ฌผ๋ก  ํ•œ๊ณ„์™€ ํ–ฅํ›„ ๊ณผ์ œ๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ๋กœ, ํ˜„์žฌ ๋ฐฉ๋ฒ•์€ ๋‹จ์ผ ๋กœ๋ด‡ ์†, ๋‹จ์ผ ์ธ๊ฐ„ ์‹œ์—ฐ, ๋‹จ์ผ ์ž‘์—…์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ ํ–ฅํ›„ ์—ฐ๊ตฌ๋กœ ์–‘์† ์กฐ์ž‘(bimanual)์ด๋‚˜ ์—ฌ๋Ÿฌ ๋กœ๋ด‡์ด ํ˜‘๋ ฅํ•˜๋Š” ๊ฒฝ์šฐ, ํ˜น์€ ์—ฌ๋Ÿฌ ์ž‘์—…์„ ํ•œ๊บผ๋ฒˆ์— ํ•™์Šตํ•˜๋Š” ๋ฉ€ํ‹ฐํƒœ์Šคํ‚น ํ™•์žฅ ๋“ฑ์„ ์–ธ๊ธ‰ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ•œ ๊ฐœ ์‹œ์—ฐ์œผ๋กœ ์—ฌ๋Ÿฌ ์Šคํ‚ฌ์„ ๋ฐฐ์šฐ๊ฒŒ ํ•˜๊ฑฐ๋‚˜, ๋‘ ์†์„ ๋™์‹œ์— ์ œ์–ดํ•˜๋Š” ๋ฌธ์ œ๋Š” ๋‚œ์ด๋„๊ฐ€ ๋”์šฑ ๋†’์ง€๋งŒ, Human2Sim2Robot์˜ ์•„์ด๋””์–ด๋ฅผ ํ™•์žฅํ•ด๋‚˜๊ฐˆ ์ˆ˜ ์žˆ๋Š” ํฅ๋ฏธ๋กœ์šด ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค. ๋‘˜์งธ, ์‹œ์—ฐ ์˜์ƒ ์ฒ˜๋ฆฌ์˜ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ์ „์ ์œผ๋กœ ๋น„๋””์˜ค์—์„œ ์ถ”์ถœํ•œ ๋ฌผ์ฒด/์† ํฌ์ฆˆ์— ์˜์กดํ•˜๋ฏ€๋กœ, ๋งŒ์•ฝ ๋น„๋””์˜ค ํ’ˆ์งˆ์ด ๋‚ฎ๊ฑฐ๋‚˜ ๋ฌผ์ฒด ์ถ”์ ์ด ์‹คํŒจํ•˜๋ฉด ํ•™์Šต์— ์ง€์žฅ์ด ์ƒ๊น๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ €์ž๋“ค์€ ์‹œ์—ฐ ์˜์ƒ์—์„œ ๋ฌผ์ฒด๋‚˜ ์†์ด ํฌ๊ฒŒ ๊ฐ€๋ ค์ ธ ์ถ”์ ์ด ์‹คํŒจํ•˜๋ฉด ์ •์ฑ…์ด ์—‰๋šฑํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ์ˆ˜๋ ดํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ๋ณด๊ณ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ํ•œ๊ณ„๋กœ ์ธํ•œ ์‹คํŒจ ๋ชจ๋“œ๋กœ, ํ–ฅํ›„ ๋ฉ€ํ‹ฐ๋ทฐ ์นด๋ฉ”๋ผ ์‚ฌ์šฉ์ด๋‚˜, ์‚ฌ๋žŒ์ด ๋ถ€๋ถ„ ๊ต์ •ํ•ด์ฃผ๋Š” ์ธํ„ฐํŽ˜์ด์Šค ๋“ฑ์œผ๋กœ ๊ฐœ์„ ๋  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์…‹์งธ, ์‚ฌ์ „ ์Šค์บ”๊ณผ ๋ชจ๋ธ ์ค€๋น„์— ์•ฝ๊ฐ„์˜ ์ˆ˜์ž‘์—…์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฒˆ ์—ฐ๊ตฌ์—์„œ๋Š” ๋ฌผ์ฒด์™€ ํ™˜๊ฒฝ์„ 3D ์Šค์บ”ํ•˜๊ณ , ๋˜ ๋ฌผ์ฒด ๋ฉ”์‰ฌ๋ฅผ ์ค€๋น„ํ•˜์—ฌ ํฌ์ฆˆ ์ถ”์ ์— ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ณผ์ •์€ ์˜ˆ์ปจ๋Œ€ ๊ฐ€์ •์ง‘ ๋กœ๋ด‡์ด ์ผ์ผ์ด ํ•˜๊ธฐ์—๋Š” ๋ฒˆ๊ฑฐ๋กœ์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ํ˜„์žฌ 3D ์Šค์บ๋‹ ๊ธฐ์ˆ ๋„ ์ž๋™ํ™”๊ฐ€ ๋ฐœ์ „ ์ค‘์ด๊ณ , ๋ฒ”์šฉ ๊ฐ์ฒด ์ธ์‹ ๋ชจ๋ธ์ด ๋” ์ข‹์•„์ง€๋ฉด ํ•„์ˆ˜ ์š”๊ฑด์ด ์™„ํ™”๋  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋์œผ๋กœ, ์‹คํ—˜ ๋ฒ”์œ„๋กœ ๋ณด์ž๋ฉด ๋‹ค๋ฃฌ ๋ฌผ์ฒด๋“ค์ด ๋น„๊ต์  ๋‹จ๋‹จํ•˜๊ณ  ํ•˜๋‚˜์˜ ๋ถ€ํ”ผ๋ฅผ ๊ฐ€์ง„ ๊ฒƒ๋“ค์ด์—ˆ์Šต๋‹ˆ๋‹ค. ์˜ท๊ฐ์ด๋‚˜ ์•ก์ฒด, ๊ด€์ ˆ ์žˆ๋Š” ๋„๊ตฌ ๋“ฑ ๋ณ€ํ˜•์ฒด๋‚˜ ๋ณตํ•ฉ ๋ฌผ์ฒด์— ๋Œ€ํ•ด์„œ๋„ ์ด ์ ‘๊ทผ์ด ์œ ํšจํ• ์ง€๋Š” ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ํ–ฅํ›„ ๊ณผ์ œ๋กœ ๋ณ€ํ˜• ๋˜๋Š” ๊ด€์ ˆ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ ๋ฌผ์ฒด๋กœ์˜ ํ™•์žฅ์„ ์–ธ๊ธ‰ํ•˜๋ฉฐ, ์ด๋Š” ์ถ”ํ›„ ์ด ๋ฐฉ๋ฒ•์˜ ์ ์šฉ ๋ฒ”์œ„๋ฅผ ๋„“ํ˜€ ์ค„ ๊ฒƒ์ด๋ผ๊ณ  ์ „๋งํ•ฉ๋‹ˆ๋‹ค.

์š”์•ฝ ๋ฐ ๊ฒฐ๋ก : โ€œํ•œ ๋ฒˆ์˜ ์ธ๊ฐ„ ์‹œ์—ฐ์œผ๋กœ Sim-to-Real RLโ€์ด๋ผ๋Š” Human2Sim2Robot์˜ ๊ฐœ๋…์€, ๋กœ๋ด‡ ํ•™์Šต ๋ถ„์•ผ์— ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•œ ์ค‘์š”ํ•œ ์„ฑ๊ณผ์ž…๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด ์šฐ๋ฆฌ๋Š” ์ธ๊ฐ„์˜ ์‹œ์—ฐ์„ ๋กœ๋ด‡ ํ•™์Šต์— ํ™œ์šฉํ•˜๋Š” ๋”์šฑ ๋˜‘๋˜‘ํ•œ ๋ฐฉ๋ฒ•์„ ๋ณด์•˜์Šต๋‹ˆ๋‹ค. ๊ณผ๊ฑฐ์ฒ˜๋Ÿผ ๋ฌด์กฐ๊ฑด ๋”ฐ๋ผํ•˜๊ฒŒ ํ•˜์ง€ ์•Š๊ณ , ์ธ๊ฐ„ ์‹œ์—ฐ์„ ๋ถ„์„ํ•ด ๋กœ๋ด‡์ด ์ดํ•ดํ•  ํ˜•ํƒœ์˜ ๊ณผ์ œ๋กœ ์ •์˜ํ•ด์ฃผ๋‹ˆ, ๋กœ๋ด‡์€ ์ž๊ธฐ ๋ชธ์— ๋งž์ถฐ ๊ทธ ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ•  ๋ฐฉ๋ฒ•์„ ์Šค์Šค๋กœ ํ„ฐ๋“ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ์ ์€ ๋ฐ์ดํ„ฐ๋กœ๋„ ๋†’์€ ์„ฑ๋Šฅ์„ ๋‚ด๊ณ , ๋ณต์žกํ•œ ์‹ค์ œ ์ž‘์—…๊นŒ์ง€ ์‹คํ–‰์— ์˜ฎ๊ธธ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ ‘๊ทผ์€ ํ–ฅํ›„ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ”Œ๋žซํผ๊ณผ ์ž‘์—…๋“ค์— ์‘์šฉ๋  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋ฉฐ, ๋กœ๋ด‡์ด ์‚ฌ๋žŒ์—๊ฒŒ์„œ ๋ฐฐ์šฐ๋Š” ์ž์—ฐ์Šค๋Ÿฌ์šด ์ƒํ˜ธ์ž‘์šฉ์˜ ํ† ๋Œ€๋ฅผ ๋งˆ๋ จํ•ด์ค๋‹ˆ๋‹ค. Human2Sim2Robot์€ ์ธ๊ฐ„-๋กœ๋ด‡ ํ˜‘๋ ฅ์˜ ๊ฐ„๊ทน์„ ํ•œ์ธต ์ขํžŒ ํ˜์‹ ์œผ๋กœ์„œ, ๊ฐ•ํ™”ํ•™์Šต๊ณผ ๋กœ๋ด‡๊ณตํ•™ ๋ฐœ์ „์˜ ๊ต์ฐจ์ ์—์„œ ํฐ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง€๋ฉฐ, ํ–ฅํ›„ ๋งŽ์€ ํ›„์† ์—ฐ๊ตฌ๋ฅผ ์ด‰๋ฐœํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

Copyright 2024, Jung Yeon Lee