Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • ๐Ÿ” Ping Review
  • ๐Ÿ”” Ring Review
    • 1. ์™œ ์ด ์—ฐ๊ตฌ๊ฐ€ ์ค‘์š”ํ• ๊นŒ?
      • ๋กœ๋ด‡์˜ ์˜์›ํ•œ ์ˆ™์ œ: In-Hand Manipulation
      • ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์˜ ํ•œ๊ณ„
    • 2. AnyRotate๋Š” ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ• ๊นŒ?
      • ์‹œ์Šคํ…œ ๊ตฌ์„ฑ: ๋กœ๋ด‡ ์† + ์ด‰๊ฐ ์„ผ์„œ
      • ํ•™์Šต ์ „๋žต: 2๋‹จ๊ณ„ ์ ‘๊ทผ๋ฒ•
      • ํ•ต์‹ฌ ์•„์ด๋””์–ด: ๋ณด์กฐ ๋ชฉํ‘œ(Auxiliary Goal)
      • ์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ: ๋‹จ๊ณ„์  ํ•™์Šต
    • 3. ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ ํ‘œํ˜„: ๊ฒŒ์ž„ ์ฒด์ธ์ €
      • ๊ธฐ์กด ์ด‰๊ฐ ํ‘œํ˜„๋“ค
      • AnyRotate์˜ ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ (Dense Touch)
      • Sim-to-Real ์ „์ด: ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ˜„์‹ค๋กœ
    • 4. ์‹คํ—˜ ๊ฒฐ๊ณผ: ์ˆซ์ž๊ฐ€ ๋งํ•ด์ฃผ๋Š” ์„ฑ๋Šฅ
      • ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์‹คํ—˜: ์ด‰๊ฐ ์ •๋ณด์˜ ์ค‘์š”์„ฑ
      • ๋ณด์กฐ ๋ชฉํ‘œ์˜ ํšจ๊ณผ
      • ์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜: ์ง„์งœ ์„ธ๊ณ„์—์„œ์˜ ๋„์ „
      • ์ด‰๊ฐ ์„ผ์„œ ๋ถ„์„: ๋กœ๋ด‡์ด โ€˜๋А๋ผ๋Š”โ€™ ๊ฒƒ
      • ๊ถ๊ทน์˜ ํ…Œ์ŠคํŠธ: ํšŒ์ „ํ•˜๋Š” ์†
    • 5. ๊ธฐ์ˆ ์  ๊นŠ์ด ํŒŒ๊ณ ๋“ค๊ธฐ
      • ๋ณด์ƒ ํ•จ์ˆ˜ ํ•ด๋ถ€
      • ๋„คํŠธ์›Œํฌ ์•„ํ‚คํ…์ฒ˜ ์ƒ์„ธ
      • ์‹œ์Šคํ…œ ์‹๋ณ„: ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ˜„์‹ค๊ณผ ๋งž์ถ”๊ธฐ
      • ๋„๋ฉ”์ธ ๋ฌด์ž‘์œ„ํ™”: ๋‹ค์–‘์„ฑ์ด ๋‹ต์ด๋‹ค
      • ์‹ค์‹œ๊ฐ„ ์ œ์–ด ํŒŒ์ดํ”„๋ผ์ธ
    • 6. ๋น„๊ต ๋ถ„์„: ๊ธฐ์กด ์—ฐ๊ตฌ์™€ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅธ๊ฐ€?
      • OpenAI์˜ โ€œSolving Rubikโ€™s Cube with a Robot Handโ€ (2019)์™€ ๋น„๊ต
      • ์ตœ๊ทผ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ๋“ค๊ณผ ๋น„๊ต
      • Sievers et al. (2022) - ํ† ํฌ ์ œ์–ด ์ˆœ์ˆ˜ ์ด‰๊ฐ
    • 7. ์ด๋ก ์  ๊ด€์ : ์™œ ์ด๊ฒŒ ์ž‘๋™ํ•˜๋Š”๊ฐ€?
      • ์ •๋ณด ์ด๋ก ์œผ๋กœ ๋ฐ”๋ผ๋ณด๊ธฐ
      • POMDP ๊ด€์ 
      • ์ ‘์ด‰ ์—ญํ•™์˜ ๊ด€์ 
      • ๊ฐ•ํ™”ํ•™์Šต ๊ด€์ : ํƒ์ƒ‰์˜ ์–ด๋ ค์›€
      • ์ฐฝ๋ฐœ์  ํ–‰๋™: ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€
    • 8. ํ•œ๊ณ„์ ๊ณผ ๊ฐœ์„  ๋ฐฉํ–ฅ
      • ๋ฌผ์ฒด ํ˜•์ƒ์˜ ๊นŒ๋‹ค๋กœ์›€
      • ํ•˜๋“œ์›จ์–ด์˜ ๋ฌผ๋ฆฌ์  ํ•œ๊ณ„
      • ํšŒ์ „์„ ๋„˜์–ด์„œ: ๋” ๋ณต์žกํ•œ ์ž‘์—…๋“ค
      • ๋ณ€ํ˜•๋˜๋Š” ๋ฌผ์ฒด๋“ค
      • ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค์˜ ๊ฐ„๊ทน
      • ํ•™์Šต ๋น„์šฉ์˜ ํ˜„์‹ค
      • ํ‰๊ฐ€์˜ ์–ด๋ ค์›€
  • โ›๏ธ Dig Review
    • AnyRotate ๋…ผ๋ฌธ ๊ฐœ์š” ๋ฐ ์‹œ์Šคํ…œ ๊ตฌ์กฐ
    • ์ด‰๊ฐ ์„ผ์„œ ๋ฐ์ดํ„ฐ์˜ ํ‘œํ˜„๊ณผ ์ •์ฑ…์—์„œ์˜ ํ™œ์šฉ
    • ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ตฌํ˜„๊ณผ ๋„๋ฉ”์ธ ์ ์‘
    • Observation Model์„ ํ†ตํ•œ ์‹œ๋ฎฌ-์‹ค์ œ ์ „์ด
    • ๊ต์‚ฌ-ํ•™์ƒ ์ •์ฑ… ํ•™์Šต ํŒŒ์ดํ”„๋ผ์ธ
    • ์ด‰๊ฐ ๊ฐ์ง€ ๋ชจ๋ธ๋ง์˜ ํ˜์‹ ์„ฑ๊ณผ ๋„์ „ ๊ณผ์ œ

๐Ÿ“ƒAnyRotate ๋ฆฌ๋ทฐ

touch
in-hand
rotation
Gravity-Invariant In-Hand Object Rotation with Sim-to-Real Touch
Published

November 2, 2025

๐Ÿ” Ping. ๐Ÿ”” Ring. โ›๏ธ Dig. A tiered review series: quick look, key ideas, deep dive.

  • Paper Link
  • Project LInk
  1. โœ‹ ๋‹ค์ž์œ ๋„ ๋กœ๋ด‡ ์†์˜ ์ค‘๋ ฅ ๋ถˆ๋ณ€ ๋‹ค์ถ• ๋ฌผ์ฒด ํšŒ์ „(gravity-invariant multi-axis in-hand object rotation)์€ ์–ด๋ ค์šด ๊ณผ์ œ์ด๋ฉฐ, ๋ณธ ๋…ผ๋ฌธ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ํ™˜๊ฒฝ ์ œ๋กœ์ƒท ์ „ํ™˜์ด ๊ฐ€๋Šฅํ•œ ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ ์ •๋ณด(dense featured sim-to-real touch)๋ฅผ ํ™œ์šฉํ•˜๋Š” AnyRotate ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  2. ๐Ÿง  ์ด ์‹œ์Šคํ…œ์€ ๋ชฉํ‘œ ์กฐ๊ฑด ๊ฐ•ํ™” ํ•™์Šต๊ณผ ์ ‘์ด‰ ์ž์„ธ ๋ฐ ํž˜์„ ํฌํ•จํ•˜๋Š” ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ ํ‘œํ˜„(dense tactile representation)์„ ์‚ฌ์šฉํ•˜์—ฌ, ์ค‘๋ ฅ ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š๋Š” ์ž„์˜์˜ ํšŒ์ „ ์ถ•๊ณผ ๋‹ค์–‘ํ•œ ์† ๋ฐฉํ–ฅ์—์„œ ๋™์ž‘ํ•˜๋Š” ๋‹จ์ผ ์ •์ฑ…์„ ์„ฑ๊ณต์ ์œผ๋กœ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
  3. ๐Ÿš€ ์‹ค์ œ ์‹คํ—˜์—์„œ AnyRotate๋Š” ๋‹ค์–‘ํ•œ ์† ๋ฐฉํ–ฅ๊ณผ ํšŒ์ „ ์ถ•์—์„œ ๋ฏธ์ง€์˜ ๊ฐ์ฒด์— ๋Œ€ํ•œ ๊ฐ•๋ ฅํ•œ ๊ฐ•๊ฑด์„ฑ(robustness)์„ ์ž…์ฆํ–ˆ์œผ๋ฉฐ, ํ’๋ถ€ํ•œ ์ด‰๊ฐ ์ •๋ณด๋กœ ๋ถˆ์•ˆ์ •ํ•œ ํŒŒ์ง€(unstable grasp)๋ฅผ ๊ฐ์ง€ํ•˜๊ณ  ์ด๋ฅผ ๋ณต๊ตฌํ•˜๋Š” ์ž์œจ์  ํ–‰๋™(emergent behavior)์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ” Ping Review

๐Ÿ” Ping โ€” A light tap on the surface. Get the gist in seconds.

๋ณธ ๋…ผ๋ฌธ โ€œAnyRotate: Gravity-Invariant In-Hand Object Rotation with Sim-to-Real Touchโ€๋Š” ๋กœ๋ด‡ ์†์ด ๋‹ค์–‘ํ•œ ์†์˜ ์›€์ง์ž„ ์†์—์„œ๋„ ๋ฌผ์ฒด๋ฅผ ์กฐ์ž‘ํ•˜๋Š” ๋ฐ ์žˆ์–ด ์ค‘๋ ฅ ๋ถˆ๋ณ€(gravity-invariant)์˜ in-hand object rotation์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•œ ์‹œ์Šคํ…œ AnyRotate๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ๋น„์ „ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ์‹์€ self-occlusion๊ณผ ๊ฐ™์€ ๋ฌธ์ œ๋กœ ์ธํ•ด in-hand manipulation์— ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ์œผ๋ฉฐ, ์ด‰๊ฐ ์„ผ์„œ(tactile sensor)๋Š” ์ƒ์„ธํ•œ ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  sim-to-real gap์œผ๋กœ ์ธํ•ด ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ๋ฐ์ดํ„ฐ๊ฐ€ ์ถฉ๋ถ„ํžˆ ํ™œ์šฉ๋˜์ง€ ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด dense featured sim-to-real touch๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ›ˆ๋ จ๋œ policy๋ฅผ ์‹ค์ œ ๋กœ๋ด‡์— zero-shot transferํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก :

AnyRotate๋Š” multi-axis gravity-invariant in-hand object rotation์„ ์œ„ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํ•ต์‹ฌ ์š”์†Œ๋“ค์„ ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค.

  1. Goal-Conditioned Reinforcement Learning (RL) Formulation: ๋ฌผ์ฒด ํšŒ์ „ ๋ฌธ์ œ๋ฅผ ๋ฌผ์ฒด ์žฌ๋ฐฉํ–ฅ(object reorientation)์œผ๋กœ ์ •ํ˜•ํ™”ํ•˜๋ฉฐ, ํšŒ์ „ ์†๋„(angular velocity) ๊ธฐ๋ฐ˜์˜ ๋ชฉํ‘œ ์„ค์ •์ด ๋น„ํšจ์œจ์ ์ž„์„ ์ง€์ ํ•˜๊ณ , ๋ณด์กฐ ๋ชฉํ‘œ(auxiliary goals) ๋ฐฉ์‹์„ ๋„์ž…ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ณด์กฐ ๋ชฉํ‘œ๋Š” ํ˜„์žฌ ๋ฌผ์ฒด ์ž์„ธ(object orientation)๋ฅผ ์›ํ•˜๋Š” ํšŒ์ „ ์ถ•(rotation axis)์„ ์ค‘์‹ฌ์œผ๋กœ ์ผ์ •ํ•œ ๊ฐ„๊ฒฉ์œผ๋กœ ํšŒ์ „์‹œ์ผœ ์ƒˆ๋กœ์šด ๋ชฉํ‘œ ์ž์„ธ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. Policy๋Š” ์ด๋Ÿฌํ•œ ๋™์ ์ธ ๋ชฉํ‘œ ์ž์„ธ๋ฅผ ์ถ”์ข…ํ•˜๋„๋ก ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค. ๋ณด์ƒ ํ•จ์ˆ˜ r๋Š” ๋ฌผ์ฒด ํšŒ์ „(rotation), ์ ‘์ด‰(contact), ์•ˆ์ •์„ฑ(stability), ์ข…๋ฃŒ(termination)์˜ ๋„ค ๊ฐ€์ง€ ์š”์†Œ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. r = r_{\text{rotation}} + r_{\text{contact}} + r_{\text{stable}} + r_{\text{terminate}} r_{\text{rotation}}์€ ํ‚คํฌ์ธํŠธ(keypoint) ๊ฑฐ๋ฆฌ K(||k_o^i - k_g^i||)์™€ ํšŒ์ „ ๋ณด๋„ˆ์Šค(goal bonus)๋ฅผ ํ†ตํ•ด ๋ชฉํ‘œ ์ž์„ธ ๋„๋‹ฌ ๋ฐ ์—ฐ์†์ ์ธ ํšŒ์ „์„ ์žฅ๋ คํ•ฉ๋‹ˆ๋‹ค. r_{\text{contact}}๋Š” ์†๋(fingertip) ์ ‘์ด‰์„ ์ตœ๋Œ€ํ™”ํ•˜๊ณ  ๋‹ค๋ฅธ ๋ถ€์œ„์˜ ์ ‘์ด‰์„ ํŒจ๋„ํ‹ฐํ™”ํ•˜์—ฌ ์ •๋ฐ€ํ•œ ํŒŒ์ง€(precision grasp)๋ฅผ ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค. r_{\text{stable}}์€ ๋ฌผ์ฒด์˜ ๊ฐ์†๋„(angular velocity), ์† ์ž์„ธ(hand-pose), ์ œ์–ด๊ธฐ(controller)์˜ ์ž‘์—…๋Ÿ‰ ๋ฐ ํ† ํฌ(torque)๋ฅผ ํŒจ๋„ํ‹ฐํ™”ํ•˜์—ฌ ์•ˆ์ •์ ์ธ ํšŒ์ „์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ r_{\text{terminate}}๋Š” ๋ฌผ์ฒด๊ฐ€ ํŒŒ์ง€์—์„œ ๋ฒ—์–ด๋‚˜๊ฑฐ๋‚˜ ํšŒ์ „ ์ถ•์ด ๋ชฉํ‘œ์—์„œ ํฌ๊ฒŒ ๋ฒ—์–ด๋‚  ๊ฒฝ์šฐ ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€์—ฌํ•ฉ๋‹ˆ๋‹ค. ํ•™์Šต ๊ณผ์ •์˜ ํšจ์œจ์„ฑ์„ ์œ„ํ•ด, episode๋‹น ๋‹ฌ์„ฑ๋œ ํ‰๊ท  ํšŒ์ „ ํšŸ์ˆ˜์— ๋”ฐ๋ผ r_{\text{contact}}์™€ r_{\text{stable}}์— ๊ฐ€์ค‘์น˜ ๊ณ„์ˆ˜ \lambda_{\text{rew}}๋ฅผ ์„ ํ˜•์ ์œผ๋กœ ์ฆ๊ฐ€์‹œํ‚ค๋Š” ์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ(adaptive curriculum)์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.

  2. Dense Tactile Representation: ๋ฌผ์ฒด์™€์˜ ์ƒํ˜ธ์ž‘์šฉ์— ๋Œ€ํ•œ ํ’๋ถ€ํ•œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๊ธฐ ์œ„ํ•ด, ๊ตญ๋ถ€์ ์ธ ์ ‘์ด‰ ์ž์„ธ(local contact pose)์™€ ์ ‘์ด‰๋ ฅ(contact force)์œผ๋กœ ๊ตฌ์„ฑ๋œ dense tactile representation์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. Contact pose๋Š” ๊ทน๊ฐ(polar angle) R_x์™€ ๋ฐฉ์œ„๊ฐ(azimuthal angle) R_y๋กœ ์ •์˜๋˜๋ฉฐ, contact force๋Š” 3D ์ ‘์ด‰๋ ฅ์˜ ํฌ๊ธฐ ||F||๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์„ผ์„œ๋ฅผ ๊ฐ•์ฒด(rigid body)๋กœ ๊ทผ์‚ฌํ•˜์—ฌ ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์ง์ ‘ ๊ฐ€์ ธ์˜ค๊ณ , ์‹ค์ œ ์„ผ์„œ์˜ ์ง€์—ฐ๊ณผ ๋…ธ์ด์ฆˆ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ์œ„ํ•ด ์ ‘์ด‰๋ ฅ์— exponential moving average๋ฅผ ์ ์šฉํ•˜๊ณ  ๊ฐ’์„ ์‹ค์ œ ์„ผ์„œ์˜ ๋ฒ”์œ„์— ๋งž์ถฐ ํฌํ™”(saturate) ๋ฐ ์žฌ์กฐ์ •(rescale)ํ•ฉ๋‹ˆ๋‹ค.

  3. Sim-to-Real Policy Transfer: Policy ํ•™์Šต์€ ๋‘ ๋‹จ๊ณ„์˜ policy distillation ๋ฐฉ์‹์„ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค.

    • Teacher Training: ํŠน๊ถŒ ์ •๋ณด(privileged information, ์˜ˆ: ๋ฌผ์ฒด ์œ„์น˜, ์ž์„ธ, ์งˆ๋Ÿ‰, ์ค‘๋ ฅ ๋ฒกํ„ฐ ๋“ฑ)๊ฐ€ ์ œ๊ณต๋œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ RL (Proximal Policy Optimization, PPO)์„ ํ†ตํ•ด teacher policy๋ฅผ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
    • Student Training: ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ๊ด€์ธก ๊ฐ€๋Šฅํ•œ ์ •๋ณด(proprioception, ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ)๋งŒ์„ ์‚ฌ์šฉํ•˜๋Š” student policy๋ฅผ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. Student policy๋Š” teacher policy์™€ ๋™์ผํ•œ actor-critic architecture๋ฅผ ๊ฐ€์ง€๋ฉฐ, ๊ณผ๊ฑฐ N๊ฐœ์˜ ๊ด€์ธก ์‹œํ€€์Šค(sequence of observations)๋กœ๋ถ€ํ„ฐ TCN (Temporal Convolutional Network) encoder๋ฅผ ํ†ตํ•ด ์ €์ฐจ์› ์ž ์žฌ ๋ฒกํ„ฐ(latent vector) z_t๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค. Student๋Š” teacher์˜ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•˜๋„๋ก ์ง€๋„ ํ•™์Šต(supervised learning) ๋ฐฉ์‹์œผ๋กœ ํ›ˆ๋ จ๋˜๋ฉฐ, ์ด๋•Œ ์ž ์žฌ ๋ฒกํ„ฐ์™€ ํ–‰๋™ ๋ถ„ํฌ์— ๋Œ€ํ•œ MSE (Mean Squared Error) ๋ฐ NLL (Negative Log-Likelihood) ์†์‹ค์„ ์ตœ์†Œํ™”ํ•ฉ๋‹ˆ๋‹ค.
    • Tactile Perception Model: Zero-shot sim-to-real transfer๋ฅผ ์œ„ํ•ด, ์‹ค์ œ ์ด‰๊ฐ ์ด๋ฏธ์ง€์—์„œ dense contact feature๋ฅผ ์ถ”์ถœํ•˜๋Š” tactile perception model์„ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ UR5 ๋กœ๋ด‡ ํŒ”์— tactile sensor๋ฅผ ๋ถ€์ฐฉํ•˜๊ณ  force/torque sensor๊ฐ€ ๋ถ€์ฐฉ๋œ ์ž‘์—…๋Œ€ ํ‘œ๋ฉด์—์„œ ์„ผ์„œ๋ฅผ ๋ฌด์ž‘์œ„๋กœ ์›€์ง์ด๋ฉฐ ์ ‘์ด‰ ๊นŠ์ด(contact depth), ์ ‘์ด‰ ์ž์„ธ, ์ ‘์ด‰๋ ฅ์„ ๋ ˆ์ด๋ธ”๋กœ ํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ CNN ๊ธฐ๋ฐ˜์œผ๋กœ ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค. ์‹ค์ œ ๋ฐฐํฌ ์‹œ์—๋Š” SSIM (Structured Similarity Index)์„ ์‚ฌ์šฉํ•˜์—ฌ ์ด์ง„ ์ ‘์ด‰(binary contact)์„ ๊ณ„์‚ฐํ•˜๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ contact pose ๋ฐ contact force ์˜ˆ์ธก๊ฐ’์„ ๋งˆ์Šคํ‚น(masking)ํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜ ๋ฐ ๋ถ„์„:

์‹คํ—˜์€ Allegro Hand์— vision-based tactile sensor๋ฅผ ์žฅ์ฐฉํ•œ ๋กœ๋ด‡ ์‹œ์Šคํ…œ์—์„œ ์ˆ˜ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

  • ํ›ˆ๋ จ ์„ฑ๋Šฅ: ๋ณด์กฐ ๋ชฉํ‘œ(auxiliary goal)๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ œ์•ˆ๋œ formulation์ด angular rotation objective๋ณด๋‹ค multi-axis rotation ์ž‘์—…์—์„œ ํ›จ์”ฌ ๋†’์€ ์ •ํ™•๋„์™€ ์ˆ˜๋ ด ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํŠนํžˆ ๋ฌผ์ฒด๊ฐ€ ๋ณธ์งˆ์ ์œผ๋กœ ๋ถˆ์•ˆ์ •ํ•œ configuration์—์„œ ์ž‘์€ ๋žœ๋ค ์•ก์…˜์ด ํšŒ๋ณต ๋ถˆ๊ฐ€๋Šฅํ•œ ์ƒํƒœ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ๋Š” ์ƒํ™ฉ์—์„œ, ๋ชฉํ‘œ ์ง€ํ–ฅ์ ์ธ ๋ณด์ƒ์ด agent๋ฅผ ๋” ํšจ๊ณผ์ ์œผ๋กœ ์•ˆ๋‚ดํ–ˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ ๋˜ํ•œ ํ•™์Šต์— ๊ธ์ •์ ์ธ ์˜ํ–ฅ์„ ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.
  • ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฒฐ๊ณผ: Dense touch policy(contact pose ๋ฐ contact force)๋Š” proprioception, binary touch, discrete touch ๋“ฑ ๋” ๋‹จ์ˆœํ•˜๊ณ  ๋œ ์ƒ์„ธํ•œ ์ด‰๊ฐ ์ •๋ณด๋ฅผ ์‚ฌ์šฉํ•˜๋Š” policy๋“ค๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ƒ์„ธํ•œ ์ด‰๊ฐ ์ •๋ณด๊ฐ€ ๋‹ค์–‘ํ•œ mass ๋ฐ shape๋ฅผ ๊ฐ€์ง„ unseen objects๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ฐ ์ค‘์š”ํ•จ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
  • ์‹ค์ œ ํ™˜๊ฒฝ ๊ฒฐ๊ณผ: Dense touch policy๋Š” ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ 10๊ฐ€์ง€ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด์— ๋Œ€ํ•ด ์„ฑ๊ณต์ ์ธ zero-shot transfer๋ฅผ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ hand orientation(์† ๋ฐฉํ–ฅ) ๋ฐ rotation axis(ํšŒ์ „ ์ถ•)์—์„œ ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ robustness๋ฅผ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์†์ด ์ค‘๋ ฅ์— ๋Œ€ํ•ด ์ˆ˜ํ‰์œผ๋กœ ์œ„์น˜ํ•  ๋•Œ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ์žˆ์—ˆ์œผ๋‚˜, dense touch policy๋Š” ์ด๋Ÿฌํ•œ noisy system์—์„œ๋„ ์•ˆ์ •์ ์ธ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค.
  • Emergent Behavior: Rich tactile sensing์ด ๋ถˆ์•ˆ์ •ํ•œ ํŒŒ์ง€(unstable grasp)๋ฅผ ๊ฐ์ง€ํ•˜๊ณ , ๋ฌผ์ฒด ๋ฏธ๋„๋Ÿฌ์ง์„ ๋ฐฉ์ง€ํ•˜๋Š” ๋ฐ˜์‘์ ์ธ finger-gaiting ์›€์ง์ž„์„ ์œ ๋ฐœํ•˜๋Š” emergent behavior๋ฅผ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” proprioception์ด๋‚˜ binary touch๋งŒ์œผ๋กœ๋Š” ๊ด€์ฐฐ๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.
  • Gravity Invariance ๋ฐ Rotating Hand: ํ›ˆ๋ จ๋œ policy๋Š” ์ค‘๋ ฅ ๋ฒกํ„ฐ๊ฐ€ ์ง€์†์ ์œผ๋กœ ๋ณ€ํ•˜๋Š” ํšŒ์ „ํ•˜๋Š” ์†(rotating hand)์—์„œ๋„ ํšจ๊ณผ์ ์œผ๋กœ ๋ฌผ์ฒด ์กฐ์ž‘์— ์ ์‘ํ•  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฌผ์ฒด์˜ 6D ์žฌ๋ฐฉํ–ฅ๊ณผ ๋™์‹œ์— ํŒŒ์ง€ ์œ„์น˜๋ฅผ ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ์ˆ˜์ค€์˜ dexterity๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก  ๋ฐ ํ•œ๊ณ„:

๋ณธ ์—ฐ๊ตฌ๋Š” rich tactile sensing์„ ํ™œ์šฉํ•˜์—ฌ ์–ด๋–ค hand direction์—์„œ๋„ ์–ด๋–ค rotation axis๋กœ๋“  in-hand object rotation์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ผ๋ฐ˜์ ์ธ policy์˜ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” multi-fingered robot hand์˜ ์ด‰๊ฐ dexterity ๋ฐœ์ „์— ์ค‘์š”ํ•œ ์ง„์ „์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ๋‚ ์นด๋กœ์šด ๊ธฐํ•˜ํ•™์  ํŠน์ง•(sharp geometric features)์„ ๊ฐ€์ง„ ๋ฌผ์ฒด(์˜ˆ: ๋ชจ์„œ๋ฆฌ)๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ฐ ์–ด๋ ค์›€์ด ์žˆ์—ˆ์œผ๋ฉฐ, ์ด๋Š” ๋” ํ’๋ถ€ํ•œ ์ด‰๊ฐ ํ‘œํ˜„(tactile representation)์ด๋‚˜ ์‹œ๊ฐ ์ •๋ณด(visual information)๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ๊ฐœ์„ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, Allegro Hand์˜ actuation์ด ํŠน์ • ์† ๋ฐฉํ–ฅ์—์„œ ์•ฝํ™”๋˜๋Š” ํ•œ๊ณ„๋ฅผ ๋ณด์—ฌ, ํ–ฅํ›„ low-cost๋ฉด์„œ๋„ ๋” ๊ฐ•๋ ฅํ•œ ํ•˜๋“œ์›จ์–ด์˜ ๊ฐœ๋ฐœ์ด ํ•„์š”ํ•จ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”” Ring Review

๐Ÿ”” Ring โ€” An idea that echoes. Grasp the core and its value.

โ€œ๊ฑฐ๊พธ๋กœ ๋“ค์–ด๋„, ์˜†์œผ๋กœ ๋“ค์–ด๋„, ๋กœ๋ด‡ ์†์ด ๋ฌผ์ฒด๋ฅผ ์ž์œ ์ž์žฌ๋กœ ํšŒ์ „์‹œํ‚จ๋‹คโ€

์•ˆ๋…•ํ•˜์„ธ์š”! ์˜ค๋Š˜์€ ๋กœ๋ด‡ ์กฐ์ž‘ ๋ถ„์•ผ์—์„œ ์ •๋ง ํฅ๋ฏธ๋กœ์šด ๋…ผ๋ฌธ์„ ์†Œ๊ฐœํ•ด๋“œ๋ฆฌ๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. Bristol ๋Œ€ํ•™๊ต์˜ Nathan Lepora ๊ต์ˆ˜ ์—ฐ๊ตฌํŒ€์ด ๋ฐœํ‘œํ•œ AnyRotate๋ผ๋Š” ์‹œ์Šคํ…œ์ธ๋ฐ์š”, ์ œ๋ชฉ์—์„œ๋ถ€ํ„ฐ ์•ผ์‹ฌ์ฐจ๊ฒŒ๋„ โ€œGravity Invariantโ€(์ค‘๋ ฅ ๋ถˆ๋ณ€)๋ผ๋Š” ๋‹จ์–ด๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์—ฌ๋Ÿฌ๋ถ„, ์†๋ฐ”๋‹ฅ์„ ์œ„๋กœ ํ–ฅํ•œ ์ฑ„๋กœ ๊ณต์„ ๋Œ๋ฆฌ๋Š” ๊ฑด ์‰ฝ์ฃ ? ๊ทธ๋Ÿฐ๋ฐ ์†๋ฐ”๋‹ฅ์„ ์•„๋ž˜๋กœ ๋’ค์ง‘์€ ์ฑ„๋กœ ๊ณต์„ ๋–จ์–ด๋œจ๋ฆฌ์ง€ ์•Š๊ณ  ๊ณ„์† ๋Œ๋ฆด ์ˆ˜ ์žˆ๋‚˜์š”? ์‹ฌ์ง€์–ด ์†์„ ์˜†์œผ๋กœ ๋Œ๋ฆฌ๊ฑฐ๋‚˜ ๊ณ„์† ์›€์ง์ด๋ฉด์„œ์š”? ์‚ฌ๋žŒ๋„ ์–ด๋ ค์šด ์ด ๋™์ž‘์„, ๋กœ๋ด‡์ด ํ•ด๋‚ธ๋‹ค๋Š” ๊ฒ๋‹ˆ๋‹ค. ๊ทธ๊ฒƒ๋„ ์ฒ˜์Œ ๋ณด๋Š” ๋ฌผ์ฒด๋กœ ๋ง์ด์ฃ !


1. ์™œ ์ด ์—ฐ๊ตฌ๊ฐ€ ์ค‘์š”ํ• ๊นŒ?

๋กœ๋ด‡์˜ ์˜์›ํ•œ ์ˆ™์ œ: In-Hand Manipulation

๋กœ๋ด‡ ํŒ”์ด ๋ฌผ์ฒด๋ฅผ ์ง‘๋Š” ๊ฑด ์ด์ œ ์–ด๋А ์ •๋„ ํ•ด๊ฒฐ๋์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์† ์•ˆ์—์„œ ๋ฌผ์ฒด๋ฅผ ์ž์œ ๋กญ๊ฒŒ ์กฐ์ž‘ํ•˜๋Š” ๊ฒƒ(in-hand manipulation)์€ ์—ฌ์ „ํžˆ ์–ด๋ ค์šด ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์† ์•ˆ์—์„œ ์—ฐํ•„์„ ๋Œ๋ฆฌ๊ณ , ๋™์ „์„ ์†๊ฐ€๋ฝ์œผ๋กœ ๊ตด๋ฆฌ๊ณ , ๋ฃจ๋น…์Šค ํ๋ธŒ๋ฅผ ๋งž์ถ”์ฃ . ํ•˜์ง€๋งŒ ๋กœ๋ด‡์—๊ฒŒ ์ด๋Ÿฐ ์ผ์€ ์ •๋ง ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

์™œ ์–ด๋ ค์šธ๊นŒ์š”?

  1. ๋†’์€ ์ž์œ ๋„: ์‚ฌ๋žŒ ์†์€ 27๊ฐœ์˜ ๋ผˆ์™€ ์ˆ˜๋งŽ์€ ๊ด€์ ˆ๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡ ์†๋„ 16๊ฐœ ์ด์ƒ์˜ ๊ด€์ ˆ์„ ์ œ์–ดํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

  2. ๋ณต์žกํ•œ ๋ฌผ๋ฆฌ: ์†๊ฐ€๋ฝ๊ณผ ๋ฌผ์ฒด ์‚ฌ์ด์˜ ๋งˆ์ฐฐ, ๋ฏธ๋„๋Ÿฌ์ง, ์ ‘์ด‰ ๋“ฑ์„ ์ •ํ™•ํžˆ ์ดํ•ดํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

  3. ๋ถ€๋ถ„ ๊ด€์ธก: ์†์ด ๋ฌผ์ฒด๋ฅผ ๊ฐ€๋ฆฌ๊ธฐ ๋•Œ๋ฌธ์— ์นด๋ฉ”๋ผ๋กœ๋Š” ์ •ํ™•ํ•œ ์ƒํƒœ๋ฅผ ๋ณด๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

  4. ์ค‘๋ ฅ์˜ ๋ฐฉํ•ด: ์†์„ ๋’ค์ง‘์œผ๋ฉด ๋ฌผ์ฒด๊ฐ€ ๋–จ์–ด์ง€๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์˜ ํ•œ๊ณ„

OpenAI์˜ ๋ฃจ๋น…์Šค ํ๋ธŒ (2019)

  • ์ •๋ง ์ธ์ƒ์ ํ•œ ์„ฑ๊ณผ์˜€์ง€๋งŒโ€ฆ
  • ์—„์ฒญ๋‚œ ์ˆ˜์˜ ์นด๋ฉ”๋ผ๊ฐ€ ํ•„์š”ํ–ˆ์Šต๋‹ˆ๋‹ค (์ž๊ธฐ ํ์ƒ‰ ๋ฌธ์ œ)
  • ์†์€ ํ•ญ์ƒ ์œ„๋ฅผ ํ–ฅํ–ˆ์Šต๋‹ˆ๋‹ค
  • ํŠน์ • ๋ฌผ์ฒด(๋ฃจ๋น…์Šค ํ๋ธŒ)์—๋งŒ ์ž‘๋™ํ–ˆ์Šต๋‹ˆ๋‹ค

์ตœ๊ทผ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ๋“ค

  • ์ด์ง„ ์ ‘์ด‰(๋‹ฟ์•˜๋‹ค/์•ˆ ๋‹ฟ์•˜๋‹ค)๋งŒ ์‚ฌ์šฉ
  • ์†๋ฐ”๋‹ฅ ์œ„ ๋ฐฉํ–ฅ์—์„œ๋งŒ ์ž‘๋™
  • x, y, z์ถ• ์ค‘ ํ•˜๋‚˜์˜ ์ถ•๋งŒ ํšŒ์ „ ๊ฐ€๋Šฅ
  • ๊ฐ ์ถ•๋งˆ๋‹ค ๋ณ„๋„์˜ ์ •์ฑ… ํ•„์š”

์ด ๋…ผ๋ฌธ์ด ํ•ด๊ฒฐํ•˜๋ ค๋Š” ๊ฒƒ:

  • โœ… ํ’๋ถ€ํ•œ ์ด‰๊ฐ ์ •๋ณด ํ™œ์šฉ
  • โœ… ์–ด๋–ค ๋ฐฉํ–ฅ์—์„œ๋“  ์ž‘๋™
  • โœ… ์ž„์˜์˜ ์ถ•์œผ๋กœ ํšŒ์ „
  • โœ… ํ•˜๋‚˜์˜ ํ†ตํ•ฉ๋œ ์ •์ฑ…
  • โœ… ๋‹ค์–‘ํ•œ ๋ฏธ์ง€์˜ ๋ฌผ์ฒด

2. AnyRotate๋Š” ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ• ๊นŒ?

์‹œ์Šคํ…œ ๊ตฌ์„ฑ: ๋กœ๋ด‡ ์† + ์ด‰๊ฐ ์„ผ์„œ

AnyRotate๋Š” Allegro Hand๋ผ๋Š” 4๊ฐœ ์†๊ฐ€๋ฝ ๋กœ๋ด‡ ์†์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ํ•ต์‹ฌ์€ ๊ฐ ์†๊ฐ€๋ฝ ๋์— ๋ถ€์ฐฉ๋œ DigiTac ์ด‰๊ฐ ์„ผ์„œ์ž…๋‹ˆ๋‹ค.

DigiTac ์„ผ์„œ๊ฐ€ ํŠน๋ณ„ํ•œ ์ด์œ :

์ด ์„ผ์„œ๋Š” ์‚ฌ๋žŒ์˜ ์ง€๋ฌธ์ฒ˜๋Ÿผ ์ž‘์€ ๋Œ๊ธฐ๋“ค์ด ์žˆ๋Š” ๋ถ€๋“œ๋Ÿฌ์šด ์Šคํ‚จ์œผ๋กœ ๋ฎ์—ฌ ์žˆ์Šต๋‹ˆ๋‹ค. ์Šคํ‚จ ์•„๋ž˜์—๋Š” ์ž‘์€ ์นด๋ฉ”๋ผ๊ฐ€ ์žˆ์–ด์„œ, ๋ฌผ์ฒด๊ฐ€ ๋‹ฟ์œผ๋ฉด ๋Œ๊ธฐ๋“ค์ด ์›€์ง์ด๋Š” ๋ชจ์Šต์„ ์ดฌ์˜ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด:

  • ์ ‘์ด‰ ์œ„์น˜: ๋ฌผ์ฒด๊ฐ€ ์†๊ฐ€๋ฝ์˜ ์–ด๋””์— ๋‹ฟ์•˜๋Š”์ง€ (๊ฐ๋„๋กœ ํ‘œํ˜„)
  • ์ ‘์ด‰ ํž˜: ์–ผ๋งˆ๋‚˜ ์„ธ๊ฒŒ ๋ˆ„๋ฅด๋Š”์ง€ (ํž˜์˜ ํฌ๊ธฐ)

์ด ๋‘ ๊ฐ€์ง€ ์ •๋ณด๋ฅผ ๋™์‹œ์— ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๊ธฐ์กด ๋ฐฉ์‹: "๋ฌผ์ฒด๊ฐ€ ๋‹ฟ์•˜๋‹ค" (1 bit ์ •๋ณด)
AnyRotate: "๋ฌผ์ฒด๊ฐ€ 15๋„ ๊ฐ๋„๋กœ, 2.3N์˜ ํž˜์œผ๋กœ ๋‹ฟ์•˜๋‹ค" (์—ฐ์†์ ์ธ ์ •๋ณด)

์ด ์ฐจ์ด๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€๋Š” ๋’ค์—์„œ ์‹คํ—˜ ๊ฒฐ๊ณผ๋กœ ๋ณด์—ฌ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต ์ „๋žต: 2๋‹จ๊ณ„ ์ ‘๊ทผ๋ฒ•

๋กœ๋ด‡์„ ํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •์ด ์ •๋ง ์˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ ํ•™์ƒ์ด ์„ ์ƒ๋‹˜๊ป˜ ๋ฐฐ์šฐ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ 2๋‹จ๊ณ„๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค.

1๋‹จ๊ณ„: Teacher ์ •์ฑ… ํ•™์Šต (์‹œ๋ฎฌ๋ ˆ์ด์…˜)

์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ์žฅ์ :

  • ๋กœ๋ด‡์„ ์‹ค์ œ๋กœ ์ˆ˜์ฒœ ๋ฒˆ ๋Œ๋ฆด ํ•„์š” ์—†์Œ
  • ๋ฌผ์ฒด๋ฅผ ๋–จ์–ด๋œจ๋ ค๋„ ๊ดœ์ฐฎ์Œ
  • 8,192๊ฐœ์˜ ๋กœ๋ด‡์„ ๋™์‹œ์— ํ•™์Šต์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ!

Teacher๊ฐ€ ๊ฐ€์ง„ ํŠน๊ถŒ:

์„ ์ƒ๋‹˜(Teacher)์€ ๋ฌผ์ฒด์˜ ์ •ํ™•ํ•œ ์œ„์น˜, ๋ฐฉํ–ฅ, ๋ฌด๊ฒŒ, ์ค‘๋ ฅ ๋ฐฉํ–ฅ ๋“ฑ ๋ชจ๋“  ์ •๋ณด๋ฅผ ์•Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‹ค์ œ ์„ธ๊ณ„์—์„œ๋Š” ๋ถˆ๊ฐ€๋Šฅํ•œ โ€œ์น˜ํŒ…โ€์ด์ง€๋งŒ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ๊ฐ€๋Šฅํ•˜์ฃ .

๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ํ•™์Šต:

Teacher๋Š” PPO(Proximal Policy Optimization)๋ผ๋Š” ๊ฐ•ํ™”ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํ•™์Šต๋ฉ๋‹ˆ๋‹ค. ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ์ž˜ ์„ค๊ณ„ํ•˜๋Š” ๊ฒŒ ํ•ต์‹ฌ์ธ๋ฐ, ์ด ๋…ผ๋ฌธ์˜ ๋ณด์ƒ ํ•จ์ˆ˜๋Š” ์ •๋ง ์ •๊ตํ•ฉ๋‹ˆ๋‹ค:

์ด ๋ณด์ƒ = ํšŒ์ „ ๋ณด์ƒ + ๋ชฉํ‘œ ๋‹ฌ์„ฑ ๋ณด๋„ˆ์Šค + ์ ‘์ด‰ ๋ณด์ƒ
        - ๋‚˜์œ ์ ‘์ด‰ ํŽ˜๋„ํ‹ฐ - ๊ณผ๋„ํ•œ ์†๋„ ํŽ˜๋„ํ‹ฐ
        - ์ž์„ธ ํŽ˜๋„ํ‹ฐ - ์—๋„ˆ์ง€ ์†Œ๋น„ ํŽ˜๋„ํ‹ฐ

2๋‹จ๊ณ„: Student ์ •์ฑ… ์ฆ๋ฅ˜ (์‹ค์ „ ์ค€๋น„)

ํ•™์ƒ(Student)์€ ์„ ์ƒ๋‹˜์ด ํ•˜๋Š” ํ–‰๋™์„ ๋”ฐ๋ผํ•˜๋ฉด์„œ ๋ฐฐ์›๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ค‘์š”ํ•œ ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค:

Student๋Š” ํŠน๊ถŒ ์ •๋ณด๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค!

  • ๋ฌผ์ฒด์˜ ์ •ํ™•ํ•œ ์œ„์น˜? ๋ชจ๋ฆ„
  • ๋ชฉํ‘œ ์ž์„ธ? ๋ชจ๋ฆ„
  • ์˜ค์ง ์†๊ฐ€๋ฝ์˜ ๊ด€์ ˆ ๊ฐ๋„์™€ ์ด‰๊ฐ ์ •๋ณด๋งŒ ์‚ฌ์šฉ

์–ด๋–ป๊ฒŒ ๊ฐ€๋Šฅํ• ๊นŒ?

TCN(Temporal Convolutional Network)์ด๋ผ๋Š” ๋„คํŠธ์›Œํฌ๊ฐ€ ๊ณผ๊ฑฐ 30 ํƒ€์ž„์Šคํ…์˜ ๊ด€์ฐฐ์„ ๋ฐ›์•„์„œ ์••์ถ•๋œ ํ‘œํ˜„(latent vector)์œผ๋กœ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ด ํ‘œํ˜„์—๋Š” ๋ฌผ์ฒด์˜ ์ƒํƒœ์— ๋Œ€ํ•œ ์•”๋ฌต์ ์ธ ์ •๋ณด๊ฐ€ ๋‹ด๊ฒจ ์žˆ์Šต๋‹ˆ๋‹ค.

[30๊ฐœ์˜ ๊ณผ๊ฑฐ ๊ด€์ฐฐ] โ†’ TCN โ†’ [8์ฐจ์› ์ž ์žฌ ๋ฒกํ„ฐ] โ†’ ์ •์ฑ… โ†’ [ํ–‰๋™]

ํ•ต์‹ฌ ์•„์ด๋””์–ด: ๋ณด์กฐ ๋ชฉํ‘œ(Auxiliary Goal)

์ด ๋ถ€๋ถ„์ด ์ •๋ง ์˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค! ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์€ โ€œ์ดˆ๋‹น 30๋„์”ฉ ํšŒ์ „ํ•ด!โ€๋ผ๊ณ  ๊ฐ์†๋„๋ฅผ ์ง์ ‘ ๋ชฉํ‘œ๋กœ ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด๊ฑด ํ•™์Šต์ด ์ •๋ง ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

AnyRotate์˜ ์ ‘๊ทผ:

๋Œ€์‹  โ€œ์ง€๊ธˆ๋ถ€ํ„ฐ 1.5์ดˆ ๋’ค์— ์ด ์ž์„ธ๊ฐ€ ๋˜์–ด์•ผ ํ•ดโ€๋ผ๋Š” ์ค‘๊ฐ„ ๋ชฉํ‘œ๋ฅผ ๊ณ„์† ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋ชฉํ‘œ์— ๋„๋‹ฌํ•˜๋ฉด ์ƒˆ๋กœ์šด ๋ชฉํ‘œ๋ฅผ ์ƒ์„ฑํ•˜๊ณ , ๋˜ ๋„๋‹ฌํ•˜๋ฉด ๋˜ ์ƒ์„ฑํ•˜๊ณ โ€ฆ ์ด๋ ‡๊ฒŒ ๊ณ„์†ํ•˜๋ฉด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํšŒ์ „์ด ๋ฉ๋‹ˆ๋‹ค!

์ด๊ฒŒ ์™œ ์ข‹์„๊นŒ์š”?

  • ๊ฐ ๋ชฉํ‘œ๋Š” ๋‹ฌ์„ฑ ๊ฐ€๋Šฅํ•œ ์ˆ˜์ค€
  • ์—ฐ์†์ ์ธ ํšŒ์ „์ด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ฐœ์ƒ
  • ํ•™์Šต์ด ํ›จ์”ฌ ์•ˆ์ •์ 

๋น„์œ ํ•˜์ž๋ฉด:

  • ๊ธฐ์กด ๋ฐฉ์‹: โ€œ100m๋ฅผ 10์ดˆ์— ๋›ฐ์–ด!โ€ (๋„ˆ๋ฌด ์–ด๋ ค์›Œโ€ฆ)
  • AnyRotate: โ€œ10m ์•ž์œผ๋กœ ๊ฐ€! (๋‹ฌ์„ฑ) ๋˜ 10m ์•ž์œผ๋กœ! (๋‹ฌ์„ฑ) ๋˜ 10mโ€ฆ!โ€ (ํ•  ์ˆ˜ ์žˆ์–ด!)

์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ: ๋‹จ๊ณ„์  ํ•™์Šต

์‚ฌ๋žŒ๋„ ๊ฑท๊ธฐ ์ „์— ๊ธฐ๊ธฐ๋ฅผ ๋ฐฐ์šฐ๋“ฏ์ด, ๋กœ๋ด‡๋„ ๋‹จ๊ณ„์ ์œผ๋กœ ๋ฐฐ์›Œ์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ดˆ๊ธฐ ๋‹จ๊ณ„:

  • ๋ณด์ƒ: โ€œ์ผ๋‹จ ๋ฌผ์ฒด๋ฅผ ์•ˆ์ •์ ์œผ๋กœ ์žก์•„!โ€
  • ํ–‰๋™: ์กฐ์‹ฌ์Šค๋Ÿฝ๊ฒŒ ๋ฌผ์ฒด๋ฅผ ํŒŒ์ง€
  • ๊ฒฐ๊ณผ: ๋ฌผ์ฒด๋ฅผ ์ž˜ ์žก์ง€๋งŒ ํšŒ์ „์€ ์•ˆ ํ•จ

์ค‘๊ฐ„ ๋‹จ๊ณ„:

  • ๋ณด์ƒ์˜ ๊ฐ€์ค‘์น˜๊ฐ€ ์„œ์„œํžˆ ๋ณ€ํ™”
  • ํšŒ์ „ ๋ณด์ƒ์˜ ๋น„์ค‘์ด ์ ์  ์ฆ๊ฐ€
  • ํ–‰๋™: ์•ˆ์ •์„ฑ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ์กฐ๊ธˆ์”ฉ ํšŒ์ „ ์‹œ๋„

ํ›„๊ธฐ ๋‹จ๊ณ„:

  • ๋ณด์ƒ: โ€œ์ด์ œ ํšŒ์ „์ด ์ค‘์š”ํ•ด!โ€
  • ํ–‰๋™: ์ ๊ทน์ ์œผ๋กœ ์†๊ฐ€๋ฝ์„ ์›€์ง์—ฌ ํšŒ์ „
  • ๊ฒฐ๊ณผ: ์•ˆ์ •์ ์ด๋ฉด์„œ๋„ ๋น ๋ฅธ ํšŒ์ „

์ด ๊ณผ์ •์€ ์ž๋™์œผ๋กœ ์ง„ํ–‰๋ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡์ด ํ‰๊ท ์ ์œผ๋กœ ์–ผ๋งˆ๋‚˜ ํšŒ์ „์„ ๋‹ฌ์„ฑํ–ˆ๋Š”์ง€์— ๋”ฐ๋ผ ์ปค๋ฆฌํ˜๋Ÿผ ๊ณ„์ˆ˜ ฮฑ๊ฐ€ 0์—์„œ 1๋กœ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.


3. ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ ํ‘œํ˜„: ๊ฒŒ์ž„ ์ฒด์ธ์ €

๊ธฐ์กด ์ด‰๊ฐ ํ‘œํ˜„๋“ค

1. ์ด์ง„ ์ ‘์ด‰ (Binary Touch)

์†๊ฐ€๋ฝ 1: ์ ‘์ด‰ O
์†๊ฐ€๋ฝ 2: ์ ‘์ด‰ X
์†๊ฐ€๋ฝ 3: ์ ‘์ด‰ O
์†๊ฐ€๋ฝ 4: ์ ‘์ด‰ O

์ •๋ณด๋Ÿ‰: 4 bits

2. ์ด์‚ฐ ์ด‰๊ฐ (Discrete Touch)

์†๊ฐ€๋ฝ 1: ์˜์—ญ 5๋ฒˆ์—์„œ ์ ‘์ด‰
์†๊ฐ€๋ฝ 2: ์ ‘์ด‰ ์—†์Œ
์†๊ฐ€๋ฝ 3: ์˜์—ญ 12๋ฒˆ์—์„œ ์ ‘์ด‰
์†๊ฐ€๋ฝ 4: ์˜์—ญ 3๋ฒˆ์—์„œ ์ ‘์ด‰

์ •๋ณด๋Ÿ‰: 16 bits (16๊ฐœ ์˜์—ญ ์ค‘ ํ•˜๋‚˜)

AnyRotate์˜ ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ (Dense Touch)

์†๊ฐ€๋ฝ 1:
  - ์ ‘์ด‰ ์ž์„ธ: ฮธ=15.2ยฐ, ฯ†=23.7ยฐ
  - ์ ‘์ด‰ ํž˜: 2.34 N
์†๊ฐ€๋ฝ 2: ์ ‘์ด‰ ์—†์Œ
์†๊ฐ€๋ฝ 3:
  - ์ ‘์ด‰ ์ž์„ธ: ฮธ=-8.1ยฐ, ฯ†=45.3ยฐ
  - ์ ‘์ด‰ ํž˜: 1.87 N
...

์ •๋ณด๋Ÿ‰: ์—ฐ์†์ ์ธ ์‹ค์ˆ˜ ๊ฐ’๋“ค (๋น„๊ตํ•  ์ˆ˜ ์—†์„ ๋งŒํผ ํ’๋ถ€!)

Sim-to-Real ์ „์ด: ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ˜„์‹ค๋กœ

์—ฌ๊ธฐ์„œ ํฐ ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์ง์ ‘ ์•Œ ์ˆ˜ ์žˆ์ง€๋งŒ, ์‹ค์ œ ๋กœ๋ด‡์€ ์ด‰๊ฐ ์ด๋ฏธ์ง€๋ฅผ ๋ฐ›์Šต๋‹ˆ๋‹ค.

ํ•ด๊ฒฐ์ฑ…: ๊ด€์ฐฐ ๋ชจ๋ธ(Observation Model)

  1. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘: ์‹ค์ œ ์„ผ์„œ๋ฅผ ํ‰ํ‰ํ•œ ํ‘œ๋ฉด์— ์—ฌ๋Ÿฌ ๊ฐ๋„์™€ ํž˜์œผ๋กœ ๋ˆ„๋ฅด๋ฉด์„œ 3,000์žฅ์˜ ์ด๋ฏธ์ง€ ์ˆ˜์ง‘
  2. CNN ํ•™์Šต: ์ด‰๊ฐ ์ด๋ฏธ์ง€ โ†’ (์ ‘์ด‰ ์ž์„ธ, ์ ‘์ด‰ ํž˜) ์˜ˆ์ธกํ•˜๋„๋ก ํ•™์Šต
  3. ๋ฐฐํฌ: ํ•™์Šต๋œ ๋ชจ๋ธ๋กœ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ด‰๊ฐ ํŠน์ง• ์ถ”์ถœ
[240ร—135 ์ด‰๊ฐ ์ด๋ฏธ์ง€]
    โ†“ (CNN)
[ฮธ, ฯ†, Fx, Fy, Fz]
    โ†“ (๊ณ„์‚ฐ)
[์ ‘์ด‰ ์ž์„ธ, ์ ‘์ด‰ ํž˜]

๋†€๋ผ์šด ์ ์€, ์ด๋ ‡๊ฒŒ ํ•™์Šตํ•œ ์ •์ฑ…์„ ์ถ”๊ฐ€ ํ•™์Šต ์—†์ด ์‹ค์ œ ๋กœ๋ด‡์— ๋ฐ”๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒ๋‹ˆ๋‹ค! (์ œ๋กœ์ƒท ์ „์ด)


4. ์‹คํ—˜ ๊ฒฐ๊ณผ: ์ˆซ์ž๊ฐ€ ๋งํ•ด์ฃผ๋Š” ์„ฑ๋Šฅ

์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์‹คํ—˜: ์ด‰๊ฐ ์ •๋ณด์˜ ์ค‘์š”์„ฑ

์ฒซ ๋ฒˆ์งธ ์‹คํ—˜์€ โ€œ์ด‰๊ฐ ์ •๋ณด๊ฐ€ ์ •๋ง ์ค‘์š”ํ•œ๊ฐ€?โ€๋ฅผ ํ™•์ธํ•ฉ๋‹ˆ๋‹ค.

ํ…Œ์ŠคํŠธ ํ™˜๊ฒฝ:

  • ํ•™์Šต ๋•Œ ๋ณด์ง€ ๋ชปํ•œ ๋ฌผ์ฒด๋“ค
  • OOD Mass: ๋” ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด
  • OOD Shape: ๋‹ค๋ฅธ ํ˜•์ƒ์˜ ๋ฌผ์ฒด

๊ฒฐ๊ณผ - OOD Mass (๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด):

๊ด€์ฐฐ ์œ ํ˜• ํšŒ์ „ ์ˆ˜ ์‹œ๊ฐ„(์ดˆ) ์„ฑ๋Šฅ
๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ๋งŒ 0.56 6.9 โญ
์ด์ง„ ์ด‰๊ฐ 1.03 11.1 โญโญ
์ด์‚ฐ ์ด‰๊ฐ 1.26 13.1 โญโญโญ
๊ณ ๋ฐ€๋„ ์ด‰๊ฐ (ํž˜ ์ œ์™ธ) 1.55 15.4 โญโญโญโญ
๊ณ ๋ฐ€๋„ ์ด‰๊ฐ (์ž์„ธ ์ œ์™ธ) 1.35 13.8 โญโญโญ
๊ณ ๋ฐ€๋„ ์ด‰๊ฐ (์ „์ฒด) 1.77 17.4 โญโญโญโญโญ

๊ฒฐ๊ณผ - OOD Shape (๋‹ค๋ฅธ ํ˜•์ƒ):

๊ด€์ฐฐ ์œ ํ˜• ํšŒ์ „ ์ˆ˜ ์‹œ๊ฐ„(์ดˆ)
๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ๋งŒ 0.84 10.4
์ด์ง„ ์ด‰๊ฐ 1.35 14.9
์ด์‚ฐ ์ด‰๊ฐ 1.66 17.7
๊ณ ๋ฐ€๋„ ์ด‰๊ฐ (์ „์ฒด) 2.35 23.3

๋ถ„์„:

  1. ์ด‰๊ฐ์ด ์žˆ์œผ๋ฉด ํ›จ์”ฌ ์ข‹๋‹ค: ๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ๋งŒ ์“ฐ๋Š” ๊ฒƒ๋ณด๋‹ค ์ด์ง„ ์ด‰๊ฐ๋„ ํฐ ๋„์›€
  2. ์ƒ์„ธํ• ์ˆ˜๋ก ์ข‹๋‹ค: ์ด‰๊ฐ ์ •๋ณด๊ฐ€ ์ƒ์„ธํ• ์ˆ˜๋ก ์„ฑ๋Šฅ์ด ๊ณ„์† ํ–ฅ์ƒ
  3. ์ž์„ธ์™€ ํž˜ ๋ชจ๋‘ ์ค‘์š”: ๋‘˜ ์ค‘ ํ•˜๋‚˜๋ฅผ ๋นผ๋ฉด ์„ฑ๋Šฅ ํ•˜๋ฝ
    • ํž˜ ์ •๋ณด: ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ํŠนํžˆ ์ค‘์š”
    • ์ž์„ธ ์ •๋ณด: ์ •๋ฐ€ํ•œ ์†๊ฐ€๋ฝ ์›€์ง์ž„์— ์ค‘์š”
  4. ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ: ํ•™์Šต ๋•Œ ๋ชป ๋ณธ ๋ฌผ์ฒด์—๋„ ์ž˜ ์ž‘๋™

๋ณด์กฐ ๋ชฉํ‘œ์˜ ํšจ๊ณผ

โ€œ๋ณด์กฐ ๋ชฉํ‘œ๊ฐ€ ์ •๋ง ํ•„์š”ํ•œ๊ฐ€?โ€ ํ…Œ์ŠคํŠธ:

๋น„๊ต ๋Œ€์ƒ:

  • ์ œ์•ˆ ๋ฐฉ๋ฒ•: ๋ณด์กฐ ๋ชฉํ‘œ + ์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ
  • w/o ๋ณด์กฐ ๋ชฉํ‘œ: ๊ฐ์†๋„ ์ง์ ‘ ์ œ์–ด
  • w/o ์ปค๋ฆฌํ˜๋Ÿผ: ๋ณด์กฐ ๋ชฉํ‘œ๋Š” ์žˆ์ง€๋งŒ ๊ณ ์ •๋œ ๋ณด์ƒ

๊ฒฐ๊ณผ:

์ œ์•ˆ ๋ฐฉ๋ฒ•:       โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ (20ํšŒ ์—ฐ์† ๋ชฉํ‘œ ๋‹ฌ์„ฑ)
w/o ์ปค๋ฆฌํ˜๋Ÿผ:    โ–ˆโ–ˆ                    (๋ฌผ์ฒด๋งŒ ์žก๊ณ  ํšŒ์ „ ์•ˆ ํ•จ)
w/o ๋ณด์กฐ ๋ชฉํ‘œ:   โ–ˆโ–ˆโ–ˆโ–ˆ                  (๋‹จ์ผ ์ถ•๋งŒ ๊ฐ€๋Šฅ, ๋‹ค์ถ• ์‹คํŒจ)

๊ฒฐ๋ก : ๋ณด์กฐ ๋ชฉํ‘œ์™€ ์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ ๋‘˜ ๋‹ค ํ•„์ˆ˜์ž…๋‹ˆ๋‹ค!

์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜: ์ง„์งœ ์„ธ๊ณ„์—์„œ์˜ ๋„์ „

์ด์ œ ์ง„์งœ ๋กœ๋ด‡์œผ๋กœ ์‹คํ—˜ํ•ฉ๋‹ˆ๋‹ค. 10๊ฐ€์ง€ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋ฅผ ์‚ฌ์šฉํ–ˆ๋Š”๋ฐ, ํ”Œ๋ผ์Šคํ‹ฑ ๊ณผ์ผ๋ถ€ํ„ฐ ๊ธˆ์† ์‹ค๋ฆฐ๋”, ๊ณ ๋ฌด ์žฅ๋‚œ๊ฐ๊นŒ์ง€ ์ •๋ง ๋‹ค์–‘ํ•ฉ๋‹ˆ๋‹ค.

์† ๋ฐฉํ–ฅ์— ๋”ฐ๋ฅธ ์„ฑ๋Šฅ

์†์„ ์—ฌ๋Ÿฌ ๋ฐฉํ–ฅ์œผ๋กœ ๋Œ๋ ค๊ฐ€๋ฉฐ ํ…Œ์ŠคํŠธํ–ˆ์Šต๋‹ˆ๋‹ค:

๋ฐฉํ–ฅ ์„ค๋ช… ๋‚œ์ด๋„ ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ ์„ฑ๋Šฅ
Palm Up ์†๋ฐ”๋‹ฅ ์œ„ โญ ์‰ฌ์›€ 6.2ํšŒ/24.7์ดˆ
Palm Down ์†๋ฐ”๋‹ฅ ์•„๋ž˜ โญโญ ์ค‘๊ฐ„ 2.8ํšŒ/18.3์ดˆ
Base Up ์†๋ชฉ ์œ„ โญโญ ์ค‘๊ฐ„ 3.5ํšŒ/20.7์ดˆ
Base Down ์†๋ชฉ ์•„๋ž˜ โญโญโญ ์–ด๋ ค์›€ 2.0ํšŒ/16.3์ดˆ
Thumb Up ์—„์ง€ ์œ„ โญโญโญโญ ๋งค์šฐ ์–ด๋ ค์›€ 1.5ํšŒ/14.7์ดˆ
Thumb Down ์—„์ง€ ์•„๋ž˜ โญโญโญโญโญ ๊ทน์•… 1.2ํšŒ/13.3์ดˆ

์™œ ์ด๋ ‡๊ฒŒ ์ฐจ์ด๊ฐ€ ๋‚ ๊นŒ?

  • Palm Up/Down: ์ค‘๋ ฅ์ด ํŒŒ์ง€๋ฅผ ๋„์™€์คŒ (๋˜๋Š” ์ ๋‹นํžˆ ๋ฐฉํ•ด)
  • Thumb Up/Down: ์†๊ฐ€๋ฝ์ด ์ˆ˜ํ‰์ด๋ผ ์ค‘๋ ฅ์ด ๊ตฌ๋™๋ ฅ์— ์ •๋ฉด์œผ๋กœ ๋ฐ˜๋Œ€
    • ์†๊ฐ€๋ฝ์ด ๋ฌผ์ฒด ๋ฌด๊ฒŒ๋ฅผ ์˜จ์ „ํžˆ ๋ฒ„ํ…จ์•ผ ํ•จ
    • Allegro Hand์˜ ๊ตฌ๋™๋ ฅ์ด ์ด ๋ฐฉํ–ฅ์—์„œ ์•ฝํ•ด์ง

๋†€๋ผ์šด ์ :

์–ด๋ ค์šด ๋ฐฉํ–ฅ์—์„œ๋„ ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ์„ ์‚ฌ์šฉํ•œ ์ •์ฑ…์€ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค! ๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ์ด๋‚˜ ์ด์ง„ ์ด‰๊ฐ์œผ๋กœ๋Š” ๊ฑฐ์˜ ๋ถˆ๊ฐ€๋Šฅํ•œ ์ˆ˜์ค€์ž…๋‹ˆ๋‹ค.

ํšŒ์ „์ถ•์— ๋”ฐ๋ฅธ ์„ฑ๋Šฅ

x, y, z ์„ธ ์ถ•์œผ๋กœ ํšŒ์ „์„ ์‹œ๋„ํ–ˆ์Šต๋‹ˆ๋‹ค:

ํšŒ์ „์ถ• ํŠน์ง• ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ ์„ฑ๋Šฅ
z์ถ• ๋ฌผ์ฒด์˜ ์ฃผ์ถ•, ๊ฐ€์žฅ ์ž์—ฐ์Šค๋Ÿฌ์›€ 4.2ํšŒ/22.3์ดˆ
x์ถ• ์†๊ฐ€๋ฝ 2๊ฐœ๋Š” ๊ณ ์ •, 2๊ฐœ๋Š” ํšŒ์ „ 5.5ํšŒ/25.3์ดˆ
y์ถ• ๊ฐ€์žฅ ๋ณต์žกํ•œ ์†๊ฐ€๋ฝ ํ˜‘์‘ ํ•„์š” 3.8ํšŒ/21.7์ดˆ

ํฅ๋ฏธ๋กœ์šด ๋ฐœ๊ฒฌ:

y์ถ•๊ณผ x์ถ• ํšŒ์ „์€ ์ •๊ตํ•œ ์†๊ฐ€๋ฝ ๊ฒŒ์ดํŒ…์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค: - ์ค‘์ง€์™€ ์—„์ง€(๋˜๋Š” ๊ฒ€์ง€์™€ ์ƒˆ๋ผ)๊ฐ€ ๋ฌผ์ฒด๋ฅผ ๊ณ ์ • - ๋‚˜๋จธ์ง€ ๋‘ ์†๊ฐ€๋ฝ์ด ํšŒ์ „๋ ฅ ์ œ๊ณต - ์ด๋Ÿฐ ๋ณต์žกํ•œ ํ˜‘์‘์€ ์ด‰๊ฐ ์ •๋ณด ์—†์ด๋Š” ๊ฑฐ์˜ ๋ถˆ๊ฐ€๋Šฅ

์ด์ง„ ์ด‰๊ฐ๋„ z์ถ•์—์„œ๋Š” ๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ๊ณผ ๋น„์Šทํ•œ ์„ฑ๋Šฅ์ด์ง€๋งŒ, x์ถ•๊ณผ y์ถ•์—์„œ๋Š” ํ™•์‹คํžˆ ๋” ์ข‹์Šต๋‹ˆ๋‹ค.

์ด‰๊ฐ ์„ผ์„œ ๋ถ„์„: ๋กœ๋ด‡์ด โ€˜๋А๋ผ๋Š”โ€™ ๊ฒƒ

์‹คํ—˜ ์ค‘ ์ด‰๊ฐ ์„ผ์„œ๊ฐ€ ์ธก์ •ํ•˜๋Š” ๊ฐ’๋“ค์„ ๋ถ„์„ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜ํ”„๋ฅผ ๋ณด๋ฉด ๋‘ ๊ฐ€์ง€ ํ•ต์‹ฌ ํŒจํ„ด์ด ๋ณด์ž…๋‹ˆ๋‹ค:

1. ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€

์‹œ๊ฐ„ 0์ดˆ: ์ ‘์ด‰ ํž˜ = 2.5N, ์ ‘์ด‰ ์ž์„ธ = 15ยฐ
์‹œ๊ฐ„ 1์ดˆ: ์ ‘์ด‰ ํž˜ = 2.3N, ์ ‘์ด‰ ์ž์„ธ = 15ยฐ โ† ์•ˆ์ •
์‹œ๊ฐ„ 2์ดˆ: ์ ‘์ด‰ ํž˜ = 1.8N, ์ ‘์ด‰ ์ž์„ธ = 18ยฐ โ† ๋ฏธ๋„๋Ÿฌ์ง!

ํž˜์ด ์ค„๊ณ  ๊ฐ๋„๊ฐ€ ๋ณ€ํ•˜๋ฉด ๋ฌผ์ฒด๊ฐ€ ๋ฏธ๋„๋Ÿฌ์ง€๋Š” ์ค‘์ž…๋‹ˆ๋‹ค.

2. ๋ฐ˜์‘์  ๊ฒŒ์ดํŒ…

๋ฏธ๋„๋Ÿผ์„ ๊ฐ์ง€ํ•˜๋ฉด ์ •์ฑ…์ด ์ฆ‰์‹œ ๋ฐ˜์‘ํ•ฉ๋‹ˆ๋‹ค: - ๋ฏธ๋„๋Ÿฌ์ง€๋Š” ์†๊ฐ€๋ฝ: ํž˜์„ ์ฆ๊ฐ€ - ๋‹ค๋ฅธ ์†๊ฐ€๋ฝ๋“ค: ๋ณด์ƒ ๋™์ž‘ ์ˆ˜ํ–‰ - ๊ฒฐ๊ณผ: ๋ฌผ์ฒด๋ฅผ ๋‹ค์‹œ ์•ˆ์ •์ ์œผ๋กœ ์žก์Œ

๋†€๋ผ์šด ์ :

๋ช…์‹œ์ ์ธ โ€œ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€ ๋ชจ๋“ˆโ€์ด ์—†์Šต๋‹ˆ๋‹ค! ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ ์ •๋ณด๋งŒ์œผ๋กœ๋„ ์ •์ฑ…์ด ์•”๋ฌต์ ์œผ๋กœ ๋ฏธ๋„๋Ÿผ์„ ๊ฐ์ง€ํ•˜๊ณ  ๋Œ€์‘ํ•˜๋Š” ๋ฒ•์„ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ด์ง„ ์ด‰๊ฐ์ด๋‚˜ ๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ์œผ๋กœ๋Š” ๊ด€์ฐฐ๋˜์ง€ ์•Š์€ ์ฐฝ๋ฐœ์  ํ–‰๋™์ž…๋‹ˆ๋‹ค.

๊ถ๊ทน์˜ ํ…Œ์ŠคํŠธ: ํšŒ์ „ํ•˜๋Š” ์†

๊ฐ€์žฅ ์ธ์ƒ์ ์ธ ์‹คํ—˜์ž…๋‹ˆ๋‹ค. ์† ์ž์ฒด๋ฅผ ๊ณ„์† ํšŒ์ „์‹œํ‚ค๋ฉด์„œ ๋ฌผ์ฒด๋ฅผ ์กฐ์ž‘ํ•ฉ๋‹ˆ๋‹ค!

  • ์†์ด ์•ž๋’ค๋กœ ํ”๋“ค๋ฆฌ๋ฉด์„œ
  • ๋™์‹œ์— ์ขŒ์šฐ๋กœ ํšŒ์ „ํ•˜๋ฉด์„œ
  • ๊ทธ ์™€์ค‘์— ์†์•ˆ์˜ ๊ณต์„ ๊ณ„์† ๋Œ๋ฆผ

์‚ฌ๋žŒ๋„ ์–ด๋ ค์šด ์ด ๋™์ž‘์„, ๋กœ๋ด‡์ด ํ•ด๋ƒ…๋‹ˆ๋‹ค. ์ค‘๋ ฅ ๋ฐฉํ–ฅ์ด ์†์˜ ์ขŒํ‘œ๊ณ„์—์„œ ๊ณ„์† ๋ณ€ํ•˜๋Š”๋ฐ๋„ ๋ง์ด์ฃ !

์„ธ ๊ฐ€์ง€ ๊ถค์  ํ…Œ์ŠคํŠธ:

  1. ๋‹จ์ˆœ ํšŒ์ „: ์†์ด ํ•œ ์ถ•์œผ๋กœ ๊ณ„์† ํšŒ์ „ โ†’ ์„ฑ๊ณต!
  2. ๋ณต์žกํ•œ 3D ๊ถค์ : ์†์ด ์—ฌ๋Ÿฌ ์ถ•์œผ๋กœ ๋ณตํ•ฉ ํšŒ์ „ โ†’ ์„ฑ๊ณต!
  3. ์„œ๋ณด์ž‰: ์†์€ ๊ณ„์† ์›€์ง์ด์ง€๋งŒ ๋ฌผ์ฒด๋Š” ๊ณต์ค‘์— ๊ฑฐ์˜ ์ •์ง€
    • ๋งˆ์น˜ ์ €๊ธ€๋ง์ฒ˜๋Ÿผ ์†์ด ๋ฌผ์ฒด ์ฃผ์œ„๋ฅผ ์ด๋™
    • 6DoF ์žฌ๋ฐฐํ–ฅ + ํŒŒ์ง€ ์œ„์น˜ ์žฌ๋ฐฐ์น˜ ๋™์‹œ ์ˆ˜ํ–‰
    • ํ”ฝ์•คํ”Œ๋ ˆ์ด์Šค ๊ฐ™์€ ์ž‘์—…์— ์œ ์šฉํ•  ๋“ฏ!

5. ๊ธฐ์ˆ ์  ๊นŠ์ด ํŒŒ๊ณ ๋“ค๊ธฐ

์—ฌ๊ธฐ์„œ๋Š” ์ข€ ๋” ๊ธฐ์ˆ ์ ์ธ ์„ธ๋ถ€์‚ฌํ•ญ์„ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์—”์ง€๋‹ˆ์–ด๋ง ์ธก๋ฉด์—์„œ ์ •๋ง ์ž˜ ์„ค๊ณ„๋˜์—ˆ๊ฑฐ๋“ ์š”.

๋ณด์ƒ ํ•จ์ˆ˜ ํ•ด๋ถ€

๋ณด์ƒ ํ•จ์ˆ˜๋Š” ๋กœ๋ด‡์ด โ€œ๋ฌด์—‡์„ ๋ฐฐ์›Œ์•ผ ํ•˜๋Š”์ง€โ€ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. AnyRotate์˜ ๋ณด์ƒ ํ•จ์ˆ˜๋Š” 10๊ฐœ์˜ ํ•ญ์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค:

๊ธ์ •์  ๋ณด์ƒ (๋กœ๋ด‡์ด ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์ข‹์•„!)

1. ํšŒ์ „ ๋ณด์ƒ (r_rot)

r_rot = exp(-ฮฒ * d_keypoint)
  • ๋ฌผ์ฒด์˜ ํ‚คํฌ์ธํŠธ๊ฐ€ ๋ชฉํ‘œ์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ๋†’์€ ๋ณด์ƒ
  • ํ‚คํฌ์ธํŠธ: ๋ฌผ์ฒด์—์„œ 5cm ๋–จ์–ด์ง„ 6๊ฐœ ์ 
  • ฮฒ = 2.0 (๊ฐ€์ค‘์น˜)

2. ๋ชฉํ‘œ ๋‹ฌ์„ฑ ๋ณด๋„ˆ์Šค (r_bonus)

r_bonus = 10.0  # ๋ชฉํ‘œ ๋„๋‹ฌ ์‹œ
  • ํ‚คํฌ์ธํŠธ ๊ฑฐ๋ฆฌ๊ฐ€ ์ž„๊ณ„๊ฐ’(0.15) ๋ฏธ๋งŒ์ด๋ฉด ๋ฐœ๋™
  • ํฌ์†Œ ๋ณด์ƒ์œผ๋กœ ์ค‘์š”ํ•œ ์ด๋ฒคํŠธ ๊ฐ•์กฐ

3. ๋ธํƒ€ ํšŒ์ „ ๋ณด์ƒ (r_delta)

r_delta = ฮ”ฮธ / ฮ”t  # ์‹ค์ œ ํšŒ์ „๋Ÿ‰
  • ๋ชฉํ‘œ ์ถ•์— ๋Œ€ํ•œ ์‹ค์ œ ๊ฐ๋„ ๋ณ€ํ™”
  • ์—ฐ์†์ ์ธ ํšŒ์ „ ์žฅ๋ ค

4. ์ข‹์€ ์ ‘์ด‰ ๋ณด์ƒ (r_contact)

r_contact = 1.0 if n_tip_contacts >= 2 else 0
  • ์†๊ฐ€๋ฝ ๋ ์ ‘์ด‰์ด 2๊ฐœ ์ด์ƒ์ด๋ฉด ๋ณด์ƒ
  • ์•ˆ์ •์ ์ธ ํŒŒ์ง€ ์œ ๋„

๋ถ€์ •์  ๋ณด์ƒ (๋กœ๋ด‡์ด ์ด๋Ÿฌ๋ฉด ์•ˆ ๋ผ!)

5. ๋‚˜์œ ์ ‘์ด‰ ํŽ˜๋„ํ‹ฐ (p_bad_contact)

  • ์†๋ฐ”๋‹ฅ์ด๋‚˜ ์†๊ฐ€๋ฝ ์˜†๋ฉด ์ ‘์ด‰ ์‹œ ํŽ˜๋„ํ‹ฐ
  • ์†๊ฐ€๋ฝ ๋๋งŒ ์‚ฌ์šฉํ•˜๋„๋ก ์œ ๋„

6. ๊ฐ์†๋„ ํŽ˜๋„ํ‹ฐ (p_ang_vel)

p_ang_vel = -1.0 if |ฯ‰| > 30 rad/s else 0
  • ๋„ˆ๋ฌด ๋น ๋ฅธ ํšŒ์ „ ๋ฐฉ์ง€
  • ์ œ์–ด ๊ฐ€๋Šฅํ•œ ์†๋„ ์œ ์ง€

7. ์ž์„ธ ํŽ˜๋„ํ‹ฐ (p_pose)

  • ํ‘œ์ค€ ํŒŒ์ง€ ์ž์„ธ์—์„œ ๋„ˆ๋ฌด ๋ฉ€์–ด์ง€๋ฉด ํŽ˜๋„ํ‹ฐ
  • ๊ทน๋‹จ์ ์ธ ๊ด€์ ˆ ๊ฐ๋„ ๋ฐฉ์ง€

8. ์ผ ํŽ˜๋„ํ‹ฐ (p_work)

  • ์—๋„ˆ์ง€ ์†Œ๋น„ ์ตœ์†Œํ™”
  • ํšจ์œจ์ ์ธ ์›€์ง์ž„ ์œ ๋„

9. ํ† ํฌ ํŽ˜๋„ํ‹ฐ (p_torque)

  • ๋†’์€ ํ† ํฌ ์‚ฌ์šฉ ์–ต์ œ
  • ํ•˜๋“œ์›จ์–ด ๋ถ€๋‹ด ๊ฐ์†Œ

10. ์ข…๋ฃŒ ํŽ˜๋„ํ‹ฐ (p_term)

p_term = -100  # ๋ฌผ์ฒด ๋‚™ํ•˜ ๋˜๋Š” ์ถ• ์ดํƒˆ ์‹œ
  • ์‹คํŒจ์— ๋Œ€ํ•œ ๊ฐ•๋ ฅํ•œ ๋ถˆ์ด์ต
  • ์•ˆ์ •์„ฑ ์ตœ์šฐ์„ 

์ตœ์ข… ๋ณด์ƒ ํ•จ์ˆ˜:

r_total = r_rot + r_bonus + r_delta + r_contact
        - p_bad_contact - p_ang_vel - p_pose
        - p_work - p_torque - p_term

๊ฐ ํ•ญ์˜ ๊ฐ€์ค‘์น˜๋Š” ์‹คํ—˜์„ ํ†ตํ•ด ์„ธ์‹ฌํ•˜๊ฒŒ ์กฐ์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋„คํŠธ์›Œํฌ ์•„ํ‚คํ…์ฒ˜ ์ƒ์„ธ

Teacher Policy

[ํŠน๊ถŒ ์ •๋ณด 18์ฐจ์›]
    โ†“
MLP Encoder [256 โ†’ 128 โ†’ 8]
    โ†“
[์ž ์žฌ ๋ฒกํ„ฐ 8์ฐจ์›] + [๊ณ ์œ ์ˆ˜์šฉ+์ด‰๊ฐ ์ •๋ณด]
    โ†“
Policy Network [512 โ†’ 256 โ†’ 128]
    โ†“
[ํ‰๊ท  ฮผ, ํ‘œ์ค€ํŽธ์ฐจ ฯƒ] (Gaussian policy)
    โ†“
์ƒ˜ํ”Œ๋ง โ†’ [ํ–‰๋™ 16์ฐจ์›]

ํ™œ์„ฑํ™” ํ•จ์ˆ˜: - MLP: ReLU - Policy: ELU (Exponential Linear Unit) - ์Œ์ˆ˜ ์˜์—ญ์—์„œ๋„ ๋ถ€๋“œ๋Ÿฌ์šด ๊ทธ๋ž˜๋””์–ธํŠธ - ์ฃฝ์€ ๋‰ด๋Ÿฐ(dead neuron) ๋ฌธ์ œ ํ•ด๊ฒฐ

Student Policy

[30 ํƒ€์ž„์Šคํ… ร— ๊ด€์ฐฐ ์ฐจ์›]
    โ†“
TCN Layer 1: Conv1D (kernel=9, stride=2) + ReLU
    โ†“
TCN Layer 2: Conv1D (kernel=5, stride=1) + ReLU
    โ†“
TCN Layer 3: Conv1D (kernel=5, stride=1) + ReLU
    โ†“
[์ž ์žฌ ๋ฒกํ„ฐ 8์ฐจ์›]
    โ†“
Policy Network [512 โ†’ 256 โ†’ 128] (Teacher์™€ ๋™์ผ)
    โ†“
[ํ–‰๋™]

TCN์˜ ์žฅ์ :

  • ์‹œ๊ฐ„์  ํŒจํ„ด ํฌ์ฐฉ (๊ณผ๊ฑฐ 30 ํ”„๋ ˆ์ž„ = 1.5์ดˆ)
  • RNN๋ณด๋‹ค ๋ณ‘๋ ฌํ™” ํšจ์œจ์ 
  • ๊ธด ์‹œํ€€์Šค์—์„œ๋„ ์•ˆ์ •์ 

๊ด€์ฐฐ ์ฐจ์›:

  • ๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ๋งŒ: 79์ฐจ์›
  • ์ด์ง„ ์ด‰๊ฐ: 83์ฐจ์› (+4)
  • ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ: 91์ฐจ์› (+12)

์‹œ์Šคํ…œ ์‹๋ณ„: ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ˜„์‹ค๊ณผ ๋งž์ถ”๊ธฐ

์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ์•„๋ฌด๋ฆฌ ์ข‹์•„๋„ ํ˜„์‹ค๊ณผ ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•ด ์‹œ์Šคํ…œ ์‹๋ณ„์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค.

์ตœ์ ํ™” ๋Œ€์ƒ: - 16๊ฐœ ๊ด€์ ˆ ร— 5๊ฐœ ํŒŒ๋ผ๋ฏธํ„ฐ = 80๊ฐœ ํŒŒ๋ผ๋ฏธํ„ฐ - ๊ฐ•์„ฑ (stiffness) - ๊ฐ์‡  (damping) - ์งˆ๋Ÿ‰ (mass) - ๋งˆ์ฐฐ (friction) - armature

๋ฐฉ๋ฒ•:

  1. ์‹ค์ œ ๋กœ๋ด‡์œผ๋กœ ์—ฌ๋Ÿฌ ๋ฐฉํ–ฅ์—์„œ ๊ถค์  ๊ธฐ๋ก
  2. ๊ฐ™์€ ๋ช…๋ น์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์‹คํ–‰
  3. CMA-ES ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ MSE ์ตœ์†Œํ™”
  4. ์ตœ์  ํŒŒ๋ผ๋ฏธํ„ฐ ๋ฐœ๊ฒฌ

๊ฒฐ๊ณผ:

์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ๋กœ๋ด‡์˜ ์›€์ง์ž„์ด ํ›จ์”ฌ ์œ ์‚ฌํ•ด์ ธ์„œ sim-to-real ๊ฒฉ์ฐจ ๊ฐ์†Œ!

๋„๋ฉ”์ธ ๋ฌด์ž‘์œ„ํ™”: ๋‹ค์–‘์„ฑ์ด ๋‹ต์ด๋‹ค

์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ•™์Šต ์ค‘์— ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ณ„์† ๋ณ€๊ฒฝํ•ฉ๋‹ˆ๋‹ค:

๋ฌผ์ฒด ๋ฌด์ž‘์œ„ํ™”:

mass = random.uniform(0.025, 0.20)  # kg
friction = 10.0  # ๊ณ ์ •
radius = random.uniform(0.025, 0.034)  # m
center_of_mass = random.uniform(-0.01, 0.01)  # m

์† ๋ฌด์ž‘์œ„ํ™”:

stiffness = random.uniform(35, 45)
damping = random.uniform(0.5, 2.5)
joint_noise = gaussian(0, 0.03)
position_noise = gaussian(0, 0.005)  # m

์ด‰๊ฐ ๋ฌด์ž‘์œ„ํ™”:

pose_noise = gaussian(0, 0.0174)  # rad (์•ฝ 1๋„)
force_noise = gaussian(0, 0.1)  # N

์™ธ๋ž€:

  • 25% ํ™•๋ฅ ๋กœ ๋žœ๋ค ํž˜ ์ ์šฉ
  • ์™ธ๋ž€ ์Šค์ผ€์ผ: 2.0
  • ์ง€์ˆ˜ ๊ฐ์‡ : 0.99

์ด๋ ‡๊ฒŒ ๋‹ค์–‘ํ•œ ์กฐ๊ฑด์—์„œ ํ•™์Šตํ•˜๋ฉด ์‹ค์ œ ์„ธ๊ณ„์˜ ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅํ•œ ์ƒํ™ฉ์— ๊ฐ•๊ฑดํ•ด์ง‘๋‹ˆ๋‹ค!

์‹ค์‹œ๊ฐ„ ์ œ์–ด ํŒŒ์ดํ”„๋ผ์ธ

์‹ค์ œ ๋กœ๋ด‡์—์„œ์˜ ์ œ์–ด๋Š” 20Hz๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค:

flowchart TD
    Start(["20 Hz ๋ฉ”์ธ ๋ฃจํ”„ ์‹œ์ž‘"]) --> Step1["1. ์ด‰๊ฐ ์ด๋ฏธ์ง€ ์ˆ˜์ง‘<br/>๋น„๋™๊ธฐ, ์ตœ๋Œ€ 30 FPS"]
    Step1 --> Step2["2. ๊ทธ๋ ˆ์ด์Šค์ผ€์ผ ๋ณ€ํ™˜ + ์ „์ฒ˜๋ฆฌ"]
    Step2 --> Step3["3. CNN์œผ๋กœ ํŠน์ง• ์ถ”์ถœ<br/>4๊ฐœ ์„ผ์„œ ๋ณ‘๋ ฌ"]
    Step3 --> Step3a["์ ‘์ด‰ ์ž์„ธ: ฮธ, ฯ†<br/>์ ‘์ด‰ ํž˜: |F|"]
    Step3a --> Step4["4. ๊ด€์ ˆ ์œ„์น˜ ์ฝ๊ธฐ"]
    Step4 --> Step5["5. Forward Kinematics"]
    Step5 --> Step5a["์†๊ฐ€๋ฝ ๋ ์œ„์น˜<br/>์†๊ฐ€๋ฝ ๋ ๋ฐฉํ–ฅ"]
    Step5a --> Step6["6. ๊ด€์ฐฐ ๋ฒกํ„ฐ ๊ตฌ์„ฑ"]
    Step6 --> Step7["7. ์ •์ฑ… ์ถ”๋ก "]
    Step7 --> Step7a["TCN โ†’ ์ž ์žฌ ๋ฒกํ„ฐ<br/>Policy โ†’ ํ–‰๋™ ์ถœ๋ ฅ"]
    Step7a --> Step8["8. ์ง€์ˆ˜ ์ด๋™ ํ‰๊ท <br/>q_target = 0.9 ร— q_old + 0.1 ร— q_new"]
    Step8 --> Step9["9. ๋ชฉํ‘œ ๊ด€์ ˆ ์œ„์น˜ ์ „์†ก"]
    Step9 --> PD["PD ์ œ์–ด๊ธฐ<br/>300 Hz"]
    PD --> Motor["๋ชจํ„ฐ ๊ตฌ๋™"]
    Motor --> Start

    style Start fill:#e1f5ff
    style Step3 fill:#fff4e1
    style Step7 fill:#ffe1f5
    style PD fill:#e1ffe1
    style Motor fill:#ffe1e1

๋ณ‘๋ชฉ ์ง€์ :

  • CNN ์ถ”๋ก : ~5ms (GPU ์‚ฌ์šฉ)
  • ์ •์ฑ… ์ถ”๋ก : ~3ms
  • ๋‚˜๋จธ์ง€: ~42ms (์—ฌ์œ  ์žˆ์Œ)

์ตœ์ ํ™”:

  • ์ด‰๊ฐ ์„ผ์„œ๋“ค์ด ๋น„๋™๊ธฐ๋กœ ์ŠคํŠธ๋ฆฌ๋ฐ (๋Œ€๊ธฐ ์‹œ๊ฐ„ ๊ฐ์†Œ)
  • ๊ฐ€์žฅ ์ตœ๊ทผ ์ด๋ฏธ์ง€ ์‚ฌ์šฉ (์ง€์—ฐ ์ตœ์†Œํ™”)
  • SSIM์œผ๋กœ ๋น ๋ฅธ ์ ‘์ด‰ ๊ฐ์ง€

6. ๋น„๊ต ๋ถ„์„: ๊ธฐ์กด ์—ฐ๊ตฌ์™€ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅธ๊ฐ€?

OpenAI์˜ โ€œSolving Rubikโ€™s Cube with a Robot Handโ€ (2019)์™€ ๋น„๊ต

2019๋…„ OpenAI๊ฐ€ ๋ฐœํ‘œํ•œ โ€œSolving Rubikโ€™s Cube with a Robot Handโ€ (Akkaya et al., 2019)์™€ ํ›„์† ์—ฐ๊ตฌ โ€œLearning Dexterous In-Hand Manipulationโ€ (Andrychowicz et al., 2020)์€ ๋กœ๋ด‡ ์กฐ์ž‘ ๋ถ„์•ผ์— ํฐ ๋ฐ˜ํ–ฅ์„ ์ผ์œผ์ผฐ์Šต๋‹ˆ๋‹ค.

OpenAI๊ฐ€ ๋ณด์—ฌ์ค€ ๊ฒƒ:

์ด ํ”„๋กœ์ ํŠธ๋Š” Shadow Hand๋ผ๋Š” 24์ž์œ ๋„ ๋กœ๋ด‡ ์†์œผ๋กœ ๋ฃจ๋น…์Šค ํ๋ธŒ๋ฅผ ํ‘ธ๋Š” ๋†€๋ผ์šด ์„ฑ๊ณผ๋ฅผ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค:

  • ํ•˜๋“œ์›จ์–ด: Shadow Dexterous Hand (24 DoF, 20๊ฐœ ๊ตฌ๋™ ๊ด€์ ˆ)
  • ์„ผ์‹ฑ: RGB ์นด๋ฉ”๋ผ 3๊ฐœ (์†์„ ๋‘˜๋Ÿฌ์‹ผ ์œ„์น˜์— ๋ฐฐ์น˜)
  • ํ•™์Šต ๋ฐฉ๋ฒ•:
    • ADR (Automatic Domain Randomization) - ์ž๋™์œผ๋กœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‚œ์ด๋„ ์ฆ๊ฐ€
    • Vision-based state estimation
    • ๋Œ€๊ทœ๋ชจ ๋ถ„์‚ฐ ํ•™์Šต (6,144 CPU ์ฝ”์–ด + 8 V100 GPU)
  • ์„ฑ๊ณผ: ๋ฃจ๋น…์Šค ํ๋ธŒ๋ฅผ 60% ์„ฑ๊ณต๋ฅ ๋กœ ํ•ด๊ฒฐ (์‹ฌ์ง€์–ด ๊ณ ๋ฌด ์žฅ๊ฐ‘ ์ฐฉ์šฉ ์ƒํƒœ์—์„œ๋„)

ํ•˜์ง€๋งŒ ํ•œ๊ณ„๊ฐ€ ๋ช…ํ™•ํ–ˆ์Šต๋‹ˆ๋‹ค:

  1. ๊ณผ๋„ํ•œ ๋น„์ „ ์˜์กด์„ฑ
    • 16-30๊ฐœ์˜ ์นด๋ฉ”๋ผ ํฌ์ธํŠธ ํ•„์š”
    • ์ž๊ธฐ ํ์ƒ‰(self-occlusion) ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ์œ„ํ•œ ๋ณต์žกํ•œ ์„ค์ •
    • ์‹คํ—˜์‹ค ํ™˜๊ฒฝ ๋ฐ–์—์„œ๋Š” ์ ์šฉ ์–ด๋ ค์›€
  2. ๊ณ ์ •๋œ ์† ๋ฐฉํ–ฅ
    • ์†์€ ํ•ญ์ƒ ํŒ” ์œ„ (palm up)
    • ์ค‘๋ ฅ์ด ํŒŒ์ง€๋ฅผ ๋„์™€์ฃผ๋Š” ์ƒํ™ฉ
    • ๋‹ค๋ฅธ ๋ฐฉํ–ฅ์—์„œ์˜ ์กฐ์ž‘์€ ์‹œ๋„๋˜์ง€ ์•Š์Œ
  3. ์ž‘์—… ํŠนํ™”
    • ๋ฃจ๋น…์Šค ํ๋ธŒ๋ผ๋Š” ํŠน์ • ๋ฌผ์ฒด์— ์ตœ์ ํ™”
    • ๋‹ค๋ฅธ ๋ฌผ์ฒด๋กœ ์ผ๋ฐ˜ํ™” ๊ฒ€์ฆ ์•ˆ ๋จ
    • ํ๋ธŒ์˜ ํŠน์ˆ˜ํ•œ ๊ธฐํ•˜ํ•™์  ํŠน์„ฑ ํ™œ์šฉ
  4. ๋ง‰๋Œ€ํ•œ ์ปดํ“จํŒ… ์ž์›
    • ์ด ํ•™์Šต ์‹œ๊ฐ„: 100๋…„ ์ƒ๋‹น์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜
    • 13,000์‹œ๊ฐ„์˜ ์‹ค์ œ ์‹œ๊ฐ„
    • ์ผ๋ฐ˜ ์—ฐ๊ตฌ์‹ค์—์„œ ์žฌํ˜„ ์–ด๋ ค์›€

AnyRotate์˜ ๊ทผ๋ณธ์  ์ฐจ์ด์ :

์ธก๋ฉด OpenAI (2019-2020) AnyRotate (2024)
์ฃผ์š” ์„ผ์‹ฑ ๋น„์ „ (๋‹ค์ค‘ ์นด๋ฉ”๋ผ) ์ด‰๊ฐ (4๊ฐœ ์„ผ์„œ)
์ž๊ธฐ ํ์ƒ‰ ๋ฌธ์ œ๊ฐ€ ๋จ ๋ฌธ์ œ ์—†์Œ
์† ๋ฐฉํ–ฅ ๊ณ ์ • (palm up) ์ž„์˜ (6+ ๋ฐฉํ–ฅ)
์ค‘๋ ฅ ๋Œ€์‘ ์ค‘๋ ฅ์ด ๋„์›€ ์ค‘๋ ฅ์— ๋ถˆ๋ณ€
ํšŒ์ „์ถ• ์ž‘์—… ํŠนํ™” ์ž„์˜ ์ถ• ํ†ตํ•ฉ ์ •์ฑ…
๋ฌผ์ฒด ์ผ๋ฐ˜ํ™” ๋ฃจ๋น…์Šค ํ๋ธŒ 10+ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด
์„ค์น˜ ๋ณต์žก๋„ ๋งค์šฐ ๋†’์Œ ์ƒ๋Œ€์ ์œผ๋กœ ๋‚ฎ์Œ
์ปดํ“จํŒ… ์ž์› 6,144 CPU + 8 GPU GPU ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ (ํ‘œ์ค€)
๋ฐฐํฌ ํ™˜๊ฒฝ ์‹คํ—˜์‹ค ์ „์šฉ ์‹ค์šฉ์  ๋ฐฐํฌ ๊ฐ€๋Šฅ

์ฒ ํ•™์  ์ฐจ์ด:

OpenAI์˜ ์ ‘๊ทผ์€ โ€œํŠน์ • ์ž‘์—…์—์„œ ์ดˆ์ธ์  ์„ฑ๋Šฅโ€์„ ๋ชฉํ‘œ๋กœ ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฃจ๋น…์Šค ํ๋ธŒ๋ฅผ ํ‘ธ๋Š” ๊ฒƒ์€ ์ธ์ƒ์ ์ด์ง€๋งŒ, ๊ทธ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฅธ ์ž‘์—…์— ์ ์šฉํ•˜๊ธฐ๋Š” ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

๋ฐ˜๋ฉด AnyRotate๋Š” โ€œ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ์กฐ์ž‘ ๋Šฅ๋ ฅโ€์„ ์ถ”๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์ฒ˜์Œ ๋ณด๋Š” ๋ฌผ์ฒด๋„ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๊ณ , ์–ด๋–ค ์† ๋ฐฉํ–ฅ์—์„œ๋„ ์ž‘๋™ํ•˜๋ฉฐ, ๋ณต์žกํ•œ ์™ธ๋ถ€ ์„ผ์„œ ์—†์ด๋„ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

๋‘˜ ์ค‘ ๋ฌด์—‡์ด ๋” ๋‚˜์€๊ฐ€?

์‚ฌ์‹ค ์ด๊ฒƒ์€ โ€œ๋ฌด์—‡์ด ๋” ๋‚˜์€๊ฐ€?โ€๋ณด๋‹ค๋Š” โ€œ๋ฌด์—‡์„ ๋ชฉํ‘œ๋กœ ํ•˜๋Š”๊ฐ€?โ€์˜ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค:

  • OpenAI: โ€œ์ด๊ฒƒ ๋ด! ๋กœ๋ด‡์ด ๋ฃจ๋น…์Šค ํ๋ธŒ๋ฅผ ํ’€ ์ˆ˜ ์žˆ์–ด!โ€ โ†’ ๊ธฐ์ˆ ์˜ ํ•œ๊ณ„๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ๋ฐ๋ชจ
  • AnyRotate: โ€œ๋กœ๋ด‡์ด ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋ฅผ ์‹ค์šฉ์ ์œผ๋กœ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ์–ดโ€ โ†’ ์‹ค์ œ ์‘์šฉ์„ ํ–ฅํ•œ ๋ฐœ๊ฑธ์Œ

๋‘ ์ ‘๊ทผ ๋ชจ๋‘ ์ค‘์š”ํ•˜๊ณ , ์„œ๋กœ ๋ณด์™„์ ์ž…๋‹ˆ๋‹ค.

์ตœ๊ทผ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ๋“ค๊ณผ ๋น„๊ต

Qi et al. (2023) - โ€œGeneral In-Hand Object Rotation with Vision and Touchโ€ (RotateIt)

UC Berkeley์˜ Jitendra Malik ๊ต์ˆ˜ ์—ฐ๊ตฌํŒ€๊ณผ Meta AI๊ฐ€ ๊ณต๋™์œผ๋กœ ๊ฐœ๋ฐœํ•œ ์‹œ์Šคํ…œ์œผ๋กœ, CoRL 2023์— ๋ฐœํ‘œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ๊ณผ ๋™๊ธฐ:

Haozhi Qi๋ฅผ ๋น„๋กฏํ•œ ์—ฐ๊ตฌํŒ€์€ โ€œ์‹œ๊ฐ๊ณผ ์ด‰๊ฐ์„ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋ฉด ๋” ๋‚˜์„๊นŒ?โ€๋ผ๋Š” ์งˆ๋ฌธ์—์„œ ์ถœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„๋„ ๋ˆˆ๊ณผ ์†์„ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋‹ˆ๊นŒ์š”. ๊ทธ๋“ค์˜ ๋‹ต์€ RotateIt ์‹œ์Šคํ…œ์ด์—ˆ์Šต๋‹ˆ๋‹ค.

์‹œ์Šคํ…œ ๊ตฌ์„ฑ:

  1. ํ•˜๋“œ์›จ์–ด

    • Allegro Hand (AnyRotate์™€ ๋™์ผํ•œ 4-finger hand)
    • DIGIT ์ด‰๊ฐ ์„ผ์„œ (Meta์—์„œ ๊ฐœ๋ฐœ, ๊ฐ ์†๊ฐ€๋ฝ์— ๋ถ€์ฐฉ)
    • ์™ธ๋ถ€ RGB-D ์นด๋ฉ”๋ผ (์† ์œ„์— ์„ค์น˜)
  2. ์„ผ์‹ฑ ๋ฐฉ์‹

    • ๋น„์ „: ์™ธ๋ถ€ ์นด๋ฉ”๋ผ๋กœ ๋ฌผ์ฒด์˜ ์ „์ฒด ํ˜•์ƒ๊ณผ ๊นŠ์ด ์ •๋ณด ๊ด€์ฐฐ
    • ์ด‰๊ฐ: DIGIT ์„ผ์„œ๋กœ ๊ณ ํ•ด์ƒ๋„ ์ ‘์ด‰ ์ •๋ณด ์ˆ˜์ง‘
      • ์ด‰๊ฐ ์ด๋ฏธ์ง€๋ฅผ 16๊ฐœ ์ด์‚ฐ ์˜์—ญ์œผ๋กœ ํ‘œํ˜„
      • ์ฃผ๋กœ ์ ‘์ด‰ ์œ„์น˜์— ์ง‘์ค‘
    • ๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ: ๊ด€์ ˆ ๊ฐ๋„์™€ ์†๋„
  3. ํ•ต์‹ฌ ๊ธฐ์ˆ : Visuotactile Transformer

    [RGB-D ์ด๋ฏธ์ง€] โ†’ Vision Encoder (ResNet)
          โ†“
    [Transformer Fusion]  โ† [4๊ฐœ DIGIT ์ด๋ฏธ์ง€] โ†’ Tactile Encoder
          โ†“
    [์œตํ•ฉ๋œ ํ‘œํ˜„] โ†’ ๋ฌผ์ฒด ํ˜•์ƒ + ๋ฌผ๋ฆฌ ์†์„ฑ ์ถ”๋ก 
          โ†“
    [์ •์ฑ… ๋„คํŠธ์›Œํฌ] โ†’ ํšŒ์ „ ํ–‰๋™ ์ถœ๋ ฅ

    Transformer๊ฐ€ cross-attention์œผ๋กœ ์‹œ๊ฐ๊ณผ ์ด‰๊ฐ์„ ์œตํ•ฉํ•ฉ๋‹ˆ๋‹ค:

    • ์นด๋ฉ”๋ผ๊ฐ€ ๋ฌผ์ฒด์˜ ์ „์ฒด ํ˜•์ƒ์„ ๋ณด๋ฉด
    • ์ด‰๊ฐ์ด ์ ‘์ด‰ ์ง€์ ์˜ ์„ธ๋ฐ€ํ•œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๊ณ 
    • โ€œ์•„, ์ด ๋ฌผ์ฒด๋Š” ์ด๋Ÿฐ ๋ชจ์–‘์ด๊ณ  ์ด ๋ฌด๊ฒŒ๋ผ์„œ ์ด๋ ‡๊ฒŒ ์žก์•„์•ผ๊ฒ ๋‹คโ€

ํ•™์Šต ๊ณผ์ •:

AnyRotate์™€ ์œ ์‚ฌํ•˜๊ฒŒ Teacher-Student ๊ตฌ์กฐ ์‚ฌ์šฉ:

  • Oracle Teacher: GT ํ˜•์ƒ๊ณผ ๋ฌผ๋ฆฌ ์†์„ฑ ์•Œ๊ณ  ์žˆ์Œ
  • Visuotactile Student: ๋…ธ์ด์ฆˆ๊ฐ€ ์žˆ๋Š” ์‹œ๊ฐ-์ด‰๊ฐ๋งŒ์œผ๋กœ ์ž‘๋™
  • ํŠน๋ณ„ํ•œ ์ : latent space์—์„œ ๋ฌผ์ฒด์˜ 3D ํ˜•์ƒ์„ ์žฌ๊ตฌ์„ฑ ๊ฐ€๋Šฅ!

์„ฑ๋Šฅ:

์‹œ๋ฎฌ๋ ˆ์ด์…˜:

  • X, Y, Z์ถ• ๊ฐ๊ฐ 80% ์ด์ƒ ์„ฑ๊ณต๋ฅ 
  • ๋น„์ „๋งŒ vs ์ด‰๊ฐ๋งŒ vs ๋‘˜ ๋‹ค โ†’ ๋‘˜ ๋‹ค๊ฐ€ ์ตœ๊ณ 

์‹ค์ œ ๋กœ๋ด‡:

  • ๋‹ค์–‘ํ•œ ์ผ์ƒ ๋ฌผ์ฒด(๋จธ๊ทธ์ปต, ๋ง์น˜, ํ”Œ๋ผ์Šคํ‹ฑ ๋ณ‘ ๋“ฑ)
  • ์ฒ˜์Œ ๋ณด๋Š” ๋ฌผ์ฒด์—๋„ ์ž˜ ์ผ๋ฐ˜ํ™”

AnyRotate์™€์˜ ์ƒ์„ธ ๋น„๊ต:

์ฐจ์› RotateIt (Qi et al. 2023) AnyRotate (2024)
์ด‰๊ฐ ํ‘œํ˜„ 16๊ฐœ ์ด์‚ฐ ์˜์—ญ + ์›๋ณธ ์ด๋ฏธ์ง€ ์—ฐ์†์  ์ž์„ธ(ฮธ,ฯ†) + ํž˜(|F|)
์ •๋ณด ๋ฐ€๋„ ์ค‘๊ฐ„ (์ด์‚ฐํ™”๋กœ ์ผ๋ถ€ ์†์‹ค) ๋†’์Œ (์—ฐ์† ์‹ค์ˆ˜ ๊ฐ’)
๋น„์ „ ํ•„์š”์„ฑ ํ•„์ˆ˜ (์™ธ๋ถ€ ์นด๋ฉ”๋ผ) ๋ถˆํ•„์š” (์ˆœ์ˆ˜ ์ด‰๊ฐ)
์„ค์น˜ ๋ณต์žก๋„ ๋†’์Œ (์นด๋ฉ”๋ผ ์บ˜๋ฆฌ๋ธŒ๋ ˆ์ด์…˜) ๋‚ฎ์Œ (์„ผ์„œ๋งŒ)
์ค‘๋ ฅ ๋ถˆ๋ณ€์„ฑ X (์†๋ฐ”๋‹ฅ ์œ„ ๊ณ ์ •) O (6+ ๋ฐฉํ–ฅ)
ํšŒ์ „์ถ• ์ œ์–ด ๋‹ค์ถ• ๊ฐ€๋Šฅ (๊ฐœ๋ณ„ ํ•™์Šต?) ํ†ตํ•ฉ ์ •์ฑ…์œผ๋กœ ์ž„์˜ ์ถ•
๋ฏธ๋„๋Ÿผ ๋Œ€์‘ ๋ช…์‹œ์  ๋ชจ๋“ˆ ํ•„์š” ์•”๋ฌต์  ํ•™์Šต (์ฐฝ๋ฐœ)
๋ฌผ์ฒด ์ดํ•ด 3D ํ˜•์ƒ ์žฌ๊ตฌ์„ฑ O ์ง์ ‘ ์žฌ๊ตฌ์„ฑ X
์„ผ์„œ DIGIT (Meta) DigiTac (Bristol)
์ฃผ์š” ๊ธฐ์—ฌ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์œตํ•ฉ ์ค‘๋ ฅ ๋ถˆ๋ณ€ + ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ

RotateIt์˜ ๊ฐ•์ :

  1. ํ˜•์ƒ ์ดํ•ด:
    • RGB-D๋กœ ๋ฌผ์ฒด ์ „์ฒด ํ˜•์ƒ ํŒŒ์•…
    • ํŠนํžˆ ์ฒ˜์Œ ๋ณด๋Š” ๋ณต์žกํ•œ ๋ฌผ์ฒด์— ์œ ๋ฆฌ
    • Learned representation์œผ๋กœ 3D shape ์žฌ๊ตฌ์„ฑ ๊ฐ€๋Šฅ
  2. Transformer ์œตํ•ฉ:
    • Attention์œผ๋กœ ์‹œ๊ฐ-์ด‰๊ฐ ์ƒํ˜ธ๋ณด์™„
    • ์ค‘์š”ํ•œ ์˜์—ญ์— ์ž๋™์œผ๋กœ ์ง‘์ค‘
  3. ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ”„๋ ˆ์ž„์›Œํฌ:
    • ํ–ฅํ›„ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ์ข‹์€ ๋ฐฉ๋ฒ•๋ก 
    • ๋‹ค๋ฅธ ์„ผ์„œ ์ถ”๊ฐ€๋„ ๊ฐ€๋Šฅํ•œ ํ™•์žฅ์„ฑ

RotateIt์˜ ํ•œ๊ณ„:

  1. ์™ธ๋ถ€ ์„ผ์„œ ์˜์กด:
    • ์นด๋ฉ”๋ผ ์„ค์น˜์™€ ์บ˜๋ฆฌ๋ธŒ๋ ˆ์ด์…˜ ํ•„์ˆ˜
    • ์‹คํ—˜์‹ค ๋ฐ– ์ ์šฉ ์–ด๋ ค์›€
    • ์กฐ๋ช… ๋ณ€ํ™”์— ๋ฏผ๊ฐ
  2. ๊ณ ์ •๋œ ์† ๋ฐฉํ–ฅ:
    • ์—ฌ์ „ํžˆ palm up๋งŒ
    • ์ค‘๋ ฅ ๋ถˆ๋ณ€์„ฑ ๋ฏธ๋‹ฌ์„ฑ
  3. ์ผ๋ถ€ ์ž๊ธฐ ํ์ƒ‰:
    • ์†์ด ๋ฌผ์ฒด๋ฅผ ๊ฐ€๋ฆผ
    • ์™„์ „ํ•œ ํ•ด๊ฒฐ์€ ์•„๋‹˜

๊ฒฐ๋ก :

RotateIt๋Š” โ€œ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌโ€์ด ๋‹ต์ด๋ผ๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค. ์‹œ๊ฐ+์ด‰๊ฐ > ๊ฐ๊ฐ์˜ ํ•ฉ.

AnyRotate๋Š” โ€œ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ๋งŒ์œผ๋กœ๋„ ์ถฉ๋ถ„โ€ํ•˜๋‹ค๊ณ  ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๊ทธ๊ฒƒ๋„ ์ž„์˜ ๋ฐฉํ–ฅ์—์„œ!

์‹ค์šฉ์  ์„ ํƒ:

  • ์นด๋ฉ”๋ผ ์‚ฌ์šฉ ๊ฐ€๋Šฅ โ†’ RotateIt (๋” ๋งŽ์€ ์ •๋ณด)
  • ์นด๋ฉ”๋ผ ์–ด๋ ค์›€ โ†’ AnyRotate (๋” ๊ฐ•๊ฑดํ•˜๊ณ  ๋‹จ์ˆœ)

Khandate et al. (2022-2023) - ์†๊ฐ€๋ฝ ๊ฒŒ์ดํŒ… ํ•™์Šต ์‹œ๋ฆฌ์ฆˆ

Columbia University์˜ Matei Ciocarlie ๊ต์ˆ˜ ์—ฐ๊ตฌ์‹ค์—์„œ ์ง„ํ–‰ํ•œ ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค. Gagan Khandate ๋ฐ•์‚ฌ๊ณผ์ • ํ•™์ƒ์ด ์ฃผ๋„ํ–ˆ์Šต๋‹ˆ๋‹ค.

์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ์ฃผ์ œ: ์†๊ฐ€๋ฝ ๊ฒŒ์ดํŒ…(Finger Gaiting)

์†๊ฐ€๋ฝ ๊ฒŒ์ดํŒ…์ด๋ž€, ๋ฌผ์ฒด๋ฅผ ์žก๊ณ  ์žˆ๋Š” ์†๊ฐ€๋ฝ์„ ๋ฐ”๊ฟ”๊ฐ€๋ฉฐ ์กฐ์ž‘ํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ๋งˆ์น˜ ์•”๋ฒฝ๋“ฑ๋ฐ˜์ฒ˜๋Ÿผ ์†๊ณผ ๋ฐœ์„ ๋ฒˆ๊ฐˆ์•„ ์›€์ง์ด๋Š” ๊ฒƒ๊ณผ ๋น„์Šทํ•˜์ฃ .

์˜ˆ๋ฅผ ๋“ค์–ด:

  1. ๊ฒ€์ง€+์ค‘์ง€๋กœ ๋ฌผ์ฒด ๊ณ ์ •
  2. ์—„์ง€+์•ฝ์ง€๊ฐ€ ์›€์ง์—ฌ์„œ ๋ฌผ์ฒด ํšŒ์ „
  3. ์ด์ œ ์—„์ง€+์•ฝ์ง€๋กœ ๊ณ ์ •
  4. ๊ฒ€์ง€+์ค‘์ง€๊ฐ€ ์›€์ง์—ฌ์„œ ๋” ํšŒ์ „
  5. ๋ฐ˜๋ณตโ€ฆ

2022๋…„ ์—ฐ๊ตฌ: โ€œOn the Feasibility of Learning Finger-gaiting In-hand Manipulation with Intrinsic Sensingโ€ (ICRA 2022)

โ€œ์ •๋ง ๊ฐ•ํ™”ํ•™์Šต๋งŒ์œผ๋กœ ์ด๋Ÿฐ ๋ณต์žกํ•œ ๊ธฐ์ˆ ์„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์„๊นŒ?โ€

์‹œ์Šคํ…œ ๊ตฌ์„ฑ:

  • ๋กœ๋ด‡ ์†: ์ปค์Šคํ…€ ์ œ์ž‘ 5-finger hand
    • ๊ฐ ์†๊ฐ€๋ฝ: 1 roll joint + 2 flexion joints = 3 DoF
    • ์ด 15 DoF (5 fingers ร— 3 joints)
    • ๋ชจ๋‘ Dynamixel XM430 ์„œ๋ณด๋ชจํ„ฐ๋กœ ๊ตฌ๋™
    • ์œ„์น˜ ์ œ์–ด ๋ชจ๋“œ
  • ์„ผ์‹ฑ:
    • ๊ฐ ์†๊ฐ€๋ฝ ๋์— ๊ด‘ํ•™ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ
    • ์œ ์—ฐํ•œ ๋ฐ˜์‚ฌ๋ง‰ + LED + ํฌํ† ๋‹ค์ด์˜ค๋“œ ๋ฐฐ์—ด
    • ๋ง‰์ด ๋ˆŒ๋ฆฌ๋ฉด ๋น› ๋ฐ˜์‚ฌ ํŒจํ„ด ๋ณ€ํ™”
    • ์ถœ๋ ฅ: ์ด์ง„ ์‹ ํ˜ธ (๋‹ฟ์Œ 1 / ์•ˆ ๋‹ฟ์Œ 0)
    • ๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ (๊ด€์ ˆ ๊ฐ๋„, ์†๋„)

ํ•ต์‹ฌ ๋„์ „: ํƒ์ƒ‰ ๋ฌธ์ œ

์†๊ฐ€๋ฝ ๊ฒŒ์ดํŒ…์˜ ๊ฐ€์žฅ ํฐ ์–ด๋ ค์›€:

๋ฌธ์ œ: ๋ฌด์ž‘์œ„ ํ–‰๋™์œผ๋กœ๋Š” ๊ฑฐ์˜ ์‹คํŒจ
- ์†๊ฐ€๋ฝ์„ ์กฐ๊ธˆ๋งŒ ์ž˜๋ชป ์›€์ง์—ฌ๋„ โ†’ ๋ฌผ์ฒด ๋‚™ํ•˜
- ์„ฑ๊ณต์ ์ธ ๊ฒŒ์ดํŒ…์€ ๊ทนํžˆ ๋“œ๋ฌผ๊ฒŒ ๋ฐœ์ƒ
- ํ•™์Šต ์‹ ํ˜ธ๊ฐ€ ๋„ˆ๋ฌด ํฌ์†Œ (sparse reward)

ํ•ด๊ฒฐ์ฑ…: Initial State Distribution

  1. ์•ˆ์ •์ ์ธ ํŒŒ์ง€ ์ž์„ธ๋“ค์„ ์‚ฌ์ „ ์ƒ์„ฑ
    • ๋‹ค์–‘ํ•œ ๊ด€์ ˆ ๊ฐ๋„ ์ƒ˜ํ”Œ๋ง
    • ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ์•ˆ์ •์„ฑ ๊ฒ€์ฆ
    • ์•ˆ์ •ํ•œ ์ž์„ธ๋งŒ ์ €์žฅ
  2. ํ•™์Šต ์‹œ ์ด ์ž์„ธ๋“ค์„ ์ดˆ๊ธฐ ์ƒํƒœ๋กœ ์‚ฌ์šฉ
    • ๋งค ์—ํ”ผ์†Œ๋“œ ์‹œ์ž‘์„ ์•ˆ์ •ํ•œ ์ž์„ธ์—์„œ
    • ๊ฑฐ๊ธฐ์„œ๋ถ€ํ„ฐ ๊ฒŒ์ดํŒ… ์—ฐ์Šต
  3. ํšจ๊ณผ
    • ๋–จ์–ด๋œจ๋ฆด ํ™•๋ฅ  โ†“โ†“
    • ์œ ์šฉํ•œ ๊ฒฝํ—˜ ์ˆ˜์ง‘ โ†‘โ†‘
    • ํ•™์Šต ์†๋„ 5-10๋ฐฐ ํ–ฅ์ƒ

ํ•™์Šต ์„ค์ •:

  • ์•Œ๊ณ ๋ฆฌ์ฆ˜: PPO (Proximal Policy Optimization)
  • ๋ชฉํ‘œ: Z์ถ• ํšŒ์ „ (์ˆ˜์ง์ถ•)
  • ๋ณด์ƒ: ๊ฐ์†๋„ + ์•ˆ์ •์„ฑ ํŽ˜๋„ํ‹ฐ
  • ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ: PyBullet

์„ฑ๊ณผ:

  • Z์ถ• ์†๊ฐ€๋ฝ ๊ฒŒ์ดํŒ… ํ•™์Šต ์„ฑ๊ณต!
  • Palm up๊ณผ palm down ๋‘ ๋ฐฉํ–ฅ ์ž‘๋™
  • ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ณด๋‹ค 5-10๋ฐฐ ๋น ๋ฅธ ํ•™์Šต
  • ๋‹จ์ˆœํ•œ ๋ณผ๋ก ๋ฌผ์ฒด (๊ตฌ, ์‹ค๋ฆฐ๋”)

ํ•œ๊ณ„:

  • ๋‹จ์ผ ์ถ•(Z์ถ•)๋งŒ
  • ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋งŒ ๊ฒ€์ฆ
  • ์‹ค์ œ ๋กœ๋ด‡ ์ „์ด ์•ˆ ๋จ

2023๋…„ ์—ฐ๊ตฌ: โ€œSampling-based Exploration for Reinforcement Learning of Dexterous Manipulationโ€ (RSS 2023)

โ€œ๋” ์–ด๋ ค์šด ๋ฌผ์ฒด๋Š” ์–ด๋–ป๊ฒŒ ๋‹ค๋ฃฐ๊นŒ? L์ž๋‚˜ U์ž ๊ฐ™์€?โ€

์ƒˆ๋กœ์šด ๋„์ „:

๋ณผ๋กํ•œ ๊ณต์€ ์–ด๋””๋ฅผ ์žก์•„๋„ ๋น„์Šทํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ:

  • L์ž ๋ฌผ์ฒด: ํ•œ์ชฝ์ด ๋ฌด๊ฑฐ์šฐ๋ฉด ๊ท ํ˜• ๊นจ์ง
  • U์ž ๋ฌผ์ฒด: ์ž˜๋ชป ์žก์œผ๋ฉด ๋น ์ ธ๋‚˜๊ฐ
  • ๊ธด ๋ง‰๋Œ€๊ธฐ: ํšŒ์ „ ๊ด€์„ฑ ๋†’์Œ

์ด๋Ÿฐ ๋ฌผ์ฒด๋“ค์€ ์ข์€ ํ†ต๋กœ(narrow passage) ๋ฌธ์ œ๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค:

์ƒํƒœ ๊ณต๊ฐ„:
[์•ˆ์ • ์˜์—ญ A] ---- ์ข์€ ํ†ต๋กœ ---- [์•ˆ์ • ์˜์—ญ B]

๋ฌธ์ œ: ๋ฌด์ž‘์œ„ ํƒ์ƒ‰์œผ๋กœ๋Š” ์ข์€ ํ†ต๋กœ๋ฅผ ํ†ต๊ณผํ•˜๊ธฐ ๊ทนํžˆ ์–ด๋ ค์›€

ํ•ด๊ฒฐ์ฑ…: Sampling-Based Planning + RL ํ•˜์ด๋ธŒ๋ฆฌ๋“œ

๋‘ ์„ธ๊ณ„์˜ ์žฅ์ ์„ ๊ฒฐํ•ฉ:

1. Sampling-Based Planning (SBP):

# RRT* ๊ฐ™์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์‚ฌ์šฉ
def plan_path(start_pose, goal_pose):
    tree = initialize_tree(start_pose)

    for i in range(iterations):
        random_pose = sample_random_pose()
        nearest = find_nearest_in_tree(random_pose)
        new_pose = extend_towards(nearest, random_pose)

        if physics_check(new_pose):  # ๋–จ์–ด์ง€์ง€ ์•Š๋Š”์ง€ ํ™•์ธ
            tree.add(new_pose)

        if close_to_goal(new_pose, goal_pose):
            return extract_path(tree, new_pose)

์ด๋ ‡๊ฒŒ ์ฐพ์€ ๊ฒฝ๋กœ๋Š”:

  • ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์‹คํ˜„ ๊ฐ€๋Šฅ
  • ์ข์€ ํ†ต๋กœ๋„ ํ†ต๊ณผ
  • ํ•˜์ง€๋งŒ ์‹ค์‹œ๊ฐ„์€ ์•„๋‹˜ (๊ณ„ํš์— ์‹œ๊ฐ„ ์†Œ์š”)

2. Reinforcement Learning:

# SBP๊ฐ€ ์ฐพ์€ ๊ฒฝ๋กœ๋ฅผ ํ™œ์šฉ
def train_policy():
    # 1. SBP๋กœ ์ข‹์€ ๊ฒฝ๋กœ๋“ค ์ˆ˜์ง‘
    paths = sampling_based_planner.get_paths()

    # 2. ๊ฒฝ๋กœ์˜ state๋“ค์„ ์ดˆ๊ธฐ ์ƒํƒœ๋กœ ํ™œ์šฉ
    for episode in training:
        init_state = sample_from(paths)
        # ์—ฌ๊ธฐ์„œ๋ถ€ํ„ฐ RL ํ•™์Šต

    # 3. ๊ฒฐ๊ณผ: ๊ฒฝ๋กœ๋ฅผ ๋„˜์–ด์„œ ์ผ๋ฐ˜ํ™”๋œ ์ •์ฑ…

ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ ‘๊ทผ์˜ ์žฅ์ :

๋ฐฉ๋ฒ• ์žฅ์  ๋‹จ์  ํ•˜์ด๋ธŒ๋ฆฌ๋“œ
์ˆœ์ˆ˜ RL ์ผ๋ฐ˜ํ™” ์ข‹์Œ ํƒ์ƒ‰ ์–ด๋ ค์›€ โœ“ ์ผ๋ฐ˜ํ™”
์ˆœ์ˆ˜ Planning ํŠน์ • ๋ชฉํ‘œ ๋‹ฌ์„ฑ ์‹ค์‹œ๊ฐ„ ์–ด๋ ค์›€ โœ“ ํšจ์œจ
์ผ๋ฐ˜ํ™” ์ œํ•œ โœ“ ์‹ค์‹œ๊ฐ„

์‹คํ—˜ ๋ฌผ์ฒด:

  • Easy: ๊ตฌ, ์‹ค๋ฆฐ๋” (๊ธฐ๋ณธ์„ )
  • Moderate: ํƒ€์›์ฒด, ๋‘๊บผ์šด ๋ง‰๋Œ€
  • Hard: L์ž, U์ž, ์–‡๊ณ  ๊ธด ๋ง‰๋Œ€

์„ฑ๊ณผ:

์‹œ๋ฎฌ๋ ˆ์ด์…˜:

  • ๋ชจ๋“  ๋‚œ์ด๋„์˜ ๋ฌผ์ฒด์—์„œ ๊ฒŒ์ดํŒ… ์„ฑ๊ณต
  • Hard ๋ฌผ์ฒด๋„ 80% ์ด์ƒ ์„ฑ๊ณต๋ฅ 
  • ์ˆœ์ˆ˜ RL๋ณด๋‹ค 3-5๋ฐฐ ๋น ๋ฅธ ์ˆ˜๋ ด

์‹ค์ œ ๋กœ๋ด‡:

  • 2023๋…„ ๋…ผ๋ฌธ์—์„œ ๋“œ๋””์–ด ์‹ค์ œ ๊ฒ€์ฆ!
  • L์ž, U์ž ๋ฌผ์ฒด ์‹ค์ œ๋กœ ํšŒ์ „ ์„ฑ๊ณต
  • IEEE Spectrum์— โ€œRobot Hand Manipulates Complex Objects by Touch Aloneโ€ ๊ธฐ์‚ฌํ™”

์‹ค์ œ ๋กœ๋ด‡ ํ•˜๋“œ์›จ์–ด:

โ€œHighly Dexterous Robot Hand Can Operate in the Darkโ€ - 5๊ฐœ ์†๊ฐ€๋ฝ, 15 DoF - ๊ฐ ์†๊ฐ€๋ฝ ๋์— ๊ด‘ํ•™ ์ด‰๊ฐ ์„ผ์„œ - ์™„์ „ ์•”ํ‘์—์„œ๋„ ์ž‘๋™ (์ˆœ์ˆ˜ ์ด‰๊ฐ) - ๋ณต์žกํ•œ ํ˜•์ƒ ๋‹ค๋ฃธ

AnyRotate์™€์˜ ์ƒ์„ธ ๋น„๊ต:

์ธก๋ฉด Khandate et al. (2022-2023) AnyRotate (2024)
์ด‰๊ฐ ํ•ด์ƒ๋„ ์ด์ง„ (1 bit/finger) ์—ฐ์† (ฮธ,ฯ†,F/finger)
์ •๋ณด๋Ÿ‰ 5 bits (5 fingers) ~15 ์—ฐ์† ๋ณ€์ˆ˜
ํšŒ์ „ ์ž์œ ๋„ ์ฃผ๋กœ Z์ถ• ์ž„์˜ ์ถ• ํ†ตํ•ฉ ์ •์ฑ…
์† ๋ฐฉํ–ฅ Palm up/down (2๊ฐ€์ง€) 6+ ๋ฐฉํ–ฅ ์ž์œ ๋กญ๊ฒŒ
์ค‘๋ ฅ ๋„์ „ ๋ถ€๋ถ„์  ํ•ด๊ฒฐ ์™„์ „ ํ•ด๊ฒฐ
ํ•™์Šต ์ ‘๊ทผ SBP + RL ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ชฉํ‘œ์กฐ๊ฑด RL + ์ปค๋ฆฌํ˜๋Ÿผ
ํƒ์ƒ‰ ์ „๋žต Planning์œผ๋กœ ๊ฒฝ๋กœ ์ œ๊ณต Adaptive curriculum
๋ฌผ์ฒด ๋ณต์žก๋„ ๋ณผ๋ก โ†’ ๋ณต์žก (L, U) ๋‹ค์–‘ํ•œ ์ผ์ƒ ๋ฌผ์ฒด
์‹ค์ œ ๊ฒ€์ฆ 2023๋…„ ์ผ๋ถ€ ๊ด‘๋ฒ”์œ„ (10๊ฐœ ๋ฌผ์ฒด)
์ฃผ์š” ๊ธฐ์—ฌ Planning-RL ๊ฒฐํ•ฉ ์ค‘๋ ฅ ๋ถˆ๋ณ€ + ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ

Khandate ์—ฐ๊ตฌ์˜ ๊ฐ•์ :

  1. ์ด๋ก ์  ์ฒด๊ณ„์„ฑ:
    • Narrow passage ๋ฌธ์ œ๋ฅผ ์›๋ฆฌ์ ์œผ๋กœ ํ•ด๊ฒฐ
    • SBP์™€ RL ๊ฒฐํ•ฉ์˜ ์ด์œ ๋ฅผ ๋ช…ํ™•ํžˆ ์„ค๋ช…
    • ๋กœ๋ณดํ‹ฑ์Šค ์ปค๋ฎค๋‹ˆํ‹ฐ์— ๋ฐฉ๋ฒ•๋ก  ์ œ์‹œ
  2. ๋ณต์žกํ•œ ํ˜•์ƒ:
    • L์ž, U์ž ๋“ฑ ๊ธฐ์กด ๋ฐฉ๋ฒ•์ด ์‹คํŒจํ•œ ๋ฌผ์ฒด
    • ํ˜•์ƒ ๋ณต์žก๋„์˜ ํ•œ๊ณ„๋ฅผ ๋„“ํž˜
    • โ€œ์ด๋Ÿฐ ๊ฒƒ๋„ ํ•™์Šต์œผ๋กœ ๊ฐ€๋Šฅํ•˜๋‹คโ€
  3. ์ ์ง„์  ๋ฐœ์ „:
    • 2022: ๊ธฐ๋ณธ ๊ฐœ๋… ๊ฒ€์ฆ (์‹œ๋ฎฌ๋ ˆ์ด์…˜)
    • 2023: ์–ด๋ ค์šด ๋ฌผ์ฒด + ์‹ค์ œ ๋กœ๋ด‡
    • ์ฒด๊ณ„์ ์ด๊ณ  ํƒ„ํƒ„ํ•œ ์—ฐ๊ตฌ ์ง„ํ–‰

Khandate ์—ฐ๊ตฌ์˜ ํ•œ๊ณ„:

  1. ์ด์ง„ ์ด‰๊ฐ์˜ ํ•œ๊ณ„:
    • โ€œ๋‹ฟ์•˜๋‹ค/์•ˆ ๋‹ฟ์•˜๋‹คโ€๋งŒ ์•Œ ์ˆ˜ ์žˆ์Œ
    • ์–ผ๋งˆ๋‚˜ ์„ธ๊ฒŒ? โ†’ ๋ชจ๋ฆ„
    • ์–ด๋А ๊ฐ๋„๋กœ? โ†’ ๋ชจ๋ฆ„
    • ๋ฏธ์„ธํ•œ ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€ ๋ถˆ๊ฐ€๋Šฅ
  2. ์ œํ•œ๋œ ์ค‘๋ ฅ ๋Œ€์‘:
    • Palm up/down์€ ๊ฐ€๋Šฅ
    • ํ•˜์ง€๋งŒ Thumb up/down ๊ฐ™์€ ๊ทนํ•œ ์ž์„ธ๋Š” ์—ฌ์ „ํžˆ ์–ด๋ ค์›€
    • ์ค‘๋ ฅ์ด ์–ด๋А ์ •๋„ ๋„์™€์ฃผ๋Š” ์ƒํ™ฉ
  3. ํšŒ์ „์ถ• ์ œํ•œ:
    • ์ฃผ๋กœ Z์ถ• (์ˆ˜์ง์ถ•) ์ค‘์‹ฌ
    • X, Y์ถ• ํšŒ์ „์€ ๋ช…์‹œ์ ์œผ๋กœ ๋‹ค๋ฃจ์ง€ ์•Š์Œ
    • ์ž„์˜ ์ถ•์€ ๋ฏธํ•ด๊ฒฐ
  4. ์‹ค์ œ ๋ฐฐํฌ ๊ฒ€์ฆ:
    • 2022๋…„์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๋งŒ
    • 2023๋…„์— ์ผ๋ถ€ ์‹ค์ œ ๊ฒ€์ฆ
    • ์žฅ์‹œ๊ฐ„ ์‹ ๋ขฐ์„ฑ, ๋‹ค์–‘ํ•œ ์กฐ๊ฑด ๊ฒ€์ฆ์€ ์ œํ•œ์ 

์—ฐ๊ตฌ ์ฒ ํ•™์˜ ์ฐจ์ด:

Khandate์˜ ์ฒ ํ•™:

"Planning(๊ณ„ํš)๊ณผ Learning(ํ•™์Šต)์„ ๊ฒฐํ•ฉํ•˜๋ฉด
 ์–ด๋ ค์šด ํƒ์ƒ‰ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค"

โ†’ ๋ฐฉ๋ฒ•๋ก ์— ์ง‘์ค‘
โ†’ ์–ด๋ ค์šด ๋ฌผ์ฒด๋กœ ๋ฐฉ๋ฒ•์˜ ์šฐ์ˆ˜์„ฑ ์ฆ๋ช…
โ†’ ์ด๋ก ๊ณผ ์‹ค์ „์˜ ๊ท ํ˜•

AnyRotate์˜ ์ฒ ํ•™:

"๊ณ ๋ฐ€๋„ ์„ผ์‹ฑ์ด ์žˆ์œผ๋ฉด
 ๊ทนํ•œ ์กฐ๊ฑด์—์„œ๋„ ๊ฐ•๊ฑดํ•œ ์กฐ์ž‘์ด ๊ฐ€๋Šฅํ•˜๋‹ค"

โ†’ ์„ผ์‹ฑ์˜ ์ค‘์š”์„ฑ ๊ฐ•์กฐ
โ†’ ์ค‘๋ ฅ ๋ถˆ๋ณ€์ด๋ผ๋Š” ์ƒˆ ์ฐจ์› ์ถ”๊ฐ€
โ†’ ์‹ค์šฉ์„ฑ์— ์ง‘์ค‘

์ƒํ˜ธ ๋ณด์™„์„ฑ:

ํฅ๋ฏธ๋กญ๊ฒŒ๋„, ๋‘ ์ ‘๊ทผ์„ ๊ฒฐํ•ฉํ•˜๋ฉด ์‹œ๋„ˆ์ง€๊ฐ€ ๋‚  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค:

Khandate์˜ SBP + AnyRotate์˜ ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ
= ๋ณต์žกํ•œ ํ˜•์ƒ์„ ์ž„์˜ ๋ฐฉํ–ฅ์—์„œ ๋‹ค๋ฃจ๋Š” ์‹œ์Šคํ…œ

์˜ˆ๋ฅผ ๋“ค์–ด:

  • L์ž ๋ฌผ์ฒด๋ฅผ ๊ฑฐ๊พธ๋กœ ๋“ค๊ณ 
  • ์ž„์˜์˜ ์ถ•์œผ๋กœ ํšŒ์ „์‹œํ‚ค๋ฉด์„œ
  • ์†๊ฐ€๋ฝ ๊ฒŒ์ดํŒ…๊นŒ์ง€ ์ˆ˜ํ–‰

ํ•ต์‹ฌ ์ฐจ๋ณ„์ :

  1. ์ •๋ณด์˜ ํ’๋ถ€ํ•จ:
    • ๊ธฐ์กด: 4 bits ~ 16 bits
    • AnyRotate: ์—ฐ์†์  ์‹ค์ˆ˜ ๊ฐ’ (๋ฌดํ•œ ํ•ด์ƒ๋„)
  2. ํ†ตํ•ฉ์„ฑ:
    • ๊ธฐ์กด: ์กฐ๊ฑด๋ณ„ ๋ณ„๋„ ์ •์ฑ…
    • AnyRotate: ํ•˜๋‚˜์˜ ์ •์ฑ…์œผ๋กœ ๋ชจ๋“  ์กฐ๊ฑด
  3. ๊ฐ•๊ฑด์„ฑ:
    • ๊ธฐ์กด: ์ œํ•œ๋œ ์กฐ๊ฑด์—์„œ๋งŒ
    • AnyRotate: ๊ทนํ•œ ์กฐ๊ฑด(๊ฑฐ๊พธ๋กœ, ์˜†์œผ๋กœ)์—์„œ๋„

Sievers et al. (2022) - ํ† ํฌ ์ œ์–ด ์ˆœ์ˆ˜ ์ด‰๊ฐ

๊ทธ๋“ค์˜ ์ ‘๊ทผ:

  • ํ† ํฌ ์ œ์–ด DLR ์† ์‚ฌ์šฉ
  • ์ˆœ์ˆ˜ ์ด‰๊ฐ (๋น„์ „ ์—†์Œ)
  • ๋ชจ๋ธ ๊ธฐ๋ฐ˜ + ๊ฐ•ํ™”ํ•™์Šต ๊ฒฐํ•ฉ

์žฅ์ :

  • ๋ฌผ๋ฆฌ ๋ฒ•์น™ ์ง์ ‘ ํ™œ์šฉ
  • ๋” ์ •๋ฐ€ํ•œ ํž˜ ์ œ์–ด

ํ•œ๊ณ„:

  • ๊ณ ์ •๋œ ์† ๋ฐฉํ–ฅ
  • ํŠน์ • ๋ฌผ์ฒด์—๋งŒ ํ…Œ์ŠคํŠธ
  • ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ์ œํ•œ์ 

AnyRotate๊ฐ€ ๋” ๋‚˜์€ ์ :

  • ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋กœ ์ผ๋ฐ˜ํ™”
  • ์ค‘๋ ฅ ๋ถˆ๋ณ€
  • ์™„์ „ ํ•™์Šต ๊ธฐ๋ฐ˜ (๋ฌผ๋ฆฌ ๋ชจ๋ธ ๋ถˆํ•„์š”)

Sievers๊ฐ€ ๋” ๋‚˜์€ ์ :

  • ๋” ์ •๋ฐ€ํ•œ ํž˜ ์ œ์–ด
  • ๋ฌผ๋ฆฌ์  ์ง๊ด€ ํ†ตํ•ฉ

7. ์ด๋ก ์  ๊ด€์ : ์™œ ์ด๊ฒŒ ์ž‘๋™ํ•˜๋Š”๊ฐ€?

๊ธฐ์ˆ ์  ๋””ํ…Œ์ผ์„ ๋„˜์–ด์„œ, ์ด ์‹œ์Šคํ…œ์ด ์™œ ์ž‘๋™ํ•˜๋Š”์ง€ ์ด๋ก ์ ์œผ๋กœ ์ดํ•ดํ•ด๋ด…์‹œ๋‹ค.

์ •๋ณด ์ด๋ก ์œผ๋กœ ๋ฐ”๋ผ๋ณด๊ธฐ

์ฑ„๋„ ์šฉ๋Ÿ‰ ๊ด€์ :

๊ฐ ์„ผ์‹ฑ ๋ฐฉ์‹์ด ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๋Ÿ‰์„ ์ƒ๊ฐํ•ด๋ด…์‹œ๋‹ค.

๊ณ ์œ ์ˆ˜์šฉ๊ฐ๊ฐ:

  • 16๊ฐœ ๊ด€์ ˆ ๊ฐ๋„
  • ์—ฐ์†๊ฐ’์ด์ง€๋งŒ ๊ฐ„์ ‘์  ์ •๋ณด
  • ์ ‘์ด‰ ์ƒํƒœ๋ฅผ ์ถ”๋ก ํ•ด์•ผ ํ•จ

์ด์ง„ ์ด‰๊ฐ:

  • 4๊ฐœ ์†๊ฐ€๋ฝ ร— 1 bit = 4 bits
  • ์ง์ ‘์ ์ด์ง€๋งŒ ์ œํ•œ์ 
  • โ€œ์–ด๋””์— ๋‹ฟ์•˜๋‚˜โ€๋Š” ๋ชจ๋ฆ„

๊ณ ๋ฐ€๋„ ์ด‰๊ฐ:

  • 4๊ฐœ ์†๊ฐ€๋ฝ ร— (ฮธ, ฯ†, |F|) = 12๊ฐœ ์—ฐ์† ๋ณ€์ˆ˜
  • ์ง์ ‘์ ์ด๊ณ  ํ’๋ถ€ํ•จ
  • ์œ„์น˜์™€ ํž˜์„ ๋™์‹œ์— ์•Ž

์ƒํ˜ธ ์ •๋ณด (Mutual Information):

๋ฌผ์ฒด ์ƒํƒœ S์™€ ๊ด€์ฐฐ O ์‚ฌ์ด์˜ ์ƒํ˜ธ ์ •๋ณด:

I(S; O) = H(S) - H(S|O)

์ฆ‰, โ€œ๊ด€์ฐฐ์„ ํ†ตํ•ด ์ƒํƒœ์— ๋Œ€ํ•œ ๋ถˆํ™•์‹ค์„ฑ์ด ์–ผ๋งˆ๋‚˜ ์ค„์–ด๋“œ๋Š”๊ฐ€?โ€

I(S; O_dense) > I(S; O_discrete) > I(S; O_binary) > I(S; O_proprio)

๊ณ ๋ฐ€๋„ ์ด‰๊ฐ์ด ๋” ๋งŽ์€ ๋ถˆํ™•์‹ค์„ฑ์„ ์ œ๊ฑฐํ•˜๋ฏ€๋กœ, ๋” ์ข‹์€ ์˜์‚ฌ๊ฒฐ์ •์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค!

POMDP ๊ด€์ 

In-hand ์กฐ์ž‘์€ ๋ณธ์งˆ์ ์œผ๋กœ ๋ถ€๋ถ„ ๊ด€์ธก ๋งˆ๋ฅด์ฝ”ํ”„ ๊ฒฐ์ • ๊ณผ์ •(POMDP)์ž…๋‹ˆ๋‹ค.

๋ฌธ์ œ:

  • ๋ฌผ์ฒด์˜ ์ •ํ™•ํ•œ ์ž์„ธ๋Š” ๋ชจ๋ฆ„
  • ์ ‘์ด‰ ์ง€์ ์˜ ์ •ํ™•ํ•œ ์œ„์น˜๋Š” ๋ชจ๋ฆ„
  • ๋งˆ์ฐฐ ๊ณ„์ˆ˜๋Š” ๋ชจ๋ฆ„

ํ•ด๊ฒฐ์ฑ…: Belief State

์—์ด์ „ํŠธ๋Š” โ€œ์‹ค์ œ ์ƒํƒœ๊ฐ€ ๋ฌด์—‡์ผ๊นŒ?โ€์— ๋Œ€ํ•œ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค:

b(s) = P(s | \text{history})

TCN์˜ ์—ญํ• :

TCN์€ ์ง€๋‚œ 30 ํ”„๋ ˆ์ž„์˜ ๊ด€์ฐฐ๋กœ๋ถ€ํ„ฐ belief state์˜ ์ถฉ๋ถ„ ํ†ต๊ณ„๋Ÿ‰์„ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค:

z_t = f_TCN(o_{t-29:t})

์ด 8์ฐจ์› ๋ฒกํ„ฐ z_t๋Š” belief state๋ฅผ ์••์ถ•ํ•œ ํ‘œํ˜„์ž…๋‹ˆ๋‹ค!

๊ณ ๋ฐ€๋„ ์ด‰๊ฐ์˜ ์ด์ :

๋” ๋งŽ์€ ์ •๋ณด โ†’ ๋” ์ •ํ™•ํ•œ belief โ†’ ๋” ์ข‹์€ ๊ฒฐ์ •

Uncertainty(b_{dense}) < Uncertainty(b_{binary})

์ ‘์ด‰ ์—ญํ•™์˜ ๊ด€์ 

์™œ ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€๊ฐ€ ์ค‘์š”ํ•œ๊ฐ€?

๋งˆ์ฐฐ ์ œ์•ฝ:

|F_{tangential}| โ‰ค ฮผ * |F_{normal}|

๋ฏธ๋„๋Ÿผ์ด ์ž„๋ฐ•ํ•˜๋ฉด:

|F_{tangential}| / |F_{normal}| โ†’ ฮผ

๊ณ ๋ฐ€๋„ ์ด‰๊ฐ์œผ๋กœ ์•Œ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ:

  • ์ ‘์ด‰ ์ž์„ธ (ฮธ, ฯ†) โ†’ ๋ฒ•์„  ๋ฐฉํ–ฅ ์ถ”์ •
  • ์ ‘์ด‰ ํž˜ |F| โ†’ ์ „์ฒด ํž˜์˜ ํฌ๊ธฐ

์ด ๋‘ ์ •๋ณด๋ฅผ ๊ฒฐํ•ฉํ•˜๋ฉด:

  • ๋ฒ•์„  ์„ฑ๋ถ„ F_normal ์ถ”์ •
  • ์ ‘์„  ์„ฑ๋ถ„ F_tangential ์ถ”์ •
  • ๋งˆ์ฐฐ ์—ฌ์œ ๋„ ๊ณ„์‚ฐ!

์ •์ฑ…์ด ๋ฐฐ์šฐ๋Š” ๊ฒƒ:

if friction_margin < threshold:
    # ๋ฏธ๋„๋Ÿผ ์ž„๋ฐ•!
    increase_normal_force()
    adjust_finger_positions()
else:
    # ์•ˆ์ „ํ•จ
    continue_rotation()

์ด ๋ชจ๋“  ๊ฒƒ์ด ๋ช…์‹œ์  ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์—†์ด ํ•™์Šต์œผ๋กœ ํš๋“๋ฉ๋‹ˆ๋‹ค!

๊ฐ•ํ™”ํ•™์Šต ๊ด€์ : ํƒ์ƒ‰์˜ ์–ด๋ ค์›€

์™œ ๋ณด์กฐ ๋ชฉํ‘œ๊ฐ€ ํ•„์š”ํ•œ๊ฐ€?

๊ฐ์†๋„๋ฅผ ์ง์ ‘ ๋ชฉํ‘œ๋กœ ํ•˜๋ฉด:

r = ฯ‰_{desired} - ฯ‰_{actual}

๋ฌธ์ œ:

  • ์ดˆ๊ธฐ์— ฯ‰_actual โ‰ˆ 0 (๋ฌผ์ฒด๊ฐ€ ์•ˆ ๋Œ์•„๊ฐ)
  • ๋ณด์ƒ์ด ๊ณ„์† ์Œ์ˆ˜
  • ์–ด๋–ป๊ฒŒ ๊ฐœ์„ ํ• ์ง€ ๋ชจ๋ฆ„ (ํฌ์†Œ ๋ณด์ƒ ๋ฌธ์ œ)

๋ณด์กฐ ๋ชฉํ‘œ ๋ฐฉ์‹:

r = exp(-\text{distance to goal})

์žฅ์ :

  • ๋ชฉํ‘œ์— ๊ฐ€๊นŒ์›Œ์งˆ์ˆ˜๋ก ์ ์ง„์ ์œผ๋กœ ๋ณด์ƒ ์ฆ๊ฐ€
  • ๋ฐ€์ง‘ ๋ณด์ƒ (dense reward)
  • ํ•™์Šต ์‹ ํ˜ธ๊ฐ€ ๋ช…ํ™•

์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ์˜ ์—ญํ• :

์ดˆ๊ธฐ ๋‹จ๊ณ„:

ฮฑ = 0 r_{total} = r_{stability} # ์•ˆ์ •์„ฑ๋งŒ ์ง‘์ค‘

ํ›„๊ธฐ ๋‹จ๊ณ„:

ฮฑ = 1 r_{total} = r_{rotation} + r_{stability} # ํšŒ์ „๋„ ์ค‘์š”

์ด๋Š” automatic curriculum learning์˜ ์ผ์ข…์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡์ด ๊ธฐ๋ณธ์„ ๋จผ์ € ๋ฐฐ์šฐ๊ณ , ์ค€๋น„๋˜๋ฉด ์ž๋™์œผ๋กœ ๋‹ค์Œ ๋‹จ๊ณ„๋กœ ๋„˜์–ด๊ฐ‘๋‹ˆ๋‹ค.

์ฐฝ๋ฐœ์  ํ–‰๋™: ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€

๊ฐ€์žฅ ํฅ๋ฏธ๋กœ์šด ๋ฐœ๊ฒฌ์€ ๋ช…์‹œ์ ์œผ๋กœ ๊ฐ€๋ฅด์น˜์ง€ ์•Š์€ ํ–‰๋™์ด ๋‚˜ํƒ€๋‚ฌ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์„ค๊ณ„:

  • ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€ ๋ชจ๋“ˆ ์—†์Œ
  • ๋ฏธ๋„๋Ÿผ์— ๋Œ€ํ•œ ๋ช…์‹œ์  ๋ณด์ƒ ์—†์Œ
  • ๋‹จ์ง€ โ€œํšŒ์ „ํ•˜๋ผ, ๋–จ์–ด๋œจ๋ฆฌ์ง€ ๋งˆ๋ผโ€ ๋งŒ ๋ช…์‹œ

๊ฒฐ๊ณผ:

  • ์ •์ฑ…์ด ์Šค์Šค๋กœ ๋ฏธ๋„๋Ÿผ์„ ๊ฐ์ง€
  • ๋ฏธ๋„๋Ÿฌ์งˆ ๋•Œ ๋ฐ˜์‘์ ์œผ๋กœ ๋Œ€์‘
  • ์•ˆ์ •์„ฑ ์œ ์ง€

์™œ ์ด๋Ÿฐ ์ผ์ด?

  1. ํ’๋ถ€ํ•œ ์ •๋ณด: ๊ณ ๋ฐ€๋„ ์ด‰๊ฐ์œผ๋กœ ๋ฏธ์„ธํ•œ ๋ณ€ํ™” ๊ฐ์ง€
  2. ์‹œ๊ฐ„์  ํŒจํ„ด: TCN์ด โ€œ์ •์ƒ vs ๋น„์ •์ƒโ€ ํŒจํ„ด ํ•™์Šต
  3. ๋ถ€์ •์  ํ”ผ๋“œ๋ฐฑ: ๋–จ์–ด๋œจ๋ฆฌ๋ฉด ํฐ ํŽ˜๋„ํ‹ฐ โ†’ ๊ทธ ์ง์ „ ์‹ ํ˜ธ ํ•™์Šต

์ด๋Š” ์•”๋ฌต์  ํ•™์Šต(implicit learning)์˜ ๊ฐ•๋ ฅํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋ชจ๋“  ๊ฒƒ์„ ๋ช…์‹œ์ ์œผ๋กœ ๊ฐ€๋ฅด์น  ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค!


8. ํ•œ๊ณ„์ ๊ณผ ๊ฐœ์„  ๋ฐฉํ–ฅ

๋ฌผ์ฒด ํ˜•์ƒ์˜ ๊นŒ๋‹ค๋กœ์›€

์‹คํ—˜์„ ํ•ด๋ณด๋‹ˆ ์žฌ๋ฏธ์žˆ๋Š” ํŒจํ„ด์ด ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ์‚ฌ๊ณผ๋‚˜ ๊ณต ๊ฐ™์€ ๋‘ฅ๊ทผ ๋ฌผ์ฒด๋Š” ์ž˜ ๋‹ค๋ฃจ๋Š”๋ฐ, ์ƒ์ž๋‚˜ ๊ธด ๋ง‰๋Œ€๋Š” ์œ ๋… ์–ด๋ ค์›Œํ•˜๋”๋ผ๋Š” ๊ฒƒ์ด์ฃ .

์™œ ๊ทธ๋Ÿด๊นŒ์š”? ์ƒ์ž๋ฅผ ์ƒ๊ฐํ•ด๋ณด์„ธ์š”. ๋กœ๋ด‡์ด ์ƒ์ž์˜ ๋ชจ์„œ๋ฆฌ๋ฅผ ์žก์•˜์„ ๋•Œ์™€ ํ‰ํ‰ํ•œ ๋ฉด์„ ์žก์•˜์„ ๋•Œ, ์ด‰๊ฐ ์„ผ์„œ๋กœ๋Š” ๋‘˜์„ ๊ตฌ๋ณ„ํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋‘˜ ๋‹ค โ€œํ‰ํ‰ํ•œ ํ‘œ๋ฉดโ€์œผ๋กœ ๋А๊ปด์ง€๋‹ˆ๊นŒ์š”. ์ด๋Ÿฐ ๋ชจํ˜ธ์„ฑ์ด ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.

๊ธด ๋ง‰๋Œ€๊ธฐ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€์ž…๋‹ˆ๋‹ค. ๋ง‰๋Œ€๊ธฐ์˜ ์–ด๋А ๋ถ€๋ถ„์„ ์žก์•˜๋Š”์ง€, ์–ด๋А ๋ฐฉํ–ฅ์œผ๋กœ ๊ธฐ์šธ์–ด์ ธ ์žˆ๋Š”์ง€๋ฅผ ์ด‰๊ฐ๋งŒ์œผ๋กœ๋Š” ์ •ํ™•ํžˆ ์•Œ๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ ‘์ด‰ ์ž์„ธ์™€ ํž˜์ด๋ผ๋Š” ์ œํ•œ๋œ ์ •๋ณด๋งŒ์œผ๋กœ๋Š” ๋ง์ด์ฃ .

๊ทธ๋ ‡๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

ํ˜„์žฌ๋Š” ์ด‰๊ฐ ์ด๋ฏธ์ง€๋ฅผ ฮธ, ฯ†, F ๊ฐ™์€ ์ˆซ์ž๋“ค๋กœ ์••์ถ•ํ•ด์„œ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์›๋ณธ ์ด‰๊ฐ ์ด๋ฏธ์ง€์—๋Š” ๋” ํ’๋ถ€ํ•œ ์ •๋ณด๊ฐ€ ๋‹ด๊ฒจ์žˆ์Šต๋‹ˆ๋‹ค. ํ‘œ๋ฉด์˜ ์งˆ๊ฐ, ์ ‘์ด‰ ๋ฉด์ ์˜ ๋ถ„ํฌ ๊ฐ™์€ ๊ฒƒ๋“ค์ด์ฃ . ์ด๋Ÿฐ ์ •๋ณด๋ฅผ ์ง์ ‘ ์‚ฌ์šฉํ•˜๋ฉด ์ƒ์ž์˜ ๋ชจ์„œ๋ฆฌ์™€ ๋ฉด์„ ๊ตฌ๋ณ„ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋˜ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์€ ์—ฌ๋Ÿฌ ์„ผ์„œ์˜ ์ •๋ณด๋ฅผ ๊ฒฐํ•ฉํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋„ค ์†๊ฐ€๋ฝ์ด ๋А๋ผ๋Š” ์ด‰๊ฐ ํŒจํ„ด์„ ์ข…ํ•ฉํ•˜๋ฉด โ€œ์•„, ์ด๊ฑด ๊ธด ๋ฌผ์ฒด๊ตฌ๋‚˜โ€ ํ˜น์€ โ€œ์ด๊ฑด ์ƒ์ž์˜ ๋ชจ์„œ๋ฆฌ๋ฅผ ์žก์€ ๊ฑฐ๊ตฌ๋‚˜โ€๋ฅผ ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๊ฒ ์ฃ . ๋งˆ์น˜ ์šฐ๋ฆฌ๊ฐ€ ๋ˆˆ์„ ๊ฐ๊ณ ๋„ ๋ฌผ์ฒด๋ฅผ ๋งŒ์ ธ์„œ ํ˜•ํƒœ๋ฅผ ํŒŒ์•…ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ์š”.

ํ•˜๋“œ์›จ์–ด์˜ ๋ฌผ๋ฆฌ์  ํ•œ๊ณ„

Allegro Hand๋Š” ํ›Œ๋ฅญํ•œ ๋กœ๋ด‡ ์†์ด์ง€๋งŒ, ์ธ๊ฐ„์˜ ์†๊ณผ ๋น„๊ตํ•˜๋ฉด ์•„์ง ์•ฝํ•œ ๋ถ€๋ถ„์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์†์„ ์˜†์œผ๋กœ ๋Œ๋ ธ์„ ๋•Œ(Thumb Up/Down ๋ฐฉํ–ฅ) ์„ฑ๋Šฅ์ด ๋–จ์–ด์ง‘๋‹ˆ๋‹ค.

์ด์œ ๋Š” ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค. ์†๊ฐ€๋ฝ์ด ์ˆ˜ํ‰ ๋ฐฉํ–ฅ์ผ ๋•Œ๋Š” ์ค‘๋ ฅ์ด ์†๊ฐ€๋ฝ์„ ์•„๋ž˜๋กœ ๋‹น๊ธฐ๋Š” ํž˜๊ณผ ์ •๋ฉด์œผ๋กœ ๋งž์„ญ๋‹ˆ๋‹ค. ์†๊ฐ€๋ฝ ๋ชจํ„ฐ๊ฐ€ ๋ฌผ์ฒด์˜ ๋ฌด๊ฒŒ๋ฟ ์•„๋‹ˆ๋ผ ์ž๊ธฐ ์ž์‹ ์˜ ๋ฌด๊ฒŒ๊นŒ์ง€ ๋ฒ„ํ…จ์•ผ ํ•˜๋Š” ๊ฑฐ์ฃ . ๋งˆ์น˜ ํŒ”์„ ์•ž์œผ๋กœ ์ญ‰ ๋ป—๊ณ  ๋ฌด๊ฑฐ์šด ๋ฌผ๊ฑด์„ ๋“ค๊ณ  ์žˆ์œผ๋ฉด ๊ธˆ๋ฐฉ ํŒ”์ด ์•„ํ”„๋“ฏ์ด ๋ง์ž…๋‹ˆ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ์—์„œ ๋ดค๋“ฏ์ด, Palm Up ๋ฐฉํ–ฅ์—์„œ๋Š” ํ‰๊ท  6.2ํšŒ ํšŒ์ „ํ–ˆ์ง€๋งŒ, Thumb Down์—์„œ๋Š” 1.2ํšŒ๋ฐ–์— ๋ชปํ–ˆ์ฃ . ๊ฑฐ์˜ 5๋ฐฐ ์ฐจ์ด์ž…๋‹ˆ๋‹ค.

ํ•ด๊ฒฐ์ฑ…์€ ๋ฌด์—‡์ผ๊นŒ์š”?

๊ฐ€์žฅ ์ง์ ‘์ ์ธ ๋ฐฉ๋ฒ•์€ ๋” ๊ฐ•๋ ฅํ•œ ๋ชจํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋‹จ์ˆœํžˆ โ€œ๋” ์„ผ ๋ชจํ„ฐโ€๋งŒ์œผ๋กœ๋Š” ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. ๋ฌด๊ฑฐ์›Œ์ง€๋ฉด ์˜คํžˆ๋ ค ์—ญํšจ๊ณผ๊ฐ€ ๋‚  ์ˆ˜ ์žˆ์œผ๋‹ˆ๊นŒ์š”.

๋” ์˜๋ฆฌํ•œ ์ ‘๊ทผ์€ ์ ์‘ํ˜• ์ œ์–ด์ž…๋‹ˆ๋‹ค. ์†์˜ ๋ฐฉํ–ฅ์— ๋”ฐ๋ผ ์ œ์–ด ๊ฒŒ์ธ์„ ์ž๋™์œผ๋กœ ์กฐ์ ˆํ•˜๋Š” ๊ฑฐ์ฃ . ์˜ˆ๋ฅผ ๋“ค์–ด, Thumb Down ๋ฐฉํ–ฅ์ผ ๋•Œ๋Š” ๋ชจํ„ฐ์— ๋” ํฐ ํž˜์„ ์ฃผ๊ณ , Palm Up์ผ ๋•Œ๋Š” ์ ๋‹นํžˆ ์กฐ์ ˆํ•˜๋Š” ์‹์ž…๋‹ˆ๋‹ค. ๋˜๋Š” ์ค‘๋ ฅ ๋ณด์ƒ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•ด์„œ, ์ค‘๋ ฅ์ด ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๊ณ„์‚ฐํ•˜๊ณ  ๊ทธ๋งŒํผ์„ ๋ฏธ๋ฆฌ ๋ณด์ •ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

์žฅ๊ธฐ์ ์œผ๋กœ๋Š” ์ €๋น„์šฉ ๊ณ ์„ฑ๋Šฅ ํ•˜๋“œ์›จ์–ด ๊ฐœ๋ฐœ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡๊ณตํ•™์˜ ์˜์›ํ•œ ์ˆ™์ œ์ฃ .

ํšŒ์ „์„ ๋„˜์–ด์„œ: ๋” ๋ณต์žกํ•œ ์ž‘์—…๋“ค

์ง€๊ธˆ AnyRotate๊ฐ€ ์ž˜ํ•˜๋Š” ๊ฑด โ€œํšŒ์ „โ€์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‹ค์ œ ์„ธ๊ณ„์—์„œ ์šฐ๋ฆฌ๊ฐ€ ํ•˜๋Š” ์กฐ์ž‘์€ ํ›จ์”ฌ ๋‹ค์–‘ํ•ฉ๋‹ˆ๋‹ค.

์ƒ๊ฐํ•ด๋ณด์„ธ์š”. ๋ณ‘๋šœ๊ป‘์„ ์—ด ๋•Œ๋Š” ์–ด๋–ป๊ฒŒ ํ•˜๋‚˜์š”? ๋จผ์ € ๋ณ‘์„ ์žก๊ณ , ๋šœ๊ป‘์„ ์žก๊ณ , ๋น„ํ‹€๊ณ , ์œ„๋กœ ๋‹น๊ธฐ์ฃ . ์—ฌ๋Ÿฌ ๋‹จ๊ณ„๊ฐ€ ์ˆœ์ฐจ์ ์œผ๋กœ ์ผ์–ด๋‚ฉ๋‹ˆ๋‹ค. ๋ ˆ๊ณ ๋ฅผ ์กฐ๋ฆฝํ•  ๋•Œ๋Š”? ๋ธ”๋ก A๋ฅผ ์žก๊ณ , ๋ธ”๋ก B๋ฅผ ์ฐพ๊ณ , ๋‘˜์„ ์ •๋ ฌํ•˜๊ณ , ๊พน ๋ˆŒ๋Ÿฌ์„œ ๋ผ์›Œ์•ผ ํ•ฉ๋‹ˆ๋‹ค.

ํ˜„์žฌ ์‹œ์Šคํ…œ์€ ์ด๋Ÿฐ ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘์„ ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ํšŒ์ „์ด๋ผ๋Š” ํ•˜๋‚˜์˜ ๊ธฐ๋ณธ ๋™์ž‘(primitive)๋งŒ ๊ฐ€๋Šฅํ•˜์ฃ . ๋” ๋ณต์žกํ•œ ์ž‘์—…์œผ๋กœ ํ™•์žฅํ•˜๋ ค๋ฉด ๊ณ„์ธต์  ๊ฐ•ํ™”ํ•™์Šต์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ƒ์œ„ ๋ ˆ๋ฒจ์—์„œ๋Š” โ€œ๋šœ๊ป‘ ์žก๊ธฐ โ†’ ๋น„ํ‹€๊ธฐ โ†’ ๋‹น๊ธฐ๊ธฐโ€ ๊ฐ™์€ ํฐ ๊ณ„ํš์„ ์„ธ์šฐ๊ณ , ํ•˜์œ„ ๋ ˆ๋ฒจ์—์„œ๋Š” ๊ฐ ๋‹จ๊ณ„๋ฅผ ์‹คํ–‰ํ•˜๋Š” ๋ฐฉ์‹์ด์ฃ .

๋˜ ๋‹ค๋ฅธ ํฅ๋ฏธ๋กœ์šด ๋ฐฉํ–ฅ์€ ๋„๊ตฌ ์‚ฌ์šฉ์ž…๋‹ˆ๋‹ค. ๋ง์น˜๋กœ ๋ชป์„ ๋ฐ•๊ฑฐ๋‚˜, ๋“œ๋ผ์ด๋ฒ„๋กœ ๋‚˜์‚ฌ๋ฅผ ์กฐ์ด๋Š” ๊ฒƒ๋“ค์ด์š”. ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ์†์˜ ๋Šฅ๋ ฅ์ด ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋„๊ตฌ์˜ ๋™์  ํŠน์„ฑ์„ ํ•™์Šตํ•˜๊ณ , ๊ฐ„์ ‘์ ์ธ ์ ‘์ด‰์„ ๋‹ค๋ฃจ๋Š” ๊ฑด ๋˜ ๋‹ค๋ฅธ ๋„์ „ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค.

์–‘์† ํ˜‘์—…๋„ ์ค‘์š”ํ•œ ํ™•์žฅ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ํฐ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ์–‘์†์„ ์”๋‹ˆ๋‹ค. ํ•œ ์†์œผ๋กœ๋Š” ์žก๊ณ , ๋‹ค๋ฅธ ์†์œผ๋กœ๋Š” ์กฐ์ž‘ํ•˜์ฃ . ๋กœ๋ด‡๋„ ๋‘ ์†์„ ์กฐ์œจํ•ด์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด ํ›จ์”ฌ ๋” ์œ ์šฉํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋ณ€ํ˜•๋˜๋Š” ๋ฌผ์ฒด๋“ค

์ง€๊ธˆ๊นŒ์ง€์˜ ๋ชจ๋“  ์‹คํ—˜์€ โ€œ๊ฐ•์ฒด(rigid body)โ€, ์ฆ‰ ๋ณ€ํ˜•๋˜์ง€ ์•Š๋Š” ๋‹จ๋‹จํ•œ ๋ฌผ์ฒด๋“ค๋กœ ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‹ค์ œ ์„ธ๊ณ„๋Š” ๊ทธ๋ ‡์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

์ฒœ์„ ์ ‘์–ด๋ณธ ์  ์žˆ๋‚˜์š”? ์ฒœ์€ ์žก๋Š” ์œ„์น˜์— ๋”ฐ๋ผ ๋ชจ์–‘์ด ๊ณ„์† ๋ฐ”๋€๋‹ˆ๋‹ค. ์ข…์ด๋„ ๋งˆ์ฐฌ๊ฐ€์ง€์ฃ . ๊ณ ๋ฌด๊ณต์€ ๋ˆ„๋ฅด๋ฉด ์ฐŒ๊ทธ๋Ÿฌ์ง‘๋‹ˆ๋‹ค. ๋ฐ˜์ฃฝ์€ ์†๊ฐ€๋ฝ ์‚ฌ์ด๋กœ ๋น ์ ธ๋‚˜๊ฐ‘๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๋ณ€ํ˜• ๊ฐ€๋Šฅํ•œ ๋ฌผ์ฒด(deformable objects)๋ฅผ ๋‹ค๋ฃจ๋Š” ๊ฑด ํ›จ์”ฌ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์™œ๋ƒํ•˜๋ฉด:

  1. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ ์‚ฌ์šฉํ•˜๋Š” ๊ฐ•์ฒด ๋ฌผ๋ฆฌ ์—”์ง„์œผ๋กœ๋Š” ์ฒœ์ด๋‚˜ ๋ฐ˜์ฃฝ์˜ ์›€์ง์ž„์„ ์ •ํ™•ํžˆ ๋ชจ์‚ฌํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์†Œํ”„ํŠธ ๋ฐ”๋”” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ํ•„์š”ํ•œ๋ฐ, ์ด๊ฑด ๊ณ„์‚ฐ ๋น„์šฉ์ด ํ›จ์”ฌ ๋†’์Šต๋‹ˆ๋‹ค.

  2. ์ƒํƒœ ์ถ”์ •์ด ๋ณต์žกํ•ฉ๋‹ˆ๋‹ค. ๊ฐ•์ฒด๋Š” ์œ„์น˜์™€ ์ž์„ธ๋งŒ ์•Œ๋ฉด ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ฒœ์€? ์ˆ˜๋ฐฑ ๊ฐœ์˜ ์ ์˜ ์œ„์น˜๋ฅผ ๋‹ค ์ถ”์ ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

  3. ์ ‘์ด‰ ์—ญํ•™์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ๋งˆ์ฐฐ, ๋ฏธ๋„๋Ÿผ, ๋ณ€ํ˜•์ด ๋ชจ๋‘ ๋ณตํ•ฉ์ ์œผ๋กœ ์ผ์–ด๋‚ฉ๋‹ˆ๋‹ค.

๊ทธ๋ž˜๋„ ํฅ๋ฏธ๋กœ์šด ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค. ์˜ท์„ ๊ฐœ๊ฑฐ๋‚˜, ์Œ์‹์„ ๋‹ค๋ฃจ๊ฑฐ๋‚˜, ํฌ์žฅ์„ ๋œฏ๋Š” ๋“ฑ ๋งŽ์€ ์‹ค์šฉ์  ์ž‘์—…์ด ๋ณ€ํ˜• ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๋‹ˆ๊นŒ์š”.

์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค์˜ ๊ฐ„๊ทน

์—ฐ๊ตฌํŒ€์ด ์ •๋ง ๋งŽ์€ ๋…ธ๋ ฅ์„ ๊ธฐ์šธ์˜€์ง€๋งŒ, ์—ฌ์ „ํžˆ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค ์‚ฌ์ด์—๋Š” ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

์ ‘์ด‰ ๋ฌผ๋ฆฌ์˜ ๋ณต์žก์„ฑ์ด ๋Œ€ํ‘œ์ ์ž…๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” โ€œ๋งˆ์ฐฐ ๊ณ„์ˆ˜ = 0.8โ€์ฒ˜๋Ÿผ ๊น”๋”ํ•œ ์ˆซ์ž๋ฅผ ์”๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‹ค์ œ ์„ธ๊ณ„์˜ ๋งˆ์ฐฐ์€ ํ›จ์”ฌ ๋ณต์žกํ•ฉ๋‹ˆ๋‹ค. ๋ฏธ๋„๋Ÿผ ์†๋„์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง€๊ณ , ํ‘œ๋ฉด ์ƒํƒœ์— ์˜ํ–ฅ๋ฐ›๊ณ , ์‹ฌ์ง€์–ด ์Šต๋„๋‚˜ ์˜จ๋„์—๋„ ๋ฏผ๊ฐํ•ฉ๋‹ˆ๋‹ค. ํ”Œ๋ผ์Šคํ‹ฑ ๋ณ‘๊ณผ ๊ธˆ์† ์‹ค๋ฆฐ๋”์˜ ๋งˆ์ฐฐ์€ ์™„์ „ํžˆ ๋‹ค๋ฅด์ฃ .

์„ผ์„œ ๋…ธ์ด์ฆˆ๋„ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” โ€œ๊ฐ€์šฐ์‹œ์•ˆ ๋…ธ์ด์ฆˆ ์ถ”๊ฐ€โ€๋กœ ๊ฐ„๋‹จํžˆ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‹ค์ œ ์„ผ์„œ์˜ ๋…ธ์ด์ฆˆ๋Š” ๊ตฌ์กฐํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์กฐ๋ช…์ด ๋ฐ”๋€Œ๋ฉด ์ด‰๊ฐ ์ด๋ฏธ์ง€๊ฐ€ ๋‹ฌ๋ผ์ง€๊ณ , ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด ์„ผ์„œ๊ฐ€ ๋“œ๋ฆฌํ”„ํŠธํ•ฉ๋‹ˆ๋‹ค. ์˜จ๋„๊ฐ€ ์˜ฌ๋ผ๊ฐ€๋ฉด ์„ผ์„œ ๊ฐ’์ด ๋‹ฌ๋ผ์ง€๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

์‹œ๊ฐ„ ์ง€์—ฐ๋„ ๋ฌด์‹œํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ๋ชจ๋“  ๊ฒŒ ์ฆ‰๊ฐ์ ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‹ค์ œ๋กœ๋Š” ์„ผ์„œ์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ฝ๋Š” ๋ฐ ๋ช‡ ๋ฐ€๋ฆฌ์ดˆ, ๋„คํŠธ์›Œํฌ๋กœ ์ „์†กํ•˜๋Š” ๋ฐ ๋ช‡ ๋ฐ€๋ฆฌ์ดˆ, ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ ๋˜ ๋ช‡ ๋ฐ€๋ฆฌ์ดˆ๊ฐ€ ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค. 20Hz ์ œ์–ด์—์„œ 10ms ์ง€์—ฐ์€ ํฐ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.

์–ด๋–ป๊ฒŒ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

๊ฐ€์žฅ ์ข‹์€ ๋ฐฉ๋ฒ•์€ ์‹ค์ œ ๋ฐ์ดํ„ฐ๋กœ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ๊ณ„์† ๊ฐœ์„ ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‹ค์ œ ๋กœ๋ด‡์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์œผ๊ณ , ๊ทธ ๋ฐ์ดํ„ฐ๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅธ์ง€ ๋ถ„์„ํ•˜๊ณ , ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๋Š” ๊ฑฐ์ฃ . ์ด๋Ÿฐ ๋””์ง€ํ„ธ ํŠธ์œˆ(Digital Twin) ์ ‘๊ทผ์€ ์ ์  ๋” ์ค‘์š”ํ•ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋˜ ๋‹ค๋ฅธ ๋ฐฉํ–ฅ์€ ์˜จ๋ผ์ธ ์ ์‘์ž…๋‹ˆ๋‹ค. ์‹ค์ œ ๋กœ๋ด‡์— ๋ฐฐํฌํ•œ ํ›„์—๋„ ๊ณ„์† ํ•™์Šตํ•˜๋Š” ๊ฑฐ์ฃ . ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋ฅผ ๋งŒ๋‚˜๋ฉด ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•˜๋Š” ๋ฉ”ํƒ€ ํ•™์Šต(Meta-learning) ๊ธฐ๋ฒ•๋„ ์œ ๋งํ•ฉ๋‹ˆ๋‹ค.

ํ•™์Šต ๋น„์šฉ์˜ ํ˜„์‹ค

์†”์งํžˆ ๋งํ•˜๋ฉด, AnyRotate๋ฅผ ์žฌํ˜„ํ•˜๋ ค๋ฉด ๊ฝค ์ข‹์€ ์ปดํ“จํ„ฐ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

8,192๊ฐœ์˜ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์„ ๋Œ๋ฆฌ๋ ค๋ฉด ๊ณ ์„ฑ๋Šฅ GPU๊ฐ€ ํ•„์ˆ˜์ž…๋‹ˆ๋‹ค. IsaacGym ๊ฐ™์€ GPU ๊ธฐ๋ฐ˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ์“ฐ๋ฉด ๊ฐ€๋Šฅํ•˜์ง€๋งŒ, ๋ชจ๋“  ์—ฐ๊ตฌ์‹ค์ด ์ด๋Ÿฐ ์ž์›์„ ๊ฐ–์ถ˜ ๊ฑด ์•„๋‹ˆ์ฃ . ํ•™์Šต์—๋„ ์ˆ˜์ผ์ด ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค.

์ด๊ฑด ๊ฐ•ํ™”ํ•™์Šต์˜ ๊ณ ์งˆ์ ์ธ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ๋„ˆ๋ฌด ๋งŽ์€ ๊ฒฝํ—˜์ด ํ•„์š”ํ•ด์š”. ์ธ๊ฐ„์€ ๋ฌผ๊ฑด ๋ช‡ ๋ฒˆ ๋งŒ์ ธ๋ณด๋ฉด ๊ฐ์„ ์žก๋Š”๋ฐ, ๋กœ๋ด‡์€ ์ˆ˜๋ฐฑ๋งŒ ๋ฒˆ์˜ ์‹œ๋„๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

๋” ํšจ์œจ์ ์ธ ๋ฐฉ๋ฒ•์€ ์—†์„๊นŒ์š”?

์—ฌ๋Ÿฌ ๋Œ€์•ˆ์ด ์—ฐ๊ตฌ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค:

  • ์ƒ˜ํ”Œ ํšจ์œจ์  ์•Œ๊ณ ๋ฆฌ์ฆ˜: SAC, TD3 ๊ฐ™์€ off-policy ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋” ํšจ์œจ์ ์œผ๋กœ ์”๋‹ˆ๋‹ค. PPO๋Š” on-policy๋ผ์„œ ๊ฒฝํ—˜์„ ํ•œ ๋ฒˆ๋งŒ ์“ฐ๊ณ  ๋ฒ„๋ฆฌ์ง€๋งŒ, off-policy๋Š” ์—ฌ๋Ÿฌ ๋ฒˆ ์žฌ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์ฃ .
  • ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๊ฐ•ํ™”ํ•™์Šต: ์„ธ๊ณ„๊ฐ€ ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๋Š”์ง€ ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๋ฉด, ๋จธ๋ฆฟ์†(๋ชจ๋ธ ์†)์—์„œ ์—ฐ์Šตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ํ•ด๋ณด์ง€ ์•Š๊ณ ๋„ โ€œ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์ด๋ ‡๊ฒŒ ๋  ๊ฒƒ ๊ฐ™์€๋ฐ?โ€๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๋Š” ๊ฑฐ์ฃ .
  • ์˜คํ”„๋ผ์ธ ๊ฐ•ํ™”ํ•™์Šต: ์ด๋ฏธ ์ˆ˜์ง‘๋œ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ์‹œ๋„๋ฅผ ํ•˜์ง€ ์•Š๊ณ ๋„ ๊ณผ๊ฑฐ ๊ฒฝํ—˜์—์„œ ๋ฐฐ์šฐ๋Š” ๊ฑฐ์ฃ . ๋งˆ์น˜ ์œ ํŠœ๋ธŒ ์˜์ƒ ๋ณด๊ณ  ๋ฐฐ์šฐ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ์š”.
  • ์ธ๊ฐ„ ์‹œ์—ฐ ํ™œ์šฉ: ์‚ฌ๋žŒ์ด ๋จผ์ € ๋ช‡ ๋ฒˆ ์‹œ์—ฐํ•˜๊ณ , ๊ฑฐ๊ธฐ์„œ๋ถ€ํ„ฐ ํ•™์Šต์„ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค. ์™„์ „ํžˆ ๋ฌด์—์„œ ์‹œ์ž‘ํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ํ›จ์”ฌ ๋น ๋ฆ…๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ์•„์ง ์™„๋ฒฝํ•œ ํ•ด๋ฒ•์€ ์—†์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡๊ณตํ•™ ์ปค๋ฎค๋‹ˆํ‹ฐ๊ฐ€ ํ•จ๊ป˜ ํ’€์–ด์•ผ ํ•  ์ˆ™์ œ์ž…๋‹ˆ๋‹ค.

ํ‰๊ฐ€์˜ ์–ด๋ ค์›€

โ€œ์–ผ๋งˆ๋‚˜ ์ž˜ํ•˜๋Š”๊ฐ€?โ€๋ฅผ ์ธก์ •ํ•˜๋Š” ๊ฒƒ๋„ ์ƒ๊ฐ๋ณด๋‹ค ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

ํ˜„์žฌ๋Š” ๋‘ ๊ฐ€์ง€ ๋ฉ”ํŠธ๋ฆญ์„ ์”๋‹ˆ๋‹ค:

  • ํšŒ์ „ ์ˆ˜: 30์ดˆ ๋™์•ˆ ๋ช‡ ๋ฒˆ ํšŒ์ „ํ–ˆ๋‚˜?
  • TTT (Time to Terminate): ๋–จ์–ด๋œจ๋ฆฌ๊ธฐ ์ „๊นŒ์ง€ ์–ผ๋งˆ๋‚˜ ๋ฒ„ํ…ผ๋‚˜?

๋ช…ํ™•ํ•˜๊ธด ํ•œ๋ฐ, ๋ญ”๊ฐ€ ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด:

  • 5๋ฒˆ ํšŒ์ „ํ–ˆ๋Š”๋ฐ ์—„์ฒญ ๊ฑฐ์น ๊ฒŒ ๋Œ๋ ธ๋‹ค๋ฉด?
  • 30์ดˆ ๋ฒ„ํ…ผ๋Š”๋ฐ ๋ฌผ์ฒด๊ฐ€ ์ƒ์ฒ˜ํˆฌ์„ฑ์ด๊ฐ€ ๋๋‹ค๋ฉด?
  • ๋А๋ฆฌ์ง€๋งŒ ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ๋Œ๋ฆฐ ๊ฒƒ๊ณผ ๋น ๋ฅด์ง€๋งŒ ์œ„ํ—˜ํ•˜๊ฒŒ ๋Œ๋ฆฐ ๊ฒƒ, ๋ญ๊ฐ€ ๋” ์ข‹์€๊ฐ€?

๋” ์ข‹์€ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์€?

์—ฌ๋Ÿฌ ๊ฐ€์ง€๋ฅผ ์ถ”๊ฐ€๋กœ ์ธก์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ์—๋„ˆ์ง€ ํšจ์œจ์„ฑ: ๊ฐ™์€ ์ž‘์—…์„ ๋” ์ ์€ ์—๋„ˆ์ง€๋กœ ํ•˜๋Š” ๊ฒŒ ์ข‹๊ฒ ์ฃ . ๋กœ๋ด‡์ด ๊ณผ๋„ํ•˜๊ฒŒ ํž˜์„ ์“ฐ๋ฉด ๋ฐฐํ„ฐ๋ฆฌ๋„ ๋นจ๋ฆฌ ๋‹ณ๊ณ  ๋ชจํ„ฐ๋„ ๋นจ๋ฆฌ ๋‹ณ์Šต๋‹ˆ๋‹ค.
  • ํŒŒ์ง€ ์•ˆ์ •์„ฑ: ๋ฌผ์ฒด์™€ ์†๊ฐ€๋ฝ ์‚ฌ์ด์˜ ์ ‘์ด‰๋ ฅ์ด ์–ผ๋งˆ๋‚˜ ์ผ์ •ํ•˜๊ฒŒ ์œ ์ง€๋˜๋Š”๊ฐ€? ๋“ค์ญ‰๋‚ ์ญ‰ํ•˜๋ฉด ๋ถˆ์•ˆ์ •ํ•œ ๊ฑฐ๊ณ , ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ์œ ์ง€๋˜๋ฉด ์ข‹์€ ๊ฑฐ์ฃ .
  • ๋ฌผ์ฒด ์†์ƒ: ํ‘œ๋ฉด์— ์Šคํฌ๋ž˜์น˜๋‚˜ ์ฐŒ๊ทธ๋Ÿฌ์ง์ด ์žˆ๋‚˜์š”? ํŠนํžˆ ์„ฌ์„ธํ•œ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
  • ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ: ์ฒ˜์Œ ๋ณด๋Š” ๋ฌผ์ฒด์— ์–ผ๋งˆ๋‚˜ ์ž˜ ์ ์‘ํ•˜๋‚˜? ์ด๊ฑด ์ •๋Ÿ‰ํ™”ํ•˜๊ธฐ ์ •๋ง ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ์ด๋Ÿฐ ๊ฒƒ๋“ค์„ ์ž๋™์œผ๋กœ ์ธก์ •ํ•˜๊ธฐ๋Š” ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋ชจ์…˜ ์บก์ฒ˜ ์‹œ์Šคํ…œ์œผ๋กœ ๋ฌผ์ฒด ์œ„์น˜๋ฅผ ์ •๋ฐ€ํ•˜๊ฒŒ ์ถ”์ ํ•˜๊ณ , ํž˜-ํ† ํฌ ์„ผ์„œ๋กœ ์ ‘์ด‰๋ ฅ์„ ์ธก์ •ํ•˜๊ณ , ๊ณ ํ•ด์ƒ๋„ ์นด๋ฉ”๋ผ๋กœ ํ‘œ๋ฉด ์ƒํƒœ๋ฅผ ํ™•์ธํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์žฅ๋น„๊ฐ€ ๋งŽ์ด ํ•„์š”ํ•˜์ฃ .

์ด์ƒ์ ์œผ๋กœ๋Š” ๋กœ๋ด‡๊ณตํ•™ ์ปค๋ฎค๋‹ˆํ‹ฐ๊ฐ€ ํ•ฉ์˜ํ•œ ํ‘œ์ค€ ๋ฒค์น˜๋งˆํฌ๊ฐ€ ์žˆ์œผ๋ฉด ์ข‹๊ฒ ์Šต๋‹ˆ๋‹ค. ์ปดํ“จํ„ฐ ๋น„์ „์— ImageNet์ด ์žˆ๊ณ , ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์— GLUE๊ฐ€ ์žˆ๋“ฏ์ด, ๋กœ๋ด‡ ์กฐ์ž‘์—๋„ ๊ทธ๋Ÿฐ ๊ฒŒ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ž˜์•ผ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋“ค์„ ๊ณต์ •ํ•˜๊ฒŒ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์œผ๋‹ˆ๊นŒ์š”.

๊ฒฐ๊ตญ ์ด ํ•œ๊ณ„๋“ค์€โ€ฆ

์ด๋Ÿฐ ํ•œ๊ณ„์ ๋“ค์„ ๋‚˜์—ดํ•˜๋‹ˆ ๋ญ”๊ฐ€ AnyRotate๊ฐ€ ๋ถ€์กฑํ•ด ๋ณด์ผ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ „ํ˜€ ๊ทธ๋ ‡์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

์˜คํžˆ๋ ค ์ด๋Ÿฐ ํ•œ๊ณ„๋“ค์€ ์—ฐ๊ตฌ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ •์งํ•œ์ง€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์—ฐ๊ตฌํŒ€์ด ์ž์‹ ๋“ค์˜ ์‹œ์Šคํ…œ์„ ๋ƒ‰์ •ํ•˜๊ฒŒ ํ‰๊ฐ€ํ•˜๊ณ , ๋‹ค์Œ ๋‹จ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ์ œ์‹œํ•œ ๊ฒƒ์ด์ฃ . โ€œ์šฐ๋ฆฌ๊ฐ€ ์ด๋งŒํผ ํ–ˆ๊ณ , ์—ฌ๊ธฐ์„œ ์ด๋Ÿฐ ๋ฌธ์ œ๊ฐ€ ๋‚จ์•˜์–ด์š”โ€๋ผ๊ณ  ์†”์งํ•˜๊ฒŒ ๋งํ•˜๋Š” ๊ฒƒ์€ ๊ณผํ•™์  ์ •์ง์„ฑ์˜ ํ‘œ์‹œ์ž…๋‹ˆ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด ํ•œ๊ณ„๋“ค์ด ๋ฐ”๋กœ ๋‹ค์Œ ์„ธ๋Œ€ ์—ฐ๊ตฌ์ž๋“ค์„ ์œ„ํ•œ ๋กœ๋“œ๋งต์ž…๋‹ˆ๋‹ค. โ€œ์—ฌ๊ธฐ๊นŒ์ง€ ์™”์œผ๋‹ˆ, ์ด์ œ ์ €๊ธฐ๋กœ ๊ฐ€๋ณด์žโ€๋ผ๋Š” ์ด์ •ํ‘œ์ธ ์…ˆ์ด์ฃ . ๋ˆ„๊ตฐ๊ฐ€๋Š” ๋ณ€ํ˜• ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ฒ•์„ ์—ฐ๊ตฌํ•  ๊ฒƒ์ด๊ณ , ๋ˆ„๊ตฐ๊ฐ€๋Š” ๋” ํšจ์œจ์ ์ธ ํ•™์Šต ๋ฐฉ๋ฒ•์„ ๊ฐœ๋ฐœํ•  ๊ฒƒ์ด๊ณ , ๋ˆ„๊ตฐ๊ฐ€๋Š” ์ €๋น„์šฉ ํ•˜๋“œ์›จ์–ด๋ฅผ ์„ค๊ณ„ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๊ณผํ•™์€ ์ด๋ ‡๊ฒŒ ๋ฐœ์ „ํ•ฉ๋‹ˆ๋‹ค. ์™„๋ฒฝํ•œ ์‹œ์Šคํ…œ์„ ํ•œ ๋ฒˆ์— ๋งŒ๋“œ๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ, ํ•œ ๊ฑธ์Œ์”ฉ ๋‚˜์•„๊ฐ€๋ฉด์„œ ์ ์  ๋‚˜์•„์ง€๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. AnyRotate๋Š” ๊ทธ ์—ฌ์ •์—์„œ ์ค‘์š”ํ•œ ํ•œ ๊ฑธ์Œ์ด๊ณ , ๋‹ค์Œ ์—ฐ๊ตฌ์ž๋“ค์€ ์—ฌ๊ธฐ์„œ ์‹œ์ž‘ํ•ด์„œ ๋” ๋ฉ€๋ฆฌ ๊ฐˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

โ›๏ธ Dig Review

โ›๏ธ Dig โ€” Go deep, uncover the layers. Dive into technical detail.

AnyRotate ๋…ผ๋ฌธ ๊ฐœ์š” ๋ฐ ์‹œ์Šคํ…œ ๊ตฌ์กฐ

AnyRotate๋Š” ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ๋‹ค์ถ• ์ค‘๋ ฅ ๋ฌด๊ด€(invariant) ์ธ-ํ•ธ๋“œ ๊ฐ์ฒด ํšŒ์ „์„ ์œ„ํ•ด ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•˜๋Š” ๋กœ๋ด‡ ์‹œ์Šคํ…œ์ด๋‹ค. 4-์ง€๊ฐ„(Allegro) ๋กœ๋ด‡ ํ•ธ๋“œ์˜ ๊ฐ ์†๊ฐ€๋ฝ ๋์— ๋ถ€์ฐฉ๋œ ์ƒ์ฒด๋ชจ๋ฐฉํ˜• ๊ด‘ํ•™ ์ด‰๊ฐ ์„ผ์„œ(TacTip ๊ธฐ๋ฐ˜ DigiTac)๋ฅผ ์‚ฌ์šฉํ•˜๋ฉฐ, ๊ฐ•ํ™”ํ•™์Šต(RL)์„ ํ†ตํ•ด ์–ด๋–ค ์ถ•(axis)์— ๋Œ€ํ•ด์„œ๋„ ์ž„์˜์˜ ๋ฐฉํ–ฅ์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ํšŒ์ „์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ๋‹จ์ผ ์ •์ฑ…(policy)์„ ํ•™์Šตํ•œ๋‹ค. ์ด ์‹œ์Šคํ…œ์˜ ํ•ต์‹ฌ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์—ฐ์†์  ์ ‘์ด‰ ํ”ผ์ฒ˜ ํ‘œํ˜„(continuous contact feature representation) ์„ ํ•™์Šตํ•˜๊ณ , ์‹ค์ œ ํ™˜๊ฒฝ์˜ ์ด‰๊ฐ ์˜์ƒ์œผ๋กœ๋ถ€ํ„ฐ ์ด๋ฅผ ์˜ˆ์ธกํ•˜์—ฌ ์ œ๋กœ์ƒท(sim-to-real) ์ •์ฑ… ์ด์ „์„ ๋‹ฌ์„ฑํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ํŠนํžˆ, ์ด‰๊ฐ ์„ผ์„œ์˜ ์—ฐ์†์  ์ ‘์ด‰ ํฌ์ฆˆ(contact pose)์™€ ์ ‘์ด‰๋ ฅ(contact force) ์ •๋ณด๋ฅผ ์ •์ฑ…์— ์ž…๋ ฅํ•จ์œผ๋กœ์จ, ๊ธฐ์กด์˜ ์ด์ง„(binary) ๋˜๋Š” ์ด์‚ฐ(discrete) ์ด‰๊ฐ ํ‘œํ˜„๋ณด๋‹ค ํ’๋ถ€ํ•œ ์ ‘์ด‰ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์˜€๋‹ค.

์ด‰๊ฐ ์„ผ์„œ ๋ฐ ํ•ธ๋“œ ๊ตฌ์กฐ: Allegro 4-์ง€๊ฐ„ ํ•ธ๋“œ(16์ž์œ ๋„)์— TacTip ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ๋ถ€์ฐฉํ•˜๊ณ , UR5 ๋กœ๋ด‡์•”์— ์žฅ์ฐฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ์† ๋ฐฉํ–ฅ(palm up/down, thumb up/down ๋“ฑ)์—์„œ ๊ฐ์ฒด๋ฅผ ํšŒ์ „์‹œํ‚จ๋‹ค (๊ทธ๋ฆผ 1, 2 ์ฐธ์กฐ). ์ด‰๊ฐ ์„ผ์„œ๋Š” ์ปค๋ธŒ๋“œ ํ‘œ๋ฉด์„ ๊ฐ€์ง€๋ฉฐ ๋ฐ€์ฐฉ๋ฉด ์ „์ฒด์˜ ์ ‘์ด‰ ์ •๋ณด๋ฅผ ๊ณ ํ•ด์ƒ๋„ ์˜์ƒ์œผ๋กœ ์ œ๊ณตํ•œ๋‹ค.

๋ชฉํ‘œ ๋ฐ ์ œ์•ฝ: AnyRotate๋Š” ์ž„์˜์˜ ํšŒ์ „์ถ•, ์ž„์˜์˜ ์† ๋ฐฉํ–ฅ์—์„œ ์—ฐ์†์ ์ด๊ณ  ์•ˆ์ •์ ์ธ ๊ฐ์ฒด ํšŒ์ „์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ํ•™์Šต๋œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋ชฉํ‘œ ์ง€ํ–ฅ(goal-conditioned) ๊ฐ•ํ™”ํ•™์Šต ๋ฌธ์ œ๋กœ ์ •์˜ํ•˜๊ณ , ๋ณด์กฐ ์„œ๋ธŒ๊ณจ(auxiliary goal)๊ณผ ์ ์ง„์  ์ปค๋ฆฌํ˜๋Ÿผ(adaptive curriculum) ๋“ฑ์„ ํ†ตํ•ด ํšจ์œจ์ ์ธ ํ•™์Šต์„ ์„ค๊ณ„ํ–ˆ๋‹ค. ๊ต์‚ฌ-ํ•™์ƒ(Teacher-Student) ๊ตฌ์กฐ๋กœ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํŠน๊ถŒ ์ •๋ณด(privileged information)๋ฅผ ์‚ฌ์šฉํ•œ ๊ต์‚ฌ ์ •์ฑ…์„ ํ•™์Šตํ•˜๊ณ , ํ•™์ƒ ์ •์ฑ…์ด ์ด‰๊ฐ-๊ณ ์œ  ๊ฐ๊ฐ๋งŒ์œผ๋กœ ์ด๋ฅผ ๋ชจ๋ฐฉํ•˜๋„๋ก ํ•œ๋‹ค.

๋ณธ ๋ถ„์„์—์„œ๋Š” ์ด‰๊ฐ ์„ผ์„œ ๋ฐ์ดํ„ฐ์˜ ํ‘œํ˜„(Representation), ์ธ์ฝ”๋”ฉ(Encoding), ์ œ์–ด ์ •์ฑ… ํ†ตํ•ฉ ๋ฐฉ๋ฒ•์„ ์ค‘์‹ฌ์œผ๋กœ, ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ตฌํ˜„๊ณผ ์‹œ๋ฎฌ-์‹ค์ œ ์ „์ด ๊ณผ์ •, ๊ทธ๋ฆฌ๊ณ  ์ด‰๊ฐ ๊ฐ์ง€ ๋ชจ๋ธ๋ง์˜ ํ˜์‹ ์  ๋ฐ ๊ณผ์ œ๋ฅผ ์ƒ์„ธํžˆ ์‚ดํŽด๋ณธ๋‹ค.

์ด‰๊ฐ ์„ผ์„œ ๋ฐ์ดํ„ฐ์˜ ํ‘œํ˜„๊ณผ ์ •์ฑ…์—์„œ์˜ ํ™œ์šฉ

์ด‰๊ฐ ์„ผ์„œ๊ฐ€ ์ƒ์„ฑํ•˜๋Š” ๊ณ ํ•ด์ƒ๋„ ์˜์ƒ(tactile image) ์€ ์›์‹œ์ ์œผ๋กœ ๋งค์šฐ ๊ณ ์ฐจ์›์ด๋ฏ€๋กœ, ์ด๋ฅผ ์ œ์–ด ์ •์ฑ…์ด ํ™œ์šฉ ๊ฐ€๋Šฅํ•œ ํ˜•ํƒœ๋กœ ๋ณ€ํ™˜ํ•ด์•ผ ํ•œ๋‹ค. AnyRotate์—์„œ๋Š” ์ด‰๊ฐ ์˜์ƒ์„ ์ ‘์ด‰ ํฌ์ฆˆ์™€ ์ ‘์ด‰๋ ฅ์ด๋ผ๋Š” ์ €์ฐจ์› ์—ฐ์†์  ํ”ผ์ฒ˜๋กœ ์ธ์ฝ”๋”ฉํ•œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์ ‘์ด‰ ํฌ์ฆˆ(contact pose) ๋Š” ์†๊ฐ€๋ฝ ๋์ (fingertip) ๊ธฐ์ค€์˜ ๊ตฌํ˜• ์ขŒํ‘œ๊ณ„์—์„œ ๊ทน๊ฐ(polar angle) ฮธ์™€ ๋ฐฉ์œ„๊ฐ(azimuthal angle) ฯ†๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ ‘์ด‰๋ ฅ(contact force) ์€ ์ ‘์ด‰์ ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ํž˜ ๋ฒกํ„ฐ์˜ ํฌ๊ธฐ(๋“ฑ๊ธ‰ํฌ๊ธฐ, magnitude)์ด๋‹ค. ์ถ”๊ฐ€๋กœ, ์ด์ง„ ์ ‘์ด‰ ์‹ ํ˜ธ(binary contact) ๋Š” ์‹ค์ œ๋กœ ์„ผ์„œ๊ฐ€ ๋ฌผ์ฒด์— ์ ‘์ด‰ ์ค‘์ž„์„ ๋‚˜ํƒ€๋‚ด๋Š” 0/1 ๊ฐ’์œผ๋กœ, ๊นŠ์ด(z์ถ•) ๋ณ€์œ„๋‚˜ ํž˜์˜ ํฌ๊ธฐ๊ฐ€ ์ผ์ • ์ž„๊ณ„๊ฐ’ ์ด์ƒ์ด๋ฉด ์ฐธ(1)์œผ๋กœ ์„ค์ •ํ•œ๋‹ค. ๋ชจ๋“  ์†๊ฐ€๋ฝ์— ๋Œ€ํ•˜์—ฌ ์ด๋“ค ๊ฐ’์ด ๊ณ„์‚ฐ๋˜์–ด ์ •์ฑ… ๊ด€์ธก(observation) ๋ฒกํ„ฐ์— ํฌํ•จ๋œ๋‹ค.

์ œ์–ด ์ •์ฑ…์˜ ๊ด€์ธก ๊ณต๊ฐ„(observation space) ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ •๋ณด๋“ค๋กœ ๊ตฌ์„ฑ๋œ๋‹ค: ํ˜„์žฌ ๋ฐ ๋ชฉํ‘œ ๊ด€์ ˆ๊ฐ, ์ด์ „ ํ–‰๋™, ๊ฐ ์†๊ฐ€๋ฝ ๋์˜ ์œ„์น˜์™€ ์ž์„ธ, ๊ทธ๋ฆฌ๊ณ  ์ด‰๊ฐ ๊ด€๋ จ ๋ณ€์ˆ˜๋กœ์„œ ๊ฐ ์†๊ฐ€๋ฝ์˜ ์ด์ง„ ์ ‘์ด‰ ์—ฌ๋ถ€, ์ ‘์ด‰ ํฌ์ฆˆ(ฮธ, ฯ†), ์ ‘์ด‰๋ ฅ ํฌ๊ธฐ์ด๋‹ค. ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์†๊ฐ€๋ฝ ๋ ์œ„์น˜/์ž์„ธ๋Š” ์—ญ๊ธฐ๊ตฌํ•™์œผ๋กœ ๊ณ„์‚ฐํ•˜๋ฉฐ, ์ด‰๊ฐ ์˜์ƒ์ฒ˜๋ฆฌ ๊ฒฐ๊ณผ๋ฅผ ํ†ตํ•ด ์ ‘์ด‰ ํฌ์ฆˆ์™€ ์ ‘์ด‰๋ ฅ์„ ์ถ”์ถœํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ๊ฐ ์†๊ฐ€๋ฝ ๋์˜ ๋กœ์ปฌ ์ ‘์ด‰ ์œ„์น˜ ๋ฒกํ„ฐ๋กœ๋ถ€ํ„ฐ ฮธ, ฯ†๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ , ์ ‘์ด‰๋ ฅ์˜ ์ •ํ•ฉ(net force)์„ |\mathbf{F}|๋กœ ์ทจํ•ด ์ด๋ฅผ ๊ด€์ธก๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ์ด์ฒ˜๋Ÿผ ์—ฐ์†์ ์ด๊ณ  ํ’๋ถ€ํ•œ ์ด‰๊ฐ ๋ณ€์ˆ˜๋“ค์€ ์ •์ฑ…์ด ๋ฌผ์ฒด์˜ ๋ฏธ์„ธ ์›€์ง์ž„๊ณผ ์ ‘์ด‰ ์ƒํƒœ๋ฅผ ์ •๋ฐ€ํ•˜๊ฒŒ ํŒŒ์•…ํ•˜๋„๋ก ๋•๋Š”๋‹ค.

์ด๋ ‡๊ฒŒ ์ถ”์ถœ๋œ ์ด‰๊ฐ ํ”ผ์ฒ˜๋Š” ์ •์ฑ…์˜ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉ๋œ๋‹ค. ๊ต์‚ฌ ์ •์ฑ…์€ ์ด๋“ค ๊ฐ’์„ ํฌํ•จํ•œ ๊ด€์ธก ๋ฒกํ„ฐ๋ฅผ ๋ฐ›์•„ ์—ฐ์† ๋™์ž‘(๊ด€์ ˆ ์ƒ๋Œ€ ์œ„์น˜๋ช…๋ น)์„ ์ถœ๋ ฅํ•˜๋ฉฐ, ์‹ค์ œ ์ •์ฑ…(ํ•™์ƒ)์€ ์ด‰๊ฐ ํžˆ์Šคํ† ๋ฆฌ์™€ ๊ณ ์œ  ๊ฐ๊ฐ(proprioception) ํžˆ์Šคํ† ๋ฆฌ๋ฅผ ๊ฒฐํ•ฉํ•œ ์ž ์žฌ๋ฒกํ„ฐ๋ฅผ ํ†ตํ•ด ํ–‰๋™์„ ์„ ํƒํ•œ๋‹ค. ํ•™์ƒ ์ •์ฑ…์—์„œ๋Š” TCN(์ˆœํ™˜ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง) ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์‹œ๊ฐ„์ถ•์œผ๋กœ ์—ฐ์†๋œ ์ด‰๊ฐ ๊ด€์ธก ์‹œํ€€์Šค๋ฅผ ์ธ์ฝ”๋”ฉํ•œ๋‹ค. ์ฆ‰, ๊ณผ๊ฑฐ 30์Šคํ…์— ๊ฑธ์นœ ์ด‰๊ฐ ํ”ผ์ฒ˜์™€ ๊ด€์ ˆ๊ฐ ํžˆ์Šคํ† ๋ฆฌ๋ฅผ TCN์— ํ†ต๊ณผ์‹œ์ผœ ์ž ์žฌ๋ฒกํ„ฐ(z)๋กœ ๋งŒ๋“ค๊ณ , ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ •์ฑ…(์•กํ„ฐ)์ด ๋™์ž‘์„ ์ถœ๋ ฅํ•œ๋‹ค. ์ •์ฑ… ํ•™์Šต ๊ณผ์ •์—์„œ๋Š” ๊ต์‚ฌ ์ •์ฑ…์ด ์ƒ์„ฑํ•œ ์ž ์žฌ๋ฒกํ„ฐ์™€ ํ•™์ƒ์˜ ์ž ์žฌ๋ฒกํ„ฐ ๊ฐ„ MSE(ํ‰๊ท ์ œ๊ณฑ์˜ค์ฐจ) ๋ฐ ํ–‰๋™ ์ถœ๋ ฅ ๊ฐ„ NLL(๋ถ€์ •๋กœ๊ทธ์šฐ๋„) ์†์‹ค์„ ์ตœ์†Œํ™”ํ•˜์—ฌ ํ•™์ƒ์„ ์ง€๋„ํ•™์Šต ๋ฐฉ์‹์œผ๋กœ ํ›ˆ๋ จํ•œ๋‹ค.

AnyRotate์˜ ์ด‰๊ฐ ์˜ˆ์ธก ํŒŒ์ดํ”„๋ผ์ธ. (a) ๊ฐ ์†๊ฐ€๋ฝ ๋์˜ ์ด‰๊ฐ ์˜์ƒ์€ ์ „์ฒ˜๋ฆฌ(๊ทธ๋ ˆ์ด์Šค์ผ€์ผ ๋ณ€ํ™˜, ๋ฆฌ์‚ฌ์ด์ฆˆ ๋“ฑ)๋ฅผ ๊ฑฐ์นœ๋‹ค. (b) ๊ฐ ์ด‰๊ฐ ์˜์ƒ์€ ํ•™์Šต๋œ ๊ด€์ฐฐ ๋ชจ๋ธ(observation model, CNN)์„ ํ†ต๊ณผํ•˜์—ฌ ์ ‘์ด‰ ํฌ์ฆˆ(ฮธ, ฯ†)์™€ ์ ‘์ด‰๋ ฅ |F|์„ ์˜ˆ์ธกํ•œ๋‹ค. (c) ์˜ˆ์ธก๋œ ์ ‘์ด‰ ํฌ์ฆˆ(๊ทน๊ฐ ฮธ, ๋ฐฉ์œ„๊ฐ ฯ†)๋Š” ๊ตฌ๋ฉด์ขŒํ‘œ๊ณ„์—์„œ ํ‘œ์‹œ๋˜๋ฉฐ, ์ ‘์ด‰๋ ฅ์€ ์ƒ‰์ƒ์˜ ๋ฉด์ ์œผ๋กœ ์‹œ๊ฐํ™”๋œ๋‹ค. ์ด์™€ ๊ฐ™์ด ์ถ”์ถœ๋œ ์ด‰๊ฐ ํ”ผ์ฒ˜๊ฐ€ ๊ฐ•ํ™”ํ•™์Šต ์ •์ฑ…์˜ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉ๋œ๋‹ค.

์œ„ ๊ทธ๋ฆผ์—์„œ ๋ณด๋“ฏ์ด, ์ด‰๊ฐ ์˜์ƒ์€ ๋จผ์ € ํ๋ฆผ/๋…ธ์ด์ฆˆ ์ œ๊ฑฐ ๋“ฑ์˜ ์ „์ฒ˜๋ฆฌ๋ฅผ ๊ฑฐ์นœ ๋’ค CNN ๊ด€์ฐฐ ๋ชจ๋ธ์— ์ž…๋ ฅ๋œ๋‹ค. CNN์€ ํ•™์Šต์„ ํ†ตํ•ด ๊ฐ ์†๊ฐ€๋ฝ ์ ‘์ด‰์˜ ๊ทน๊ฐ(ฮธ), ๋ฐฉ์œ„๊ฐ(ฯ†) ๊ทธ๋ฆฌ๊ณ  ์ด ์ ‘์ด‰๋ ฅ ํฌ๊ธฐ |\mathbf{F}|์„ ์˜ˆ์ธกํ•œ๋‹ค. ์ ‘์ด‰ ํฌ์ฆˆ (\theta,\phi)์™€ ์ ‘์ด‰๋ ฅ ํฌ๊ธฐ๋Š” ์ •์ฑ…์— ์—ฐ์† ๋ณ€์ˆ˜๋กœ ์ œ๊ณต๋˜๋ฉฐ, ์†๊ฐ€๋ฝ๋ณ„๋กœ (์ด์ง„ ์ ‘์ด‰, ฮธ, ฯ†, |\mathbf{F}|) ๊ฐ’์ด ๋งค ํƒ€์ž„์Šคํ…์˜ ๊ด€์ธก(state)์— ํฌํ•จ๋œ๋‹ค. ์ด๋Ÿฌํ•œ ์—ฐ์†์  ์ด‰๊ฐ ํ‘œํ˜„์€ 2D ์ด๋ฏธ์ง€๋ฅผ ๋‹จ์ˆœํžˆ ์ ‘์ด‰ ์žˆ์Œ/์—†์Œ์œผ๋กœ ์ด์ง„ํ™”ํ•œ ๊ธฐ์กด ๋ฐฉ์‹์— ๋น„ํ•ด ํ›จ์”ฌ ํ’๋ถ€ํ•œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ์‹ค์ œ๋กœ ์‹คํ—˜ ๊ฒฐ๊ณผ ์—ฐ์† ์ ‘์ด‰ ํฌ์ฆˆ์™€ ํž˜ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•œ ์ •์ฑ…์€ ์ด์‚ฐํ™”(discrete) ์ด‰๊ฐ ํ‘œํ˜„๋ณด๋‹ค ๋ฌผ์ฒด ํšŒ์ „ ์„ฑ๋Šฅ์ด ํ˜„์ €ํžˆ ์šฐ์ˆ˜ํ•˜์˜€๋‹ค.

์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ตฌํ˜„๊ณผ ๋„๋ฉ”์ธ ์ ์‘

AnyRotate์—์„œ๋Š” ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๊ฐ€์ƒ์œผ๋กœ ๊ตฌํ˜„ํ•˜์—ฌ ๊ต์‚ฌ ์ •์ฑ…์„ ํ•™์Šต์‹œํ‚จ๋‹ค. IsaacGym ๋ฌผ๋ฆฌ์—”์ง„์„ ์‚ฌ์šฉํ•˜์—ฌ ์ถฉ๋Œ์„ ์ฒ˜๋ฆฌํ•˜๋ฉฐ, ๊ฐ ์†๊ฐ€๋ฝ ๋์—์„œ ๋ฐœ์ƒํ•œ ์‹ค์ œ ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์ด์šฉํ•œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‹จ๊ณ„์—์„œ ์†๊ฐ€๋ฝ ๋์˜ ๋กœ์ปฌ ์ ‘์ด‰ ์œ„์น˜ p_{\rm local}๋ฅผ ์ถ”์ถœํ•˜์—ฌ ์ด๋ฅผ ๊ทน์ขŒํ‘œ (\theta,\phi)๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค. ๋˜ํ•œ, ์ ‘์ด‰์œผ๋กœ ์ธํ•œ ํž˜ ๋ฒกํ„ฐ๋ฅผ ๊ณ„์‚ฐํ•˜์—ฌ ๊ทธ ํฌ๊ธฐ |\mathbf{F}|๋ฅผ ๊ตฌํ•˜๊ณ , ์ด๋ฅผ ์ ‘์ด‰๋ ฅ ๊ด€์ธก๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ์ด ๋•Œ ์‹ค์„ธ๊ณ„ ์„ผ์„œ์˜ ํŠน์„ฑ์„ ๋ชจ์‚ฌํ•˜๊ธฐ ์œ„ํ•ด ๋ช‡ ๊ฐ€์ง€ ์ฒ˜๋ฆฌ๋ฅผ ์ถ”๊ฐ€ํ•œ๋‹ค. ๋จผ์ € ๋ถ€๋“œ๋Ÿฌ์šด(tactile) ์„ผ์„œ๊ฐ€ ๊ฐ€์ง„ ํƒ„์„ฑ ๋ณ€ํ˜• ๋”œ๋ ˆ์ด๋ฅผ ๋ชจ์‚ฌํ•˜๊ธฐ ์œ„ํ•ด ํž˜ ๊ฐ’์— ์ง€์ˆ˜ํ‰ํ™œ(exponential moving average)์„ ์ ์šฉํ•˜๊ณ , ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ์˜ ํž˜/ํฌ์ฆˆ ๊ฐ’์„ ์‹ค์ œ ์„ผ์„œ์˜ ์ธก์ • ๋ฒ”์œ„์— ๋งž์ถฐ ํฌํ™”(saturation) ๋ฐ ์žฌ์Šค์ผ€์ผ๋งํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ํž˜ ํฌ๊ธฐ์˜ ์ตœ๋Œ€๊ฐ’์„ ์ œํ•œํ•˜๊ณ  ๋ฒ”์œ„๋ฅผ ์žฌ์กฐ์ •ํ•˜์—ฌ ๊ฐ€์ƒ ์„ผ์„œ๊ฐ€ ์‹ค์ œ์™€ ์œ ์‚ฌํ•œ ๋ฒ”์œ„ ๋‚ด์—์„œ ๋™์ž‘ํ•˜๋„๋ก ํ•œ๋‹ค. ํฌ์ฆˆ ๊ฐ๋„๋„ ๋ฌผ๋ฆฌ์  ์„ผ์„œ๊ฐ€ ํ—ˆ์šฉํ•˜๋Š” ์ตœ๋Œ€ ๊ฐ๋„๋กœ ์ œํ•œํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์กฐ์ •์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ผ์„œ ๊ฐ„์˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ์ฐจ์ด๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•œ ์ผ์ข…์˜ ๋„๋ฉ”์ธ ์ ์‘(domain adaptation) ๊ธฐ๋ฒ•์ด๋‹ค.

๋˜ํ•œ, ์‹ค์ œ ์ด‰๊ฐ ์„ผ์„œ์—์„œ๋Š” ์ ‘์ด‰์ด ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š” ์ƒํƒœ์—์„œ๋„ ๋ฏธ์•ฝํ•œ ๋…ธ์ด์ฆˆ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ, ์ด๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋„ ์ด์ง„ ์ ‘์ด‰ ์‹ ํ˜ธ๋ฅผ ๋งŒ๋“ค ๋•Œ ์ผ์ • ์ž„๊ณ„๊ฐ’(\theta_F)์„ ์‚ฌ์šฉํ•œ๋‹ค. ์ฆ‰, ํž˜ ํฌ๊ธฐ๊ฐ€ ์ž‘์€ ๊ฒฝ์šฐ์—๋Š” ์ ‘์ด‰ ์—†์Œ์œผ๋กœ ๊ฐ„์ฃผํ•˜์—ฌ ์ ‘์ด‰ ํฌ์ฆˆ์™€ ํž˜์„ 0์œผ๋กœ ๋งˆ์Šคํ‚นํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์ ˆ์ฐจ๋กœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๋œ ์ด‰๊ฐ ๊ด€์ธก๊ฐ’(ฮธ, ฯ†, |\mathbf{F}|, ์ ‘์ด‰ ์œ ๋ฌด)์ด RL ๊ด€์ธก ๊ณต๊ฐ„์— ๊ณต๊ธ‰๋˜๋ฉฐ, ๊ต์‚ฌ ์ •์ฑ…์€ ์ด๋ฅผ ํฌํ•จํ•œ ์™„์ „ ๊ด€์ธก ์ƒํƒœ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ•™์Šต๋œ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ๋กœ๋ด‡ ์ œ์–ด ์ฃผํŒŒ์ˆ˜๋Š” ๊ฐ๊ฐ 60Hz, 20Hz๋กœ ์‹ค์ œ ์‹œ์Šคํ…œ๊ณผ ๋™์ผํ•˜๊ฒŒ ์„ค์ •๋˜์—ˆ๋‹ค. ์ด์ฒ˜๋Ÿผ ์„ธ์‹ฌํ•˜๊ฒŒ ์กฐ์ •๋œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ด‰๊ฐ์€ ์‹ค์ œ ์„ผ์„œ์™€์˜ ์‹ฌ๋„ ์ฐจ์ด(depth), ์Šˆ์–ด(shear) ๋ฒ”์œ„๋ฅผ ๋ฐ˜์˜ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ๋‹ค.

๋„๋ฉ”์ธ ๋žœ๋คํ™”(domain randomization)์˜ ๊ด€์ ์—์„œ ์‚ดํŽด๋ณด๋ฉด, AnyRotate๋Š” ์ „ํ†ต์ ์ธ ์ด๋ฏธ์ง€ ๋…ธ์ด์ฆˆ/ํ…์Šค์ฒ˜ ๋žœ๋คํ™” ๋Œ€์‹ , ๋ฌผ๋ฆฌ์  ํŒŒ๋ผ๋ฏธํ„ฐ ํฌํ™” ๋ฐ ์Šค์ผ€์ผ ๋งคํ•‘์œผ๋กœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ๊ฒฉ์ฐจ๋ฅผ ์ค„์ธ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‹ค์ œ TacTip ์„ผ์„œ๋Š” ๊นŠ์ด ๋ฐฉํ–ฅ ๋ณ€์œ„๊ฐ€ ์ˆ˜ mm ๋ฒ”์œ„ ๋‚ด์—์„œ๋งŒ ๋ฏผ๊ฐํ•˜๊ฒŒ ๋ฐ˜์‘ํ•˜๋ฏ€๋กœ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์ ‘์ด‰ ๊นŠ์ด๋„ ์•ฝ ~ mm ๋ฒ”์œ„๋กœ ์ œํ•œํ•œ๋‹ค. ์ด์ฒ˜๋Ÿผ ์‹คํ—˜์ ์œผ๋กœ ์ •ํ•ด์ง„ ๋ฒ”์œ„ ๋‚ด์—์„œ ์ด‰๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜์—ฌ ๊ด€์ฐฐ ๋ชจ๋ธ์„ ํ•™์Šตํ•จ์œผ๋กœ์จ ์‹œ๋ฎฌ-์‹ค์ œ ๊ฐ„์˜ ํŠน์„ฑ ๋ถˆ์ผ์น˜๋ฅผ ์ตœ์†Œํ™”ํ•œ๋‹ค.

Observation Model์„ ํ†ตํ•œ ์‹œ๋ฎฌ-์‹ค์ œ ์ „์ด

์‹ค์ œ ๋กœ๋ด‡ ํ™˜๊ฒฝ์—์„œ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ์ฒ˜๋Ÿผ ์ ‘์ด‰ ์œ„์น˜๋‚˜ ํž˜์„ ์ง์ ‘ ๊ณ„์‚ฐํ•  ์ˆ˜ ์—†์œผ๋ฏ€๋กœ, ์ด๋ฏธ์ง€ ๊ธฐ๋ฐ˜ ๊ด€์ฐฐ ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ์‹ค์ œ ์ด‰๊ฐ ์˜์ƒ์„ ์ด‰๊ฐ ํ”ผ์ฒ˜๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด AnyRotate๋Š” CNN ๊ธฐ๋ฐ˜ ๊ด€์ฐฐ์ž ๋ชจ๋ธ(Observation Model)์„ ํ•™์Šตํ•œ๋‹ค. ํ•™์Šต ๋ฐ์ดํ„ฐ๋Š” 6-์ž์œ ๋„ UR5 ๋กœ๋ด‡์•”์— ํƒ‘์žฌ๋œ TacTip ์„ผ์„œ์™€ ํž˜/ํ† ํฌ(F/T) ์„ผ์„œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ˆ˜์ง‘๋œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์„ผ์„œ๋ฅผ ํ‰ํ‰ํ•œ ์ž๊ทน ํ‘œ๋ฉด์— ๋ฌด์ž‘์œ„ ๋ฐฉํ–ฅยท์œ„์น˜๋กœ ์ ‘์ด‰(tap)์‹œ์ผœ ์–ป์€ ์ด‰๊ฐ ์ด๋ฏธ์ง€์™€ F/T ์„ผ์„œ์˜ ํž˜ ์ •๋ณด๋ฅผ ํ•จ๊ป˜ ์ €์žฅํ•œ๋‹ค. ๊ฐ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์€ ๋กœ๋ด‡์˜ x,y,z ์œ„์น˜์™€ ์ ‘์ด‰๋ ฅ (F_x,F_y,F_z)์„ ํฌํ•จํ•˜๋ฉฐ, ์ด ์ค‘ ์ ‘์ด‰ ํฌ์ฆˆ(ฮธ, ฯ†)๋Š” ๋กœ๋ด‡ ์•”์˜ ์œ„์น˜๋กœ๋ถ€ํ„ฐ, ์ ‘์ด‰๋ ฅ ํฌ๊ธฐ๋Š” F/T ์„ผ์„œ ๊ฐ’์˜ ํฌ๊ธฐ๋กœ ์ •๋‹ต ๋ ˆ์ด๋ธ”(label)๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์‹œ ์„ผ์„œ ์ž์„ธ(pose)๋Š” ์‹คํ—˜์ ์œผ๋กœ ๋‹ค์Œ ๋ฒ”์œ„ ๋‚ด์—์„œ ๋žœ๋ค ์ƒ˜ํ”Œ๋ง๋œ๋‹ค: ๊นŠ์ด \Delta z\in[-4,-1]mm, x,y๋ฐฉํ–ฅ \pm2mm, ํšŒ์ „ \pm28^\circ ๋ฒ”์œ„. ์„ผ์„œ๋‹น ์•ฝ 3000๊ฐœ์˜ ์ด๋ฏธ์ง€๋ฅผ ๋ชจ์•„ CNN์„ ํ•™์Šตํ•œ๋‹ค.

ํ•™์Šต๋œ ๊ด€์ฐฐ ๋ชจ๋ธ์€ ์ž…๋ ฅ์œผ๋กœ ์›์‹œ ์ด‰๊ฐ ์˜์ƒ(๊ทธ๋ ˆ์ด์Šค์ผ€์ผ, 240ร—135 ํ”ฝ์…€)์„ ๋ฐ›์•„ 6์ฐจ์› ์ถœ๋ ฅ์„ ์˜ˆ์ธกํ•œ๋‹ค. ์ด 6์ฐจ์›์€ ์ ‘์ด‰ ๊นŠ์ด d_z, ์ ‘์ด‰ ํฌ์ฆˆ \theta,\phi, ๊ทธ๋ฆฌ๊ณ  ํž˜ ๋ฒกํ„ฐ ์„ฑ๋ถ„ F_x,F_y,F_z์ด๋‹ค. ์ดํ›„ ์ด ์ค‘์—์„œ ์‹ค์ œ ๊ฐ•ํ™”ํ•™์Šต ๊ด€์ธก๊ฐ’์œผ๋กœ๋Š” (\theta,\phi,|\mathbf{F}|) ์„ธ ๊ฐ’๋งŒ ์‚ฌ์šฉ๋œ๋‹ค. ์ฆ‰, ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ (F_x,F_y,F_z)๋กœ๋ถ€ํ„ฐ ํฌ๊ธฐ |\mathbf{F}|=\sqrt{F_x^2+F_y^2+F_z^2}์„ ๊ณ„์‚ฐํ•˜์—ฌ ์ ‘์ด‰๋ ฅ์„ ์–ป๊ณ , ์ ‘์ด‰ ์—ฌ๋ถ€๋Š” SSIM(๊ตฌ์กฐ์  ์œ ์‚ฌ์„ฑ ์ง€ํ‘œ)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ฒฐ์ •ํ•œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ํ˜„์žฌ ์ž…๋ ฅ ์˜์ƒ๊ณผ ์„ผ์„œ๊ฐ€ ์ ‘์ด‰ํ•˜์ง€ ์•Š์€ ๊ธฐ์ค€ ์˜์ƒ์„ ๋น„๊ตํ•˜์—ฌ SSIM ์œ ์‚ฌ๋„๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ , ์ด ๊ฐ’์ด 0.6 ์ด์ƒ์ด๋ฉด ์ ‘์ด‰์œผ๋กœ ๊ฐ„์ฃผํ•˜์—ฌ ์œ„์—์„œ ์˜ˆ์ธกํ•œ (\theta,\phi,|\mathbf{F}|)๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด ์ ‘์ด‰ํ•˜์ง€ ์•Š์€ ๊ฒƒ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜์—ฌ ๋ชจ๋“  ์ด‰๊ฐ ํ”ผ์ฒ˜๋ฅผ 0์œผ๋กœ ๋งˆ์Šคํ‚นํ•œ๋‹ค. ์ด ๊ณผ์ •์—์„œ SSIM ์ž„๊ณ„๊ฐ’์€ ๊ฒฝํ—˜์ ์œผ๋กœ 0.6์œผ๋กœ ์„ค์ •ํ•˜์˜€๊ณ , ๊ทธ๋ ˆ์ด์Šค์ผ€์ผ ์˜์ƒ์— ๋ธ”๋Ÿฌ์™€ ์–ด๋Œ‘ํ‹ฐ๋ธŒ ์ž„๊ณ„์ฒ˜๋ฆฌ(adaptive threshold) ๋“ฑ ์ „์ฒ˜๋ฆฌ ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•˜์—ฌ ๋…ธ์ด์ฆˆ๋ฅผ ์ค„์ธ๋‹ค.

ํ•™์Šต๋œ CNN ๊ด€์ฐฐ ๋ชจ๋ธ์€ ์ œ๋กœ์ƒท(sim-to-real) ์ •์ฑ… ์ด์ „์— ํ•ต์‹ฌ ์—ญํ• ์„ ํ•œ๋‹ค. ์ฆ‰, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šต๋œ ๊ต์‚ฌ-ํ•™์ƒ ์ •์ฑ…์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ƒ์˜ ์ด‰๊ฐ ํ”ผ์ฒ˜๋ฅผ ์ด์šฉํ•˜์ง€๋งŒ, ์‹ค์ œ ๋ฐฐ์น˜ ์‹œ์—๋Š” ์„ผ์„œ๊ฐ€ ์ œ๊ณตํ•˜๋Š” ์‹ค์‹œ๊ฐ„ ์˜์ƒ์—์„œ ๊ด€์ฐฐ ๋ชจ๋ธ์ด ์ถ”์ถœํ•œ ์ด‰๊ฐ ํ”ผ์ฒ˜๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ์ด ๋•Œ ๊ด€์ฐฐ ๋ชจ๋ธ์€ ์ด์ „์— ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ๋กœ ์ถฉ๋ถ„ํžˆ ํ•™์Šต๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ •์ฑ…์€ ํ•™์Šต ์‹œ์™€ ์œ ์‚ฌํ•œ ํ˜•ํƒœ์˜ ์ด‰๊ฐ ์ž…๋ ฅ์„ ๋ฐ›๊ฒŒ ๋˜์–ด ์ถ”๊ฐ€์ ์ธ ์žฌํ•™์Šต ์—†์ด(์ œ๋กœ์ƒท) ๋ฐ”๋กœ ์‹คํ™˜๊ฒฝ์— ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.

๊ต์‚ฌ-ํ•™์ƒ ์ •์ฑ… ํ•™์Šต ํŒŒ์ดํ”„๋ผ์ธ

AnyRotate์˜ ํ•™์Šต์€ ํฌ๊ฒŒ ๋‘ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋œ๋‹ค. ์ฒซ์งธ, ๊ต์‚ฌ ์ •์ฑ…(Teacher Policy)์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํŠน๊ถŒ ์ •๋ณด(privileged information)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ PPO ๊ฐ™์€ RL ๊ธฐ๋ฒ•์œผ๋กœ ํ•™์Šตํ•œ๋‹ค. ๊ต์‚ฌ ์ •์ฑ…์˜ ์ž…๋ ฅ ๊ด€์ธก์—๋Š” ์•ž์„œ ์–ธ๊ธ‰ํ•œ ์ด‰๊ฐ ํ”ผ์ฒ˜ ์™ธ์—๋„ ๊ฐ์ฒด์˜ ์ •ํ™•ํ•œ ์œ„์น˜ยท์ž์„ธ, ๊ฐ๋„ ์†๋„, ๊ฐ์ฒด ํฌ๊ธฐ, ์ค‘๋ ฅ ์ž‘์šฉ๋ ฅ ๋“ฑ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋งŒ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๊ฐ€ ํฌํ•จ๋œ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•™์Šต๋œ ๊ต์‚ฌ ์ •์ฑ…์€ ๋ชฉํ‘œ ์ถ•์— ๋Œ€ํ•ด ๋ฌผ์ฒด๋ฅผ ์•ˆ์ •์ ์œผ๋กœ ํšŒ์ „์‹œํ‚ค๋Š” ์ •์ฑ…์„ ๋งŒ๋“ค์–ด๋‚ธ๋‹ค.

๋‘˜์งธ, ํ•™์ƒ ์ •์ฑ…(Student Policy)์€ ์‹ค์ œ ์ƒํ™ฉ์—์„œ์˜ ์‹คํ–‰์„ ์œ„ํ•ด ํ•™์Šต๋œ๋‹ค. ํ•™์ƒ์€ ๊ต์‚ฌ๋ฅผ ๋ชจ๋ฐฉํ•˜๊ธฐ ์œ„ํ•ด ์ง€๋„ํ•™์Šต(policy distillation)์„ ์‚ฌ์šฉํ•œ๋‹ค. ํ•™์ƒ ์ •์ฑ…์€ ์˜ค๋กœ์ง€ ๊ณ ์œ ๊ฐ๊ฐ(๊ด€์ ˆ๊ฐ ๋“ฑ)๊ณผ ์•ž์„œ ์ถ”์ถœ๋œ ์ด‰๊ฐ ํžˆ์Šคํ† ๋ฆฌ๋งŒ์„ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›๋Š”๋‹ค. ๊ต์‚ฌ ์ •์ฑ…์€ ๋งค ์‹œ์ ๋งˆ๋‹ค ๋‚ด๋ถ€ ์ž ์žฌ๋ฒกํ„ฐ(z)๋ฅผ ์ƒ์„ฑํ•˜๋Š”๋ฐ, ํ•™์ƒ ์ •์ฑ…์€ TCN ์ธ์ฝ”๋”๋กœ ์ž…๋ ฅ ์—ฐ์† ๊ด€์ธก์„ ์ž ์žฌ๋ฒกํ„ฐ๋กœ ์••์ถ•ํ•˜๊ณ , ์ด ์ž ์žฌ๋ฒกํ„ฐ๊ฐ€ ๊ต์‚ฌ์˜ ๊ฒƒ๊ณผ ์œ ์‚ฌํ•ด์ง€๋„๋ก ํ•™์Šต๋œ๋‹ค. ๋˜ํ•œ ํ•™์ƒ ์ •์ฑ…์˜ ์ถœ๋ ฅ ํ–‰๋™์ด ๊ต์‚ฌ ์ •์ฑ…์˜ ํ–‰๋™๊ณผ ๊ฐ€๊นŒ์›Œ์ง€๋„๋ก NLL ์†์‹ค์„ ์ถ”๊ฐ€๋กœ ์ตœ์ ํ™”ํ•œ๋‹ค. ์ด๋•Œ ์ „์ฒด ์†์‹ค์€ ์ž ์žฌ๋ฒกํ„ฐ MSE์™€ ํ–‰๋™ NLL์˜ ํ•ฉ์ด๋ฉฐ, ์‹์œผ๋กœ ํ‘œํ˜„ํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค: \mathcal{L} = \alpha |z_{\rm teacher} - z_{\rm student}|^2 + \beta\,\bigl(-\log p_{\rm student}(a_{\rm teacher}|s)\bigr), ์—ฌ๊ธฐ์„œ z_{\rm teacher}๋Š” ๊ต์‚ฌ์˜ ์ž ์žฌ๋ฒกํ„ฐ, z_{\rm student}๋Š” ํ•™์ƒ์˜ ์ธ์ฝ”๋” ์ถœ๋ ฅ, p_{\rm student}(a_{\rm teacher}|s)๋Š” ํ•™์ƒ ์ •์ฑ…์ด ๊ต์‚ฌ ํ–‰๋™ a_{\rm teacher}๋ฅผ ์ทจํ•  ํ™•๋ฅ ์ด๋‹ค. ์ด ๊ณผ์ •์—์„œ ํ•™์Šต๋œ ๊ด€์ฐฐ ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ•™์ƒ ํ•™์Šต ๋‹จ๊ณ„์—์„œ๋„ ์‹ค์ œ ์ด‰๊ฐ ํ”ผ์ฒ˜๋ฅผ ๋ชจ์‚ฌํ•˜์—ฌ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

AnyRotate์˜ ํ•™์Šต ๋ฐ ์ ์šฉ ํŒŒ์ดํ”„๋ผ์ธ ๊ฐœ์š”. (์™ผ์ชฝ) ๋ชฉํ‘œ ํšŒ์ „์ถ•์— ๋Œ€ํ•œ ๋ฌผ์ฒด ์ž์„ธ ์žฌ์„ค์ •(auxiliary goal) ๋ฐฉ์‹์˜ RL ๋ฌธ์ œ ์„ค์ •. (์˜ค๋ฅธ์ชฝ) ๊ต์‚ฌ-ํ•™์ƒ ์ •์ฑ…(distillation) ๊ตฌ์กฐ. ๊ต์‚ฌ ์ •์ฑ…(Teacher)์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ํŠน๊ถŒ ์ •๋ณด์™€ ์ด‰๊ฐ ๊ด€์ธก์„ ์ž…๋ ฅ์œผ๋กœ RL ํ•™์Šต์„ ์ˆ˜ํ–‰ํ•˜๊ณ , ํ•™์ƒ ์ •์ฑ…(Student)์€ ์ด‰๊ฐยท๊ณ ์œ ๊ฐ๊ฐ ๊ด€์ธก ํžˆ์Šคํ† ๋ฆฌ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๊ต์‚ฌ๋ฅผ ๋ชจ๋ฐฉํ•œ๋‹ค. ์‹ค์„ธ๊ณ„ ์ด์ „ ์‹œ์—๋Š” CNN ๊ด€์ฐฐ ๋ชจ๋ธ์ด ์‹ค์ œ ์ด‰๊ฐ ์˜์ƒ์—์„œ ์ ‘์ด‰ ํ”ผ์ฒ˜๋ฅผ ์ถ”์ถœํ•˜์—ฌ ํ•™์ƒ ์ •์ฑ…์— ๊ณต๊ธ‰ํ•œ๋‹ค.

๊ทธ๋ฆผ์—์„œ ๋ณด๋“ฏ, AnyRotate๋Š” ๊ต์‚ฌ-ํ•™์ƒ ์ •์ฑ… ๊ตฌ์กฐ์™€ ๋ณด์กฐ ๋ชฉํ‘œ(auxiliary goal), ์ ์‘ํ˜• ์ปค๋ฆฌํ˜๋Ÿผ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ํ•™์Šต์„ ์ง„ํ–‰ํ•œ๋‹ค. ๊ต์‚ฌ ์ •์ฑ…์€ ๊ฐ์ฒด ์ž์„ธ๋ฅผ ๋ชฉํ‘œ๋กœ ์„ค์ •ํ•˜๊ณ , ๊ฐ์ฒด์˜ 6D ํ‚คํฌ์ธํŠธ(keypoint) ๊ฑฐ๋ฆฌ ๋ณด์ƒ ๋“ฑ์„ ํฌํ•จํ•œ ๋ชฉํ‘œ ์ง€ํ–ฅ ๋ณด์ƒํ•จ์ˆ˜๋กœ ํ›ˆ๋ จ๋œ๋‹ค. ํ•™์ƒ ์ •์ฑ…์€ ์ด๋ ‡๊ฒŒ ํ•™์Šต๋œ ๊ต์‚ฌ์˜ ์•ˆ์ •์ ์ธ ์›€์ง์ž„์„ ์‹ค์ œ ์„ผ์„œ ๋ฐ์ดํ„ฐ๋กœ ์žฌํ˜„ํ•  ์ˆ˜ ์žˆ๋„๋ก, TCN ์ธ์ฝ”๋”ฉ๊ณผ ํ–‰๋™ ๋ชจ๋ฐฉ์„ ํ†ตํ•ด ํ•™์Šต๋œ๋‹ค. ์ด ๊ณผ์ •์„ ํ†ตํ•ด AnyRotate๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์„ ์ถ”๊ฐ€ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์ด๋‚˜ ์žฌํ•™์Šต ์—†์ด ์‹คํ™˜๊ฒฝ์— ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

์ด‰๊ฐ ๊ฐ์ง€ ๋ชจ๋ธ๋ง์˜ ํ˜์‹ ์„ฑ๊ณผ ๋„์ „ ๊ณผ์ œ

AnyRotate๊ฐ€ ์ œ์‹œํ•˜๋Š” ์ฃผ์š”ํ•œ ํ˜์‹ ์„ฑ ์ค‘ ํ•˜๋‚˜๋Š” ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•œ ์‹œ๋ฎฌ-์‹ค์ œ RL ์ •์ฑ…์„ ๊ตฌํ˜„ํ–ˆ๋‹ค๋Š” ์ ์ด๋‹ค. ๊ธฐ์กด์˜ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ์กฐ์ž‘ ์—ฐ๊ตฌ์—์„œ๋Š” ์ข…์ข… ์ ‘์ด‰ ์˜์ƒ์„ ๋‹จ์ˆœํ•œ ์ด์ง„ ์‹ ํ˜ธ๋‚˜ ์ด์‚ฐ ๊ณต๊ฐ„์œผ๋กœ ์ถ•์†Œํ•˜์—ฌ ์‚ฌ์šฉํ•ด ์™”๋‹ค. ๋ฐ˜๋ฉด ๋ณธ ๋…ผ๋ฌธ์€ ์ด‰๊ฐ ์˜์ƒ์„ ์—ฐ์†์ ์ด๊ณ  ๊ธฐํ•˜ํ•™์ ์ธ ํ”ผ์ฒ˜(ฮธ, ฯ†, |F|)๋กœ ํ‘œํ˜„ํ•จ์œผ๋กœ์จ, ํ›จ์”ฌ ๋” ํ’๋ถ€ํ•œ ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์ •์ฑ… ํ•™์Šต์— ํ™œ์šฉํ•˜์˜€๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ฏธ์ง€์˜ ๋ฌผ์ฒด๋‚˜ ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด์—์„œ๋„ ์œ ์—ฐํ•˜๊ฒŒ ์ผ๋ฐ˜ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ๋‹จ์ผ ์ •์ฑ…์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ์‹ค์ œ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋กœ์˜ ์ „์ด ์‹คํ—˜์—์„œ ๋ณต์ˆ˜์˜ ์ด‰๊ฐ ์„ผ์„œ๋งŒ์œผ๋กœ๋„ ์„ฑ๊ณต์ ์œผ๋กœ ํšŒ์ „ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜์˜€๋‹ค. ๋˜ํ•œ, ๋ณต์ˆ˜ ์ด‰๊ฐ ์ •๋ณด๋ฅผ ํ†ตํ•ด ๋ฌผ์ฒด์˜ ๋ฏธ๋„๋Ÿฌ์ง(slippage)์ด๋‚˜ ์žก๊ธฐ ์‹คํŒจ๋ฅผ ์•”๋ฌต์ ์œผ๋กœ ํƒ์ง€ํ•˜์—ฌ ๋ฐ˜์‘ํ•˜๋Š” ํ–‰๋™์„ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค๋Š” ์ ๋„ ์ฃผ๋ชฉํ•  ๋งŒํ•˜๋‹ค. ์—ฐ๊ตฌ์ง„์€ ๋ช…์‹œ์  ๋ฏธ๋„๋Ÿผ ๊ฒ€์ถœ๊ธฐ ์—†์ด๋„ โ€œํ’๋ถ€ํ•œ ๋‹ค์ง€๊ฐ„ ์ด‰๊ฐ ์„ผ์„œ๊ฐ€ ๊ฐ์ฒด ์›€์ง์ž„์„ ๊ฐ์ง€ํ•˜๊ณ  ์ •์ฑ…์˜ ๊ฐ•์ธ์„ฑ(robustness)์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ˜์‘ ํ–‰๋™์„ ์œ ๋ฐœโ€ํ•œ๋‹ค๋Š” ์‚ฌ์‹ค์„ ๋ณด๊ณ ํ•˜์˜€๋‹ค.

๊ทธ๋Ÿฌ๋‚˜ ์ด‰๊ฐ ์„ผ์„œ ๋ชจ๋ธ๋ง์—๋Š” ์—ฌ๋Ÿฌ ๋„์ „ ๊ณผ์ œ๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์šฐ์„ , ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ํ•œ๊ณ„๋‹ค. TacTip๊ณผ ๊ฐ™์€ ๊ด‘ํ•™ ์ด‰๊ฐ ์„ผ์„œ๋Š” ์œ ์—ฐํ•œ ๊ฒ” ํ‘œ๋ฉด์˜ ๋ณ€ํ˜•์„ ์˜์ƒ์œผ๋กœ ํฌ์ฐฉํ•˜๋ฏ€๋กœ, ์™„์ „ํžˆ ์ •ํ™•ํ•œ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์€ ์–ด๋ ค์šฐ๋ฉฐ ๋งค์šฐ ๊ณ„์‚ฐ ์ง‘์•ฝ์ ์ผ ์ˆ˜ ์žˆ๋‹ค. AnyRotate์—์„œ๋Š” ๋‹จ์ˆœํžˆ ์ถฉ๋Œ ์ง€์ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ ‘์ด‰ ์œ„์น˜์™€ ํž˜์„ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๊ทผ์‚ฌํ–ˆ์ง€๋งŒ, ์‹ค์ œ ์„ผ์„œ์˜ ๋ฏธ์„ธํ•œ ์••๋ ฅ ๋ถ„ํฌ๋‚˜ ์„ผ์„œ ๋‚ด๋ถ€ ๋ Œ์ฆˆ ์™œ๊ณก ๋“ฑ์€ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•œ๋‹ค. ๋”ฐ๋ผ์„œ ์‹œ๋ฎฌ-์‹ค์ œ ๊ฐ„์˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ์ฐจ์ด๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋ฅผ ๋ณด์ •ํ•˜๊ธฐ ์œ„ํ•ด ์‹คํ—˜์ ์œผ๋กœ ๊ฐ’์˜ ํฌํ™”, ์‹œ์  ๋ณ€๊ฒฝ ๋“ฑ์˜ ๋„๋ฉ”์ธ ์ ์‘ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•˜์˜€๋‹ค.

๋˜ํ•œ, ์ด‰๊ฐ ์˜์ƒ ์ž์ฒด๊ฐ€ ๋งค์šฐ ๋†’์€ ์ฐจ์›์„ ๊ฐ€์ง€๋ฏ€๋กœ ์ด๋ฅผ ์œ ์šฉํ•œ ํ”ผ์ฒ˜๋กœ ์••์ถ•ํ•˜๋Š” ์‹ ๊ฒฝ๋ง ์„ค๊ณ„๋„ ์ค‘์š”ํ•œ ๋ฌธ์ œ๋‹ค. AnyRotate๋Š” ๊ฐ ์†๊ฐ€๋ฝ๋งˆ๋‹ค ๊ฐœ๋ณ„ CNN์„ ํ•™์Šตํ•˜์—ฌ ์ ‘์ด‰ ํ”ผ์ฒ˜๋ฅผ ์ถ”์ถœํ–ˆ์ง€๋งŒ, ์ด ๊ณผ์ •์—์„œ ๊ณผ์ ํ•ฉ(overfitting) ๋ฐฉ์ง€์™€ ์ •๋ฐ€๋„(accuracy) ํ™•๋ณด๋ฅผ ์œ„ํ•ด ๋งŽ์€ ๋ฐ์ดํ„ฐ์™€ ์ ์ ˆํ•œ ๋„คํŠธ์›Œํฌ ๊ทœ๋ชจ๋ฅผ ํ•„์š”๋กœ ํ–ˆ๋‹ค. ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๋กœ๋ด‡ ์กฐ์ž‘ ์ค‘์—๋Š” ์„ผ์„œ ์ด๋ฏธ์ง€์— ๋™์  ๋…ธ์ด์ฆˆ(์†๋–จ๋ฆผ, ๊ด‘์› ๋ณ€ํ™” ๋“ฑ)๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ๊ด€์ฐฐ ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ ๋ณ€ํ™”์— ๊ฒฌ๊ณ ํ•ด์•ผ ํ•œ๋‹ค. ์ด ์—ฐ๊ตฌ์—์„œ๋Š” SSIM ๊ธฐ๋ฐ˜์˜ ์ ‘์ด‰ ์œ ๋ฌด ๊ฒ€์ถœ๊ณผ ์˜์ƒ ์ „์ฒ˜๋ฆฌ๋กœ ๋…ธ์ด์ฆˆ๋ฅผ ๊ฐ์†Œ์‹œ์ผฐ์ง€๋งŒ, ์™„์ „ํ•œ ์ผ๋ฐ˜ํ™”๋ฅผ ์œ„ํ•ด์„œ๋Š” ์ถ”๊ฐ€์ ์ธ ๋„๋ฉ”์ธ ๋žœ๋คํ™”(์˜ˆ: ์กฐ๋ช… ์ƒ‰๊น” ๋ณ€ํ™”, ๋…ธ์ด์ฆˆ ์ถ”๊ฐ€ ๋“ฑ)๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ๋‹ค.

๋์œผ๋กœ, AnyRotate๋Š” ๋‹จ์ผ ์ •์ฑ…์œผ๋กœ ๋ชจ๋“  ํšŒ์ „์ถ•์— ์ผ๋ฐ˜ํ™”ํ•œ๋‹ค๋Š” ์ ์—์„œ ๊ธฐ์ˆ ์ ์œผ๋กœ๋„ ๊ณผ์ œ๋‹ค. ์„œ๋กœ ๋‹ค๋ฅธ ์ถ• ํšŒ์ „์€ ์ค‘๋ ฅ์˜ ์˜ํ–ฅ๊ณผ ์ ‘์ด‰ ๊ธฐ๊ตฌํ•™์ด ๋‹ฌ๋ผ์ง€๋ฏ€๋กœ, ์ •์ฑ…์ด ์ถฉ๋ถ„ํžˆ ๋ชจ๋“  ์ƒํ™ฉ์„ ์ปค๋ฒ„ํ•˜๋„๋ก ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์–‘ํ™”ํ•ด์•ผ ํ•œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์—ฐ๊ตฌ์ง„์€ ์—ํ”ผ์†Œ๋“œ๋งˆ๋‹ค ๋ชฉํ‘œ ํšŒ์ „์ถ•๊ณผ ์† ๋ฐฉํ–ฅ์„ ๋ฌด์ž‘์œ„๋กœ ์„ค์ •ํ•˜๊ณ , ์ ์‘ํ˜• ๋ณด์ƒ ์ปค๋ฆฌํ˜๋Ÿผ์„ ํ†ตํ•ด ํ•™์Šต ์ดˆ๊ธฐ์—๋Š” ์‰ฌ์šด ๊ณผ์ œ๋ถ€ํ„ฐ ์‹œ์ž‘ํ–ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ ‘๊ทผ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ํšจ๊ณผ์ ์ด์—ˆ์œผ๋‚˜, ์‹ค์„ธ๊ณ„์—์„œ๋Š” ๋ˆˆ์— ๋„๋Š” ์ถ”๊ฐ€ ๊ตฌํ˜„ ์—†์ด๋„ ์ „์ด ๊ฐ€๋Šฅํ•ด์•ผ ํ•œ๋‹ค. AnyRotate๋Š” ๊ด€์ฐฐ ๋ชจ๋ธ์„ ํ†ตํ•œ ์ œ๋กœ์ƒท ์ „์ด๋กœ ์ด๋ฅผ ๋‹ฌ์„ฑํ–ˆ์œผ๋‚˜, ์•„์ง๋„ โ€œ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ๋ณธ ๊ฒƒ๊ณผ ์™„์ „ํžˆ ๋‹ค๋ฅธ ํ˜•ํƒœ์˜ ์ ‘์ด‰โ€์—๋Š” ๋ฏผ๊ฐํ•  ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ดํ˜•์ ์ธ ์žฌ์งˆ์ด๋‚˜ ์œค๊ณฝ์„ ๊ฐ€์ง„ ๋ฌผ์ฒด์—์„œ๋Š” ๊ด€์ฐฐ ๋ชจ๋ธ์ด ์˜ˆ์ธก ์˜ค์ฐจ๋ฅผ ๋‚ผ ์ˆ˜ ์žˆ์–ด ์ •์ฑ… ์„ฑ๋Šฅ์— ์˜ํ–ฅ์ด ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์‹ ํ˜ธ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์— ์ •๋ฐ€ํžˆ ๋ฐ˜์˜ํ•˜๋Š” ๊ฒƒ์€ ์ง€์†์ ์ธ ์—ฐ๊ตฌ ๊ณผ์ œ๋กœ ๋‚จ์•„ ์žˆ๋‹ค.

์ด์ฒ˜๋Ÿผ AnyRotate๋Š” ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์ •๋ณด์˜ ์‹œ๋ฎฌ-์‹ค์ œ ํ†ตํ•ฉ์ด๋ผ๋Š” ์ธก๋ฉด์—์„œ ์ค‘์š”ํ•œ ์ง„์ „์„ ์ด๋ค˜๋‹ค. ์—ฐ์†์ ์ธ ์ด‰๊ฐ ํ”ผ์ฒ˜ ํ‘œํ˜„๊ณผ ๊ด€์ฐฐ ๋ชจ๋ธ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ œ๋กœ์ƒท ์ด์ „์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ–ˆ๋‹ค๋Š” ์ ์€ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ์กฐ์ž‘ ์—ฐ๊ตฌ์˜ ์ƒˆ๋กœ์šด ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•œ๋‹ค. ๋™์‹œ์—, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ์˜ ์„ผ์„œ ๊ทผ์‚ฌํ™” ๋ฐ ์‹œ๋ฎฌ-์‹ค์ œ ์ฐจ์ด ๊ทน๋ณต์ด๋ผ๋Š” ์–ด๋ ค์šด ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์—ˆ์œผ๋ฉฐ, ๋‹ค๊ฐ€์˜ค๋Š” ์—ฐ๊ตฌ์—์„œ๋Š” ๋”์šฑ ์ •๊ตํ•œ ๋ฌผ๋ฆฌ ๋ชจ๋ธ๋ง๊ณผ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๋ฐฉ๋ฒ•์ด ์š”๊ตฌ๋  ๊ฒƒ์œผ๋กœ ๋ณด์ธ๋‹ค.

Copyright 2024, Jung Yeon Lee