Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • Brief Review
  • Detail Review
    • ๊ธฐ์ˆ ์  ๊ธฐ์—ฌ
    • ๋ฐฉ๋ฒ•๋ก ์˜ ์ฐธ์‹ ์„ฑ
    • ์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ๊ฒฐ๊ณผ ๋ถ„์„
    • ๊ฒฐ๋ก 

๐Ÿ“ƒVT-Refine ๋ฆฌ๋ทฐ

visuo-tactile
bimanual
Learning Bimanual Assembly with Visuo-Tactile Feedback via Simulation Fine-Tuning
Published

October 21, 2025

  • Paper Link
  • Homepage
  • Code Link
  1. ๐Ÿค– VT-Refine์€ ์‹ค์ œ ์‹œ์—ฐ, ๊ณ ์ถฉ์‹ค๋„ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ๊ฐ•ํ™” ํ•™์Šต์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ •๋ฐ€ํ•˜๊ณ  ์ ‘์ด‰์ด ๋งŽ์€ ์–‘์† ์กฐ๋ฆฝ ์ž‘์—…์„ ์œ„ํ•œ ์‹œ๊ฐ-์ด‰๊ฐ ์ •์ฑ… ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
  2. ํ›ˆ๋ จ์€ ์†Œ๋Ÿ‰์˜ ์‹ค์ œ ์‹œ๊ฐ-์ด‰๊ฐ ์‹œ์—ฐ์œผ๋กœ ํ™•์‚ฐ ์ •์ฑ…์„ ์‚ฌ์ „ ํ•™์Šตํ•œ ํ›„, GPU ๊ฐ€์† ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๋Œ€๊ทœ๋ชจ ๊ฐ•ํ™” ํ•™์Šต์„ ํ†ตํ•ด ์ •์ฑ…์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜์—ฌ sim-to-real ์ „์ด๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
  3. ๐Ÿ“ˆ ์‹คํ—˜ ๊ฒฐ๊ณผ, VT-Refine์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ํ™˜๊ฒฝ ๋ชจ๋‘์—์„œ ์กฐ๋ฆฝ ์„ฑ๋Šฅ๊ณผ ๊ฐ•๊ฑด์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์œผ๋ฉฐ, ํŠนํžˆ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์ด ์ •๋ฐ€๋„์™€ ํƒ์ƒ‰ ๋Šฅ๋ ฅ ๊ฐ•ํ™”์— ๊ฒฐ์ •์ ์ธ ์—ญํ• ์„ ํ•จ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

VT-Refine ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ์š”: VT-Refine๋Š” ์‹ค์ œ ์‚ฌ๋žŒ ์‹œ์—ฐ์œผ๋กœ ํ•™์Šตํ•œ ์‹œ๊ฐ-์ด‰๊ฐ ๊ธฐ๋ฐ˜ ํ™•์‚ฐ ์ •์ฑ…์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ์ด์ „ํ•˜์—ฌ ๋Œ€๊ทœ๋ชจ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ์„ธ๋ฐ€ํ•˜๊ฒŒ ๊ฐœ์„ ํ•œ ํ›„ ๋‹ค์‹œ ํ˜„์‹ค์— ์ ์šฉํ•˜๋Š” ์‹ค์„ธ๊ณ„-์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์„ธ๊ณ„(real-to-sim-toreal) ์–‘ํŒ” ์กฐ๋ฆฝ ํ•™์Šต ๊ธฐ๋ฒ•์ด๋‹ค. ์œ„ ๊ทธ๋ฆผ์—์„œ ๋ณด์ด๋“ฏ, Stage 1์—์„œ๋Š” ์‚ฌ๋žŒ ์›๊ฒฉ์กฐ์ž‘์œผ๋กœ ์ˆ˜์ง‘ํ•œ ์•ฝ 30๊ฐœ์˜ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ์‹œ๊ฐ ๋ฐ ์ด‰๊ฐ ์ž…๋ ฅ์ด ํฌํ•จ๋œ ํ™•์‚ฐ ์ •์ฑ…(diffusion policy)์„ ์‚ฌ์ „ ํ•™์Šตํ•˜๊ณ , Stage 2์—์„œ๋Š” ํ•ด๋‹น ์ •์ฑ…์„ ๊ฐ€์ƒ ํ™˜๊ฒฝ์˜ ๋””์ง€ํ„ธ ํŠธ์œˆ์œผ๋กœ ์˜ฎ๊ฒจ ๋™๋“ฑํ•œ ์‹œ๊ฐ/์ด‰๊ฐ ์„ผ์„œ ์ž…๋ ฅ์„ ๋ชจ์‚ฌํ•˜๋ฉด์„œ ๋ณ‘๋ ฌ ๊ฐ•ํ™”ํ•™์Šต(RL)์œผ๋กœ ์ •์ฑ…์„ ํŒŒ์ธํŠœ๋‹ํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ์„ฑ๋Šฅ์„ ๋Œ์–ด์˜ฌ๋ฆฐ ์ •์ฑ…์€ ๋‹ค์‹œ ์‹ค์ œ ๋กœ๋ด‡์œผ๋กœ ์˜ฎ๊ฒจ์ ธ ์ •๊ตํ•œ ์–‘ํŒ” ์กฐ๋ฆฝ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ๋œ๋‹ค.


Brief Review

VT-Refine๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฏธ์„ธ ์กฐ์ •(Simulation Fine-Tuning)์„ ํ†ตํ•ด Visuo-Tactile(์‹œ๊ฐ-์ด‰๊ฐ) ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜์˜ ์–‘์† ์กฐ๋ฆฝ ์ž‘์—…์„ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ์‚ฌ๋žŒ์ด ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์— ์ ์‘ํ•˜๋ฉฐ ์–‘์† ์กฐ๋ฆฝ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋Šฅ๋ ฅ์€ ๋›ฐ์–ด๋‚˜์ง€๋งŒ, ๋กœ๋ด‡์—๊ฒŒ ํ–‰๋™ ๋ณต์ œ(Behavioral Cloning)๋งŒ์œผ๋กœ๋Š” ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ๋ฌธ์ œ์— ์ฃผ๋ชฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์‚ฌ๋žŒ ์‹œ์—ฐ์˜ ๋น„์ตœ์ ์„ฑ(suboptimality)๊ณผ ์ œํ•œ๋œ ๋‹ค์–‘์„ฑ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

VT-Refine์€ ์ •๋ฐ€ํ•˜๊ณ  ์ ‘์ด‰์ด ๋งŽ์€ ์–‘์† ์กฐ๋ฆฝ ์ž‘์—…์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์‹ค์ œ ์‹œ์—ฐ, ๊ณ ์ถฉ์‹ค๋„ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜, ๊ทธ๋ฆฌ๊ณ  ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning, RL)์„ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก ์€ ๋‘ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค:

  1. ์‹ค์ œ ์„ธ๊ณ„ ์‚ฌ์ „ ํ•™์Šต(Real-World Pre-Training):
    • ์†Œ๋Ÿ‰์˜ ์‹ค์ œ ์„ธ๊ณ„ ์‹œ์—ฐ(์˜ˆ: 30 ์—ํ”ผ์†Œ๋“œ)์„ ์‚ฌ์šฉํ•˜์—ฌ Visuo-Tactile Diffusion Policy๋ฅผ ์‚ฌ์ „ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
    • ์ด ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋Š” ๋™๊ธฐํ™”๋œ ์‹œ๊ฐ ๋ฐ ์ด‰๊ฐ ์ž…๋ ฅ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์‹œ๊ฐ ์ž…๋ ฅ์€ ๋กœ๋ด‡์˜ Ego-centric ์นด๋ฉ”๋ผ์—์„œ ์–ป์€ ์ปฌ๋Ÿฌ ์—†๋Š” ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ P_{\text{visual},t} \in \mathbb{R}^{N_{\text{vis}} \times 4}์ด๋ฉฐ, ์ด‰๊ฐ ์ž…๋ ฅ์€ ์„ผ์„œ ์œ ๋‹›์˜ 3D ์œ„์น˜์™€ ์—ฐ์†์ ์ธ ์„ผ์„œ ๊ฐ’์„ ๋‚˜ํƒ€๋‚ด๋Š” ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ P_{\text{tactile},t} \in \mathbb{R}^{N_{\text{tac}} \times 4}์ž…๋‹ˆ๋‹ค.
    • N_{\text{tac}} = 384 \times N_{\text{finger}}๋กœ ์„ค์ •๋˜๋Š”๋ฐ, ์ด๋Š” ๊ฐ ์„ผ์„œ ํŒจ๋“œ๊ฐ€ 12 \times 32 = 384๊ฐœ์˜ ์ด‰๊ฐ ํฌ์ธํŠธ๋ฅผ ๊ฐ€์ง€๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.
    • ๋กœ๋ด‡ ๊ณ ์œ  ์ˆ˜์šฉ ๊ฐ๊ฐ(Proprioception) ์ •๋ณด(๋‘ ํŒ”๊ณผ ๋‘ ๊ทธ๋ฆฌํผ์˜ ์กฐ์ธํŠธ ์œ„์น˜)๋„ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
    • ์‹œ๊ฐ ๋ฐ ์ด‰๊ฐ ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ๋Š” PointNet ์ธ์ฝ”๋”(\text{PointNetEncoderXYZTactile})์— ์˜ํ•ด ์ฒ˜๋ฆฌ๋˜๋ฉฐ, ๊ทธ ์ถœ๋ ฅ์€ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก (MLP)์œผ๋กœ ์ธ์ฝ”๋”ฉ๋œ ๊ณ ์œ  ์ˆ˜์šฉ ๊ฐ๊ฐ ํŠน์ง•๊ณผ ์—ฐ๊ฒฐ๋˜์–ด ๋…ธ์ด์ฆˆ ์ œ๊ฑฐ ํ™•์‚ฐ ๋„คํŠธ์›Œํฌ(denoising diffusion network)์˜ ์ปจ๋””์…”๋‹ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
    • ์‚ฌ์ „ ํ•™์Šต๋œ ๋ชจ๋ธ์€ Diffusion Policy [1]์˜ ํ–‰๋™ ์ฒญํฌ ์˜ˆ์ธก ๋ฐฉ์‹(action chunk prediction)์„ ๋”ฐ๋ฅด๋ฉฐ, ์ œํ•œ๋œ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋กœ ์ธํ•ด ์ž‘์—… ์„ฑ๊ณต๋ฅ ์ด ๋†’์ง€ ์•Š์„ ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ฏธ์„ธ ์กฐ์ • ๋‹จ๊ณ„์—์„œ RL์„ ์œ„ํ•œ ๊ฐ•๋ ฅํ•œ ์‚ฌ์ „ ์ง€์‹(prior)์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  2. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฏธ์„ธ ์กฐ์ •(Simulation Fine-Tuning):
    • ์‚ฌ์ „ ํ•™์Šต๋œ Diffusion Policy๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์˜ ๋””์ง€ํ„ธ ํŠธ์œˆ์œผ๋กœ ์ „์ด๋ฉ๋‹ˆ๋‹ค.
    • ์—ฌ๊ธฐ์„œ ๊ฐ•ํ™” ํ•™์Šต์„ ํ†ตํ•ด ์ •์ฑ…์„ ์ถ”๊ฐ€๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•˜์—ฌ ๊ฐ•๊ฑด์„ฑ(robustness)๊ณผ ์ผ๋ฐ˜ํ™”(generalization) ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.
    • ๋ฏธ์„ธ ์กฐ์ •์€ Diffusion Policy Policy Optimization (DPPO) [6] ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋ฉฐ, ๋…ธ์ด์ฆˆ ์ œ๊ฑฐ ๊ณผ์ •์„ ๋งˆ๋ฅด์ฝ”ํ”„ ๊ฒฐ์ • ๊ณผ์ •(MDP)์œผ๋กœ ํ˜•์‹ํ™”ํ•˜์—ฌ ๋ณด์ƒ ์‹ ํ˜ธ๊ฐ€ ๋…ธ์ด์ฆˆ ์ œ๊ฑฐ ์ฒด์ธ์„ ํ†ตํ•ด ํšจ๊ณผ์ ์œผ๋กœ ์ „ํŒŒ๋˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.
    • ์•กํ„ฐ(Actor) ๋„คํŠธ์›Œํฌ๋Š” ์‚ฌ์ „ ํ•™์Šต๋œ ๊ฐ€์ค‘์น˜๋กœ ์ดˆ๊ธฐํ™”๋˜๊ณ , ํฌ๋ฆฌํ‹ฑ(Critic) ๋„คํŠธ์›Œํฌ๋Š” ๋ฌด์ž‘์œ„๋กœ ์ดˆ๊ธฐํ™”๋ฉ๋‹ˆ๋‹ค. ํฌ๋ฆฌํ‹ฑ์€ ๋กœ๋ด‡ ๋ฐ ๊ฐ์ฒด ์ƒํƒœ์˜ ์ €์ฐจ์› ํ‘œํ˜„์„ ๋ฐ›๋Š” ๋น„๋Œ€์นญ ์•กํ„ฐ-ํฌ๋ฆฌํ‹ฑ ์ „๋žต(Asymmetric Actor-Critic strategy) [53]์„ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค.
    • ๋ณด์ƒ ํ•จ์ˆ˜๋Š” ํฌ์†Œ ๋ณด์ƒ(Sparse Reward)์œผ๋กœ ์„ค์ •๋ฉ๋‹ˆ๋‹ค. ๋ถ€ํ’ˆ์ด ์„ฑ๊ณต์ ์œผ๋กœ ์กฐ๋ฆฝ๋˜๋ฉด 1์˜ ๋ณด์ƒ์„ ๋ฐ›๊ณ , ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด 0์˜ ๋ณด์ƒ์„ ๋ฐ›์Šต๋‹ˆ๋‹ค. ์‚ฌ์ „ ํ•™์Šต์ด RL ํƒ์ƒ‰์„ ์•ˆ๋‚ดํ•˜๋Š” ๊ฐ•๋ ฅํ•œ ์‚ฌ์ „ ์ง€์‹์„ ์ œ๊ณตํ•˜๋ฏ€๋กœ ๋ณต์žกํ•œ ๋ณด์ƒ ์„ค๊ณ„๋Š” ํ”ผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

VT-Refine์€ ์ •ํ™•ํ•œ Sim-to-Real ์ „์ด๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด GPU ๊ฐ€์† ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์‚ฌ์šฉํ•˜์—ฌ ์••์ €ํ•ญ์‹(piezoresistive) ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ์‚ฌ์‹ค์ ์œผ๋กœ ๋ชจ๋ธ๋งํ•ฉ๋‹ˆ๋‹ค. ์ด ์„ผ์„œ(โ€œFlexiTacโ€)๋Š” 12x32 ์„ผ์„œ ์œ ๋‹› ๋งคํŠธ๋ฆญ์Šค๋กœ ๊ตฌ์„ฑ๋˜์–ด 2mm ๊ณต๊ฐ„ ํ•ด์ƒ๋„๋กœ ๋ฒ•์„  ๋ฐฉํ–ฅ ํž˜(normal force) ์‹ ํ˜ธ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์€ TacSL [12] ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ๊ฐ ์ด‰๊ฐ ํฌ์ธํŠธ์™€ ๊ฐ•์ฒด ๊ฐ์ฒด ๊ฐ„์˜ ์ ‘์ด‰์„ Kelvin-Voigt ๋ชจ๋ธ๋กœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์„ ํ˜• ์Šคํ”„๋ง๊ณผ ์ ์„ฑ ๋Œํผ๊ฐ€ ๋ณ‘๋ ฌ๋กœ ์—ฐ๊ฒฐ๋œ ํ˜•ํƒœ๋กœ, ์ ‘์ด‰ ๋ฒ•์„  ํž˜ f_n = -(k_n d + k_d \dot{d})n๋ฅผ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ d๋Š” ์นจํˆฌ ๊นŠ์ด(interpenetration depth), \dot{d}๋Š” ์ ‘์ด‰ ๋ฒ•์„ ์„ ๋”ฐ๋ฅธ ์ƒ๋Œ€ ์†๋„, n์€ ์™ธํ–ฅ ์ ‘์ด‰ ๋ฒ•์„  ๋ฒกํ„ฐ์ด๋ฉฐ, k_n๊ณผ k_d๋Š” ๊ฐ๊ฐ ํƒ„์„ฑ๋ฅ (compliance stiffness)๊ณผ ์ ์„ฑ ๊ณ„์ˆ˜(damping coefficient)์ž…๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ผ์„œ ๊ฐ„์˜ ์‘๋‹ต์„ ์ผ์น˜์‹œํ‚ค๊ธฐ ์œ„ํ•ด ์„ผ์„œ ์บ˜๋ฆฌ๋ธŒ๋ ˆ์ด์…˜ ์ ˆ์ฐจ๋ฅผ ๊ฑฐ์น˜๋ฉฐ, ์ด๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ํžˆ์Šคํ† ๊ทธ๋žจ ๋ถ„ํฌ๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ฒ€์ฆ๋ฉ๋‹ˆ๋‹ค.

์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜ ํ‘œํ˜„์„ ์‚ฌ์šฉํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ํ™˜๊ฒฝ ๊ฐ„์˜ ๊ฒฌ๊ณ ํ•œ ์ „์ด๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋ฉฐ, ์ด๋Š” ์‹œ๊ฐ ๋ฐ ์ด‰๊ฐ ์–‘์‹์˜ ๊ณต๊ฐ„ ๊ด€๊ณ„๋ฅผ ๋ณด์กดํ•˜์—ฌ ์ •์ฑ… ํšจ๊ณผ๋ฅผ ๋†’์ž…๋‹ˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ์— ๋”ฐ๋ฅด๋ฉด, VT-Refine์€ ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ์„ ๋†’์ด๊ณ  ๋ณด๋‹ค ํšจ๊ณผ์ ์ธ ์ •์ฑ… ๋ฏธ์„ธ ์กฐ์ •์„ ํ†ตํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ํ™˜๊ฒฝ ๋ชจ๋‘์—์„œ ์กฐ๋ฆฝ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์‚ฌ์ „ ํ•™์Šต๋งŒ์œผ๋กœ๋Š” ๋‹ฌ์„ฑํ•˜๊ธฐ ์–ด๋ ค์› ๋˜ ๋ฏธ์„ธํ•œ ์กฐ์ • ๋™์ž‘(์˜ˆ: โ€œwiggle-and-dockโ€ maneuvers)์ด RL ๋ฏธ์„ธ ์กฐ์ •์„ ํ†ตํ•ด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋‚˜ํƒ€๋‚˜ ์ •์ฑ…์˜ ์„ฑ๊ณต๋ฅ ์„ ํฌ๊ฒŒ ๋†’์˜€์Šต๋‹ˆ๋‹ค.

Detail Review

๊ธฐ์ˆ ์  ๊ธฐ์—ฌ

VT-Refine ์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ๋Š” ์ •๋ฐ€ํ•œ ์–‘ํŒ” ์กฐ๋ฆฝ ์ž‘์—…์„ ์œ„ํ•œ ์‹œ๊ฐ-์ด‰๊ฐ ํ†ตํ•ฉ ์ •์ฑ… ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ ๊ฒƒ์ด๋‹ค. ์ €์ž๋“ค์€ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๊ธฐ์ˆ ์  ํ˜์‹ ์„ ๊ฐ•์กฐํ•œ๋‹ค:

  1. ์‹œ์—ฐ ๊ธฐ๋ฐ˜ ํ™•์‚ฐ ์ •์ฑ… + ๊ฐ•ํ™”ํ•™์Šต ํŒŒ์ธํŠœ๋‹: ์†Œ๋Ÿ‰์˜ ์‚ฌ๋žŒ ์‹œ์—ฐ์œผ๋กœ ํ•™์Šต๋œ ์‹œ๊ฐ-์ด‰๊ฐ ํ™•์‚ฐ ์ •์ฑ…์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ์˜ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ฏธ์„ธ์กฐ์ •์œผ๋กœ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ์ด๋Š” ๊ธฐ์กด ํ–‰๋™๋ชจ๋ฐฉ๋งŒ์œผ๋กœ๋Š” ๋ถ€์กฑํ–ˆ๋˜ ์ •์ฑ…์˜ ํƒ์ƒ‰ ๋Šฅ๋ ฅ์„ ๋†’์—ฌ, ์‹œ์—ฐ ๋ฐ์ดํ„ฐ ์ฃผ๋ณ€์˜ ์ƒํƒœ-ํ–‰๋™ ๊ณต๊ฐ„์„ ์ ๊ทน ํƒํ—˜ํ•˜๊ณ  ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค. ๋‹ค์‹œ ๋งํ•ด, ํ–‰๋™๋ชจ๋ฐฉ(BC) ๋‹จ๊ณ„์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์ด ๊ธฐ๋ณธ๊ธฐ๋ฅผ ์ œ๊ณตํ•˜๋ฉด, ์ดํ›„ RL ๋‹จ๊ณ„์—์„œ ๊ทธ ์ฃผ๋ณ€ ์˜์—ญ์„ ํƒ์ƒ‰ ๋ฐ ์ตœ์ ํ™”ํ•˜์—ฌ ์‚ฌ๋žŒ ๋ฐ๋ชจ์— ์—†๋˜ ๋ฏธ์„ธ ๋™์ž‘๊นŒ์ง€ ์Šต๋“ํ•˜๋„๋ก ๋งŒ๋“  ๊ฒƒ์ด๋‹ค.
  2. ๊ณ ์ถฉ์‹ค๋„ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ชจ๋“ˆ: GPU ๊ฐ€์† ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋‚ด์— ์‹ค์ œ ์ด‰๊ฐ์„ผ์„œ๋ฅผ ์ถฉ์‹คํžˆ ๋ชจ์‚ฌํ•˜๋Š” ๋ณ‘๋ ฌ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ชจ๋“ˆ์„ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ํŠนํžˆ ํ”ผ์—์กฐ์ €ํ•ญ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ์˜ ์ •๊ทœ๋ ฅ(normal force) ์‹ ํ˜ธ๋ฅผ ์ •ํ™•ํžˆ ์žฌํ˜„ํ•˜๋„๋ก ํ•จ์œผ๋กœ์จ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค ๊ฐ„ ์ด‰๊ฐ ์ •๋ณด์˜ ์ฐจ์ด๋ฅผ ํฌ๊ฒŒ ์ค„์˜€๋‹ค. ๊ธฐ์กด์˜ ๊ด‘ํ•™์‹ ์ด‰๊ฐ์„ผ์„œ๊ฐ€ ์กฐ๋ช… ์กฐ๊ฑด๊ณผ ๋ณต์žกํ•œ ์งˆ๊ฐ ์žฌํ˜„ ๋ฌธ์ œ๋กœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ๊นŒ๋‹ค๋กœ์šด ๋ฐ˜๋ฉด, VT-Refine๋Š” ๊ตฌ์กฐ์  ์ ‘์ด‰ ํŒจํ„ด๊ณผ ์ •๊ทœ๋ ฅ ๋ถ„ํฌ์— ์ดˆ์ ์„ ๋งž์ถ˜ ์ด‰๊ฐ์„ผ์„œ๋ฅผ ์„ ํƒํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์šฉ์ด์„ฑ๊ณผ ์ด์‹์„ฑ์„ ๋†’์˜€๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ์ด‰๊ฐ ์ •๋ณด์˜ ์‹ค-๊ฐ€์ƒ ์ „ํ™˜ ๊ฐ„ ๊ฒฉ์ฐจ(sim-to-real gap)๋ฅผ ํฌ๊ฒŒ ์ขํ˜€, ๋Œ€๊ทœ๋ชจ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ •์ฑ… ํ•™์Šต์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.
  3. ์‹œ๊ฐ-์ด‰๊ฐ ํฌ์ธํŠธ ๊ธฐ๋ฐ˜ ํ‘œํ˜„ ๋ฐ ํ†ตํ•ฉ: ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค์„ ์ž์œ ๋กญ๊ฒŒ ์˜ค๊ฐˆ ์ˆ˜ ์žˆ๋Š” ํ†ตํ•ฉ ์ƒํƒœ ํ‘œํ˜„์œผ๋กœ ํฌ์ธํŠธํด๋ผ์šฐ๋“œ(point cloud) ๊ธฐ๋ฐ˜ ํ‘œํ˜„์„ ๋„์ž…ํ–ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์นด๋ฉ”๋ผ๋กœ ์–ป์€ ์‹œ๊ฐ ์ •๋ณด๋ฅผ 3์ฐจ์› ์ ๋“ค๋กœ ํ‘œํ˜„ํ•˜๊ณ , ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์— ๋ถ„ํฌ๋œ ์ด‰๊ฐ ๊ฐ’๋“ค๋„ ํ•ด๋‹น ์œ„์น˜์˜ ์ ๋“ค๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ, ๋‘ ์ •๋ณด๋ฅผ ํ•˜๋‚˜์˜ ์  ๊ตฌ๋ฆ„์œผ๋กœ ๊ฒฐํ•ฉํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์‹œ๊ฐ๊ณผ ์ด‰๊ฐ์˜ ๊ณต๊ฐ„์  ๊ด€๊ณ„๊ฐ€ ๋ณด์กด๋˜์–ด, ๋™์ผํ•œ ์ธ์ฝ”๋”(์˜ˆ: PointNet)๋ฅผ ํ†ตํ•ด ์ผ๊ด€๋˜๊ฒŒ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๊ณ , ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค ๋กœ๋ด‡ ๊ฐ„์— ๋™์ผํ•œ ํ˜•ํƒœ์˜ ์ž…๋ ฅ์œผ๋กœ ์ •์ฑ…์„ ์ „์ดํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ†ตํ•ฉ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ‘œํ˜„์€ ์–‘์† ์กฐ์ž‘ ์ •์ฑ…์˜ ์–‘๋ฐฉํ–ฅ ์ด์‹์„ฑ์„ ๋†’์—ฌ, ํ˜„์‹คโ†’์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์‚ฌ์ „ํ•™์Šต ๋ฐ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐโ†’ํ˜„์‹ค ํŒŒ์ธํŠœ๋‹ ๊ฒฐ๊ณผ์˜ ์†์‹ค์„ ์ตœ์†Œํ™”ํ•˜๋Š” ๋ฐ ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์„ ํ–ˆ๋‹ค. ์ด์ƒ์˜ ๊ธฐ์ˆ ์  ๊ธฐ์—ฌ๋ฅผ ํ†ตํ•ด VT-Refine๋Š” ๋†’์€ ์ •๋ฐ€๋„์™€ ์ ‘์ด‰์ด ํ’๋ถ€ํ•œ ์–‘ํŒ” ์กฐ๋ฆฝ ๋ฌธ์ œ์—์„œ ๊ธฐ์กด ๋ฐฉ์‹๋“ค์ด ๊ฐ–๊ณ  ์žˆ๋˜ ํ•œ๊ณ„๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ๋ŒํŒŒํ•˜์˜€๋‹ค. ํŠนํžˆ ์‚ฌ๋žŒ์˜ ์ด‰๊ฐ ํ™œ์šฉ ๋Šฅ๋ ฅ์„ ๋กœ๋ด‡์— ์ด์‹ํ•˜๊ธฐ ์œ„ํ•ด ์‹ค์ œ ๋ฐ์ดํ„ฐ์˜ ํ•œ๊ณ„๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ๋กœ ๋ณด์™„ํ•˜๋Š” ์ „๋žต๊ณผ, ํ•™์Šต ํ‘œํ˜„ ๋ฐ ์„ผ์„œ ๋””์ž์ธ๊นŒ์ง€ ์•„์šฐ๋ฅด๋Š” ์ด์ฒด์  ์ ‘๊ทผ์„ ์„ ๋ณด์ธ ์ ์ด ๋‹๋ณด์ธ๋‹ค.

๋ฐฉ๋ฒ•๋ก ์˜ ์ฐธ์‹ ์„ฑ

VT-Refine์˜ ๋ฐฉ๋ฒ•๋ก ์€ ์‹œ๊ฐ-์ด‰๊ฐ ํ†ตํ•ฉ ์ •์ฑ…์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ํ•™์Šต ๋ฐ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ์„ ์ œ์‹œํ•œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์ด ๋ฐฉ๋ฒ•๋ก ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ฐธ์‹ ํ•œ ๊ตฌ์„ฑ ์š”์†Œ๋“ค๋กœ ์ด๋ฃจ์–ด์ง„๋‹ค.

  • ํ™•์‚ฐ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ •์ฑ… ํ•™์Šต: ์ดˆ๊ธฐ ์ •์ฑ…์€ ์ธ๊ณต์ง€๋Šฅ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ์ผ์ข…์ธ DDPM(Denoising Diffusion Probabilistic Model)์„ ์ด์šฉํ•ด ํ•™์Šต๋œ๋‹ค. ์—ฐ๊ตฌ์ง„์€ 30ํšŒ ์ •๋„์˜ ์‚ฌ๋žŒ ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜ ์‹œ์—ฐ์„ ๋ชจ์•„ ๋กœ๋ด‡์˜ ์‹œ๊ฐ(์นด๋ฉ”๋ผ point cloud)๊ณผ ์ด‰๊ฐ(์„ผ์„œ point cloud) ๋ฐ ๊ด€์ ˆ ์ƒํƒœ(proprioception)๋ฅผ ์ž…๋ ฅ์œผ๋กœ, ๋‹ค ๋‹จ๊ณ„ ๋””ํ“จ์ „ ๊ณผ์ •์„ ํ†ตํ•ด ๋ฏธ๋ž˜ H=16 ์Šคํ…์˜ ํ–‰๋™ ์‹œํ€€์Šค๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์ •์ฑ… \pi: O \rightarrow A๋ฅผ ํ›ˆ๋ จ์‹œ์ผฐ๋‹ค. ํ™•์‚ฐ ๋ชจ๋ธ์€ ์ฃผ์–ด์ง„ ๊ด€์ธก์—์„œ ๋…ธ์ด์ฆˆ๋ฅผ ์ ์ฐจ ์ œ๊ฑฐํ•˜๋ฉฐ ์ตœ์  ํ–‰๋™์„ ์ถœ๋ ฅํ•˜๋„๋ก ํ•™์Šต๋˜๋Š”๋ฐ, ์ด๋Š” ์ œํ•œ๋œ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋กœ๋„ ๋‹ค์–‘ํ•œ ํ–‰๋™ ๋ถ„ํฌ๋ฅผ ์ผ๋ฐ˜ํ™”ํ•˜๋Š” ๋Šฅ๋ ฅ์ด ์žˆ์–ด ์ตœ๊ทผ ๋กœ๋ด‡ ์ œ์–ด์— ๋„์ž…๋˜๊ณ  ์žˆ๋‹ค. VTRefine๋Š” ์ด๋Ÿฌํ•œ ํ™•์‚ฐ ์ •์ฑ…์„ ์–‘ํŒ” ์กฐ์ž‘์— ์ ์šฉํ•˜์—ฌ, ์‚ฌ๋žŒ ์‹œ์—ฐ์˜ ๋ถ„ํฌ๋ฅผ ํ•™็ฟ’ํ•˜๋ฉด์„œ๋„ ์ผ์ • ์ˆ˜์ค€์˜ ํƒ์ƒ‰์  ํ–‰๋™์„ ๋‚ด์žฌํ•œ ์ดˆ๊ธฐ ์ •์ฑ…์„ ์–ป๋Š”๋‹ค.
  • ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์„ผ์„œ ์„ค๊ณ„ ๋ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜: VT-Refine์˜ ๋˜ ๋‹ค๋ฅธ ํ˜์‹ ์€ ํ˜„์‹ค๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ชจ๋‘์—์„œ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ๋งž์ถคํ˜• ์ด‰๊ฐ ์„ผ์„œ(FlexiTac)๋ฅผ ์„ค๊ณ„ํ•œ ๊ฒƒ์ด๋‹ค. ๊ฐ ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์—๋Š” 12\times32 ๋ฐฐ์—ด์˜ ์ด‰๊ฐ ์„ผ์„œ ํŒจ๋“œ๊ฐ€ ๋ถ€์ฐฉ๋˜๋Š”๋ฐ, ์ธ์ ‘ ์„ผ์„œ ๊ฐ„ ๊ฐ„๊ฒฉ์ด 2mm์ธ ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ๋งคํŠธ๋ฆญ์Šค์ด๋‹ค. ์ด ํŒจ๋“œ๋Š” ์œ ์—ฐํ•œ ์ธ์‡„ํšŒ๋กœ ๊ธฐํŒ (FPC) ๋‘ ์žฅ ์‚ฌ์ด์— ์••๋ ฅ ๊ฐ์‘ ํ•„๋ฆ„(ํ”ผ์—์กฐ ์ €ํ•ญ์ธต)์„ ๋ผ์šด 3์ค‘ ๋ ˆ์ด์–ด ๊ตฌ์กฐ๋กœ ์ œ์ž‘๋˜์–ด, ํž˜์„ ๊ฐ€ํ•˜๋ฉด ํ•ด๋‹น ์ง€์ ์˜ ์ €ํ•ญ์ด ๋ณ€ํ•ด ์ •๊ทœ๋ ฅ ๋ถ„ํฌ๋ฅผ ์ฝ์–ด๋‚ผ ์ˆ˜ ์žˆ๋‹ค ใ€30โ€ ใ€‘. ์ด๋Ÿฌํ•œ ์„ค๊ณ„๋Š” ์–‡๊ณ  ์œ ์—ฐํ•˜์—ฌ ๋กœ๋ด‡ ๊ทธ๋ฆฌํผ์˜ ๊ณก๋ฉด์—๋„ ๋ถ€์ฐฉ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋ฌด์—‡๋ณด๋‹ค ๊ด‘ํ•™์‹ ์ด‰๊ฐ์„ผ์„œ ๋Œ€๋น„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ์šฉ์ดํ•˜๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค. ๊ด‘ํ•™ ์„ผ์„œ๋Š” ๋ฏธ์„ธํ•œ ์งˆ๊ฐ๊ณผ ์ „๋‹จ๋ ฅ๊นŒ์ง€ ๊ฐ์ง€ํ•˜์ง€๋งŒ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ์ด๋ฅผ ์ •ํ™•ํžˆ ์žฌํ˜„ํ•˜๊ธฐ ์–ด๋ ต๋‹ค. ๋ฐ˜๋ฉด FlexiTac ์„ผ์„œ๋Š” ํ‘œ๋ฉด ์ ‘์ด‰ ํŒจํ„ด์„ ์ •๊ทœ๋ ฅ ๊ฐ’๋“ค์˜ ํ–‰๋ ฌ๋กœ ์ œ๊ณตํ•˜๋ฏ€๋กœ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ ๋ฌผ์ฒด์™€ ์„ผ์„œ ๊ฒฉ์ž ๊ฐ„ ์ถฉ๋Œ ๊นŠ์ด๋ฅผ ๊ณ„์‚ฐํ•ด ๋Œ€์‘ํ•˜๋Š” ํž˜ ์‹ ํ˜ธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋น„๊ต์  ์ •ํ™•ํžˆ ๋ชจ์‚ฌํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” Nvidia Isaac Gym ๊ธฐ๋ฐ˜์˜ TacSL ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์ด์šฉํ•ด ์ด๋Ÿฌํ•œ ํƒ„์„ฑ ์ ‘์ด‰ ๋ชจ๋ธ์„ ๋ณ‘๋ ฌ GPU ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ๊ตฌํ˜„ํ•˜์˜€๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ํ˜„์‹ค์—์„œ์˜ ์ด‰๊ฐ ๋ถ„ํฌ์™€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒ์„ฑ ์ด‰๊ฐ ๋ถ„ํฌ๊ฐ€ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์‚ฌํ•˜๊ฒŒ ์ผ์น˜ํ•จ์„ ํ™•์ธํ•˜์˜€๊ณ , ์ด๋ฅผ ํ†ตํ•ด ๋Œ€๊ทœ๋ชจ ๊ฐ€์ƒ ์ด‰๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์•ˆ์‹ฌํ•˜๊ณ  ์ƒ์„ฑํ•˜์—ฌ ์ •์ฑ… ๊ฐ•ํ™”ํ•™์Šต์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

FlexiTac ์ด‰๊ฐ ์„ผ์„œ ์„ค๊ณ„: VT-Refine์—์„œ ์‚ฌ์šฉํ•œ ์œ ์—ฐํ•œ ์ด‰๊ฐ์„ผ์„œ(FlexiTac)์˜ ๊ตฌ์กฐ๋ฅผ ๋‚˜ํƒ€๋‚ธ ๊ทธ๋ฆผ์ด๋‹ค. ์–‡์€ ์ƒ/ํ•˜๋ถ€ FPC์ธต(0.2mm) ์‚ฌ์ด์— ์••๋ ฅ ๊ฐ์‘ ํ•„๋ฆ„(0.1mm)์ด ๋†“์—ฌ ์žˆ์œผ๋ฉฐ, ์„ผ์„œ ํŒจ๋“œ ์ „์ฒด ํฌ๊ธฐ๋Š” ์•ฝ ๊ฐ€๋กœ 6.4cm, ์„ธ๋กœ 2.5cm์ด๋‹ค. ์ด๋Ÿฌํ•œ ์„ผ์„œ 4๊ฐœ๊ฐ€ ๋กœ๋ด‡ ์–‘ํŒ” ๊ทธ๋ฆฌํผ์˜ ์†๊ฐ€๋ฝ๋“ค์— ๋ถ€์ฐฉ๋˜์–ด, ์ ‘์ด‰ ์‹œ ๊ฐ ์ง€์ ์˜ ์ •๊ทœ๋ ฅ ๋ณ€ํ™”๋ฅผ 384๊ฐœ ์ฑ„๋„์˜ ์‹ค์‹œ๊ฐ„ ์‹ ํ˜ธ๋กœ ํš๋“ํ•œ๋‹ค. ํ•ด๋‹น ์‹ ํ˜ธ๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋„ ๋™์ผํ•œ ๋ถ„ํ•ด๋Šฅ์œผ๋กœ ์ƒ์„ฑ๋˜๋ฉฐ, ํ›„์ฒ˜๋ฆฌ๋ฅผ ํ†ตํ•ด ์ด‰๊ฐ pointcloud ํ˜•ํƒœ๋กœ ๋ณ€ํ™˜๋˜์–ด ์‹œ๊ฐ ์ •๋ณด์™€ ๊ฒฐํ•ฉ๋œ๋‹ค.

  • ๊ฐ•ํ™”ํ•™์Šต์„ ํ†ตํ•œ ์ •์ฑ… ํŒŒ์ธํŠœ๋‹: ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋‚ด ๋””์ง€ํ„ธ ํŠธ์œˆ ํ™˜๊ฒฝ์—์„œ๋Š” ์ƒ๊ธฐ ํ•™์Šต๋œ ํ™•์‚ฐ ์ •์ฑ…์„ ์ดˆ๊ธฐํ™” ๊ฐ’์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ, ์ •์ฑ…๊ฒฝ์‚ฌ ๊ธฐ๋ฐ˜์˜ ๊ฐ•ํ™”ํ•™์Šต(RL)์œผ๋กœ ์ถ”๊ฐ€ ํ›ˆ๋ จ์„ ์ง„ํ–‰ํ•œ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ํ™•์‚ฐ ์ •์ฑ…์˜ ์‹œ๊ฐ„์ „๊ฐœ ๊ณผ์ •์„ MDP๋กœ ํ•ด์„ํ•˜์—ฌ DPPO(Diffusion Policy Policy Optimization) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์•ˆํ•˜๋Š”๋ฐ, ๊ฐ„๋‹จํžˆ ๋งํ•ด ๋ฐฐ์น˜ํ˜• ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์—์„œ ๋‹ค์ˆ˜์˜ ๋กœ๋ด‡์ด ๋™์‹œ์— ์กฐ๋ฆฝ ์ž‘์—…์„ ์‹œ๋„ํ•˜๋ฉด์„œ ์„ฑ๊ณต ์—ฌ๋ถ€(์™„์„ฑ ์‹œ ๋ณด์ƒ 1)๋ฅผ ๊ฐ€์ง€๊ณ  ์ •์ฑ…๋ง์„ ์—…๋ฐ์ดํŠธํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ด๋•Œ ๋ฐฐ์šฐ(Actor) ์‹ ๊ฒฝ๋ง์€ ์‚ฌ์ „ํ•™์Šต๋œ ํ™•์‚ฐ ์ •์ฑ… ๊ฐ€์ค‘์น˜๋ฅผ ์ด์–ด๋ฐ›๊ณ , ๋น„๋Œ€์นญ ํ•™์Šต์„ ์œ„ํ•ด ๋น„ํ‰๊ฐ€(Critic)๋ง์—๋Š” ๋กœ๋ด‡ ์ƒํƒœ์˜ ์ €์ฐจ์› ์ •๋ณด(๋ฌผ์ฒด ์œ„์น˜ ๋“ฑ)๊ฐ€ ์ฃผ์–ด์ ธ ํšจ์œจ์ ์œผ๋กœ ๊ฐ€์น˜๋ฅผ ํ‰๊ฐ€ํ•œ๋‹ค. Sparseํ•œ ์„ฑ๊ณต/์‹คํŒจ ๋ณด์ƒ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์ด๋ฏธ ์–ด๋А ์ •๋„ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต๋œ ์ •์ฑ…์„ ์ถœ๋ฐœ์ ์œผ๋กœ ์‚ผ๊ธฐ์— ํ•™์Šต์ด ์›ํ™œํ•˜๋ฉฐ, ์ˆ˜์‹ญ๋งŒ ํšŒ์˜ ๊ฐ€์ƒ ์กฐ๋ฆฝ ์‹œ๋„๋กœ ๋ฏธ์„ธ ์กฐ์ •๋œ ์ •์ฑ…์„ ์–ป์„ ์ˆ˜ ์žˆ์—ˆ๋‹ค. ์ด ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ RL ํŒŒ์ธํŠœ๋‹ ๊ณผ์ •์€ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋งŒ์œผ๋กœ ํ•™์Šตํ•œ ์ •์ฑ…์ด ํ•ด๋‚ด์ง€ ๋ชปํ–ˆ๋˜ ๋งˆ์ง€๋ง‰ ์ˆ˜ ๋ฐ€๋ฆฌ๋ฏธํ„ฐ์˜ ์ •๋ฐ€ ์กฐ๋ฆฝ ๋™์ž‘์„ ์ž๋™์œผ๋กœ ํ„ฐ๋“ํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ํ•ต์‹ฌ ๋‹จ๊ณ„์ด๋‹ค.
  • ์‹ค์„ธ๊ณ„ ๋ณต๊ท€ ๋ฐ ํ๋ฃจํ”„ ๊ฐœ์„ : ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ํ–ฅ์ƒ๋œ ์ •์ฑ…์€ ์ตœ์ข…์ ์œผ๋กœ ๋‹ค์‹œ ์‹ค์ œ ๋กœ๋ด‡์— ํƒ‘์žฌ๋˜์–ด ํ…Œ์ŠคํŠธ๋œ๋‹ค. ์ด๋•Œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค์˜ ์ฐจ์ด(์˜ˆ: ๊นŠ์ด ์นด๋ฉ”๋ผ pointcloud ์žก์Œ, ๋กœ๋ด‡ ์ œ์–ด๊ธฐ์˜ ๋ฏธ์„ธ ์˜ค์ฐจ ๋“ฑ)๋กœ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ์ผ๋ถ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, VT-Refine์—์„œ๋Š” ์ด‰๊ฐ์„ผ์„œ์˜ ๋‚ฎ์€ ๋„๋ฉ”์ธ ๊ฒฉ์ฐจ(low-gap tactile modality)์™€ ํฌ์ธํŠธ ๊ธฐ๋ฐ˜ ํ‘œํ˜„ ๋•๋ถ„์— ์‹คโ†’๊ฐ€์ƒ ์ „ํ™˜ ์‹œ ์„ฑ๊ณต๋ฅ  5~10% ํ•˜๋ฝ, ๊ฐ€์ƒโ†’์‹ค ์ „ํ™˜ ์‹œ 0~5% ๋ฏธ๋งŒ์˜ ๊ฒฝ๋ฏธํ•œ ์„ฑ๋Šฅ ์ €ํ•˜๋งŒ ๊ด€์ฐฐ๋˜์—ˆ๋‹ค. ๋ฐ˜๋ฉด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒ RL ํŒŒ์ธํŠœ๋‹์œผ๋กœ ์–ป์€ ์„ฑ๊ณต๋ฅ  ํ–ฅ์ƒ์ด 30%ํฌ์ธํŠธ ์ด์ƒ์— ๋‹ฌํ–ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ด๋Ÿฌํ•œ ์ „์ด ์†์‹ค์€ ์ „์ฒด ์„ฑ๋Šฅ ๊ฐœ์„  ํšจ๊ณผ์— ๋น„ํ•ด ๋ฌด์‹œํ•  ์ˆ˜์ค€์ด์—ˆ๋‹ค๊ณ  ๋ณด๊ณ ๋œ๋‹ค. ์š”์•ฝํ•˜๋ฉด, VT-Refine์˜ ๋ฐฉ๋ฒ• ๋ก ์€ ์‹ค์„ธ๊ณ„ ์†Œ๋Ÿ‰ ํ•™์Šต โ†’ ๊ฐ€์ƒํ™˜๊ฒฝ ๋Œ€๋Ÿ‰ ๊ฐ•ํ™” โ†’ ์‹ค์„ธ๊ณ„ ๊ฒ€์ฆ์˜ ์ˆœํ™˜ ๊ณ ๋ฆฌ๋ฅผ ํ†ตํ•ด, ํ˜„์‹ค ๋ฐ์ดํ„ฐ ํš๋“์˜ ๋น„์šฉ๊ณผ ์œ„ํ—˜์„ ์ค„์ด๋ฉด์„œ๋„ ์ตœ์ข… ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๋…์ฐฝ์ ์ธ ๋ฐฉ์‹์ด๋ผ ํ•  ์ˆ˜ ์žˆ๋‹ค.

์‹คํ—˜ ์„ค๊ณ„ ๋ฐ ๊ฒฐ๊ณผ ๋ถ„์„

์ด ๋…ผ๋ฌธ์—์„œ๋Š” 5๊ฐœ์˜ ๋‚œ์ด๋„ ๋†’์€ ์–‘ํŒ” ์กฐ๋ฆฝ ์ž‘์—…์„ ์„ ์ •ํ•˜์—ฌ ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์˜ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•˜์˜€๋‹ค. ์‹คํ—˜์— ์‚ฌ์šฉ๋œ ์ž‘์—…๋“ค์€ AutoMate ๋ฐ์ดํ„ฐ์…‹์— ํฌํ•จ๋œ ๊ณผ์ œ๋“ค๋กœ์„œ, ๊ฐ๊ธฐ ๋‹ค๋ฅธ ํ˜•์ƒ์˜ ํ”Œ๋Ÿฌ๊ทธ-์†Œ์ผ“ ์Œ์„ ์–‘์†์œผ๋กœ ์ง‘์–ด์„œ ๊ณต์ค‘์—์„œ ๊ฒฐํ•ฉ(in-air insertion)ํ•ด์•ผ ํ•˜๋Š” ๋ฌธ์ œ๋“ค์ด๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์œก๊ฐ ๊ธฐ๋‘ฅ ๋ชจ์–‘ ๋„ˆํŠธ-๋ณผํŠธ ๊ฒฐํ•ฉ, ์นด๋ฉ”๋ผ ๋ Œ์ฆˆ ๋งˆ์šดํŠธ์™€ ์œ ์‚ฌํ•œ ๋ฒ ์š”๋„ท ๊ฒฐํ•ฉ, ์›ํ†ตํ˜• ์ถ•์„ ์Šฌ๋ฆฌ๋ธŒ์— ๋ผ์šฐ๊ธฐ, ์ „๊ธฐ ์ปค๋„ฅํ„ฐ ์‚ฝ์ž… ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ์ •๋ฐ€ ์ ‘ํ•ฉ ์ž‘์—…์ด ํฌํ•จ๋˜์—ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ž‘์—…๋“ค์€ ๊ฒฐํ•ฉ ์‹œ ์‹œ์•ผ๊ฐ€ ๊ฐ€๋ ค์ง€๊ณ  ๋ฏธ์„ธํ•œ ์˜ค์ฐจ์—๋„ ์กฐ๋ฆฝ์ด ๋ถˆ๋ฐœ๋˜๊ธฐ ์‰ฌ์›Œ, ์‹œ๊ฐ ์ •๋ณด๋งŒ์œผ๋กœ๋Š” ์„ฑ๊ณตํ•˜๊ธฐ ์–ด๋ ต๊ณ  ํ’๋ถ€ํ•œ ์ด‰๊ฐ ํ™œ์šฉ์ด ํ•„์ˆ˜์ ์ธ ๊ณผ์ œ๋“ค์ด๋‹ค.

์‹คํ—˜ ํ™˜๊ฒฝ ๊ตฌ์„ฑ: ์—ฐ๊ตฌ์ง„์€ ์„œ๋กœ ๋‹ค๋ฅธ ๋‘ ๋กœ๋ด‡ ํ”Œ๋žซํผ์—์„œ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ์ œ์•ˆ ๊ธฐ๋ฒ•์˜ ๋ฒ”์šฉ์„ฑ๋„ ํ‰๊ฐ€ํ•˜์˜€๋‹ค. ํ•˜๋‚˜๋Š” ์ฑ…์ƒ ์œ„์— 6์ž์œ ๋„ ๋กœ๋ด‡ํŒ” 2๋Œ€๋ฅผ ๋ฐฐ์น˜ํ•œ ํ…Œ์ด๋ธ”ํƒ‘ ์–‘ํŒ” ๋กœ๋ด‡์œผ๋กœ, ์†Œํ˜• WidowX ์•”๊ณผ ์†Œํ”„ํŠธ ๊ทธ๋ฆฌํผ๋ฅผ ์‚ฌ์šฉํ–ˆ๋‹ค. ๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” ์‚ฌ๋žŒ ์ƒ๋ฐ˜์‹ ์„ ๋ชจ์‚ฌํ•œ ์„ธ๋ฏธ-ํœด๋จธ๋…ธ์ด๋“œ ์–‘ํŒ” ๋กœ๋ด‡์œผ๋กœ, 7์ž์œ ๋„ Kinova Gen3 ๋‘ ๋Œ€์™€ Robotiq 2F-140 ๊ทธ๋ฆฌํผ๋ฅผ ์‚ฌ์šฉํ•œ ๋ณด๋‹ค ํฌ๊ณ  ๋ฌด๊ฑฐ์šด ์‹œ์Šคํ…œ์ด๋‹ค. ๋‘ ํ”Œ๋žซํผ ๋ชจ๋‘ ๊ฐ ๊ทธ๋ฆฌํผ์˜ ์†๊ฐ€๋ฝ 4๊ฐœ ๋ฉด์— FlexiTac ์ด‰๊ฐ์„ผ์„œ๊ฐ€ ๋ถ€์ฐฉ๋˜์—ˆ๊ณ , ์ธํ…” RealSense D455 ๊นŠ์ด ์นด๋ฉ”๋ผ๋กœ๋ถ€ํ„ฐ ๋กœ๋ด‡ ์ค‘์‹ฌ ์‹œ์ ์˜ ์ ๊ตฐ ์‹œ๊ฐ์ •๋ณด๋ฅผ ์ž…๋ ฅ๋ฐ›์•˜๋‹ค. ์‚ฌ๋žŒ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋Š” Meta Quest 2 VR ์žฅ์น˜๋ฅผ ์ด์šฉํ•œ ์›๊ฒฉ ์กฐ์ž‘์œผ๋กœ ์ˆ˜์ง‘๋˜์—ˆ๋Š”๋ฐ, ์‚ฌ๋žŒ์ด ๊ฐ€์ƒํ˜„์‹ค ํ•ธ๋“œ์ปจํŠธ๋กค๋Ÿฌ๋กœ ๋ฌผ์ฒด๋ฅผ ์žก๊ณ  ๋ผ์šฐ๋Š” ๋™์ž‘์„ ํ•˜๋ฉด ๋กœ๋ด‡ ํŒ”์ด ์ด๋ฅผ ๋ชจ๋ฐฉํ•˜๋„๋ก ์ œ์–ดํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ด๋ ‡๊ฒŒ ๊ณผ์ œ๋‹น 30ํšŒ์˜ ์‹œ์—ฐ์„ ๋ชจ์•„ ์•ž์„œ ์„ค๋ช…ํ•œ Stage 1 ํ™•์‚ฐ ์ •์ฑ… ํ•™์Šต์„ ์ง„ํ–‰ํ•œ ํ›„, ๋™์ผํ•œ ๊ณผ์ œ๋ฅผ ๋ชจ์‚ฌํ•œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ํ™˜๊ฒฝ์—์„œ Stage 2 RL ํŒŒ์ธํŠœ๋‹์„ ๊ฑฐ์ณ ์ •์ฑ…์„ ์ตœ์ข… ์™„์„ฑ์‹œ์ผฐ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋Š” ๋งค ์—ํญ๋งˆ๋‹ค ์ˆ˜๋ฐฑ ๋Œ€์˜ ๋ณ‘๋ ฌ ๋กœ๋ด‡์ด ์ž‘์—…์„ ๋ฐ˜๋ณต์‹œ๋„ํ•˜๋ฉด์„œ ํ•™์Šต์ด ์ด๋ฃจ์–ด์ ธ, ํ˜„์‹ค์—์„œ๋Š” ๋ถˆ๊ฐ€๋Šฅํ•œ ๋Œ€๋Ÿ‰์˜ ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ์•ˆ์ „ํ•˜๊ฒŒ ๊ฒฝํ—˜ํ•˜๊ฒŒ ํ–ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ ์ด๋ ‡๊ฒŒ ์–ป์–ด์ง„ ์ •์ฑ…์„ ๋‘ ์‹ค์ œ ๋กœ๋ด‡ ํ”Œ๋žซํผ์— ์ด์‹ํ•˜์—ฌ ์„ฑ๊ณต๋ฅ (success rate) ๋ฐ ์กฐ๋ฆฝ ์ •๋ฐ€๋„๋ฅผ ์ธก์ •ํ•˜์˜€๋‹ค. ๊ฐ ์ž‘์—…๋งˆ๋‹ค ์ˆ˜์‹ญ ํšŒ์˜ ์‹œ๋„๋ฅผ ํ†ตํ•ด ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ ๊ธฐ๋กํ•˜๊ณ , ๋ฐฉ๋ฒ• ๊ฐ„ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•˜์˜€๋‹ค.

๋น„๊ต ๋Œ€์ƒ ๋ฐ ํ‰๊ฐ€ ์ง€ํ‘œ: ๊ฒ€์ฆ์„ ์œ„ํ•ด ๋„ค ๊ฐ€์ง€ ๋ฐฉ์‹์˜ ์ •์ฑ…์ด ๋น„๊ต๋˜์—ˆ๋‹ค. (a) Pre-Train ์ „์šฉ: ์‚ฌ๋žŒ ์‹œ์—ฐ๋งŒ์œผ๋กœ ํ•™์Šต๋œ ํ™•์‚ฐ ์ •์ฑ…(ํŒŒ์ธํŠœ๋‹ ์—†์ด ๋ฐ”๋กœ ์‹คํ–‰). (b) Fine-Tune (w/ Pre-Train): ์‹œ์—ฐ์œผ๋กœ ํ•™์Šต๋œ ์ •์ฑ…์„ ์ดˆ๊ธฐํ™”๋กœ ํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ RL ํŒŒ์ธํŠœ๋‹๊นŒ์ง€ ๊ฑฐ์นœ ์ตœ์ข… ์ •์ฑ…(์ œ์•ˆ ๋ฐฉ๋ฒ•). (c) Fine-Tune (w/o Pre-Train): ์‹œ์—ฐ ๋ฐ์ดํ„ฐ ์—†์ด ์ฒ˜์Œ๋ถ€ํ„ฐ RL๋กœ๋งŒ ํ•™์Šตํ•œ ์ •์ฑ…. (d) ์‹œ๊ฐ ์ „์šฉ ์ •์ฑ…: ์œ„์˜ (a)์™€ (b)์— ๋Œ€ํ•˜์—ฌ ์ด‰๊ฐ ์ž…๋ ฅ์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ  ์นด๋ฉ”๋ผ ์˜์ƒ๋งŒ์œผ๋กœ ํ•™์Šต์‹œํ‚จ ๋Œ€์‘ ์‹คํ—˜. ์ด๋“ค์€ ๊ณง ๊ธฐ์กด์˜ Vision-only BC ๋ฐ Vision-only RL ๋ฐฉ๋ฒ•์— ํ•ด๋‹นํ•œ๋‹ค. ๋ชจ๋“  ์ •์ฑ…์— ๋Œ€ํ•ด ์กฐ๋ฆฝ ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ 1/0์˜ ๋ณด์ƒ์œผ๋กœ ์ •์˜ํ•˜์—ฌ ์„ฑ๊ณต๋ฅ ์„ ์ธก์ •ํ–ˆ๊ณ , ์ถ”๊ฐ€๋กœ ์กฐ๋ฆฝ์ด ๊ฑฐ์˜ ์™„๋ฃŒ๋˜์—ˆ์œผ๋‚˜ ๋งˆ์ง€๋ง‰ ์ˆ˜ ๋ฐ€๋ฆฌ๋ฏธํ„ฐ ๊ฐ„๊ฒฉ์„ ์ขํžˆ์ง€ ๋ชปํ•œ ๊ฒฝ์šฐ ๋“ฑ์„ ๋ถ„์„ํ•˜์—ฌ ์ •์ฑ…์˜ ์ •๋ฐ€๋„๋ฅผ ํ‰๊ฐ€ํ•˜์˜€๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ: ์ „๋ฐ˜์ ์ธ ๊ฒฐ๊ณผ๋Š” ์ œ์•ˆํ•œ VT-Refine ๋ฐฉ๋ฒ•์˜ ๋šœ๋ ทํ•œ ์šฐ์ˆ˜์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค.

  • ์ฒซ์งธ, RL ํŒŒ์ธํŠœ๋‹์˜ ํšจ๊ณผ๊ฐ€ ๋‘๋“œ๋Ÿฌ์กŒ๋Š”๋ฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒ์˜ ๊ฐ•ํ™”ํ•™์Šต์„ ๊ฑฐ์นœ ์ •์ฑ…์€ ๊ฑฐ์น˜์ง€ ์•Š์€ ์ •์ฑ…์— ๋น„ํ•ด ํ˜„์‹ค ์„ฑ๊ณต๋ฅ ์ด ํฐ ํญ์œผ๋กœ ํ–ฅ์ƒ๋˜์—ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํ…Œ์ด๋ธ”ํƒ‘ ์–‘ํŒ”๋กœ๋ด‡ ์‹คํ—˜์—์„œ, ์ด‰๊ฐ์„ ํฌํ•จํ•œ ์ •์ฑ…์˜ ๊ฒฝ์šฐ ์‹œ์—ฐ๋งŒ์œผ๋กœ ๋‹ฌ์„ฑํ•œ ์„ฑ๊ณต๋ฅ ์ด ๊ณผ์ œ์— ๋”ฐ๋ผ 12~54% ์ˆ˜์ค€์ด์—ˆ์œผ๋‚˜, RL ํŒŒ์ธํŠœ๋‹ ํ›„์—๋Š” 76~98%๊นŒ์ง€ ์ƒ์Šนํ•˜์˜€๋‹ค. ํ–ฅ์ƒ ํญ์€ ๊ณผ์ œ์— ๋”ฐ๋ผ +30%p ์ด์ƒ์— ๋‹ฌํ–ˆ์œผ๋ฉฐ, ํŠนํžˆ ๊ฒฐํ•ฉ ๊ฐ„๊ฒฉ์ด ๋งค์šฐ ์ด˜์ด˜ํ•œ ๊ณ ์ •๋ฐ€ ์ž‘์—…์ผ์ˆ˜๋ก ํŒŒ์ธํŠœ๋‹ ์ „ํ›„ ์„ฑ๋Šฅ ๊ฒฉ์ฐจ๊ฐ€ ์ปธ๋‹ค. ํฅ๋ฏธ๋กญ๊ฒŒ๋„, ์‹œ์—ฐ ๋ฐ์ดํ„ฐ ์—†์ด ์ฒ˜์Œ๋ถ€ํ„ฐ RL๋กœ ํ•™์Šตํ•œ ์ •์ฑ…์€ ์–ด๋–ค ๊ฒฝ์šฐ๋„ ์„ฑ๊ณต์ ์ธ ์กฐ๋ฆฝ์„ ํ•ด๋‚ด์ง€ ๋ชปํ•ด ์„ฑ๊ณต๋ฅ  0%์— ๋จธ๋ฌผ๋ €๋Š”๋ฐ, ์ด๋Š” ์ดˆ๊ธฐ ์‹œ์—ฐ์„ ํ†ตํ•ด ํ•™์Šต์„ ์•ˆ์ •ํ™”ํ•˜๋Š” ๋‹จ๊ณ„๊ฐ€ ํ•„์ˆ˜์ ์ž„์„ ๋ฐฉ์ฆํ•œ๋‹ค. ๋‹ค์‹œ ๋งํ•ด ์‚ฌ๋žŒ ๋ฐ๋ชจ์˜ ๊ธฐ๋ณธ๊ธฐ๊ฐ€ ์—†๋‹ค๋ฉด, ๋ณต์žกํ•œ ์–‘ํŒ” ์กฐ๋ฆฝ์„ ์ˆœ์ „ํžˆ ๊ฐ•ํ™”ํ•™์Šต๋งŒ์œผ๋กœ๋Š” ํƒ์ƒ‰ํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.
  • ๋‘˜์งธ, ์ด‰๊ฐ ์ •๋ณด์˜ ๊ธฐ์—ฌ๊ฐ€ ์ •๋Ÿ‰์ ์œผ๋กœ ํ™•์ธ๋˜์—ˆ๋‹ค. ์ด‰๊ฐ์„ ํฌํ•จํ•œ ์‹œ๊ฐ-์ด‰๊ฐ ์ •์ฑ…์€ ์ด‰๊ฐ์„ ๋ฐฐ์ œํ•œ ์‹œ๊ฐ ์ „์šฉ ์ •์ฑ…์— ๋น„ํ•ด ์ผ๊ด€๋˜๊ฒŒ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค. ์˜ˆ์ปจ๋Œ€ ์‹œ๊ฐ ์ „์šฉ ์ •์ฑ…์€ ํ”Œ๋Ÿฌ๊ทธ์™€ ์†Œ์ผ“์˜ ๋ฏธ์„ธํ•œ ์ ‘์ด‰ ๋‹จ์„œ๋“ค์„ ์ธ์ง€ํ•˜์ง€ ๋ชปํ•ด ๋‘ ๋ฌผ์ฒด๋ฅผ ๋งž๋ฌผ๋ฆฌ๋Š” ๊ณผ์ •์—์„œ ๊ณต์ค‘์—์„œ ๋จธ๋ญ‡๊ฑฐ๋ฆฌ๊ฑฐ๋‚˜(hovering) ๊ฐ๋„ ๋ถˆ์ผ์น˜๋กœ ์‚ฝ์ž…์„ ์‹œ๋„ํ•˜๋‹ค ์‹คํŒจํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•˜๋‹ค. ๋ฐ˜๋ฉด ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ์ •์ฑ…์€ ๊ฒฐํ•ฉ๋ถ€์— ๋‹ฟ๋Š” ์ˆœ๊ฐ„์˜ ํž˜ ๋ณ€ํ™”๋ฅผ ๊ฐ์ง€ํ•ด ์ฆ‰๊ฐ์ ์œผ๋กœ ๋ฏธ์„ธ ์œ„์น˜๋ฅผ ์กฐ์ •ํ•จ์œผ๋กœ์จ ๋๊นŒ์ง€ ๊ฒฐํ•ฉ์„ ์™„๋ฃŒํ•˜๋Š” ๋น„์œจ์ด ๋†’์•˜๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ํ‰๊ฐ€์—์„œ ์ด‰๊ฐ ์ •์ฑ…์€ ์ดˆ๊ธฐ ํ•™์Šต๋‹จ๊ณ„๋ถ€ํ„ฐ ์‹œ๊ฐ ์ „์šฉ๋ณด๋‹ค ๋†’์€ ์„ฑ๊ณต๋ฅ ๋กœ ์‹œ์ž‘ํ•ด ์ตœ์ข…์—๋„ ๋” ๋†’์€ ์ •ํ™•๋„๋กœ ์ˆ˜๋ ดํ•˜์˜€๋Š”๋ฐ, ์ด๋Š” ์ด‰๊ฐ์ด ์ดˆ๊ธฐ ํ•™์Šต ๊ฐ€์ด๋“œ์™€ ์ตœ์ข… ๋ฏธ์„ธ ์กฐ์ • ๋ชจ๋‘์—๋„์›€์„ ์ฃผ์—ˆ์Œ์„ ์‹œ์‚ฌํ•œ๋‹ค. ์š”์•ฝํ•˜์ž๋ฉด, โ€œ์ด‰๊ฐ์„ ์‚ฌ์šฉํ•œ ์šฐ๋ฆฌ ์ •์ฑ…์€ ์‹œ์ž‘๋„ ๋๋„ ๋” ์ •๋ฐ€ํ–ˆ๋‹คโ€๋Š” ๊ฒƒ์ด ์ €์ž๋“ค์˜ ์„ค๋ช…์ด๋‹ค.
  • ์…‹์งธ, ์„ธ๋ถ€ ์„ฑ๋Šฅ ๋ถ„์„ ๋ฐ ๋‚ด์„ฑ ํ‰๊ฐ€๋„ ์„ค๋“๋ ฅ ์žˆ๊ฒŒ ์ œ์‹œ๋˜์—ˆ๋‹ค. ์‹œ์—ฐ ๋ฐ์ดํ„ฐ์˜ ์–‘์„ ๋‹ฌ๋ฆฌํ•ด๋ณธ ์‹คํ—˜์—์„œ, 10๊ฐœ ์‹œ์—ฐ์œผ๋กœ ํ•™์Šตํ•œ ์ •์ฑ…์€ ๊ฑฐ์˜ ์„ฑ๊ณต๋ฅ  0%์— ๊ทธ์ณค์œผ๋‚˜ RL ํŒŒ์ธํŠœ๋‹ ํ›„ ์•ฝ 30%๊นŒ์ง€ ํ–ฅ์ƒ๋˜์—ˆ๊ณ , 30๊ฐœ vs 50๊ฐœ ์‹œ์—ฐ์œผ๋กœ ํ•™์Šตํ•œ ์ •์ฑ…์€ ๋‘˜ ๋‹ค ํŒŒ์ธํŠœ๋‹ ํ›„ ๊ฑฐ์˜ ์™„๋ฒฝ์— ๊ฐ€๊นŒ์šด ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๋‹ค. ์‹œ์—ฐ์„ 30๊ฐœ์—์„œ 50๊ฐœ๋กœ ๋Š˜๋ฆฌ๋Š” ๊ฒƒ์€ ์ดˆ๊ธฐ ์„ฑ๊ณต๋ฅ ์— ์•ฝ๊ฐ„ ๊ธฐ์—ฌํ–ˆ์ง€๋งŒ ๊ฒฐ์ •์ ์ด์ง€ ์•Š์•˜์œผ๋ฉฐ, ๊ฒฐ๊ตญ ๋ณ‘๋ชฉ์€ ์ถฉ๋ถ„ํ•œ ๋ฐ๋ชจ ์ˆ˜์ง‘๋ณด๋‹ค RL์„ ํ†ตํ•œ ๋ฏธ์„ธ๋™์ž‘ ํ•™์Šต์— ์žˆ์—ˆ๋‹ค๊ณ  ๋ถ„์„๋œ๋‹ค. ๋˜ํ•œ ์ •์ฑ…์˜ ๊ฐ•์ธ์„ฑ(robustness) ์ธก๋ฉด์—์„œ, ์ €์ž๋“ค์€ ์ž„์˜์˜ ์ดˆ๊ธฐ ๋ฌผ์ฒด ๋ฐฐ์น˜ ๋ณ€ํ™”(์•ฝ ยฑ3cm ๋ฒ”์œ„)๋‚˜ ์žก๋Š” ๊ณผ์ •์—์„œ์˜ ๋ฏธ๋„๋Ÿฌ์ง ๋“ฑ์ด ๋ฐœ์ƒํ•ด๋„ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ํŒŒ์ธํŠœ๋‹ ์ •์ฑ…์€ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ โ€œ๋ฌผ์ฒด๋ฅผ ํ”๋“ค๋ฉฐ ๋‹ค์‹œ ๋งž์ถ”๋Š”(wiggleand-dock)โ€ ๋™์ž‘์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ ์„ฑ๊ณต์— ์ด๋ฅด๋Š” ๊ฒƒ์„ ๊ด€์ฐฐํ–ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋™์ž‘์€ ์‚ฌ๋žŒ์ด ์ด‰๊ฐ์œผ๋กœ ์‚ฝ์ž…์„ ์‹œ๋„ํ• ๋•Œ ๋ณด์ด๋Š” ์ „๋žต๊ณผ ์œ ์‚ฌํ•˜๋ฉฐ, ์ดˆ๊ธฐ ๋ฐ๋ชจ์—๋Š” ์—†์—ˆ๋˜ ๊ฒƒ์ด RL ๋‹จ๊ณ„๋ฅผ ํ†ตํ•ด ์ž๋ฐœ์ ์œผ๋กœ ํ•™์Šต๋œ ํ–‰๋™ ํŒจํ„ด์ด์—ˆ๋‹ค๊ณ  ํ•œ๋‹ค. ๋ฐ˜๋ฉด ์ด‰๊ฐ์ด ์—†๋Š” ์ •์ฑ…์€ ์‚ฝ์ž…์ด ์–ด๊ธ‹๋‚ฌ์„ ๋•Œ ๋ฌด์ž‘์ • ํž˜์„ ์ค˜ ๋ฐ€๋‹ค ์‹คํŒจํ•˜๊ฑฐ๋‚˜ ๋ฌผ์ฒด๋ฅผ ๋–จ์–ด๋œจ๋ฆฌ๋Š” ๋“ฑ ์„ฌ์„ธํ•œ ๋Œ€์‘์„ ํ•˜์ง€ ๋ชปํ–ˆ๋‹ค. ๋์œผ๋กœ, ๋‘ ๋กœ๋ด‡ ํ”Œ๋žซํผ ๊ฐ„ ์„ฑ๋Šฅ ๋น„๊ต์—์„œ๋Š” ๋Œ€์ฒด๋กœ ์ผ๊ด€๋œ ํ–ฅ์ƒ ์ถ”์ด๊ฐ€ ๋‚˜ํƒ€๋‚ฌ์œผ๋‚˜, ํ…Œ์ด๋ธ”ํƒ‘ ์†Œํ˜• ๋กœ๋ด‡์— ๋น„ํ•ด Kinova ๊ธฐ๋ฐ˜ ํฐ ๋กœ๋ด‡์—์„œ๋Š” ์ ˆ๋Œ€ ์„ฑ๊ณต๋ฅ ์ด ๋‹ค์†Œ ๋‚ฎ์•˜๋‹ค. ์ด๋Š” ํฐ ๋กœ๋ด‡์˜ ์ œ์–ด ๋ฏธ์„ธ ์ •ํ™•๋„ ํ•œ๊ณ„๋‚˜ ์นด๋ฉ”๋ผ ์‹œ์•ผ ๋“ฑ์˜ ์ฐจ์ด๋กœ ์ธํ•œ ๊ฒƒ์ด๋ฉฐ, ๊ทธ๋Ÿผ์—๋„ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ํŒŒ์ธํŠœ๋‹์œผ๋กœ ์–ป์€ ๊ฐœ์„ ์œจ์€ ๋‘ ํ”Œ๋žซํผ์—์„œ ์œ ์‚ฌํ•˜์—ฌ ์ œ์•ˆ ๊ธฐ๋ฒ•์˜ ์ผ๋ฐ˜์„ฑ์„ ์ž…์ฆํ•˜์˜€๋‹ค.

์ข…ํ•ฉํ•˜๋ฉด, ์‹คํ—˜ ์„ค๊ณ„๋Š” ์ ์ ˆํ•œ ๋‚œ์ด๋„์˜ ๊ณผ์ œ๋ฅผ ์„ ๋ณ„ํ•˜๊ณ , ๋‹ค์–‘ํ•œ ํ†ต์ œ ์‹คํ—˜(์œ /๋ฌด ์ด‰๊ฐ, ์œ /๋ฌด ํŒŒ์ธํŠœ๋‹, ๋ฐ๋ชจ ์ˆ˜๋Ÿ‰ ๋ณ€ํ™”, ๋กœ๋ด‡ ํ”Œ๋žซํผ ๋ณ€ํ™” ๋“ฑ)์„ ํ†ตํ•ด ์ œ์•ˆ ๋ฐฉ๋ฒ•์˜ ํšจ๊ณผ๋ฅผ ๋‹ค๊ฐ๋„๋กœ ์ž…์ฆํ•˜์˜€๋‹ค. ์„ฑ๊ณต๋ฅ ๊ณผ ๋™์ž‘ ํŒจํ„ด์— ๋Œ€ํ•œ ์ •๋Ÿ‰/์ •์„ฑ ๋ถ„์„์ด ๋ชจ๋‘ ์ œ์‹œ๋˜์–ด ์„ค๋“๋ ฅ์„ ๋†’์˜€์œผ๋ฉฐ, ํŠนํžˆ โ€œ์ด‰๊ฐ์„ ์‚ฌ์šฉํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํŒŒ์ธํŠœ๋‹์ด ์—†๋‹ค๋ฉด ๋ถˆ๊ฐ€๋Šฅํ–ˆ์„ ์กฐ๋ฆฝ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹คโ€๋Š” ์ฃผ์žฅ์„ ์‹คํ—˜ ๋ฐ์ดํ„ฐ๋กœ ๋’ท๋ฐ›์นจํ•œ ์ ์ด ๋‹๋ณด์ธ๋‹ค.

๊ฒฐ๋ก 

VT-Refine๋Š” ์‹œ๊ฐ๊ณผ ์ด‰๊ฐ์„ ๊ฒฐํ•ฉํ•œ ์–‘ํŒ” ๋กœ๋ด‡ ์กฐ์ž‘ ๋ถ„์•ผ์—์„œ ํ•œ ๋‹จ๊ณ„ ๋„์•ฝ์„ ์ด๋ฃฌ ์—ฐ๊ตฌ๋กœ ํ‰๊ฐ€๋œ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์‚ฌ๋žŒ์ด ์†๋์˜ ๊ฐ๊ฐ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋Š” ์ •๋ฐ€ ์กฐ๋ฆฝ์„ ๋กœ๋ด‡์ด ํ•™์Šตํ•˜๋„๋ก ํ•˜๊ธฐ ์œ„ํ•ด, ์‹ค์ œ-๊ฐ€์ƒ ํ™˜๊ฒฝ์„ ์™•๋ณตํ•˜๋Š” ์ƒˆ๋กœ์šด ํ•™์Šต ์‚ฌ์ดํด์„ ์ œ์•ˆํ–ˆ๋‹ค. ์†Œ์ˆ˜์˜ ์‹ค์ œ ์‹œ์—ฐ์œผ๋กœ ํ•™์Šต๋œ ์ •์ฑ…์„ ๋Œ€๊ทœ๋ชจ ๊ฐ€์ƒ ๋ฐ์ดํ„ฐ๋กœ ๊ฐ•ํ™”ํ•˜์—ฌ ํ˜„์‹ค์— ๋‹ค์‹œ ์ ์šฉํ•˜๋Š” ์ด ์ ‘๊ทผ๋ฒ•์€, ๋ฐ์ดํ„ฐ ๋ถ€์กฑ๊ณผ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๊ฐ„ ๊ฒฉ์ฐจ๋ผ๋Š” ๋‘ ๋‚œ์ œ๋ฅผ ๋ชจ๋‘ ํ•ด๊ฒฐํ•œ ์ ์—์„œ ์˜์˜๊ฐ€ ํฌ๋‹ค. ๋˜ํ•œ ์ด‰๊ฐ์„ผ์„œ ํ•˜๋“œ์›จ์–ด ๊ฐœ๋ฐœ๋ถ€ํ„ฐ ํ‘œํ˜„ ํ†ตํ•ฉ, ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ค๊ณ„, ์‹คํ—˜ ๊ฒ€์ฆ๊นŒ์ง€ ์ „ ์Šคํƒ(full-stack)์„ ์•„์šฐ๋ฅด๋Š” ํ†ตํ•ฉ ์—ฐ๊ตฌ๋กœ์„œ, ํ–ฅํ›„ ์œ ์‚ฌํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋กœ๋ด‡ ํ•™์Šต์— ์ข‹์€ ์ฒญ์‚ฌ์ง„์„ ์ œ์‹œํ•œ๋‹ค. ๋ฌผ๋ก  ์™„๋ฒฝํ•œ ์ˆ˜์ค€์€ ์•„๋‹ˆ์–ด์„œ, ํ˜„์žฌ ๋ฐฉ๋ฒ•๋„ ์ผ๋ถ€ ์‹คํŒจ ์ผ€์ด์Šค(์˜ˆ: ํŠน์ • ๊ฐ๋„๋กœ ์‚ฝ์ž…์ด ์–ด๋ ค์šด ๊ฒฝ์šฐ ๋“ฑ)๊ฐ€ ์กด์žฌํ•˜๋ฉฐ ์—ฌ์ „ํžˆ ์‚ฌ์ „ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ์— ์„ฑ๋Šฅ์ด ์˜์กดํ•˜๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ €์ž๋“ค์ด ๊ณต๊ฐœํ•œ FlexiTac ์„ผ์„œ์™€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ชจ๋“ˆ์€ ๊ด€๋ จ ์—ฐ๊ตฌ ์ปค๋ฎค๋‹ˆํ‹ฐ์— ํ™œ์šฉ ๊ฐ€์น˜๊ฐ€ ๋†’๊ณ , ํ–ฅํ›„ ์‹œ์—ฐ ์—†์ด๋„ ์ž์ฒด ํƒ์ƒ‰์œผ๋กœ ํ•™์Šตํ•˜๋Š” ์ž์œจ์„ฑ์ด๋‚˜ ๋” ๋ณต์žกํ•œ ์กฐ๋ฆฝ ์‹œ๋‚˜๋ฆฌ์˜ค๋กœ์˜ ํ™•์žฅ ๋“ฑ ๋„์ „ ๊ณผ์ œ๋“ค์ด ๋‚จ์•„ ์žˆ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๊ฒฐ๋ก ์ ์œผ๋กœ, VT-Refine๋Š” โ€œ์ด‰๊ฐ์ด ์žˆ์–ด์•ผ ๋งˆ์ง€๋ง‰ 2mm๋ฅผ ํ•ด๋‚ผ ์ˆ˜ ์žˆ๋‹คโ€๋Š” ๊ตํ›ˆ์„ ๋กœ๋ด‡ ํ•™์Šต์— ๋ช…ํ™•ํžˆ ๊ฐ์ธ์‹œํ‚จ ์„ฑ๊ณต์ ์ธ ์‚ฌ๋ก€๋กœ ๋‚จ์„ ๊ฒƒ์ด๋‹ค.

Copyright 2024, Jung Yeon Lee