Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • 1 Brief Review
  • 2 Detail Review
    • 2.1 ๋…ผ๋ฌธ ๊ฐœ์š” ๋ฐ ๋ฌธ์ œ ์ œ๊ธฐ
    • 2.2 ๋ฐฉ๋ฒ•๋ก  ์ƒ์„ธ ๋ถ„์„
    • 2.3 ์‹คํ—˜ ์„ค์ • ๋ฐ ๋ฒค์น˜๋งˆํฌ
    • 2.4 ๊ฒฐ๊ณผ ๋ถ„์„
    • 2.5 ํ•œ๊ณ„์  ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ
    • 2.6 ์ดํ‰ ๋ฐ ๊ธฐ์—ฌ๋„ ํ‰๊ฐ€

๐Ÿ“ƒSequential Dexterity ๋ฆฌ๋ทฐ

rl
assembly
hand
Chaining Dexterous Policies for Long-Horizon Manipulation
Published

July 22, 2025

  • Paper Link
  • Project Link
  1. ๐Ÿค– ๋ณธ ๋…ผ๋ฌธ์€ ๋ณต์žกํ•˜๊ณ  ์žฅ๊ธฐ์ ์ธ ์กฐ์ž‘ ์ž‘์—…์„ ์œ„ํ•ด ์—ฌ๋Ÿฌ Dexterous ์ •์ฑ…๋“ค์„ ํšจ์œจ์ ์œผ๋กœ ์—ฐ๊ฒฐํ•˜๋Š” โ€œSequential Dexterityโ€ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  2. โš™๏ธ ์ด ์‹œ์Šคํ…œ์€ ์ „๋ฐฉ ์ดˆ๊ธฐํ™”(forward initialization)์™€ Transition Feasibility Function์„ ํ™œ์šฉํ•œ ํ›„๋ฐฉ ๋ฏธ์„ธ ์กฐ์ •(backward fine-tuning)์„ ํฌํ•จํ•˜๋Š” ์–‘๋ฐฉํ–ฅ ์ตœ์ ํ™” ๊ณผ์ •์„ ํ†ตํ•ด ์ •์ฑ… ๊ฐ„์˜ ์›ํ™œํ•œ ์ „ํ™˜์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
  3. โœ… ์ œ์•ˆ๋œ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ์‹ค์ œ ๋กœ๋ด‡ ํ™˜๊ฒฝ์—์„œ ๊ธฐ์กด ๋‹จ๋ฐฉํ–ฅ ์Šคํ‚ฌ ์ฒด์ด๋‹ ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค ์ž‘์—… ์„ฑ๊ณต๋ฅ ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ์ƒˆ๋กœ์šด ๊ฐ์ฒด ๋ชจ์–‘์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋ฐ zero-shot transfer ๋Šฅ๋ ฅ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

1 Brief Review

๋ณธ ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์„œ๋ธŒํƒœ์Šคํฌ๋“ค๋กœ ๊ตฌ์„ฑ๋œ ์žฅ๊ธฐ์ (long-horizon)์ด๊ณ  ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•œ RL(Reinforcement Learning) ๊ธฐ๋ฐ˜์˜ ์ผ๋ฐ˜ ์‹œ์Šคํ…œ์ธ Sequential Dexterity๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ํ•ธ๋“œ(dexterous hand)๋Š” ๋†’์€ ์ž์œ ๋„์™€ ์ ์‘์„ฑ์œผ๋กœ ์ด๋Ÿฌํ•œ ๋ณต์žกํ•œ ์ž‘์—…์— ์ ํ•ฉํ•˜์ง€๋งŒ, ๊ณ ์ฐจ์›์ ์ธ ํ–‰๋™ ๊ณต๊ฐ„๊ณผ ๋ณตํ•ฉ์ ์ธ ๋™์—ญํ•™์œผ๋กœ ์ธํ•ด ํ™œ์šฉ์ด ์–ด๋ ต๋‹ค๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค. Sequential Dexterity๋Š” ์—ฌ๋Ÿฌ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์ •์ฑ…(policy)์„ ์—ฐ๊ฒฐ(chain)ํ•˜์—ฌ ์žฅ๊ธฐ์  ์ž‘์—… ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ์‹œ์Šคํ…œ์˜ ํ•ต์‹ฌ์€ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜(Transition Feasibility Function, TFF)์ด๋‹ค. ์ด TFF๋Š” ์ •์ฑ… ์—ฐ๊ฒฐ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ์„œ๋ธŒ ์ •์ฑ…(sub-policy)์„ ์ ์ง„์ ์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •(finetune)ํ•˜๊ณ , ์‹คํŒจ๋กœ๋ถ€ํ„ฐ์˜ ๋ณต๊ตฌ ๋ฐ ๋ถˆํ•„์š”ํ•œ ๋‹จ๊ณ„๋ฅผ ๊ฑด๋„ˆ๋›ฐ๊ธฐ ์œ„ํ•œ ์ž์œจ์ ์ธ ์ •์ฑ… ์ „ํ™˜(policy-switching)์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์†Œ์ˆ˜์˜ ๊ฐ์ฒด๋กœ๋งŒ ํ›ˆ๋ จ๋˜์—ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ๋ณธ ์‹œ์Šคํ…œ์€ ์ƒˆ๋กœ์šด ๊ฐ์ฒด ํ˜•์ƒ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋ณด์ด๋ฉฐ, ์‹ค์ œ ๋กœ๋ด‡ ์‹œ์Šคํ…œ์œผ๋กœ ์ œ๋กœ-์ƒท ์ „์ด(zero-shot transfer)๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.

๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์€ ๋‹จ์ผ ์Šคํ‚ฌ(skill)์— ์ค‘์ ์„ ๋‘๊ฑฐ๋‚˜, ์ธ์ ‘ํ•œ ์Šคํ‚ฌ ๊ฐ„์˜ ์ƒํƒœ ๊ณต๊ฐ„ ์ •๊ทœํ™”(regularization)์— ์ง‘์ค‘ํ•˜์—ฌ ์žฅ๊ธฐ์  ๋ชฉํ‘œ๊ฐ€ ์ดˆ๊ธฐ ์ •์ฑ…์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๊ณ ๋ คํ•˜์ง€ ์•Š์•˜๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ์ด์™€ ๋‹ฌ๋ฆฌ ์ด์ค‘ ๋ฐฉํ–ฅ ์ตœ์ ํ™”(bi-directional optimization) ๊ณผ์ •์„ ์ œ์•ˆํ•˜์—ฌ ์ „์ฒด ์Šคํ‚ฌ ์ฒด์ธ(skill chain)์„ ํฌ๊ด„์ ์œผ๋กœ ์ตœ์ ํ™”ํ•œ๋‹ค. ์ด๋Š” ์ˆœ๋ฐฉํ–ฅ ์ดˆ๊ธฐํ™”(forward initialization) ๊ณผ์ •๊ณผ ์—ญ๋ฐฉํ–ฅ ๋ฏธ์„ธ ์กฐ์ •(backward fine-tuning) ๊ณผ์ •์œผ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์„œ๋ธŒ ์ •์ฑ… ํ•™์Šต(Learning dexterous sub-policies): ์žฅ๊ธฐ์  ์ž‘์—…์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์€ ๋งค์šฐ ์–ด๋ ต๊ธฐ ๋•Œ๋ฌธ์—, ๋จผ์ € ์ „์ฒด ์ž‘์—…์„ K๋‹จ๊ณ„์˜ ์„œ๋ธŒํƒœ์Šคํฌ G = (g_1, g_2, ..., g_K)๋กœ ๋ถ„ํ•ดํ•˜๊ณ , ๊ฐ ์„œ๋ธŒ ์ •์ฑ… \pi_i๋ฅผ PPO(Proximal Policy Optimization) ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํ•™์Šตํ•œ๋‹ค. ๊ฐ ์„œ๋ธŒํƒœ์Šคํฌ๋Š” MDP(Markov Decision Process) M = (\mathcal{S}, \mathcal{A}, \pi, T, R, \gamma, \rho)๋กœ ๊ณต์‹ํ™”๋œ๋‹ค. ์ˆœ๋ฐฉํ–ฅ ์ดˆ๊ธฐํ™”(Forward initialization): ๊ฐœ๋ณ„ ์„œ๋ธŒ ์ •์ฑ…์„ ํ›ˆ๋ จํ•˜๊ธฐ ์œ„ํ•œ ์ดˆ๊ธฐ ์ƒํƒœ๋ฅผ ์ •ํ™•ํ•˜๊ฒŒ ์ƒ˜ํ”Œ๋งํ•˜๋Š” ๊ฒƒ์€ ์–ด๋ ต๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ์ด์ „ ์„œ๋ธŒํƒœ์Šคํฌ \pi_{i-1}์˜ ์„ฑ๊ณต์ ์ธ ์ตœ์ข… ์ƒํƒœ(\mathbf{s}_T^{i-1})๊ฐ€ ๋‹ค์Œ ์„œ๋ธŒ ์ •์ฑ… \pi_i์˜ ๊ทธ๋Ÿด๋“ฏํ•œ ์ดˆ๊ธฐ ์ƒํƒœ(\rho_i)๋ฅผ ์ œ๊ณตํ•œ๋‹ค๋Š” ์ ์— ์ฐฉ์•ˆํ•œ๋‹ค. ๋”ฐ๋ผ์„œ, ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ํƒœ์Šคํฌ์˜ ์‹œ๊ฐ„ ์ˆœ์„œ์— ๋”ฐ๋ผ ์„œ๋ธŒ ์ •์ฑ…๋“ค์„ ์ˆœ์ฐจ์ ์œผ๋กœ ํ›ˆ๋ จํ•œ๋‹ค. ๊ฐ ์„œ๋ธŒ ์ •์ฑ… \pi_i๋ฅผ ํ›ˆ๋ จํ•œ ํ›„, ์„ฑ๊ณต์ ์ธ ์ข…๋ฃŒ ์ƒํƒœ ์ง‘ํ•ฉ \{\mathbf{s}_T^i\}์„ ์ˆ˜์ง‘ํ•˜๊ณ , ์ด๋ฅผ ๋‹ค์Œ ์ •์ฑ… \pi_{i+1}์„ ํ›ˆ๋ จํ•˜๊ธฐ ์œ„ํ•œ ์ดˆ๊ธฐ ์ƒํƒœ ๋ถ„ํฌ \rho_{i+1}๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ์ด ์ˆœ๋ฐฉํ–ฅ ํ›ˆ๋ จ ๋ฐฉ์‹์€ ์ดˆ๊ธฐ ์ƒํƒœ์˜ ์œ ํšจ์„ฑ์„ ๋ณด์žฅํ•˜์—ฌ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์ •์ฑ… ํ•™์Šต์˜ ํšจ์œจ์„ฑ์„ ๋†’์ธ๋‹ค.

  1. ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ ์ •์ฑ… ์—ฐ๊ฒฐ(Policy chaining with Transition Feasibility Function): ์ˆœ๋ฐฉํ–ฅ ์ดˆ๊ธฐํ™”๋งŒ์œผ๋กœ๋Š” ์ด์ „ ์ •์ฑ… \pi_{i-1}์ด ๋‹ค์Œ ์ •์ฑ… \pi_i๊ฐ€ ํ•ด๊ฒฐํ•  ์ˆ˜ ์—†๋Š” ์ข…๋ฃŒ ์ƒํƒœ์— ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ์„ฑ๊ณต์„ ๋ณด์žฅํ•˜์ง€ ๋ชปํ•œ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋‹ค์Œ ์ •์ฑ… \pi_i์˜ ๊ฐ€๋Šฅ์„ฑ(feasibility)์„ ์ด์ „ ์ •์ฑ… \pi_{i-1}์— ์—ญ์œผ๋กœ ์ „๋‹ฌํ•˜์—ฌ, \pi_{i-1}์ด \pi_i๊ฐ€ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํƒœ๋กœ ์ตœ์ ํ™”๋˜๋„๋ก ํ•ด์•ผ ํ•œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ ์—ญ๋ฐฉํ–ฅ ์ •์ฑ… ๋ฏธ์„ธ ์กฐ์ • ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์ œ์•ˆํ•œ๋‹ค. ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜ ํ•™์Šต(Learning Transition Feasibility Function): ์ฃผ์–ด์ง„ ์ƒํƒœ์— ๋Œ€ํ•œ ์ •์ฑ…์˜ ๊ฐ€๋Šฅ์„ฑ์€ ํ•ด๋‹น ์ƒํƒœ์—์„œ ์‹œ์ž‘ํ•  ๋•Œ ์ •์ฑ…์ด ์ตœ์ข…์ ์œผ๋กœ ์„ฑ๊ณตํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์œผ๋กœ ์ •์˜๋œ๋‹ค. ์ด ๊ฐœ๋…์€ ์ „์ด ์ƒํƒœ \mathbf{s}_0^i \in \rho_i (์ด๋Š” \mathbf{s}_T^{i-1}์™€ ๋™์ผ)๋ฅผ ์„œ๋ธŒํƒœ์Šคํฌ ์‹คํ–‰ ๋‚ด์˜ ์˜ˆ์ƒ ๋ณด์ƒ ํ•ฉ E_{\pi_i} \left[ \sum_{t=0}^{T-1} r_t \right]์œผ๋กœ ๋งคํ•‘ํ•˜๋Š” ํ•จ์ˆ˜ F: \mathcal{S} \rightarrow \mathbb{R}๋กœ ์ •ํ˜•ํ™”๋œ๋‹ค. TFF๋Š” ๋‹จ์ผ ์ƒํƒœ \mathbf{s}_T^{i-1}๋งŒ์œผ๋กœ๋Š” \pi_i์˜ ์„ฑ๋Šฅ์„ ๊ตฌ๋ถ„ํ•˜๊ธฐ์— ๋ถˆ์ถฉ๋ถ„ํ•˜๋ฏ€๋กœ, ์ด์ „ ์„œ๋ธŒํƒœ์Šคํฌ๋กœ๋ถ€ํ„ฐ์˜ ๊ฐ์ฒด ์†๋„์™€ ๊ฐ™์€ ์‹œ๊ฐ„์  ์ •๋ณด๋ฅผ ํฌํ•จํ•˜์—ฌ 10๋‹จ๊ณ„์˜ ๊ด€์ฐฐ ์ƒํƒœ ์‹œํ€€์Šค \mathbf{s}_{[0:T-1]}^{i-1}๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ , Multi-head Attention Network๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ ์ ˆํ•œ ์‹œ๊ฐ„ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•œ๋‹ค. TFF F^i์˜ ์ตœ์ข… ํ•™์Šต ๋ชฉํ‘œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค: L_i = \|F^i(\mathbf{s}_{[0:T-1]}^{i}) - E_{\pi_i} \left[ \sum_{t=0}^{T-1} r_t \right] \|_2^2 ์—ญ๋ฐฉํ–ฅ ์ •์ฑ… ๋ฏธ์„ธ ์กฐ์ •(Backward policy fine-tuning): F^i๊ฐ€ ํ›ˆ๋ จ๋˜๋ฉด, F^i๋ฅผ ๋ณด์กฐ ๋ณด์ƒ ๊ตฌ์„ฑ ์š”์†Œ๋กœ ํ†ตํ•ฉํ•˜์—ฌ ์ด์ „ ์ •์ฑ… \pi_{i-1}์„ ๋ฏธ์„ธ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ฏธ์„ธ ์กฐ์ •์€ ๋งˆ์ง€๋ง‰ ์„œ๋ธŒํƒœ์Šคํฌ ์ •์ฑ… \pi_{K-1}๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ ์ฒซ ๋ฒˆ์งธ ์ •์ฑ… \pi_1์ด ์—…๋ฐ์ดํŠธ๋  ๋•Œ๊นŒ์ง€ ๊ฐ ์ด์ „ ์ •์ฑ…์„ ์ˆœ์ฐจ์ ์œผ๋กœ ๊ฐœ์„ ํ•œ๋‹ค. ๊ฐ ๋ฏธ์„ธ ์กฐ์ • ๋‹จ๊ณ„์—์„œ, F^i๋Š” ์›๋ณธ ์„œ๋ธŒํƒœ์Šคํฌ ๋ณด์ƒ R_{i-1}๊ณผ ๊ฒฐํ•ฉ๋˜์–ด \pi_{i-1}์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ์ถ”๊ฐ€ ๋ณด์ƒ์œผ๋กœ ์‚ฌ์šฉ๋œ๋‹ค. ์ตœ์ข… ์ •์ฑ… ๋ฏธ์„ธ ์กฐ์ • ๋ณด์ƒ ํ•จ์ˆ˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค: R'_{i-1}(\mathbf{s}_t, \mathbf{a}_t, \mathbf{s}_{t+1}; F^i) = \lambda_1 R_{i-1}(\mathbf{s}_t, \mathbf{a}_t, \mathbf{s}_{t+1}) + \lambda_2 F^i_{\omega}(\mathbf{s}_{[0:T-1]}^i) ์—ฌ๊ธฐ์„œ \lambda_1๊ณผ \lambda_2๋Š” ๊ฐ€์ค‘์น˜ ๊ณ„์ˆ˜์ด๋‹ค. \pi_{i-1}์ด ๊ฐœ์„ ๋˜๋ฉด, ๋ฐ์ดํ„ฐ(์ดˆ๊ธฐ ์ƒํƒœ \mathbf{s}_{[0:T-1]}^{i-2}์—์„œ \pi_{i-1}์ด ๋ฐ›์€ ๋ˆ„์  ๋ณด์ƒ E_{\pi_{i-1}} [\sum r_t]๊นŒ์ง€ ๋งคํ•‘)๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ ์ƒˆ๋กœ์šด ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜ F^{i-1}๋ฅผ ๊ตฌ์„ฑํ•˜๊ณ , ์ด๋Š” ๋‹ค์‹œ ์ด์ „ ์ •์ฑ… \pi_{i-2}๋ฅผ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.

  2. ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ ์ •์ฑ… ์ „ํ™˜(Policy switching with Transition Feasibility Function): ์—ฌ๋Ÿฌ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์ •์ฑ…์„ ์—ฐ๊ฒฐํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•œ ๊ณผ์ œ๋Š” ๋‹ค์Œ ์ •์ฑ…์œผ๋กœ ์–ธ์ œ, ์–ด๋–ค ์ •์ฑ…์œผ๋กœ ์ „ํ™˜ํ•ด์•ผ ํ• ์ง€ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” ํ›ˆ๋ จ๋œ TFF๋ฅผ ์ •์ฑ… ์ „ํ™˜ ์‹๋ณ„์ž๋กœ ํ™œ์šฉํ•œ๋‹ค. ๊ฐ ์‹œ๊ฐ„ ๋‹จ๊ณ„์—์„œ ๋‹ค์Œ ์„œ๋ธŒ ์ •์ฑ…์˜ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋Š” ๊ฐ€๋Šฅ์„ฑ ์ ์ˆ˜ c_{i+1}^t = F^{i+1}(\mathbf{s}_{[0:t-1]}^t)/h_{i+1}๋ฅผ ์ถœ๋ ฅํ•˜๋ฉฐ, h_{i+1}์€ ์„ฑ๊ณต์ ์ธ ํƒœ์Šคํฌ ์‹คํ–‰์˜ ๋ณด์ƒ์— ๊ธฐ๋ฐ˜ํ•œ ์ž„๊ณ„๊ฐ’์ด๋‹ค. ์ •์ฑ… ์ „ํ™˜์˜ ์ด์ƒ์ ์ธ ์‹œ์ ์€ c_{i+1}^t > 1์ผ ๋•Œ๋กœ ์ •์˜๋œ๋‹ค. ๋˜ํ•œ, ๋กœ๋ด‡์ด ์ด์ „ ์ •์ฑ…์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ณต๊ตฌํ•ด์•ผ ํ•˜๊ฑฐ๋‚˜ ์ด๋ฏธ ๋‹ฌ์„ฑ๋œ ์„œ๋ธŒํƒœ์Šคํฌ๋ฅผ ๊ฑด๋„ˆ๋›ฐ์–ด์•ผ ํ•  ์ˆ˜๋„ ์žˆ์œผ๋ฏ€๋กœ, ํ•™์Šต๋œ TFF ๊ทธ๋ฃน (F^2, ..., F^K)์„ ๋‹จ๊ณ„ ์ถ”์ •๊ธฐ(stage estimator)๋กœ ํ™œ์šฉํ•œ๋‹ค. ๋งค ์ •์ฑ… ์ „ํ™˜ ๋‹จ๊ณ„์—์„œ, ์ „์ฒด ํƒœ์Šคํฌ์˜ ์ตœ์ข… TFF๋ถ€ํ„ฐ ์—ญ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐ€๋Šฅ์„ฑ ์ ์ˆ˜๋ฅผ ๊ณ„์‚ฐํ•˜์—ฌ, ์ฒ˜์Œ์œผ๋กœ c_i^t > 1์ธ ์„œ๋ธŒ ์ •์ฑ…์ด ๋‹ค์Œ ์‹คํ–‰ ์ •์ฑ…์œผ๋กœ ์„ ํƒ๋œ๋‹ค. ์–ด๋–ค ์ ์ˆ˜๋„ ๋งŒ์กฑํ•˜์ง€ ์•Š์œผ๋ฉด, ๋กœ๋ด‡์€ ์ „์ฒด ํƒœ์Šคํฌ๋ฅผ ์ฒ˜์Œ๋ถ€ํ„ฐ ์žฌ์‹œ์ž‘ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ์ •์ฑ… ์‹คํ–‰ ์ค‘ ์˜ˆ์ƒ์น˜ ๋ชปํ•œ ์‹คํŒจ์— ๋Œ€ํ•œ ๋กœ๋ด‡์˜ ๊ฒฌ๊ณ ์„ฑ(robustness)์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ๋ถˆํ•„์š”ํ•œ ๋‹จ๊ณ„๋ฅผ ๊ฑด๋„ˆ๋›ฐ์–ด ํšจ์œจ์ ์ธ ํƒœ์Šคํฌ ์‹คํ–‰์„ ์ด‰์ง„ํ•œ๋‹ค.

๋ณธ ์‹œ์Šคํ…œ์€ Lego ๋ธ”๋ก ๊ตฌ์กฐ ๊ตฌ์ถ• ๋ฐ ๋„๊ตฌ ์œ„์น˜ ์ง€์ •์ด๋ผ๋Š” ๋‘ ๊ฐ€์ง€ ์žฅ๊ธฐ์  ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์กฐ์ž‘ ํƒœ์Šคํฌ์— ๋Œ€ํ•ด ํ‰๊ฐ€๋˜์—ˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, ๋ณธ ์—ฐ๊ตฌ์˜ ์ด์ค‘ ๋ฐฉํ–ฅ ์ตœ์ ํ™” ๋ฐฉ์‹์€ ๊ธฐ์กด์˜ ๋‹จ์ผ ๋ฐฉํ–ฅ ์Šคํ‚ฌ ์—ฐ๊ฒฐ ๋ฐฉ๋ฒ•๋“ค(V-Chain, Policy-Seq, T-STAR)๋ณด๋‹ค ํƒœ์Šคํฌ ์„ฑ๊ณต๋ฅ ์—์„œ 20% ์ด์ƒ ํฌ๊ฒŒ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค. ํŠนํžˆ, TFF๋Š” PPO๋กœ ํ›ˆ๋ จ๋œ ๊ฐ€์น˜ ํ•จ์ˆ˜๋ณด๋‹ค ๋‹ค์Œ ์ •์ฑ…์˜ ๊ฐ€๋Šฅ์„ฑ์„ ๋” ์ž˜ ๋ชจ๋ธ๋งํ•˜์—ฌ 30% ์ด์ƒ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ๋˜ํ•œ, TFF์— ์‹œ๊ฐ„์ (temporal) ์ •๋ณด๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ ์ •์  ์ƒํƒœ ์ •๋ณด๋งŒ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ๋ณด๋‹ค 8% ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ, ๋™์ ์ธ ์†๊ฐ€๋ฝ ์›€์ง์ž„์„ ํฌํ•จํ•˜๋Š” ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์ •์ฑ… ์—ฐ๊ฒฐ์— ์žˆ์–ด ์‹œ๊ฐ„ ์ •๋ณด ์ถ”์ถœ์˜ ์ค‘์š”์„ฑ์„ ๊ฐ•์กฐํ–ˆ๋‹ค. ์ž์œจ์ ์ธ ์ •์ฑ… ์ „ํ™˜ ๋Šฅ๋ ฅ์€ 30% ์ด์ƒ์˜ ์„ฑ๊ณต๋ฅ  ํ–ฅ์ƒ์„ ๊ฐ€์ ธ์™€ ์žฅ๊ธฐ์  ํƒœ์Šคํฌ ์„ฑ๊ณต์— ํ•„์ˆ˜์ ์ž„์„ ์ž…์ฆํ–ˆ๋‹ค. ์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜์—์„œ๋„ ๋ณธ ์ ‘๊ทผ ๋ฐฉ์‹์€ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค 30% ์ด์ƒ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์ด๋ฉฐ, ๋‘ ๊ฐœ์˜ ๋ธ”๋ก์„ ์Œ“๋Š” ๋„์ „์ ์ธ 8๋‹จ๊ณ„ ํƒœ์Šคํฌ์—์„œ 33%์˜ ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ–ˆ๋‹ค(๋‹ค๋ฅธ ๋ฒ ์ด์Šค๋ผ์ธ์€ 0%).

๋ณธ ์—ฐ๊ตฌ์˜ ํ•œ๊ณ„์ ์œผ๋กœ๋Š” ์ ‘์ด‰์ด ๋งŽ์€ ์‚ฝ์ž… ๊ณผ์ •์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ์–ด๋ ต๊ณ , ์‹ค์ œ ๋กœ๋ด‡ ๋ฐฐํฌ ์‹œ ์ˆ˜๋™์œผ๋กœ ์„ค๊ณ„๋œ ๋ˆ„๋ฆ„ ๋™์ž‘์ด ํ•„์š”ํ•˜๋‹ค๋Š” ์ ๊ณผ, ๋ชจํ„ฐ ์ด‰๊ฐ(motor tactile) ์ •๋ณด๊ฐ€ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ํฐ ๊ธฐ์—ฌ๋ฅผ ํ•˜์ง€ ๋ชปํ–ˆ๋‹ค๋Š” ์ ์ด ์žˆ๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ์„ผ์„œ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์‹ ํ˜ธ์˜ ์ž ์žฌ๋ ฅ์„ ํƒ์ƒ‰ํ•  ์ˆ˜ ์žˆ๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ, Sequential Dexterity๋Š” ์‹ฌ์ธต ๊ฐ•ํ™” ํ•™์Šต์œผ๋กœ ํ•™์Šต๋œ ๋‹ค์ˆ˜์˜ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์ •์ฑ…์„ ์—ฐ๊ฒฐํ•˜๋Š” ์ด์ค‘ ๋ฐฉํ–ฅ ์ตœ์ ํ™” ๊ณผ์ •์„ ํ†ตํ•ด ์žฅ๊ธฐ์  ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์กฐ์ž‘ ํƒœ์Šคํฌ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ์‹œ์Šคํ…œ์ด๋‹ค. ์‹œ์Šคํ…œ์˜ ํ•ต์‹ฌ์ธ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋Š” ์„œ๋ธŒ ์ •์ฑ…์˜ ์ ์ง„์ ์ธ ๋ฏธ์„ธ ์กฐ์ •๊ณผ ๋™์  ์ •์ฑ… ์ „ํ™˜์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜์—ฌ ์ •์ฑ… ์—ฐ๊ฒฐ์˜ ์„ฑ๊ณต๋ฅ ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค. ๋ณธ ์‹œ์Šคํ…œ์€ ์‹ค์ œ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ๋กœ๋ด‡์œผ๋กœ ์ œ๋กœ-์ƒท ์ „์ด๊ฐ€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์ƒˆ๋กœ์šด ๊ฐ์ฒด ํ˜•์ƒ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋ณด์ธ๋‹ค. ๋ณธ ์ด์ค‘ ๋ฐฉํ–ฅ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ์กฐ์ž‘์„ ๋„˜์–ด ์–‘ํŒ” ๋กœ๋ด‡(bimanual robots)์„ ์œ„ํ•œ ์Šคํ‚ฌ ์—ฐ๊ฒฐ๊ณผ ๊ฐ™์€ ์ž ์žฌ์  ์‘์šฉ ๋ถ„์•ผ์—์„œ๋„ ์ผ๋ฐ˜์ ์ธ ์Šคํ‚ฌ ์—ฐ๊ฒฐ ๋ฐฉ๋ฒ•์œผ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.


2 Detail Review

Sequential Dexterity: ๋‹ค๋‹จ๊ณ„ ์ •๊ตํ•œ ์กฐ์ž‘์„ ์œ„ํ•œ ์ •์ฑ… ์—ฐ์‡„ ์‹ฌ์ธต ๋ถ„์„

2.1 ๋…ผ๋ฌธ ๊ฐœ์š” ๋ฐ ๋ฌธ์ œ ์ œ๊ธฐ

Sequential Dexterity๋Š” ๊ธด ์‹œํ€€์Šค๋กœ ์ด๋ฃจ์–ด์ง„ ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—…์„ ๋‹ค์ค‘ ์„œ๋ธŒ ์ •์ฑ…(sub-policy)์„ ์—ฐ์‡„ํ•˜์—ฌ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค. ํ˜„์‹ค ์„ธ๊ณ„์˜ ์กฐ์ž‘ ๊ณผ์—…๋“ค์€ ์—ฌ๋Ÿฌ ์„œ๋ธŒํƒœ์Šคํฌ(์˜ˆ: ํƒ์ƒ‰, ์ •๋ ฌ, ํŒŒ์ง€, ์‚ฝ์ž…)๋กœ ๊ตฌ์„ฑ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์œผ๋ฉฐ, ๊ฐ ๋‹จ๊ณ„์˜ ์š”๊ตฌ์‚ฌํ•ญ์ด ์ƒ์ดํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์˜ ์†๊ณผ ์œ ์‚ฌํ•œ ๋‹ค์ง€(ๅคšๆŒ‡) ๋กœ๋ด‡ ์†(dexterous hand)์€ ๋„๊ตฌ ๊ต์ฒด๋‚˜ ์žฌํŒŒ์ง€ ์—†์ด ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ๋ชจ๋“œ๋ฅผ ์ „ํ™˜ํ•  ์ˆ˜ ์žˆ์–ด ์ด๋Ÿฌํ•œ ์žฅ๊ธฐ ๋‹ค๋‹จ๊ณ„ ์ž‘์—…์— ์ž ์žฌ๋ ฅ์ด ํฌ์ง€๋งŒ, ๋™์‹œ์— ์ž์œ ๋„์™€ ํ–‰๋™ ๊ณต๊ฐ„์ด ๊ณ ์ฐจ์›์ด๋ผ ํ•™์Šต๊ณผ ์ œ์–ด๊ฐ€ ๋งค์šฐ ์–ด๋ ค์šด ๋„์ „๊ณผ์ œ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด์—๋Š” ์ „์ฒด ์ž‘์—…์„ ๋‹จ์ผ ์ •์ฑ…์œผ๋กœ ํ•™์Šตํ•˜๊ธฐ ์–ด๋ ค์›Œ ํƒœ์Šคํฌ๋ฅผ ๋ถ„ํ• ํ•œ ๋’ค ๊ฐ ๋‹จ๊ณ„๋ฅผ ์ˆœ์ฐจ ์‹คํ–‰ํ•˜๋Š” ์ ‘๊ทผ์ด ๊ฒ€ํ† ๋˜์—ˆ์œผ๋‚˜, ๋‚˜์ด๋ธŒํ•œ ์ˆœ์ฐจ ์‹คํ–‰์€ ์•ž ๋‹จ๊ณ„์—์„œ ๋„๋‹ฌํ•œ ์ƒํƒœ๊ฐ€ ๋‹ค์Œ ๋‹จ๊ณ„ ์ •์ฑ…์ด ํ•™์Šต๋œ ๋ถ„ํฌ๋ฅผ ๋ฒ—์–ด๋‚˜๋Š” ๊ฒฝ์šฐ ์‰ฝ๊ฒŒ ์‹คํŒจํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๋‹ค์‹œ ๋งํ•ด, ํ•œ ๋‹จ๊ณ„์˜ ์ข…๋ฃŒ ์ƒํƒœ๊ฐ€ ๋‹ค์Œ ๋‹จ๊ณ„ ์ •์ฑ…์˜ ์‹œ์ž‘ ์ƒํƒœ ๋ถ„ํฌ ๋ฐ–์— ์žˆ๋‹ค๋ฉด ์—ฐ์‡„์— ์‹คํŒจํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ƒํƒœ ๋ถ„ํฌ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ์™€ ๊ธด ํ˜ธ๋ผ์ด์ฆŒ์— ๊ฑธ์นœ ๋ณต์žกํ•œ ๋™์  ์ƒํ˜ธ์ž‘์šฉ์€ ๋‹ค๋‹จ๊ณ„ ์ •์ฑ… ์—ฐ์‡„์˜ ํ•ต์‹ฌ ๋‚œ์ œ๋กœ ์ง€๋ชฉ๋ฉ๋‹ˆ๋‹ค. Sequential Dexterity ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž, ์ •์ฑ… ์ฒด์ด๋‹(policy chaining)์„ ์œ„ํ•œ ์ƒˆ๋กœ์šด ์–‘๋ฐฉํ–ฅ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ๋ณต์ˆ˜์˜ ์† ๋™์ž‘ ์ •์ฑ…๋“ค์„ ํ•œ ๋ฐ ๋ฌถ์–ด ๋ณต์žกํ•œ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•˜๊ณ , ํ•™์Šต์— ์‚ฌ์šฉํ•˜์ง€ ์•Š์€ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด ํ˜•ํƒœ์—๋„ ์ผ๋ฐ˜ํ™”ํ•˜๋ฉฐ, ๋‚˜์•„๊ฐ€ ์ถ”๊ฐ€ ํ•™์Šต ์—†์ด ์‹ค๋ฌผ ๋กœ๋ด‡์— ์ ์šฉ(์ œ๋กœ์ƒท ์ „์ด)ํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์—ฐํ•˜์˜€์Šต๋‹ˆ๋‹ค.

2.2 ๋ฐฉ๋ฒ•๋ก  ์ƒ์„ธ ๋ถ„์„

๊ทธ๋ฆผ 1: Sequential Dexterity ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ์š”. (a) ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ๊ฐ ์„œ๋ธŒํƒœ์Šคํฌ๋ณ„ ์ •์ฑ… \pi^1, \pi^2, \pi^3, \pi^4๋ฅผ ์ˆœ์ฐจ ํ•™์Šตํ•˜๋Š” ์ˆœ๋ฐฉํ–ฅ ์ดˆ๊ธฐํ™”(ํŒŒ๋ž€์ƒ‰)์™€, ํ•™์Šต ์™„๋ฃŒ ํ›„ ์ด์ „ ์ •์ฑ…์„ ๋ฏธ์„ธ์กฐ์ •ํ•˜๋Š” ์—ญ๋ฐฉํ–ฅ ํŒŒ์ธํŠœ๋‹(๋นจ๊ฐ„์ƒ‰) ๊ณผ์ •. \rho^i๋Š” ์ •์ฑ… \pi^i์˜ ์ƒํƒœ ๋ถ„ํฌ, F^i๋Š” ์„œ๋ธŒํƒœ์Šคํฌ i์™€ i!-!1 ์‚ฌ์ด์˜ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜. (b) ์‹ค ๋กœ๋ด‡ ์ ์šฉ ์‹œ ์ •์ฑ… ์ž…๋ ฅ์œผ๋กœ 6D ๋ฌผ์ฒด ์ž์„ธ์™€ ๋กœ๋ด‡ ์ƒํƒœ๊ฐ€ ์ฃผ์–ด์ง€๋ฉฐ, ์ •์ฑ… ์„ ํƒ์€ ์ตœ๊ทผ 10์Šคํ… ์ƒํƒœ๋ฅผ ๊ณ ๋ คํ•œ F^i ์ถœ๋ ฅ์ด ์ž„๊ณ„๊ฐ’ h^i๋ฅผ ๋„˜๋Š”์ง€์— ๋”ฐ๋ผ ์ด๋ฃจ์–ด์ง„๋‹ค. ๋‹จ๊ณ„ \pi^2 Orient, \pi^3 Grasp, \pi^4 Insert๋ฅผ ์‹ค ๋กœ๋ด‡์—์„œ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ชจ์Šต.

Sequential Dexterity์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ๊ธด ์กฐ์ž‘ ์ž‘์—…์„ ๊ตฌ์„ฑํ•˜๋Š” ๊ฐ ๋‹จ๊ณ„๋ฅผ ๋…๋ฆฝ์ ์ธ ํ•˜์œ„ ์ •์ฑ…์œผ๋กœ ์ •์˜ํ•˜๊ณ  ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ํ•™์Šตํ•œ ๋’ค, ์ด๋“ค์„ ์ฒด๊ณ„์ ์œผ๋กœ ์—ฐ๊ฒฐํ•˜์—ฌ ์ „์ฒด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ๋งŒ๋“œ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋…ผ๋ฌธ์—์„œ๋Š” ์–‘๋ฐฉํ–ฅ ์ตœ์ ํ™”(bi-directional optimization)๋ผ๊ณ  ๋ถˆ๋ฆฌ๋Š” ํ•™์Šต ์ ˆ์ฐจ๋ฅผ ๋„์ž…ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์šฐ์„ , ์ˆœ๋ฐฉํ–ฅ ์ดˆ๊ธฐํ™” ๋‹จ๊ณ„์—์„œ๋Š” ๊ฐ ์„œ๋ธŒํƒœ์Šคํฌ๋งˆ๋‹ค ๊ฐœ๋ณ„ ์ •์ฑ…์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ PPO ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋“ฑ์˜ ๊ฐ•ํ™”ํ•™์Šต ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ ์„œ๋ธŒํƒœ์Šคํฌ๋ฅผ MDP๋กœ ์ •์˜ํ•˜๊ณ  ์ •์ฑ…์„ ํ›ˆ๋ จํ•˜๋ฉฐ, ์ด์ „ ๋‹จ๊ณ„์˜ ์ข…๋ฃŒ ์ƒํƒœ ๋ถ„ํฌ๋ฅผ ํ™œ์šฉํ•ด ๋‹ค์Œ ๋‹จ๊ณ„ ์ •์ฑ…์˜ ์ดˆ๊ธฐ ์ƒํƒœ๋กœ ์ƒ˜ํ”Œ๋งํ•จ์œผ๋กœ์จ ์—ฐ์‡„ ์‹œ ๋ฐœ์ƒํ•  ์ƒํƒœ ๋ถ„ํฌ๋ฅผ ๋ฏธ๋ฆฌ ํฌํ•จ์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ๊ฐ ์ •์ฑ… \pi^i๊ฐ€ ์ „ ๋‹จ๊ณ„ \pi^{i-1}๊ฐ€ ๋งŒ๋“ค์–ด๋‚ผ ๋ฒ•ํ•œ ์ƒํƒœ์—์„œ๋„ ๋™์ž‘ํ•˜๋„๋ก ์ „๋ฐฉ์œ„ ํ•™์Šต์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ดํ›„ ์—ญ๋ฐฉํ–ฅ ํŒŒ์ธํŠœ๋‹ ๋‹จ๊ณ„์—์„œ๋Š” ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜(Transition Feasibility Function, F^i)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ด์›ƒํ•œ ์ •์ฑ… ์‚ฌ์ด์˜ ์ ‘์†์„ ๋”์šฑ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค. ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜ F^i(s)๋ž€ ์„œ๋ธŒํƒœ์Šคํฌ i์˜ ์ดˆ๊ธฐ ์ƒํƒœ s์— ๋Œ€ํ•ด ํ•ด๋‹น ์ƒํƒœ์—์„œ ์ •์ฑ… \pi^i๋ฅผ ์‹œ์ž‘ํ–ˆ์„ ๋•Œ ์„ฑ๊ณต ๊ฐ€๋Šฅ์„ฑ์ด๋‚˜ ์„ฑ๊ณผ๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ๊ฐ \pi^i๋ฅผ ํ•™์Šตํ•œ ํ›„, \pi^{i-1}์˜ ์ข…๋ฃŒ ์ƒํƒœ(์ฆ‰ \pi^i์˜ ์‹œ์ž‘ ์ƒํƒœ)๋“ค๊ณผ ๊ทธ๋กœ๋ถ€ํ„ฐ \pi^i๋ฅผ ์‹คํ–‰ํ–ˆ์„ ๋•Œ ์–ป์€ ๋ˆ„์  ๋ณด์ƒ ๋˜๋Š” ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ ๋ชจ์•„์„œ F^i๋ฅผ ์ง€๋„ ํ•™์Šต์œผ๋กœ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•™์Šต๋œ F^i๋Š” ์ƒํƒœ s๊ฐ€ ๋‹ค์Œ ๋‹จ๊ณ„ ์ •์ฑ…์— ์–ผ๋งˆ๋‚˜ ์ ํ•ฉํ•œ์ง€๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ์—ญํ• ์„ ํ•˜๋ฉฐ, ๋งˆ์น˜ ๋‹ค์Œ ์ •์ฑ…์˜ ๊ฐ€์น˜ ํ•จ์ˆ˜์ฒ˜๋Ÿผ ๋™์ž‘ํ•˜์ง€๋งŒ ์ผ๋ฐ˜์ ์ธ RL ๊ฐ€์น˜ ํ•จ์ˆ˜์™€ ๋‹ฌ๋ฆฌ ํ• ์ธ๋˜์ง€ ์•Š์€ ์ตœ์ข… ์„ฑ๊ณผ์— ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ PPO ๋“ฑ์œผ๋กœ ์–ป์€ ๊ฐ€์น˜ ํ•จ์ˆ˜๋Š” ํ• ์ธ์˜ ์˜ํ–ฅ์œผ๋กœ ํ›„์† ์ •์ฑ…์˜ ์„ฑ๊ณต ๊ฐ€๋Šฅ์„ฑ์„ ์ œ๋Œ€๋กœ ํ‰๊ฐ€ํ•˜์ง€ ๋ชปํ•˜๋Š”๋ฐ, ์ €์ž๋“ค์€ ๋ณ„๋„์˜ F^i ํ•™์Šต์œผ๋กœ ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜์˜€๋‹ค๊ณ  ๋ณด๊ณ ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ F^i์—๋Š” ์ตœ๊ทผ ๋ช‡ ์Šคํ… ๋™์•ˆ์˜ ์ƒํƒœ ๋ณ€ํ™”๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ์‹œ๊ฐ„์  ๋งฅ๋ฝ๋„ ๋ฐ˜์˜ํ•˜์˜€๋Š”๋ฐ, ์ด๋ ‡๊ฒŒ ๊ณผ๊ฑฐ ์ƒํƒœ ์ด๋ ฅ์„ ํ†ตํ•ฉํ•จ์œผ๋กœ์จ ๋‹จ์ˆœ ๋‹จ์ผ ์ƒํƒœ ๊ธฐ์ค€๋ณด๋‹ค ์ „์ด ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ ์ •ํ™•ํžˆ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

์ด ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ์ด์ „ ๋‹จ๊ณ„ ์ •์ฑ…์„ ์—ญ๋ฐฉํ–ฅ์œผ๋กœ ๋ฏธ์„ธ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์ •์ฑ… \pi^{i-1}์˜ ํ•™์Šต์— F^i๋ฅผ ํ†ตํ•œ ์ถ”๊ฐ€ ๋ณด์ƒ ๋˜๋Š” ๊ทœ์ œ ํ•ญ์„ ๋ถ€์—ฌํ•˜์—ฌ, \pi^{i-1}์ด ์ข…๋ฃŒ ์‹œ ์ƒํƒœ๋ฅผ F^i ๊ธฐ์ค€์œผ๋กœ ๋†’์€ ์ „์ด ์ ์ˆ˜๋ฅผ ์–ป๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์„œ๋ธŒํƒœ์Šคํฌ 2 (Orient)์˜ ์ „์ด ํ•จ์ˆ˜ F^3๊ฐ€ โ€œ์ด ์ƒํƒœ์—์„œ ์„œ๋ธŒํƒœ์Šคํฌ 3 (Grasp)์ด ์„ฑ๊ณตํ•  ๊ฐ€๋Šฅ์„ฑโ€์„ ๋‚˜ํƒ€๋‚ธ๋‹ค๋ฉด, \pi^2์˜ ์ข…๋ฃŒ ์ƒํƒœ๊ฐ€ F^3 ์ƒ ๋†’์€ ์ ์ˆ˜๋ฅผ ๋ฐ›๋„๋ก \pi^2๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๋Š” ์‹์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฐ ํ•˜์œ„ ์ •์ฑ…์˜ ์ข…๋ฃŒ ์ƒํƒœ ๋ถ„ํฌ๋ฅผ ๋‹ค์Œ ์ •์ฑ…์˜ ์ดˆ๊ธฐ ์ƒํƒœ ๋ถ„ํฌ์™€ ์ตœ๋Œ€ํ•œ ์ผ์น˜์‹œํ‚ค๋ฉฐ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ •์ฑ… ์—ฐ์‡„์˜ ์„ฑ๊ณต๋ฅ ์„ ๊ทน๋Œ€ํ™”ํ•ฉ๋‹ˆ๋‹ค. Lee ๋“ฑ(2021)์˜ T-STAR์™€ ๊ฐ™์€ ๊ธฐ์กด ๊ธฐ์ˆ  ์—ฐ์‡„ ๊ธฐ๋ฒ•๋“ค์ด ์ข…๋ฃŒ ์ƒํƒœ ๋ถ„ํฌ๋ฅผ ์ค„์ด๋Š” ๋Œ€ํ•ญํ›ˆ๋ จ(์–ด๋“œ๋ฒ„์„œ๋ฆฌ) ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•œ ๊ฒƒ๊ณผ ๋Œ€๋น„๋˜๋ฉฐ, Sequential Dexterity๋Š” ๋ณด๋‹ค ์ง์ ‘์ ์œผ๋กœ ํ›„์† ์„ฑ๊ณต ๊ฐ€๋Šฅ์„ฑ์„ ์˜ˆ์ธกํ•˜์—ฌ ํ™œ์šฉํ•œ๋‹ค๋Š” ์ฐจ๋ณ„์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ์ •์ฑ… ์ฒด์ด๋‹ ์‹คํ–‰ ๋‹จ๊ณ„์—์„œ ์ค‘์š”ํ•œ ๊ฒƒ์ด ์ž์œจ์ ์ธ ์ •์ฑ… ์ „ํ™˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ž…๋‹ˆ๋‹ค. ๊ณ ์ •๋œ ๋‹จ๊ณ„ ์ˆœ์„œ๋กœ ํ•œ ๋ฒˆ์”ฉ๋งŒ ์ •์ฑ…์„ ์‹คํ–‰ํ•˜๋Š” ๋Œ€์‹ , ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ ์ ˆํ•œ ์ •์ฑ…์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ ๋กœ๋ด‡์ด ์ž‘์—… ๋„์ค‘ ๋งค ์‹œ์ ๋งˆ๋‹ค ํ˜„์žฌ ์ƒํƒœ๋ฅผ ๊ฐ€์ง€๊ณ  ๊ฐ ๋‹ค์Œ ๊ฐ€๋Šฅ ๋‹จ๊ณ„๋“ค์˜ F ๊ฐ’์„ ํ‰๊ฐ€ํ•˜๊ณ , ์ž„๊ณ„๊ฐ’์„ ๋„˜๊ฒจ ์‹คํ–‰ ์ค€๋น„๊ฐ€ ๋œ ๊ฒƒ์œผ๋กœ ํŒ์ •๋œ ๊ฐ€์žฅ ํ›„์ˆœ์œ„ ๋‹จ๊ณ„๋ถ€ํ„ฐ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋ธ”๋ก ์Œ“๊ธฐ ์ž‘์—…์—์„œ, ํ˜„์žฌ ์ƒํƒœ์—์„œ ์‚ฝ์ž… ๋‹จ๊ณ„๊ฐ€ ๋ฐ”๋กœ ๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ํŒ๋‹จ๋˜๋ฉด (์˜ˆ: ๋ธ”๋ก์„ ์ด๋ฏธ ์†์— ์ฅ๊ณ  ์žˆ๊ณ  ์ž์„ธ๋„ ๋งž๋‹ค๋ฉด) ์ค‘๊ฐ„ ๋‹จ๊ณ„๋ฅผ ๊ฑด๋„ˆ๋›ฐ๊ณ  ์‚ฝ์ž…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋Œ€๋กœ, ๋งŒ์•ฝ ํ˜„์žฌ ๋‹จ๊ณ„ ์ˆ˜ํ–‰์ด ์ž˜๋ชป๋˜์–ด ๋ชฉํ‘œ ์ƒํƒœ์— ๋„๋‹ฌํ•˜์ง€ ๋ชปํ•˜๋”๋ผ๋„, F๊ฐ€ ์•Œ๋ ค์ฃผ๋Š” ๋ฐ”์— ๋”ฐ๋ผ ์ด์ „ ๋‹จ๊ณ„๋กœ ๋˜๋Œ์•„๊ฐ€ ๊ต์ •ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ €์ž๋“ค์€ ์ •์ฑ… ์ „ํ™˜์„ ์—ญ์ˆœ์œผ๋กœ ํƒ์ƒ‰ํ•˜๋Š” ๋ฐฉ์‹์„ ์ทจํ•˜๋Š”๋ฐ, ์‚ฝ์ž…(\pi^4)โ†’ํŒŒ์ง€(\pi^3)โ†’์ •๋ ฌ(\pi^2) ์ˆœ์œผ๋กœ ๊ฐ๊ฐ์˜ F ๊ฐ’์„ ํ™•์ธํ•ด ๊ฐ€๋Šฅํ•œ ๊ฐ€์žฅ ์ง„์ „๋œ ๋‹จ๊ณ„๋กœ ์ ํ”„ํ•˜๊ฑฐ๋‚˜, ๋ชจ๋“  F ์ถœ๋ ฅ์ด ๊ธฐ์ค€ ๋ฏธ๋งŒ์ด๋ฉด ์ฒ˜์Œ๋ถ€ํ„ฐ ํƒ์ƒ‰(\pi^1)์„ ๋‹ค์‹œ ์‹คํ–‰ํ•˜๋„๋ก ์„ค๊ณ„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋™์  ์Šค์œ„์นญ์€ ์‹คํŒจ ๋ณต๊ตฌ์™€ ๋ถˆํ•„์š”ํ•œ ๋‹จ๊ณ„ ์ƒ๋žต์„ ๋ชจ๋‘ ๊ฐ€๋Šฅ์ผ€ ํ•˜์—ฌ ์ฒด์ด๋‹์˜ ๊ฐ•์ธ์„ฑ์„ ํฌ๊ฒŒ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€, Sequential Dexterity๋Š” ํ•™์Šต ๋‹จ๊ณ„์—์„œ ๊ฐ ์ •์ฑ…์ด ์—ฐ์‡„์— ์ ํ•ฉํ•˜๋„๋ก ์–‘๋ฐฉํ–ฅ์œผ๋กœ ์ตœ์ ํ™”๋˜๊ณ , ์‹คํ–‰ ๋‹จ๊ณ„์—์„œ๋Š” ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜ ๊ธฐ๋ฐ˜์˜ ์ง€๋Šฅํ˜• ์ „ํ™˜์„ ํ†ตํ•ด ๊ธด ๊ณ„ํš์„ ๊ฒฌ๊ณ ํ•˜๊ฒŒ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค.

๊ฐ ์„œ๋ธŒํƒœ์Šคํฌ์˜ ๋ณด์ƒ ์„ค๊ณ„๋Š” ํ•ด๋‹น ๋‹จ๊ณ„์˜ ๋ชฉํ‘œ ์™„๋ฃŒ์— ์ค‘์ ์„ ๋‘๊ณ  ์ด๋ฃจ์–ด์กŒ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด โ€œํƒ์ƒ‰โ€ ์ •์ฑ…์—๋Š” ์˜ฌ๋ฐ”๋ฅธ ๋ธ”๋ก์„ ์‹๋ณ„ํ•˜๊ฑฐ๋‚˜ ์ ‘๊ทผํ–ˆ์„ ๋•Œ์˜ ๋ณด์ƒ, โ€œ์ •๋ ฌโ€ ์ •์ฑ…์—๋Š” ๋ฌผ์ฒด์˜ ์ž์„ธ๋ฅผ ๋ชฉํ‘œ ์ž์„ธ์— ๊ฐ€๊น๊ฒŒ ๋งŒ๋“ค์ˆ˜๋ก ๋ถ€์—ฌ๋˜๋Š” ๋ณด์ƒ, โ€œํŒŒ์ง€โ€์—๋Š” ์„ฑ๊ณต์ ์œผ๋กœ ๋ธ”๋ก์„ ์ฅ์—ˆ์„ ๋•Œ์˜ ๋ณด์ƒ ๋“ฑ์ด ์ฃผ์–ด์ง‘๋‹ˆ๋‹ค. Sparse reward(ํฌ์†Œ ๋ณด์ƒ)๋ณด๋‹ค shaping ๋ณด์ƒ์„ ์ ์ ˆํžˆ ์ถ”๊ฐ€ํ•˜์—ฌ ํ•™์Šต์„ ์œ ๋„ํ–ˆ์„ ๊ฒƒ์œผ๋กœ ์ถ”์ธก๋˜๋ฉฐ, ์ตœ์ข… ๋‹จ๊ณ„์ธ โ€œ์‚ฝ์ž…โ€๋„ ๋ธ”๋ก์ด ๋ชฉํ‘œ ์œ„์น˜์— ์•ˆ์ฐฉํ•˜๋ฉด ๋ณด์ƒ์„ ์–ป๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์—ญ๋ฐฉํ–ฅ ํŒŒ์ธํŠœ๋‹ ์‹œ์—๋Š” ์•ž์„œ ์–ธ๊ธ‰ํ•œ ๋Œ€๋กœ F^i์˜ ์ถœ๋ ฅ์„ ์ผ์ข…์˜ ์ถ”๊ฐ€ ๋ณด์ƒ์œผ๋กœ ์ทจ๊ธ‰ํ•˜์—ฌ ์ด์ „ ์ •์ฑ…์˜ ์ข…๋ฃŒ ์ƒํƒœ๋ฅผ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ ์‚ฌ์šฉํ•˜์˜€๊ณ , ์ด๋Š” ๊ธฐ์กด ๋ณด์ƒ๊ณผ ํ•ฉ์ณ์ ธ ์—์ด์ „ํŠธ๊ฐ€ ๋‹ค์Œ ๋‹จ๊ณ„์˜ ์„ฑ๊ณต๊นŒ์ง€ ์—ผ๋‘์— ๋‘” ํ–‰๋™์„ ํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณด์ƒ ์ฒด๊ณ„์™€ ์ „์ด ํ•จ์ˆ˜ ํ™œ์šฉ์„ ํ†ตํ•ด ๋ถ€๋ถ„ ์ตœ์ ํ•ด์— ๋จธ๋ฌด๋ฅด๊ธฐ ์‰ฌ์šด ๊ฐœ๋ณ„ ์ •์ฑ…๋“ค์„ ์ „์ฒด ์ž‘์—…์˜ ์„ฑ๊ณต์ด๋ผ๋Š” ๊ธ€๋กœ๋ฒŒ ๋ชฉํ‘œ์— ์ˆ˜๋ ด์‹œํ‚ค๋„๋ก ์œ ๋„ํ•œ ๊ฒƒ์ด ๋ณธ ๋ฐฉ๋ฒ•๋ก ์˜ ํŠน์ง•์ž…๋‹ˆ๋‹ค.

2.3 ์‹คํ—˜ ์„ค์ • ๋ฐ ๋ฒค์น˜๋งˆํฌ

๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ์ œ์•ˆํ•œ Sequential Dexterity ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์‹คํ—˜๊ณผ ์‹ค ๋กœ๋ด‡ ์‹คํ—˜์„ ํ†ตํ•ด ๊ฒ€์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ๋œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋Š” ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์„ ์ง€์›ํ•˜๋Š” Isaac Gym์œผ๋กœ, ๊ฐ ์„œ๋ธŒํƒœ์Šคํฌ ์ •์ฑ…์„ ํ•™์Šตํ•  ๋•Œ ์ตœ๋Œ€ 1024๊ฐœ์˜ ํ™˜๊ฒฝ์—์„œ ๋ณ‘๋ ฌ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•จ์œผ๋กœ์จ ํ•™์Šต ํšจ์œจ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ์‹คํ—˜์€ ๋‘ ๊ฐ€์ง€ ๋Œ€ํ‘œ์ ์ธ ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘ ๊ณผ์ œ์— ๋Œ€ํ•ด ์ด๋ฃจ์–ด์กŒ์œผ๋ฉฐ, ๊ฐ ๊ณผ์ œ์— ๋Œ€ํ•ด ์ œ์•ˆ ๊ธฐ๋ฒ•์˜ ์„ฑ๋Šฅ์„ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค๊ณผ ๋น„๊ต ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ๊ณผ์ œ 1: ๋ธ”๋ก ์กฐ๋ฆฝ (Building Blocks) โ€“ ๋‹ค์–‘ํ•œ ์ƒ‰์ƒ๊ณผ ํฌ๊ธฐ์˜ ๋ธ”๋ก๋“ค์ด ์„ž์—ฌ์žˆ๋Š” ์ƒ์ž์—์„œ ์ง€์ •๋œ ๋ธ”๋ก์„ ์ฐพ์•„ (ํƒ์ƒ‰), ์†๊ฐ€๋ฝ์„ ์ด์šฉํ•ด ์ ์ ˆํ•œ ์ž์„ธ๋กœ ์ •๋ ฌํ•œ ํ›„, ๋ธ”๋ก์„ ํŒŒ์ง€ํ•˜์—ฌ ๋“ค์–ด ์˜ฌ๋ฆฌ๊ณ , ๋ชฉํ‘œ ๊ตฌ์กฐ๋ฌผ์˜ ํ•ด๋‹น ์œ„์น˜์— ์‚ฝ์ž…ํ•˜๋Š” ์ผ๋ จ์˜ ์ž‘์—…์ž…๋‹ˆ๋‹ค. ์ด ๊ณผ์ œ๋Š” Mega Bloks ์žฅ๋‚œ๊ฐ์„ ์‚ฌ์šฉํ•œ ๊ฐ„์ด ์กฐ๋ฆฝ ์ž‘์—…์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ „์ฒด ๊ตฌ์กฐ๋ฅผ ์™„์„ฑํ•˜๊ธฐ ์œ„ํ•ด ์ด๋Ÿฌํ•œ ๋„ค ๊ฐ€์ง€ ์„œ๋ธŒํƒœ์Šคํฌ๋ฅผ ๋ธ”๋ก ๊ฐœ์ˆ˜๋งŒํผ ๋ฐ˜๋ณต ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋Š” ๋ณตํ•ฉ ์žฅ๊ธฐ๊ณผ์—…์ž…๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ๋Š” ๋ธ”๋ก๋“ค์ด ๋ฌด์ž‘์œ„๋กœ ์Œ“์—ฌ์žˆ๊ณ  ๋กœ๋ด‡์€ ์†๋ชฉ ์นด๋ฉ”๋ผ ๋“ฑ์˜ ๊ฐ๊ฐ์„ ํ†ตํ•ด ๋ธ”๋ก์„ ์ธ์‹ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์‹คํ—˜์— ์‚ฌ์šฉ๋œ ๋กœ๋ด‡์€ ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์†(4-finger dexterous hand)์„ ์žฅ์ฐฉํ•œ ๋กœ๋ด‡ ํŒ”๋กœ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์„ ๊ทธ๋Œ€๋กœ ์ ์šฉํ•˜์—ฌ ์‹ค์ œ ํ”Œ๋ผ์Šคํ‹ฑ ๋ธ”๋ก ์กฐ๋ฆฝ์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹ค ๋กœ๋ด‡ ํ™˜๊ฒฝ์—์„œ๋Š” ์ƒ๋‹จ์— ์žฅ์ฐฉ๋œ ์นด๋ฉ”๋ผ๋กœ ํ…Œ์ด๋ธ” ์œ„ ๋ธ”๋ก๋“ค์˜ ๋Œ€๋žต์  ์œ„์น˜๋ฅผ ํŒŒ์•…ํ•˜๊ณ , ์†๋ชฉ์— ์žฅ์ฐฉ๋œ RGB-D ์นด๋ฉ”๋ผ ์˜์ƒ์—์„œ ๋ชฉํ‘œ ๋ธ”๋ก์„ ๋ถ„ํ• (segmentation) ๋ฐ ์ถ”์ ํ•˜์—ฌ ์‹ค์‹œ๊ฐ„ 6D ์ž์„ธ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋น„์ „ ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์ •๋ณด๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ •์ฑ…์— ์ž…๋ ฅํ•˜์—ฌ ๋กœ๋ด‡์ด ๋ธ”๋ก์„ ์ฐพ์•„ ์ง‘์„ ์ˆ˜ ์žˆ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ๋ธ”๋ก์„ ํ™ˆ์— ๋ผ์›Œ ๋„ฃ๋Š” ์‚ฝ์ž… ๋™์ž‘์˜ ์•„์ฃผ ์„ธ๋ฐ€ํ•œ ๋ถ€๋ถ„(๋ธ”๋ก์„ ์™„์ „ํžˆ ๋ˆŒ๋Ÿฌ ๋ผ์šฐ๋Š” ๊ณผ์ •)์€ ์ ‘์ด‰ ๋ชจ๋ธ ํ•œ๊ณ„๋กœ ๊ตฌํ˜„์ด ์–ด๋ ค์› ๊ธฐ ๋•Œ๋ฌธ์—, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์‚ฝ์ž… ์ •์ฑ…์ด ๋ธ”๋ก์„ ๋ชฉํ‘œ ์œ„์น˜์— ๋Œ€๋žต ๋†“๋Š” ๊ฒƒ์œผ๋กœ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์‹ค ๋กœ๋ด‡ ์‹คํ—˜์—์„œ๋Š” ๋ธ”๋ก์„ ์ œ์ž๋ฆฌ์— ์˜ฌ๋ ค๋†“๋Š” ๊ฒƒ๊นŒ์ง€๋ฅผ ํ•™์Šต๋œ ์ •์ฑ…์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๊ณ , ๋งˆ์ง€๋ง‰์— ๋กœ๋ด‡ ํŒ”๋กœ ๋ธ”๋ก์„ ์•„๋ž˜๋กœ ๋ˆŒ๋Ÿฌ ์™„์ „ํžˆ ๋ผ์šฐ๋Š” ๋™์ž‘์€ ์Šคํฌ๋ฆฝํŠธ๋กœ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์‹ค์ œ ์กฐ๋ฆฝ์„ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ถ€๋ถ„์€ ๋ณธ ๋ฐฉ๋ฒ•์˜ ๋ฌผ๋ฆฌ ํ•œ๊ณ„๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•œ ์กฐ์น˜๋กœ, ์ดํ›„ ํ•œ๊ณ„์ ์—์„œ ์ถ”๊ฐ€ ๋…ผ์˜๋ฉ๋‹ˆ๋‹ค.

  • ๊ณผ์ œ 2: ๊ณต๊ตฌ ์ž์„ธ ๋งž์ถ”๊ธฐ (Tool Positioning) โ€“ ํ…Œ์ด๋ธ” ์œ„์— ์ž„์˜ ์ž์„ธ๋กœ ๋†“์ธ ๊ณต๊ตฌ๋ฅผ ํŒŒ์ง€ํ•˜์—ฌ ๋“ค์–ด์˜ฌ๋ฆฐ ๋’ค, ์‚ฌ์šฉํ•˜๊ธฐ ํŽธํ•œ ์ค€๋น„ ์ž์„ธ๋กœ ์žฌ์ •๋ ฌ(reorient)ํ•˜๋Š” ์ž‘์—…์ž…๋‹ˆ๋‹ค. ์‹คํ—˜์—์„œ๋Š” ๋ง์น˜(hammer)๋ฅผ ๋Œ€ํ‘œ์ ์ธ ๊ณต๊ตฌ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ํ•™์Šตํ•˜์˜€๊ณ , ์ดˆ๊ธฐ์—๋Š” ๋ง์น˜๊ฐ€ ๋ฐ”๋‹ฅ์— ์•„๋ฌด๋ ‡๊ฒŒ๋‚˜ ๋†“์—ฌ ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡ ์†์ด ๋ง์น˜๋ฅผ ์ง‘์–ด ๋“œ๋Š” ๋™์ž‘(Grasp)์ด 1๋‹จ๊ณ„, ์ด์–ด์„œ ๊ณต๊ตฌ๋ฅผ ํšŒ์ „์‹œ์ผœ ์†์žก์ด ๋ถ€๋ถ„์ด ์•„๋ž˜๋กœ ํ–ฅํ•˜๋„๋ก ์„ธ์šฐ๋Š” ๋™์ž‘(Orient)์ด 2๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ œ๋Š” ๋‘ ๋‹จ๊ณ„์˜ ์ฒด์ด๋‹์ด์ง€๋งŒ, ํ•ต์‹ฌ์€ ์ฒซ ํŒŒ์ง€์˜ ๋ฐฉ์‹์ด ๋‘ ๋ฒˆ์งธ ๋‹จ๊ณ„์˜ ๋‚œ์ด๋„์— ํฐ ์˜ํ–ฅ์„ ์ค€๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ๋ง์น˜๋ฅผ ์—‰๋šฑํ•œ ๊ฐ๋„๋กœ ์ง‘์œผ๋ฉด ํšŒ์ „ ๋‹จ๊ณ„์—์„œ ๊ท ํ˜•์„ ์žก๊ธฐ ์–ด๋ ต๊ฑฐ๋‚˜ ์ถฉ๋Œ์ด ๋ฐœ์ƒํ•ด ์‹คํŒจํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ดˆ๊ธฐ ํŒŒ์ง€ ๋‹จ๊ณ„๋ถ€ํ„ฐ ์ „์ฒด ๊ณผ์—…์„ ๊ณ ๋ คํ•œ ์ตœ์ ์˜ ๋ฐฉ์‹์„ ์ทจํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ œ ์—ญ์‹œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ํ•™์Šตํ•œ ํ›„ ์‹ค์ œ ๋กœ๋ด‡์œผ๋กœ ์ œ๋กœ์ƒท ๊ฒ€์ฆ๋˜์—ˆ์œผ๋ฉฐ, ์ถ”๊ฐ€๋กœ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ ํ‰๊ฐ€๋ฅผ ์œ„ํ•ด ํ•™์Šต์— ์‚ฌ์šฉํ•˜์ง€ ์•Š์€ ๊ณต๊ตฌ(์ฃผ๊ฑฑ, ์ˆŸ๊ฐ€๋ฝ ๋“ฑ์˜ ๋„๊ตฌ)๋ฅผ ๋Œ€์ƒ์œผ๋กœ๋„ ์‹คํ—˜์ด ์ˆ˜ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ฆผ 2: ์‹คํ—˜ ํ™˜๊ฒฝ ๋ฐ ๋น„๊ต. (a) ๋ธ”๋ก ์กฐ๋ฆฝ ๊ณผ์ œ โ€“ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ(์™ผ์ชฝ)์™€ ์‹ค์ œ ๋กœ๋ด‡(์˜ค๋ฅธ์ชฝ)์˜ ์ž‘์—… ํ™˜๊ฒฝ. ๋กœ๋ด‡ ํŒ” ๋์— 4์†๊ฐ€๋ฝ ๋กœ๋ด‡ ํ•ธ๋“œ์™€ ์†๋ชฉ ์นด๋ฉ”๋ผ(๋นจ๊ฐ„ ์ƒ์ž), ์ƒ๋‹จ์— ์ „์—ญ ์นด๋ฉ”๋ผ(ํŒŒ๋ž€ ์ƒ์ž)๊ฐ€ ๋ฐฐ์น˜๋˜์–ด ๋ธ”๋ก์„ ํƒ์ƒ‰ํ•˜๊ณ  ์กฐ๋ฆฝํ•œ๋‹ค. (b) ๊ณต๊ตฌ ์ž์„ธ ๋งž์ถ”๊ธฐ ๊ณผ์ œ โ€“ ์ดˆ๊ธฐ ์ƒํƒœ์— ๋†“์ธ ๋ง์น˜๋ฅผ ๋Œ€์ƒ์œผ๋กœ, Baseline(๊ธฐ์กด ์ˆœ์ฐจ ์‹คํ–‰ ๋ฐฉ๋ฒ•) vs Ours(์ œ์•ˆ ๋ฐฉ๋ฒ•)์˜ ๋น„๊ต ์˜ˆ์‹œ. Baseline์€ 1๋‹จ๊ณ„ ํŒŒ์ง€ ์ดํ›„ ๋ง์น˜๋ฅผ ๋น„์Šค๋“ฌํžˆ ์žก์•„ 2๋‹จ๊ณ„ ์ •๋ ฌ์— ์‹คํŒจ(๋นจ๊ฐ„ X)ํ•˜์ง€๋งŒ, ์ œ์•ˆ ๋ฐฉ๋ฒ•์€ ์ฒซ ํŒŒ์ง€๋ถ€ํ„ฐ ๊ฐ๋„๋ฅผ ๊ณ ๋ คํ•ด ์žก์Œ์œผ๋กœ์จ ์ตœ์ข… ์ •๋ ฌ์— ์„ฑ๊ณต(๋…น์ƒ‰ ์ฒดํฌ)ํ•œ๋‹ค.

๋ฒค์น˜๋งˆํฌ ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋น„๊ต ๋Œ€์ƒ์ด ์„ ์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ, ๊ฐ ์„œ๋ธŒํƒœ์Šคํฌ๋ฅผ ๊ฐœ๋ณ„์ ์œผ๋กœ ํ•™์Šตํ•œ ํ›„ ์•„๋ฌด ์กฐ์ • ์—†์ด ์ˆœ์„œ๋Œ€๋กœ ์‹คํ–‰ํ•˜๋Š” ๊ธฐ๋ณธ ์ •์ฑ… ์—ฐ์‡„ ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ  ๋‹จ์ˆœํžˆ ์ •ํ•ด์ง„ ์ˆœ์„œ๋กœ ํ•œ ๋ฒˆ์”ฉ ์ •์ฑ…์„ ์ ์šฉํ•˜๋Š” ๊ฒƒ์œผ๋กœ, ์ „์ด ๋ถ„ํฌ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ๋ฅผ ๊ทธ๋Œ€๋กœ ๊ฐ€์ง€๋Š” baseline์ž…๋‹ˆ๋‹ค. ๋‘˜์งธ, Lee ๋“ฑ(2021)์ด ์ œ์•ˆํ•œ T-STAR ๊ธฐ๋ฒ• ๋“ฑ ๊ธฐ์กด ๊ธฐ์ˆ  ์ฒด์ด๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ์˜ ๋น„๊ต๊ฐ€ ์ˆ˜ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค. T-STAR๋Š” ์ข…๋ฃŒ ์ƒํƒœ ๋ถ„ํฌ๋ฅผ ์ œํ•œํ•˜๊ธฐ ์œ„ํ•ด ์ ๋Œ€์  ํ•™์Šต์„ ํ™œ์šฉํ–ˆ๋˜ ์„ ํ–‰ ์—ฐ๊ตฌ๋กœ, ๋ณธ ๋…ผ๋ฌธ์˜ ๋ฌธ์ œ ์„ค์ •(ํŠนํžˆ ๋‹ค์ง€ ๋กœ๋ด‡ ์† ์‚ฌ์šฉ)๊ณผ๋Š” ์ฐจ์ด๊ฐ€ ์žˆ์ง€๋งŒ ์•„์ด๋””์–ด์ƒ ์ธ์ ‘ํ•œ ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. ์…‹์งธ, V-Chain์ด๋ผ๊ณ  ๋ช…๋ช…๋œ ๋น„๊ต ๋ฐฉ๋ฒ•์€ ๋‹ค์Œ ๋‹จ๊ณ„ ์ •์ฑ…์˜ RL ๊ฐ€์น˜ํ•จ์ˆ˜๋ฅผ ์ „์ด ํ‰๊ฐ€์— ํ™œ์šฉํ•˜์—ฌ ์ด์ „ ์ •์ฑ…๋“ค์„ ํŒŒ์ธํŠœ๋‹ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ, ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ์“ฐ๋Š” ๋Œ€์‹  PPO๋กœ ํ•™์Šต๋œ ๊ฐ€์น˜๋ง์œผ๋กœ ์—ฐ์‡„๋ฅผ ์‹œ๋„ํ•œ ๊ฒฝ์šฐ์ž…๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ์ด๋ฅผ ํ†ตํ•ด ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜์˜ ์ด์ ์„ ๊ฒ€์ฆํ•˜๊ณ ์ž ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋„ท์งธ, Ours w/o temporal์ด๋ผ๊ณ  ํ•˜๋Š” ๋ณ€ํ˜• ๋ชจ๋ธ์€ ์ œ์•ˆํ•œ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜์—์„œ ์‹œ๊ฐ„์  ์ด๋ ฅ(์ƒํƒœ ์‹œํ€€์Šค) ์ž…๋ ฅ์„ ์ œ์™ธํ•˜๊ณ  ํ˜„์žฌ ์ƒํƒœ๋งŒ์œผ๋กœ ์ „์ด ํŒ์ •์„ ํ•˜๋„๋ก ํ•œ ๋ฒ„์ „์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ „์ด ํ•จ์ˆ˜์— ์‹œ๊ฐ„ ์ •๋ณด๋ฅผ ํฌํ•จ์‹œํ‚ค๋Š” ๊ฒƒ์ด ์„ฑ๋Šฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ํ™•์ธํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ๋ณธ ๋…ผ๋ฌธ์˜ Ours (์ œ์•ˆ ๊ธฐ๋ฒ•)์€ ์–‘๋ฐฉํ–ฅ ์ตœ์ ํ™” + ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜ + ์ž์œจ ์Šค์œ„์นญ์˜ ํ’€์…‹์„ ์‚ฌ์šฉํ•œ ์™„์ „ํ•œ Sequential Dexterity ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค.

ํ‰๊ฐ€ ์ง€ํ‘œ๋กœ๋Š” ๊ฐ ๊ณผ์ œ์—์„œ ์ตœ์ข… ๋ชฉํ‘œ๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ๋‹ฌ์„ฑํ–ˆ๋Š”์ง€์˜ ์„ฑ๊ณต๋ฅ ์ด ์ฃผ์š”ํ•˜๊ฒŒ ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ธ”๋ก ์กฐ๋ฆฝ์˜ ๊ฒฝ์šฐ ์ฃผ์–ด์ง„ ๊ตฌ์กฐ๋ฌผ์„ ๋ชจ๋‘ ์™„์„ฑํ•˜๋Š” ๋ฐ ์„ฑ๊ณตํ•œ ์‹คํ—˜ ์—ํ”ผ์†Œ๋“œ ๋น„์œจ๋กœ ์ธก์ •๋˜๋ฉฐ, ๊ณต๊ตฌ ์ž์„ธ ๋งž์ถ”๊ธฐ๋Š” ๊ณต๊ตฌ๋ฅผ ๋ฐ”๋ฅธ ์ž์„ธ๋กœ ์„ธ์›Œ์„œ ์•ˆ์ •์ ์œผ๋กœ ์œ ์ง€ํ•˜๋Š” ๋ฐ ์„ฑ๊ณตํ•œ ๋น„์œจ๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ ์„œ๋ธŒํƒœ์Šคํฌ๋ณ„ ๋‹จ๊ณ„ ์„ฑ๊ณต๋ฅ ์ด๋‚˜ ์ˆ˜ํ–‰ ์‹œ๊ฐ„, ์ •์ฑ… ์ „ํ™˜ ํšŸ์ˆ˜ ๋“ฑ๋„ ๋ถ€๊ฐ€์ ์œผ๋กœ ๊ด€์ฐฐ๋˜์—ˆ์œผ๋‚˜, ๊ฐ€์žฅ ์ค‘์š”ํ•œ ํ‰๊ฐ€์ง€ํ‘œ๋Š” ์ „์ฒด ์ž‘์—…์˜ ์™„์ˆ˜ ์—ฌ๋ถ€์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์ •์„ฑ์  ํ‰๊ฐ€๋กœ ๊ฐ ๊ณผ์ •์˜ ํ–‰๋™ ๊ถค์ ๊ณผ ์ตœ์ข… ์ƒํƒœ๋ฅผ ๋น„๊ตํ•˜๊ณ , ์ •์ฑ… ์ „ํ™˜ ์ „๋žต์— ๋”ฐ๋ฅธ ์„ฑ๊ณต/์‹คํŒจ ์‚ฌ๋ก€๋ฅผ ๋ถ„์„ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜ํ™” ํ‰๊ฐ€๋กœ๋Š”, ์•ž์„œ ์–ธ๊ธ‰ํ•œ ๋Œ€๋กœ ๊ณต๊ตฌ ๊ณผ์ œ์—์„œ๋Š” ํ•™์Šต ์‹œ ๋ณด์ง€ ๋ชปํ•œ ์ƒˆ๋กœ์šด ๋„๊ตฌ(์˜ˆ: ์ฃผ๊ฑฑ, ์ˆŸ๊ฐ€๋ฝ)๋ฅผ ํˆฌ์ž…ํ•˜์—ฌ ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ ์ธก์ •ํ•˜์˜€๊ณ , ๋ธ”๋ก ์กฐ๋ฆฝ ๊ณผ์ œ์—์„œ๋Š” ์ƒˆ๋กœ์šด ๊ตฌ์กฐ ์กฐ๋ฆฝ(์˜ˆ: ๋‹ค๋ฅธ ํ˜•ํƒœ์˜ ๋ธ”๋ก ์กฐํ•ฉ ๊ตฌ์กฐ)์— ๋Œ€ํ•œ ์ ์šฉ์„ ์‚ดํŽด๋ณด์•˜์Šต๋‹ˆ๋‹ค. ๋์œผ๋กœ, ์‹ค์ œ ๋กœ๋ด‡ ๊ฒ€์ฆ์—์„œ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์„ ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉํ•˜์—ฌ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ํ•˜๊ณ , ๊ทธ ์„ฑ๊ณต ์‚ฌ๋ก€ ์˜์ƒ๊ณผ ๋นˆ๋„๋ฅผ ๋ณด๊ณ ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์„ฑ๊ณต๋ฅ ์˜ ๊ฒฝ์šฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๋งŒํผ ๋‹ค์ˆ˜ ๋ฐ˜๋ณตํ•˜์ง€๋Š” ๋ชปํ–ˆ์ง€๋งŒ, ๋ช‡ ์ฐจ๋ก€ ์‹œ์—ฐ์—์„œ ์ง€์†์ ์œผ๋กœ ์ž‘์—… ์™„์ˆ˜์— ์„ฑ๊ณตํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ ์ œ๋กœ์ƒท ํ•™์Šต ์ „์ด์˜ ๊ฐ€๋Šฅ์„ฑ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

2.4 ๊ฒฐ๊ณผ ๋ถ„์„

์‹คํ—˜ ๊ฒฐ๊ณผ, Sequential Dexterity ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ œ์•ˆํ•œ ์š”์†Œ๋“ค์ด ๋ชจ๋‘ ๊ฒฐํ•ฉ๋˜์—ˆ์„ ๋•Œ ๊ธฐ์กด ๋ฐฉ๋ฒ• ๋Œ€๋น„ ํ˜„์ €ํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋ฃจ๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ „์ฒด ์ž‘์—… ์„ฑ๊ณต๋ฅ  ์ง€ํ‘œ์—์„œ ๋‘ ๊ณผ์ œ ๋ชจ๋‘ ์œ ์˜๋ฏธํ•œ ๊ฐœ์„ ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

๋จผ์ € ๋ธ”๋ก ์กฐ๋ฆฝ ๊ณผ์ œ๋ฅผ ์‚ดํŽด๋ณด๋ฉด, ์ œ์•ˆ ๊ธฐ๋ฒ•์€ ์•ฝ 80% ์ด์ƒ์˜ ์ตœ์ข… ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ•˜์—ฌ, ๊ธฐ๋ณธ ์ˆœ์ฐจ ์‹คํ–‰ ๋ฐฉ์‹(์ „์ด ์ตœ์ ํ™” ์—†์ด ๊ฐ ๋‹จ๊ณ„ ํ•œ ๋ฒˆ์”ฉ ์ˆ˜ํ–‰) ๋Œ€๋น„ ์•ฝ 30%ํฌ์ธํŠธ ์ด์ƒ ์ƒ์Šนํ•œ ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, baseline์˜ ๊ฒฝ์šฐ ์—ฌ๋Ÿฌ ๋ฒˆ์˜ ์‹œํ–‰ ์ค‘ ์ ˆ๋ฐ˜๋„ ์•ˆ ๋˜๋Š” ์—ํ”ผ์†Œ๋“œ์—์„œ๋งŒ ๊ตฌ์กฐ ์™„์„ฑ์— ์„ฑ๊ณตํ•œ ๋ฐ˜๋ฉด, Sequential Dexterity๋ฅผ ์ ์šฉํ•˜๋ฉด 10๋ฒˆ ์ค‘ 8๋ฒˆ ์ด์ƒ์€ ๋กœ๋ด‡์ด ๋ชจ๋“  ๋ธ”๋ก์„ ์ œ์ž๋ฆฌ์— ์ •ํ™•ํžˆ ์Œ“์•„์˜ฌ๋ฆด ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๊ณต๊ตฌ ์ž์„ธ ๋งž์ถ”๊ธฐ ๊ณผ์ œ์—์„œ๋„ ์œ ์‚ฌํ•œ ๊ฒฝํ–ฅ์œผ๋กœ, ์ œ์•ˆ ๊ธฐ๋ฒ•์€ ์•ฝ 90%์— ๊ฐ€๊นŒ์šด ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ•˜์—ฌ baseline(์•ฝ 60% ์ˆ˜์ค€)๋ณด๋‹ค ํฌ๊ฒŒ ์•ž์„ฐ์Šต๋‹ˆ๋‹ค. ์ด๋กœ์จ ์ •์ฑ… ์ฒด์ด๋‹์˜ ํšจ๊ณผ๊ฐ€ ์ •๋Ÿ‰์ ์œผ๋กœ ์ž…์ฆ๋˜์—ˆ๋Š”๋ฐ, ํŠนํžˆ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜ ๊ธฐ๋ฐ˜์˜ ์ž์œจ ์Šค์œ„์นญ์ด ์—†์—ˆ๋˜ ๊ฒฝ์šฐ(์ •์ฑ… ์ „ํ™˜ ํ—ˆ์šฉ ํšŸ์ˆ˜ 0์ผ ๋•Œ) ์„ฑ๊ณต๋ฅ ์ด ํฌ๊ฒŒ ๋‚ฎ์•˜๋‹ค๊ฐ€, ์Šค์œ„์นญ์„ 1ํšŒ, 2ํšŒ, 3ํšŒ๋กœ ๋Š˜๋ฆด์ˆ˜๋ก ์„ฑ๊ณต๋ฅ ์ด ๋‹จ๊ณ„์ ์œผ๋กœ ํ–ฅ์ƒ๋˜๋Š” ์–‘์ƒ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 3-(a)์—์„œ ๋ณด์ด๋“ฏ์ด, ์ •์ฑ… ์Šค์œ„์นญ์„ ์ „ํ˜€ ํ—ˆ์šฉํ•˜์ง€ ์•Š์œผ๋ฉด ๋ธ”๋ก ์กฐ๋ฆฝ ์„ฑ๊ณต๋ฅ ์€ 50% ๋ฏธ๋งŒ์— ๋จธ๋ฌผ๋ €์œผ๋‚˜, ์ตœ๋Œ€ 3ํšŒ๊นŒ์ง€ ์žฌ์‹œ๋„๋ฅผ ํ—ˆ์šฉํ•˜์ž ์•ฝ 80% ์ˆ˜์ค€๊นŒ์ง€ ๋†’์•„์กŒ์Šต๋‹ˆ๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๊ณต๊ตฌ ๊ณผ์ œ๋„ 0ํšŒ ์Šค์œ„์นญ ์‹œ ~60%์—์„œ 3ํšŒ ์‹œ ~90%๋กœ ์ƒ์Šนํ•˜์—ฌ, ๋™์  ์ •์ฑ… ์ „ํ™˜์ด ๋ณต์žกํ•œ ์กฐ์ž‘์„ ์„ฑ๊ณต์œผ๋กœ ์ด๋„๋Š” ๋ฐ ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์„ ํ•จ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ฆผ 3: ์„ฑ๋Šฅ ์ง€ํ‘œ ๋ฐ ์ „์ด ํ•จ์ˆ˜ ํšจ๊ณผ ๋ถ„์„. (a) ์ •์ฑ… ์Šค์œ„์นญ ํ—ˆ์šฉ ํšŸ์ˆ˜์— ๋”ฐ๋ฅธ ์ตœ์ข… ์„ฑ๊ณต๋ฅ  โ€“ ์Šค์œ„์นญ์„ ๋Š˜๋ฆด์ˆ˜๋ก ๋ธ”๋ก ์กฐ๋ฆฝ(ํŒŒ๋ž€์ƒ‰)๊ณผ ๊ณต๊ตฌ ์กฐ์ •(์ฃผํ™ฉ์ƒ‰) ๊ณผ์ œ ๋ชจ๋‘ ์„ฑ๊ณต๋ฅ ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋จ์„ ๋ณด์—ฌ์ค€๋‹ค. (b) ๋ฌผ์ฒด ์ž์„ธ ๋ถ„ํฌ ๋น„๊ต(T-STAR vs Ours) โ€“ ๋ธ”๋ก ์กฐ๋ฆฝ ๊ณผ์ œ์˜ ์ •๋ ฌ ๋‹จ๊ณ„์—์„œ, ๊ธฐ์กด ๋ฐฉ๋ฒ•(T-STAR)์€ ๋กœ๋ด‡์ด ๋‹ค์–‘ํ•œ ๊ฐ๋„๋กœ ๋ธ”๋ก์„ ๋ฐฐ์น˜ํ•˜์—ฌ ํ›„์† ํŒŒ์ง€ ๋‹จ๊ณ„์— ์ง„์ž…ํ•˜์ง€๋งŒ(์œ„, ํŒŒ๋ž€์  ๋ถ„ํฌ), ์ œ์•ˆ ๋ฐฉ๋ฒ•์€ ๋ธ”๋ก์˜ ๋Œ๊ธฐ๊ฐ€ ์œ„๋กœ ํ–ฅํ•œ ์ž์„ธ์— ๋Œ€๋ถ€๋ถ„ ๋ชจ์ด๋„๋ก ์œ ๋„ํ•จ์œผ๋กœ์จ ์ดํ›„ ํŒŒ์ง€์™€ ์‚ฝ์ž…์„ ์‰ฝ๊ฒŒ ๋งŒ๋“ค๊ณ  ์„ฑ๊ณต ํ™•๋ฅ ์„ ๋†’์ธ๋‹ค(์•„๋ž˜). ์ด๋Š” ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๊ฐ€ ๋‹ค์Œ ๋‹จ๊ณ„ ์„ฑ๊ณต์— ์ตœ์ ์ธ ์ƒํƒœ๋ฅผ ํ•™์Šตํ•˜๊ณ  ์ด์ „ ๋‹จ๊ณ„ ์ •์ฑ…์„ ๊ทธ ๋ฐฉํ–ฅ์œผ๋กœ ์œ ๋„ํ•œ ๊ฒฐ๊ณผ์ด๋‹ค.

์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜์˜ ํ™œ์šฉ์€ ๋‹จ์ˆœํ•œ ์„ฑ๊ณต๋ฅ  ์ƒ์Šน๋ฟ ์•„๋‹ˆ๋ผ, ๊ฐ ๋‹จ๊ณ„์˜ ์ •์„ฑ์  ๋™์ž‘ ํ’ˆ์งˆ๋„ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋ธ”๋ก ์กฐ๋ฆฝ์—์„œ ์ •๋ ฌ(Orient) ์ •์ฑ…์€ ๋ธ”๋ก์˜ ๋ฐฉํ–ฅ์„ ์–ด๋–ป๊ฒŒ ์žก๋А๋ƒ๊ฐ€ ์ดํ›„ ํŒŒ์ง€ ๋ฐ ์‚ฝ์ž… ์„ฑ๊ณต์— ๊ฒฐ์ •์ ์ธ๋ฐ, ์ œ์•ˆ ๊ธฐ๋ฒ•์€ ์ •๋ ฌ ๋‹จ๊ณ„์—์„œ ๋ธ”๋ก์˜ ๋Œ๊ธฐ๊ฐ€ ์œ„๋กœ ํ–ฅํ•˜๋„๋ก ํšŒ์ „์‹œํ‚ค๋Š” ๊ฒฝํ–ฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‚ฌ๋žŒ์ด ๋ ˆ๊ณ  ๋ธ”๋ก์„ ๋ผ์šธ ๋•Œ ์œ—๋ฉด ๋Œ๊ธฐ๊ฐ€ ์œ„๋กœ ์˜ค๋„๋ก ๋งž์ถ”๋Š” ๊ฒƒ๊ณผ ์œ ์‚ฌํ•œ ์ „๋žต์œผ๋กœ, ์ด๋Ÿฌํ•œ ๊ณ„ํš์  ๋™์ž‘์€ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๊ฐ€ โ€œ์ด ์ž์„ธ๊ฐ€ ๋‹ค์Œ ๋‹จ๊ณ„์— ์œ ๋ฆฌํ•˜๋‹คโ€๋Š” ์‹ ํ˜ธ๋ฅผ ์ฃผ์—ˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, ์ „์ด ํ•จ์ˆ˜๋ฅผ ์“ฐ์ง€ ์•Š์€ ๋ฐฉ๋ฒ•์ด๋‚˜ T-STAR ๋“ฑ์˜ ๊ธฐ์กด ์ ‘๊ทผ์€ ์ •๋ ฌ ๋‹จ๊ณ„์—์„œ ๋‹ค์–‘ํ•œ ๊ฐ๋„๋กœ ๋ธ”๋ก์„ ๋†“์•„ ํ›„์† ๋‹จ๊ณ„์— ๋” ๋„“์€ ์ดˆ๊ธฐ ๋ถ„ํฌ๋ฅผ ํ—ˆ์šฉํ•˜์ง€๋งŒ, ์˜คํžˆ๋ ค ๊ทธ ๋•Œ๋ฌธ์— ํŒŒ์ง€๋‚˜ ์‚ฝ์ž… ๋‹จ๊ณ„์—์„œ ๋ถˆํ•„์š”ํ•œ ์–ด๋ ค์›€์ด ์ƒ๊ธธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 3-(b)๋Š” ์ด๋Ÿฌํ•œ ์ฐจ์ด๋ฅผ ์ž˜ ๋ณด์—ฌ์ฃผ๋Š”๋ฐ, T-STAR ๋ฐฉ์‹์œผ๋กœ ์ตœ์ ํ™”๋œ ์ •์ฑ…์€ ๋ธ”๋ก์˜ ์ตœ์ข… ์ž์„ธ ๋ถ„ํฌ๊ฐ€ ๋น„๊ต์  ๋„“๊ฒŒ ํผ์ ธ ์žˆ๋Š” ๋ฐ˜๋ฉด(Ours ์ด์ „์˜ ์ฐธ๊ณ ์šฉ), Sequential Dexterity์˜ ์ •์ฑ…์€ ํ•œ์ •๋œ ๋ฒ”์œ„(๊ฑฐ์˜ ๋Œ๊ธฐ๊ฐ€ ์œ„์ชฝ์„ ํ–ฅํ•œ ์˜์—ญ)์— ๋ชฐ๋ ค ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๋“ฏ ์šฐ๋ฆฌ ๋ฐฉ๋ฒ•์ด ๋ชฉํ‘œ ์ƒํƒœ ๊ณต๊ฐ„์„ ํšจ๊ณผ์ ์œผ๋กœ ์ œํ•œํ•จ์œผ๋กœ์จ ์ „์ฒด ์—ฐ์‡„์˜ ์„ฑ๊ณต ๊ฐ€๋Šฅ์„ฑ์„ ๋†’์˜€์Œ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Baseline ๋Œ€๋น„ ์„ฑ๋Šฅ ๊ฐœ์„ ์€ ๊ฐœ๋ณ„ ์‚ฌ๋ก€ ๋น„๊ต๋ฅผ ํ†ตํ•ด์„œ๋„ ๋“œ๋Ÿฌ๋‚ฉ๋‹ˆ๋‹ค. ๊ณต๊ตฌ ์ž์„ธ ๋งž์ถ”๊ธฐ ๊ณผ์ œ์˜ ๊ฒฝ์šฐ, ๊ธฐ์กด ์ˆœ์ฐจ ์‹คํ–‰ ๋ฐฉ์‹(baseline)์€ ์ฒซ ํŒŒ์ง€์—์„œ ๋ง์น˜๋ฅผ ์˜†์œผ๋กœ ๋ˆ•ํžŒ ์ฑ„ ์žก๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•˜๊ณ , ์ด ์ƒํƒœ์—์„œ๋Š” ์•„๋ฌด๋ฆฌ ํšŒ์ „ํ•˜๋ ค ํ•ด๋„ ๋ง์น˜๋จธ๋ฆฌ๊ฐ€ ๊ฑธ๋ ค ์ž์„ธ ๋ณ€๊ฒฝ์— ์‹คํŒจํ•˜๊ณค ํ–ˆ์Šต๋‹ˆ๋‹ค (์œ„ ๊ทธ๋ฆผ 2-(b) ๋นจ๊ฐ„ X ์ƒํ™ฉ). ๋ฐ˜๋ฉด Sequential Dexterity๋ฅผ ํ†ตํ•ด ํ•™์Šต๋œ ์ •์ฑ…์€ ์ฒซ ๋‹จ๊ณ„์—์„œ๋ถ€ํ„ฐ ๋ง์น˜๋ฅผ ์„ธ์šธ ๊ฒƒ์„ ์—ผ๋‘์— ๋‘๊ณ  ์†์žก์ด ๋ถ€๋ถ„์„ ์•„๋ž˜์ชฝ์œผ๋กœ ํ–ฅํ•˜๊ฒŒ ์žก๋Š” ์ „๋žต์„ ์ทจํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๋‘ ๋ฒˆ์งธ ๋‹จ๊ณ„์—์„œ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ง์น˜๋ฅผ ๋˜‘๋ฐ”๋กœ ์„ธ์šธ ์ˆ˜ ์žˆ์—ˆ๊ณ  ์ตœ์ข…์ ์œผ๋กœ ์•ˆ์ •๋œ ์ž์„ธ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค (๊ทธ๋ฆผ 2-(b) ๋…น์ƒ‰ ์ฒดํฌ ์ƒํ™ฉ). ์ด์ฒ˜๋Ÿผ ์ดˆ๊ธฐ ๋‹จ๊ณ„์—์„œ์˜ ์ ์ ˆํ•œ ๊ฒฐ์ •์ด ํ›„์† ๋‹จ๊ณ„ ์„ฑ๊ณต์œผ๋กœ ์ด์–ด์ง€๋Š” ์‚ฌ๋ก€๊ฐ€ ๋‹ค์ˆ˜ ๊ด€์ฐฐ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ ์ธก๋ฉด์—์„œ๋„ ๊ณ ๋ฌด์ ์ธ ๊ฒฐ๊ณผ๊ฐ€ ๋ณด๊ณ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ณต๊ตฌ ๊ณผ์ œ์—์„œ ํ•™์Šต์— ์‚ฌ์šฉํ•˜์ง€ ์•Š์€ ์ฃผ๊ฑฑ, ์ˆŸ๊ฐ€๋ฝ ๋“ฑ์˜ ๋„๊ตฌ์— ๋Œ€ํ•ด์„œ๋„ ์ œ์•ˆ ์ •์ฑ…์€ ํฐ ์„ฑ๋Šฅ ์ €ํ•˜ ์—†์ด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ด๋ƒˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์ˆŸ๊ฐ€๋ฝ์˜ ๋„“์ ํ•œ ๋ถ€๋ถ„์„ ์žก์„ ๋•Œ์—๋„ ํ•™์Šต๋œ ๋ง์น˜ ํŒŒ์ง€ ์ •์ฑ…์„ ์‘์šฉํ•˜์—ฌ ๋น„์Šทํ•œ ์›๋ฆฌ๋กœ ํŒŒ์ง€ ๋ฐ ์„ธ์šฐ๊ธฐ ๋™์ž‘์„ ์„ฑ๊ณต์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์„ฑ๊ณต๋ฅ  ์ˆ˜์น˜๋Š” ๋ง์น˜์— ๋น„ํ•ด ๋‹ค์†Œ ๋‚ฎ์•„์งˆ ์ˆ˜ ์žˆ์œผ๋‚˜, baseline๊ณผ ๋น„๊ตํ•˜๋ฉด ์—ฌ์ „ํžˆ ๋†’์€ ์„ฑ๊ณต ๋น„์œจ์„ ์œ ์ง€ํ•˜๋ฉฐ ์šฐ์ˆ˜ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ์‹œํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ธ”๋ก ์กฐ๋ฆฝ์˜ ๊ฒฝ์šฐ ํ•™์Šต์—๋Š” ๋ช‡ ๊ฐ€์ง€ ํฌ๊ธฐ์™€ ์ƒ‰์ƒ์˜ ๋ธ”๋ก๋งŒ ์‚ฌ์šฉ๋˜์—ˆ์ง€๋งŒ, ํ…Œ์ŠคํŠธ์—์„œ๋Š” ์ฒ˜์Œ ๋ณด๋Š” ํ˜•ํƒœ์˜ ๋ธ”๋ก(์˜ˆ: ๋‹ค๋ฅธ ๋ชจ์–‘์˜ ์กฐ๋ฆฝ ๋ธ”๋ก)์„ ํˆฌ์ž…ํ•ด๋„ ์†์‰ฝ๊ฒŒ ์ ์‘ํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ œ์•ˆํ•œ ์ •์ฑ…์ด ๋ฌผ์ฒด์˜ ์ •ํ™•ํ•œ CAD ๋ชจ๋ธ์— ์˜์กดํ•˜๊ธฐ๋ณด๋‹ค๋Š” ์‹œ๊ฐ/์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์— ๊ธฐ๋ฐ˜ํ•œ ์กฐ์ž‘ ์Šคํ‚ฌ์„ ํ•™์Šตํ–ˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ธ”๋ก์˜ ์ดˆ๊ธฐ ๋ฐฐ์น˜๋‚˜ ๋ชฉํ‘œ ๊ตฌ์กฐ์˜ ํ˜•ํƒœ๊ฐ€ ๋‹ฌ๋ผ์ ธ๋„, ์ฃผ์–ด์ง„ ์กฐ๋ฆฝ ์„ค๋ช…์„œ๋งŒ ๋ฐ”๊พธ๋ฉด (์˜ˆ: GUI๋กœ ์›ํ•˜๋Š” ๊ตฌ์กฐ๋ฅผ ์ง€์ •) ๋กœ๋ด‡์ด ๋™์ผํ•œ ์—ฐ์‡„ ์ •์ฑ…์œผ๋กœ ์ƒˆ๋กœ์šด ๊ตฌ์กฐ๋ฅผ ์Œ“์•„์˜ฌ๋ ธ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํƒœ์Šคํฌ ์ ์‘๋ ฅ์€ ๋ณธ ๊ธฐ๋ฒ•์˜ ๋ฒ”์šฉ์„ฑ์„ ๋’ท๋ฐ›์นจํ•˜๋Š” ์ฆ๊ฑฐ์ž…๋‹ˆ๋‹ค.

๋์œผ๋กœ, ์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜ ๊ฒฐ๊ณผ Sequential Dexterity์˜ ์‹ค์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…๋“ค์„ ๊ทธ๋Œ€๋กœ ์ด์‹ํ•œ ๋กœ๋ด‡์€, ์นด๋ฉ”๋ผ๋กœ ์‹๋ณ„ํ•œ ๋ธ”๋ก์„ ์ฐพ์•„ ์ง‘์–ด์„œ ๊ตฌ์กฐ๋ฌผ์„ ์Œ“๋Š” ์ผ๋ จ์˜ ๋™์ž‘์„ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์— ๊ณต๊ฐœ๋œ ๋™์˜์ƒ์„ ๋ณด๋ฉด ๋กœ๋ด‡์ด ์—ฌ๋Ÿฌ ํ˜•ํƒœ์˜ ๋ธ”๋ก ๊ตฌ์กฐ (์˜ˆ: ๋‹ค์ธต ํƒ‘, ํŠน์ • ํŒจํ„ด ์กฐ๋ฆฝ ๋“ฑ)๋ฅผ ์‚ฌ๋žŒ์˜ ๋„์›€ ์—†์ด ์™„์„ฑํ•˜๋Š” ์ธ์ƒ์ ์ธ ์‹œ์—ฐ์ด ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ถ”๊ฐ€ ํ•™์Šต์ด๋‚˜ ๋ฏธ์„ธ์กฐ์ • ์—†์ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ •์ฑ…์„ ๋ฐ”๋กœ ์‚ฌ์šฉํ–ˆ๋‹ค๋Š” ์ ์—์„œ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„ ๊ฒฉ์ฐจ(sim2real gap)๋ฅผ ์ตœ์†Œํ™”ํ•œ ์ •์ฑ… ํ•™์Šต์˜ ํšจ๊ณผ๋ฅผ ์‹ค์ฆํ–ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก  ์™„๋ฒฝํ•œ ์ œ๋กœ์ƒท ์ „์ด๋ฅผ ์œ„ํ•ด ๋ช‡ ๊ฐ€์ง€ ์—”์ง€๋‹ˆ์–ด๋ง์ด ๋”ํ•ด์กŒ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋Š” ์†๊ฐ€๋ฝ ์›€์ง์ž„์ด ๋น ๋ฅด๊ฒŒ ํŠ€๋Š” ์ง„๋™ ํ˜„์ƒ์ด ์žˆ์—ˆ์œผ๋‚˜, ์‹ค์ œ ๋กœ๋ด‡์—์„œ๋Š” ์ด๋ฅผ ์ง€์ˆ˜ํ‰ํ™œ ํ•„ํ„ฐ๋กœ ํ‰ํƒ„ํ™”ํ•˜์—ฌ ์ œ์–ด์˜ ์•ˆ์ •์„ฑ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์•ž์„œ ์„ค๋ช…ํ•œ ๋Œ€๋กœ ๋งˆ์ง€๋ง‰ ์‚ฝ์ž… ๋™์ž‘์€ ์•ฝ๊ฐ„์˜ ์Šคํฌ๋ฆฝํŠธ ๋ณด์กฐ๋ฅผ ๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ํ•™์Šต๋œ ๋ถ€๋ถ„(ํƒ์ƒ‰์ •๋ ฌํŒŒ์ง€)๋งŒ์œผ๋กœ๋„ ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ๋ธ”๋ก์„ ์ง‘์–ด ์ •ํ™•ํ•œ ์ž์„ธ๋กœ ์œ„์น˜์‹œํ‚ค๋Š” ๊ฑด ๊ธฐ์กด์—๋Š” ๋ณด๊ธฐ ๋“œ๋ฌธ ์„ฑ๊ณผ๋กœ, ๋ชจ๋ธ ์ž์œ  ๊ฐ•ํ™”ํ•™์Šต(model-free RL) ๊ธฐ๋ฒ•์œผ๋กœ ์ด๋ ‡๊ฒŒ ๋ณต์žกํ•œ ์‹ค์ œ ์กฐ๋ฆฝ ์ž‘์—…์„ ์„ฑ๊ณตํ•œ ์ฒซ ์‚ฌ๋ก€ ์ค‘ ํ•˜๋‚˜๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค.

2.5 ํ•œ๊ณ„์  ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

Sequential Dexterity๋Š” ๊ธด ์ˆ˜ํ‰์„ (long-horizon)์˜ ๋‹ค๋‹จ๊ณ„ ์ž‘์—…์— ๋Œ€ํ•œ ์ƒˆ๋กœ์šด ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ–ˆ์ง€๋งŒ, ์—ฌ์ „ํžˆ ๋ช‡ ๊ฐ€์ง€ ํ•œ๊ณ„์ ์ด ์กด์žฌํ•˜๋ฉฐ ํ–ฅํ›„ ๊ฐœ์„  ์—ฌ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

์ฒซ์งธ, ์„œ๋ธŒํƒœ์Šคํฌ์˜ ๋ถ„ํ• ๊ณผ ์ •์˜๊ฐ€ ์‚ฌ๋žŒ์— ์˜ํ•ด ์‚ฌ์ „์— ์ฃผ์–ด์ง€๋Š” ์ ์ž…๋‹ˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ๋ธ”๋ก ํƒ์ƒ‰, ์ •๋ ฌ, ํŒŒ์ง€, ์‚ฝ์ž…์˜ 4๋‹จ๊ณ„์™€ ๊ณต๊ตฌ ํŒŒ์ง€, ์ •๋ ฌ์˜ 2๋‹จ๊ณ„๋ฅผ ์ „์ œ๋กœ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์„œ๋ธŒํƒœ์Šคํฌ ๋ถ„ํ• ์€ ๋„๋ฉ”์ธ ์ง€์‹์„ ํ™œ์šฉํ•œ ๊ฒƒ์œผ๋กœ, ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ’€๊ธฐ ์‰ฝ๊ฒŒ ๋งŒ๋“  ์žฅ์ ์ด ์žˆ์ง€๋งŒ ๋ฒ”์šฉ ์ธ๊ณต์ง€๋Šฅ์  ์ ‘๊ทผ๊ณผ๋Š” ๊ฑฐ๋ฆฌ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ํ–ฅํ›„์—๋Š” ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ์„œ๋ธŒํƒœ์Šคํฌ๋ฅผ ๋ฐœ๊ฒฌํ•˜๊ฑฐ๋‚˜, ๊ณ ์ˆ˜์ค€ ๋ชฉํ‘œ๋งŒ ์ฃผ์–ด์ ธ๋„ ๋‚ด๋ถ€์ ์œผ๋กœ ์ ์ ˆํ•œ ์ •์ฑ… ์ฒด์ธ์„ ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ์ž๋™ ๊ณ„์ธตํ™” ํ•™์Šต์œผ๋กœ ํ™•์žฅ๋  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋‘˜์งธ, ํ•™์Šต ๋น„์šฉ์˜ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ๊ฐ ์„œ๋ธŒ ์ •์ฑ…์„ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ํ›ˆ๋ จํ•˜๋Š” ๋ฐ ์ƒ๋‹นํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์‹œ๊ฐ„์ด ๊ฑธ๋ ธ์Šต๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์— ๋”ฐ๋ฅด๋ฉด ๋ธ”๋ก ์กฐ๋ฆฝ์˜ ๊ฒฝ์šฐ ์„œ๋ธŒํƒœ์Šคํฌ ํ•˜๋‚˜๋ฅผ ํ•™์Šตํ•˜๋Š” ๋ฐ ํ•˜๋ฃจ~์ดํ‹€ ์ •๋„ ์†Œ์š”๋˜๋ฉฐ, ๋ชจ๋“  ๋‹จ๊ณ„๋ฅผ ์ˆœ์ฐจ/์—ญ๋ฐฉํ–ฅ์œผ๋กœ ์ตœ์ ํ™”ํ•˜๋Š” ๋ฐ ์ƒ๋‹นํ•œ ๊ณ„์‚ฐ์ž์›์ด ํ•„์š”ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํ˜„์žฌ ๊ธฐ์ˆ  ์ˆ˜์ค€์—์„œ ๋ถˆ๊ฐ€ํ”ผํ•œ ๋ฉด๋„ ์žˆ์ง€๋งŒ, ํ–ฅํ›„ ๋” ํšจ์œจ์ ์ธ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜(PPO ์™ธ์— ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ• ๋“ฑ)์ด๋‚˜ ์ง€ํ‘œํ•จ์ˆ˜ ์žฌ์‚ฌ์šฉ ๋“ฑ์„ ํ†ตํ•ด ํ›ˆ๋ จ ์‹œ๊ฐ„์„ ๋‹จ์ถ•ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ํ˜„์žฌ๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ ๋Œ€๋Ÿ‰์˜ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์„ ์‚ฌ์šฉํ–ˆ๋Š”๋ฐ, ์‹ค์ œ ๋กœ๋ด‡ ํ•™์Šต์œผ๋กœ ์ด๋Ÿฌํ•œ ๊ธฐ๋ฒ•์„ ํ™•์žฅํ•˜๋ ค๋ฉด ํ‘œ๋ณธ ํšจ์œจ์„ ๋†’์ด๊ฑฐ๋‚˜ ์ธ๊ฐ„ ์‹œ์—ฐ์œผ๋กœ ์ดˆ๊ธฐ ์ •์ฑ…์„ ์–ป๋Š” ๋“ฑ์˜ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์…‹์งธ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค์˜ ์ฐจ์ด๋กœ ์ธํ•œ ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ ์ง€์ ํ–ˆ๋“ฏ์ด ๋ธ”๋ก ์‚ฝ์ž…๊ณผ ๊ฐ™์€ ์ ‘์ด‰์ด ๋งŽ์€ ์„ธ๋ฐ€ํ•œ ๋™์ž‘์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ์ •ํ™•ํžˆ ๊ตฌํ˜„ํ•˜๊ธฐ ์–ด๋ ค์› ๊ณ , ๊ฒฐ๊ตญ ์ผ๋ถ€๋ฅผ ์Šคํฌ๋ฆฝํŠธ์— ์˜์กดํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ณง ์ ‘์ด‰๋ ฅ, ๋งˆ์ฐฐ, ๋ณ€ํ˜• ๋“ฑ์˜ ๋ฌผ๋ฆฌ์  ์ƒํ˜ธ์ž‘์šฉ์„ ์ •ํ™•ํžˆ ๋‹ค๋ฃจ๋Š” ์–ด๋ ค์›€์„ ๋œปํ•ฉ๋‹ˆ๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜์— ์ด๋Ÿฌํ•œ ์ ‘์ด‰ ์•ˆ์ •์„ฑ์— ๋Œ€ํ•œ ํ‰๊ฐ€๋ฅผ ํฌํ•จ์‹œํ‚ค๊ฑฐ๋‚˜, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‹จ๊ณ„์—์„œ๋ถ€ํ„ฐ ๋ฌผ๋ฆฌ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋‹ค์–‘ํ™”ํ•˜๋Š” ๋„๋ฉ”์ธใƒฉใƒณ๋คํ™”(domain randomization)๋ฅผ ํ†ตํ•ด ํ˜„์‹ค ์ ์‘๋ ฅ์„ ๋†’์ผ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ์ด‰๊ฐ ์„ผ์„œ๋‚˜ ํž˜ ์ œ์–ด๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ, ๋‹จ์ˆœ ์‹œ๊ฐ ์ •๋ณด๋กœ ์–ด๋ ค์šด ๋ฏธ์„ธ ์ ‘์ด‰ ๋™์ž‘์˜ ์„ฑ๊ณต๋ฅ ์„ ๋†’์ด๋Š” ๋ฐฉํ–ฅ๋„ ๊ณ ๋ คํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋„ท์งธ, ์„ผ์‹ฑ ๋ฐ ์‹œ์Šคํ…œ ๋ณต์žก๋„์˜ ํ•œ๊ณ„์ž…๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์™„์ „์ƒํƒœ ๊ด€์ฐฐ(ground-truth state)์„ ์ฃผ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ํ•™์Šตํ–ˆ๊ณ , ํ˜„์‹ค ์‹คํ—˜์—์„œ๋Š” ์ด๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด 2๋Œ€์˜ ์นด๋ฉ”๋ผ์™€ ์„ธ๋ถ„ํ™”/์ถ”์  ๋ฐ 6D ํฌ์ฆˆ ์ถ”์ • ์•Œ๊ณ ๋ฆฌ์ฆ˜(XMem, DenseFusion ๋“ฑ)์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ธ์ง€ ์‹œ์Šคํ…œ์€ ์ถ”๊ฐ€์ ์ธ ์˜ค๋ฅ˜ ๊ฐ€๋Šฅ์„ฑ์„ ๋‚ดํฌํ•˜๋ฉฐ, ์‹ค์ œ ์ ์šฉ ์‹œ ์ƒ๋‹นํ•œ ์„ค์ •๊ณผ ๋ณด์ •์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ํ–ฅํ›„์—๋Š” ํ•™์Šต ๋‹จ๊ณ„์—์„œ๋ถ€ํ„ฐ ์˜์ƒ ์ž…๋ ฅ์„ ๋ฐ›์•„ end-to-end๋กœ ์ •์ฑ…์„ ํ•™์Šตํ•˜๊ฑฐ๋‚˜, ๋ณด๋‹ค ๊ฒฝ๋Ÿ‰์˜ ์„ผ์„œ ๊ตฌ์„ฑ์œผ๋กœ ๋™์ž‘ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋‹จ์ˆœํ™”ํ•˜๋Š” ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์†๋ชฉ ์นด๋ฉ”๋ผ ํ•˜๋‚˜๋งŒ์œผ๋กœ๋„ ๋ชฉํ‘œ ๋ฌผ์ฒด๋ฅผ ํƒ์ง€ํ•˜๊ณ  ์กฐ์ž‘ํ•˜๋„๋ก ํ•™์Šต์‹œํ‚ค๋Š” ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋‚œ์ด๋„๊ฐ€ ๋†’์ง€๋งŒ, ์„ฑ๊ณตํ•œ๋‹ค๋ฉด ์‹œ์Šคํ…œ ๊ตฌ์„ฑ์˜ ๋ณต์žก๋„๋ฅผ ์ค„์ด๊ณ  ์‹ค์šฉ์„ฑ์„ ๋†’์ผ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋‹ค์„ฏ์งธ, ์ •์ฑ… ์—ฐ์‡„์˜ ๋ฒ”์œ„์— ๊ด€ํ•œ ํ•œ๊ณ„์ž…๋‹ˆ๋‹ค. Sequential Dexterity๋Š” ํ˜„์žฌ ๊ณ ์ •๋œ ์ˆœ์„œ์˜ ์Šคํ‚ฌ ์ฒด์ธ ๋‚ด์—์„œ๋งŒ ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค (๋น„๋ก ์Šค์œ„์นญ์œผ๋กœ ๋ฐ˜๋ณต์ด๋‚˜ ์ƒ๋žต์€ ๊ฐ€๋Šฅํ•˜์ง€๋งŒ). ๋งŒ์•ฝ ์ž‘์—… ๋„์ค‘ ์ „ํ˜€ ์ƒˆ๋กœ์šด ํ•˜์œ„ ๊ณผ์ œ๊ฐ€ ํ•„์š”ํ•ด์ง€๊ฑฐ๋‚˜ ๋ถ„๊ธฐ(branch)๊ฐ€ ๋ฐœ์ƒํ•˜๋Š” ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ๋Š” ๊ทธ๋Œ€๋กœ ์ ์šฉํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์กฐ๋ฆฝ ์ž‘์—… ์ค‘ ๋ธ”๋ก์ด ๋–จ์–ด์ง€๊ฑฐ๋‚˜ ํŒŒ์†๋˜๋Š” ๋“ฑ ์˜ˆ์™ธ ์ƒํ™ฉ์ด ๋ฐœ์ƒํ•˜๋ฉด, ํ˜„์žฌ ์ฒด๊ณ„๋กœ๋Š” ์‚ฌ์ „์— ํ•™์Šต๋œ ์„œ๋ธŒํƒœ์Šคํฌ๋กœ ๋Œ€์ฒ˜ํ•  ์ˆ˜ ์—†์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋น„์ •ํ˜• ์ƒํ™ฉ์— ๋Œ€์‘ํ•˜๋ ค๋ฉด ์ƒ์œ„ ๊ณ„์ธต์˜ ํ”Œ๋ž˜๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‚˜ ์˜จ๋””๋งจ๋“œ ํ•™์Šต๊ณผ ๊ฒฐํ•ฉ์ด ํ•„์š”ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ๋Š” ์ฒด์Šค์™€ ๊ฐ™์€ ์ „๋žต ๊ฒŒ์ž„์—์„œ ๋ณด๋“ฏ์ด, ๊ณ ์ˆ˜์ค€ ํ”Œ๋ž˜๋„ˆ๊ฐ€ ์„œ๋ธŒ ์ •์ฑ…๋“ค์„ ํ˜ธ์ถœํ•˜๊ณ  ์กฐํ•ฉํ•˜๋Š” ๊ณ„์ธต์  ์ œ์–ด ๊ตฌ์กฐ๋กœ ํ™•์žฅํ•˜๋Š” ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์—ฌ๋Ÿฌ ๋Œ€์˜ ๋กœ๋ด‡ ์†์ด๋‚˜ ์‚ฌ๋žŒ-๋กœ๋ด‡ ํ˜‘์—… ๋“ฑ์˜ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์ƒํ™ฉ์—์„œ๋„ ์ด์™€ ์œ ์‚ฌํ•œ ์ •์ฑ… ์ฒด์ด๋‹ ๊ฐœ๋…์„ ์ ์šฉํ•˜๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ• ์ง€ ํƒ๊ตฌํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ๋‹ค์ง€ ๋กœ๋ด‡ ์† ์ž์ฒด์˜ ํ•œ๊ณ„๋„ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ๋žŒ ์†๊ณผ ์œ ์‚ฌํ•œ ๋กœ๋ด‡ ํ•ธ๋“œ๋Š” ์œ ์—ฐ์„ฑ์ด ๋†’์ง€๋งŒ ์ œ์–ด๊ฐ€ ์–ด๋ ค์›Œ, ํ˜„์žฌ๊นŒ์ง€๋Š” ๋ณ‘๋ ฌ ๊ทธ๋ฆฌํผ ๋“ฑ์— ๋น„ํ•ด ์‹ ๋ขฐ๋„๊ฐ€ ๋‚ฎ์€ ํŽธ์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ ํ‰ํ–‰๊ทธ๋ฆฌํผ๋กœ๋Š” ์ˆ˜ํ–‰์ด ์–ด๋ ค์šด ์ž‘์—…์ด ๋ณธ ๊ณผ์ œ์˜€์Œ์„ ๊ฐ•์กฐํ•˜๊ณ  ์žˆ์œผ๋‚˜, ๋ฐ˜๋Œ€๋กœ ๋งํ•˜๋ฉด ๋‹ค์ง€ ์†์ด ๋ฐ˜๋“œ์‹œ ํ•„์š”ํ•˜์ง€ ์•Š์€ ์ž‘์—…์—์„œ๋Š” ์ฒด์ด๋‹ ๊ธฐ๋ฒ• ์—†์ด๋„ ์„ฑ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฏ€๋กœ ์–ด๋–ค ์œ ํ˜•์˜ ์ž‘์—…์— ๋‹ค์ง€ ์† + ์ฒด์ด๋‹ ์ ‘๊ทผ์ด ์œ ๋ฆฌํ•œ์ง€๋ฅผ ์‹๋ณ„ํ•˜๊ณ , ๋ถˆํ•„์š”ํ•œ ๊ฒฝ์šฐ์—๋Š” ๋‹จ์ˆœ ๊ทธ๋ฆฌํผ๋‚˜ ๋‹จ์ผ ์ •์ฑ…์œผ๋กœ๋„ ์ถฉ๋ถ„ํ•œ์ง€๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ์—ฐ๊ตฌ๊ฐ€ ์‹ค์šฉ์  ๊ด€์ ์—์„œ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋‹ค์ง€ ์†์˜ ๊ณ ์œ ํ•œ ๋ฌธ์ œ์ธ ๊ด€์ ˆ ์ œ์•ฝ, ๋‚ด๊ตฌ์„ฑ, ์ œ์–ด ์ง€์—ฐ ๋“ฑ์ด ํ˜„์‹ค ์ ์šฉ์— ๊ฑธ๋ฆผ๋Œ์ผ ์ˆ˜ ์žˆ์–ด, ์ด๋Ÿฌํ•œ ๋ถ€๋ถ„์„ ๊ฐœ์„ ํ•˜๊ฑฐ๋‚˜ ์ฒด์ด๋‹ ๊ธฐ๋ฒ•์ด ๊ทธ๋Ÿฌํ•œ ํ•˜๋“œ์›จ์–ด ํ•œ๊ณ„๋ฅผ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋„ ์‚ดํŽด๋ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

2.6 ์ดํ‰ ๋ฐ ๊ธฐ์—ฌ๋„ ํ‰๊ฐ€

Sequential Dexterity ๋…ผ๋ฌธ์€ ๋กœ๋ด‡ ๊ฐ•ํ™”ํ•™์Šต ๋ถ„์•ผ์—์„œ ์žฅ๊ธฐ horizon ๊ณผ์—…์„ ํ’€๊ธฐ ์œ„ํ•ด ํ•œ ๊ฑธ์Œ ๋‚˜์•„๊ฐ„ ์ค‘์š”ํ•œ ์—ฐ๊ตฌ๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์†๊ณผ ๊ฐ™์ด ์ œ์–ด๊ฐ€ ๊นŒ๋‹ค๋กœ์šด ๋งค๋‹ˆํ“ฐ๋ ˆ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ, ์ด์ „์—๋Š” ์‚ฌ๋žŒ์ด ๊ฐœ์ž…ํ•˜๊ฑฐ๋‚˜ ์‹คํŒจ์œจ์ด ๋†’์•˜๋˜ ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘ ์ž‘์—…์„ ์ž์œจ์ ์œผ๋กœ ํ•™์Šต ์ˆ˜ํ–‰ํ•ด๋‚ธ ์ ์—์„œ ํฐ ์˜์˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์˜ ์ฃผ์š” ๊ธฐ์—ฌ๋„(contribution)๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ๋‹ค๋‹จ๊ณ„ ์„ฌ์„ธ ์กฐ์ž‘์„ ์œ„ํ•œ ์ •์ฑ… ์ฒด์ด๋‹์˜ ๊ฐœ์ฒ™: ๋ณธ ์—ฐ๊ตฌ๋Š” ์žฅ๊ธฐ ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘ ์ž‘์—…์— ์ •์ฑ… ์—ฐ์‡„ ๊ธฐ๋ฒ•์„ ์ ์šฉํ•œ ์ตœ์ดˆ์˜ ์‚ฌ๋ก€ ์ค‘ ํ•˜๋‚˜๋กœ, ํŠนํžˆ ๋‹ค์ง€ ๋กœ๋ด‡ ์†์„ ์ด์šฉํ•œ ์ •๊ตํ•œ ์ž‘์—…์— ์ดˆ์ ์„ ๋งž์ถ”์—ˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์—๋Š” ์ฃผ๋กœ ๋‹จ์ˆœ ๊ทธ๋ฆฌํผ๋‚˜ ๋‹จ์ผ ๋‹จ๊ณ„ ์ž‘์—… ์œ„์ฃผ๋กœ ์—ฐ๊ตฌ๋˜๋˜ ๋ถ„์•ผ์—, ๋ณต์žกํ•œ ์† ์กฐ์ž‘ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ์ œ์‹œํ•˜๊ณ  ํ•ด๊ฒฐ์ฑ…์„ ๋ชจ์ƒ‰ํ–ˆ๋‹ค๋Š” ์ ์—์„œ ํ•™์ˆ ์  ๊ฐ€์น˜๋ฅผ ์ง€๋‹™๋‹ˆ๋‹ค.

  • ์ผ๋ฐ˜์ ์ธ ์–‘๋ฐฉํ–ฅ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์•ˆ: ๋‹จ์ˆœํžˆ ๊ฐœ๋ณ„ ์‹คํ—˜ ๊ฒฐ๊ณผ๋ฅผ ๋„˜์–ด์„œ, ์ˆœ๋ฐฉํ–ฅ ํ•™์Šต + ์ „์ด ํ•จ์ˆ˜ ๊ธฐ๋ฐ˜ ์—ญ๋ฐฉํ–ฅ ํŒŒ์ธํŠœ๋‹์ด๋ผ๋Š” ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ตฌ์ถ•ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ํ–ฅํ›„ ๋‹ค๋ฅธ ํ˜•ํƒœ์˜ ๋‹ค๋‹จ๊ณ„ ์ž‘์—…์ด๋‚˜ ๋‹ค๋ฅธ ๋กœ๋ด‡ ํ”Œ๋žซํผ์—๋„ ์‘์šฉ๋  ์ˆ˜ ์žˆ๋Š” ์„ค๊ณ„๋กœ์„œ, ์ •์ฑ… ์ฒด์ด๋‹์— ๋Œ€ํ•œ ๋ณดํŽธ์ ์ธ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•œ ์ ์ด ๋†’์ด ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ํŠนํžˆ value ํ•จ์ˆ˜๊ฐ€ ์•„๋‹Œ ๋ณ„๋„์˜ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ๋„์ž…ํ•˜๊ณ , ์ด๋ฅผ ์ •์ฑ… ์ „ํ™˜ ์ „๋žต๊นŒ์ง€ ํ†ตํ•ฉ์‹œํ‚จ ๊ฒƒ์€ ๋ณธ ๋…ผ๋ฌธ์˜ ๊ธฐ์ˆ ์  ์ฐฝ์˜์„ฑ์ด๋ผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘์—์„œ์˜ SOTA ์„ฑ๋Šฅ๊ณผ ์‹คํ™˜๊ฒฝ ๊ฒ€์ฆ: ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค์ด ์‹คํŒจํ•˜๊ฑฐ๋‚˜ ์„ฑ๋Šฅ์ด ๋‚ฎ์•˜๋˜ ๋ณตํ•ฉ ์ž‘์—…์„ ์„ฑ๊ณต์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜์˜€์œผ๋ฉฐ, ์ˆ˜์น˜์ ์œผ๋กœ๋„ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด์ „ ๊ฐ•ํ™”ํ•™์Šต ์—ฐ๊ตฌ์—์„œ๋Š” ๋ชจ๋ธ ํ”„๋ฆฌ ๋ฐฉ์‹์œผ๋กœ๋Š” ํ’€์ง€ ๋ชปํ–ˆ๋˜ IKEA ๊ฐ€๊ตฌ ์กฐ๋ฆฝ๋ฅ˜์˜ ์ž‘์—…์„ ๋ณธ ์—ฐ๊ตฌ์™€ ์œ ์‚ฌํ•œ ์ ‘๊ทผ์œผ๋กœ ํ•ด๊ฒฐํ–ˆ๊ณ , ๋ณธ ๋…ผ๋ฌธ ์—ญ์‹œ ๋ธ”๋ก ์กฐ๋ฆฝ ์ž‘์—…์„ ์ตœ์ดˆ๋กœ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ํ•™์Šต๋œ ์ •์ฑ…์„ ๋ฐ”๋กœ ์‹ค์ œ ๋กœ๋ด‡์— ์ด์‹ํ•˜์—ฌ ์ž‘์—… ์„ฑ๊ณต์„ ์‹œ์—ฐํ•จ์œผ๋กœ์จ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฒฐ๊ณผ์— ๊ทธ์น˜์ง€ ์•Š๊ณ  ํ˜„์‹ค ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ๊นŒ์ง€ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡ ํ•™์Šต ์—ฐ๊ตฌ์—์„œ ์ƒ๋‹นํžˆ ๊นŒ๋‹ค๋กœ์šด ๋‹จ๊ณ„์ธ๋ฐ, ์ €์ž๋“ค์˜ ํ†ตํ•ฉ์  ๋…ธ๋ ฅ(์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์„ ์ •, ๋น„์ „ ๋ชจ๋“ˆ ๊ฐœ๋ฐœ, ์ œ์–ด ์•ˆ์ •ํ™” ๋“ฑ)์œผ๋กœ ์ด๋ฃจ์–ด๋‚ธ ์„ฑ๊ณผ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ sim-to-real ์„ฑ๊ณต ์‚ฌ๋ก€๋Š” ํ•™๊ณ„์™€ ์—…๊ณ„ ๋ชจ๋‘์— ์˜๊ฐ์„ ์ฃผ๋ฉฐ, ํ–ฅํ›„ ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์— ๋Œ€ํ•œ ์‹ ๋ขฐ๋„๋ฅผ ๋†’์ด๋Š” ๋ฐ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.

์ด ๋…ผ๋ฌธ์„ ๊ด€๋ จ ๋ฌธํ—Œ๋“ค๊ณผ ๋น„๊ตํ•ด๋ณด๋ฉด, ์ด์ „์˜ ์Šคํ‚ฌ ์ฒด์ด๋‹ ์—ฐ๊ตฌ๋“ค์€ ์ฃผ๋กœ ์ƒํƒœ ๊ณต๊ฐ„ ํ™•์žฅ์ด๋‚˜ ์˜ต์…˜ ํ”„๋ ˆ์ž„์›Œํฌ ๋“ฑ์„ ํ†ตํ•ด ์ •์ฑ… ์—ฐ๊ฒฐ์„ ์‹œ๋„ํ–ˆ๋Š”๋ฐ, Sequential Dexterity๋Š” ์ƒํƒœ ๋ถ„ํฌ์˜ ํญ๋ฐœ์  ์ฆ๊ฐ€๋ฅผ ์–ต์ œํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ ‘๊ทผํ•œ ์ ์ด ๋…ํŠนํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ T-STAR(Lee et al., 2021) ๋“ฑ์ด adversarial training์œผ๋กœ ๋ถ„ํฌ๋ฅผ ์ œํ•œํ•œ ๋ฐ ๋ฐ˜ํ•ด, ๋ณธ ๋…ผ๋ฌธ์€ ํ•™์Šต๋œ ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ฅผ ํ™œ์šฉํ•œ ์ง์ ‘์ ์ธ ๋ณด์ƒ ํ”ผ๋“œ๋ฐฑ์œผ๋กœ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜์—ฌ ์•ˆ์ •์ ์ด๋ฉด์„œ๋„ ํšจ๊ณผ์ ์ธ ๊ฐœ์„ ์„ ์ด๋ฃจ์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ณผ๊ฑฐ ์—ฐ๊ตฌ๋“ค์ด ๋ณ‘๋ ฌ ๊ทธ๋ฆฌํผ ๋“ฑ ์ œํ•œ๋œ ์กฐ์ž‘์—์„œ ๋‹จ์ˆœ ์ž‘์—…(์˜ˆ: ๋ธ”๋ก ์Œ“๊ธฐ 2~3๋‹จ๊ณ„ ์ •๋„)์„ ์‹œ์—ฐํ•œ ๊ฒƒ์— ๋น„ํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” ๋‹ค์ง€ ์†์˜ ํ’๋ถ€ํ•œ ์กฐ์ž‘ ๊ฐ€๋Šฅ์„ฑ์„ ํ™œ์šฉํ•ด ๋” ๋ณต์žกํ•œ ์ž‘์—…์„ ํ–ˆ๋‹ค๋Š” ์ ์—์„œ ์‹ค์šฉ์  ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์˜ ์†์ฒ˜๋Ÿผ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ค„์•ผ ํ•˜๋Š” ๊ณผ์ œ์—์„œ ๋ณธ ๋ฐฉ๋ฒ•์ด ์ง„๊ฐ€๋ฅผ ๋ฐœํœ˜ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค€ ์…ˆ์ž…๋‹ˆ๋‹ค.

๋ฌผ๋ก  Sequential Dexterity์—๋„ ์•ž์„œ ๋…ผ์˜ํ•œ ๊ฐœ์„ ์ ๋“ค์ด ์žˆ์ง€๋งŒ, ํ˜„์žฌ ์‹œ์  ๊ธฐ์ค€์œผ๋กœ ๋ณผ ๋•Œ ์ด ๋…ผ๋ฌธ์€ ์žฅ๊ธฐ ๊ฐ•ํ™”ํ•™์Šต ์ œ์–ด์™€ ๋กœ๋ด‡ ์กฐ์ž‘์˜ ๊ต์ฐจ์ ์—์„œ ์ƒ๋‹นํ•œ ์ง„์ „์„ ์ด๋ฃฌ ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ํ•™๋ฌธ์ ์œผ๋กœ๋Š”, ๊ธด ์‹œ๊ฐ„๋ฒ”์œ„์˜ ์˜์‚ฌ๊ฒฐ์ • ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๊ณ„ํš(plan)๊ณผ ํ•™์Šต(learning)์„ ์ ‘๋ชฉํ•œ ํ•œ ๊ฐ€์ง€ ์„ฑ๊ณต ์˜ˆ๋ฅผ ์ œ์‹œํ–ˆ๊ณ , ์‹ค์šฉ์ ์œผ๋กœ๋Š” ํ–ฅํ›„ ์‚ฐ์—…์šฉ ๋กœ๋ด‡์ด๋‚˜ ๊ฐ€์ •์šฉ ๋กœ๋ด‡์˜ ๋ณต์žกํ•œ ์ž‘์—… ํ•™์Šต์— ์ ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ˆ  ๋ฐฉํ–ฅ์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ•จ์ˆ˜๋ผ๋Š” ๊ฐœ๋…์€ ์ถ”ํ›„ ๋‹ค์–‘ํ•œ ๊ณ„์ธตํ˜• ๊ฐ•ํ™”ํ•™์Šต ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ์•„์ด๋””์–ด๋กœ, ๋‹ค๋ฅธ ์—ฐ๊ตฌ์ž๋“ค์ด ์ด๋ฅผ ๋ณ€ํ˜•ยทํ™•์žฅํ•˜์—ฌ ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งŒ๋“ค ๊ฐ€๋Šฅ์„ฑ๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‚ฌ๋žŒ์˜ ์‹œ์—ฐ์„ ํ™œ์šฉํ•œ ์ •์ฑ… ์—ฐ์‡„ ํ•™์Šต์ด๋‚˜, ๋‹ค์ค‘ ๋กœ๋ด‡ ํ˜‘์—… ๊ณผ์ œ์— ์ „์ด ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€๋ฅผ ๋„์ž…ํ•˜๋Š” ๋ฐฉํ–ฅ ๋“ฑ์ด ๋– ์˜ค๋ฆ…๋‹ˆ๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ, โ€œSequential Dexterity: Chaining Dexterous Policies for Long-Horizon Manipulationโ€ ๋…ผ๋ฌธ์€ ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘ ๋ฌธ์ œ์— ๋„์ „ํ•œ ํ˜์‹ ์ ์ธ ์—ฐ๊ตฌ๋กœ์„œ, ์ •์ฑ… ์—ฐ์‡„๋ฅผ ํ†ตํ•œ ์žฅ๊ธฐ ๊ณผ์—… ํ•ด๊ฒฐ์ด๋ผ๋Š” ๋กœ๋ด‡ํ•™์Šต ๋ถ„์•ผ์˜ ๋‚œ์ œ๋ฅผ ํ•œ ๋‹จ๊ณ„ ์ „์ง„์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ์˜ ์„ฑ๊ณผ๋Š” ํ–ฅํ›„ ๋กœ๋ด‡์ด ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ๋‹ค์–‘ํ•˜๊ณ  ๊ธด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด ์–ด๋–ค ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ํ•„์š”ํ•œ์ง€์— ๋Œ€ํ•œ ํ†ต์ฐฐ์„ ์ œ๊ณตํ•˜๋ฉฐ, ๊ด€๋ จ ๋ถ„์•ผ ์—ฐ๊ตฌ์ž ๋ฐ ํ•™์ƒ๋“ค์—๊ฒŒ ์œ ์šฉํ•œ ๋ฒค์น˜๋งˆํฌ์™€ ์•„์ด๋””์–ด์˜ ๊ธฐ์ค€์ ์ด ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์•ž์œผ๋กœ ์ด ๋ฐฉํ–ฅ์˜ ์—ฐ๊ตฌ๊ฐ€ ๋”์šฑ ๋ฐœ์ „ํ•˜์—ฌ, ๋กœ๋ด‡์ด ์‹ค์ œ ์„ธ๊ณ„์—์„œ ์—ฐ์†์ ์ธ ๋ณตํ•ฉ ์ž‘์—…์„ ์•ˆ์ „ํ•˜๊ณ  ์‹ ๋ขฐ์„ฑ ์žˆ๊ฒŒ ์ˆ˜ํ–‰ํ•˜๋Š” ๋‚ ์ด ์•ž๋‹น๊ฒจ์ง€๊ธธ ๊ธฐ๋Œ€ํ•ด๋ด…๋‹ˆ๋‹ค.

Copyright 2024, Jung Yeon Lee