Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • Brief Review
  • Detail Review
    • ๋ฐฐ๊ฒฝ: ๋กœ๋ด‡ ์„ฌ์„ธ ์กฐ์ž‘๊ณผ ๊ด€์ ˆ ๊ฐ์ฒด์˜ ๋„์ „
    • ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์˜ ํ•œ๊ณ„
    • DexArt ๋ฒค์น˜๋งˆํฌ: ๊ตฌ์„ฑ๊ณผ ํŠน์ง•
    • ์„ฑ๋Šฅ ํ‰๊ฐ€์™€ ์‹คํ—˜ ์„ค์ •
    • ์ฃผ์š” ๊ฒฐ๊ณผ์™€ ํ†ต์ฐฐ
    • ํ•œ๊ณ„์  ๋ฐ ํ–ฅํ›„ ๊ณผ์ œ

๐Ÿ“ƒDexArt ๋ฆฌ๋ทฐ

benchmark
rl
survey
Benchmarking Generalizable Dexterous Manipulation with Articulated Objects
Published

August 12, 2025

  • Paper Link
  1. ๐Ÿ•น๏ธ ์ด ๋…ผ๋ฌธ์€ ๋‹ค์ง€(multi-finger) ๋กœ๋ด‡ ์†์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๋‹ค๊ด€์ ˆ ๊ฐ์ฒด๋ฅผ ์กฐ์ž‘ํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๋ฒค์น˜๋งˆํ‚นํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์…‹ ๋ฐ ํƒœ์Šคํฌ ์Šค์œ„ํŠธ์ธ DexArt๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  2. ๐Ÿค– DexArt ๋ฒค์น˜๋งˆํฌ๋Š” 3D Point Cloud ๊ด€์ธก๊ฐ’์„ ๊ธฐ๋ฐ˜์œผ๋กœ RL(Reinforcement Learning) ์ •์ฑ…์„ ํ•™์Šตํ•˜๋ฉฐ, ํŠนํžˆ ํ•™์Šต๋˜์ง€ ์•Š์€ ๊ฐ์ฒด์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ๊ณผ ์‹œ๊ฐ์  ํ‘œํ˜„ ํ•™์Šต์˜ ์˜ํ–ฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  3. ๐Ÿ’ก ์—ฐ๊ตฌ ๊ฒฐ๊ณผ, ๋” ๋งŽ์€ ๊ฐ์ฒด๋กœ ํ›ˆ๋ จํ• ์ˆ˜๋ก ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜๊ณ , ๋” ์ž‘์€ PointNet ์ธ์ฝ”๋”๊ฐ€ ํšจ์œจ์ ์ด๋ฉฐ, ๊ฐ์ฒด ๋ถ€๋ถ„ ๋ถ„ํ• (part segmentation) ์‚ฌ์ „ ํ•™์Šต์ด ์กฐ์ž‘ ์„ฑ๋Šฅ ๋ฐ ์นด๋ฉ”๋ผ ์‹œ์  ๋ณ€ํ™”์— ๋Œ€ํ•œ ๊ฐ•๊ฑด์„ฑ์„ ํฌ๊ฒŒ ๊ฐœ์„ ํ•จ์„ ๋ฐํ˜€๋ƒˆ์Šต๋‹ˆ๋‹ค.

Brief Review

์ด ๋…ผ๋ฌธ์€ ๋กœ๋ด‡์ด ์ผ์ƒ์ƒํ™œ์—์„œ ์ธ๊ฐ„์ฒ˜๋Ÿผ ๋‹ค์–‘ํ•œ ๊ฐ€๋™ํ˜•(articulated) ๋ฌผ์ฒด๋ฅผ ์กฐ์ž‘ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ์ธ DexArt๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ํ˜„์žฌ ๋กœ๋ด‡ ์กฐ์ž‘์€ ์ฃผ๋กœ ๋ณ‘๋ ฌ ๊ทธ๋ฆฌํผ์— ์˜์กดํ•˜๊ณ  ์žˆ์–ด ์ œํ•œ๋œ ๋ฌผ์ฒด์—๋งŒ ์ ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, ๋‹ค์ค‘ ์†๊ฐ€๋ฝ ๋กœ๋ด‡ ์†(multi-finger robot hand)์€ ์ธ๊ฐ„์˜ ํ–‰๋™์— ๋” ๊ฐ€๊น๊ฒŒ ๋ชจ๋ฐฉํ•˜๊ณ  ๋‹ค์–‘ํ•œ ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด ์กฐ์ž‘์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ๋ฒค์น˜๋งˆํฌ๋Š” ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด๋ฅผ ์ด์šฉํ•œ ์ •๊ตํ•œ(dexterous) ์กฐ์ž‘์„ ๋‹ค๋ฃจ๋ฉฐ, ์—ฌ๋Ÿฌ ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—…์„ ์ •์˜ํ•˜๊ณ  ๊ฐ ์ž‘์—… ๋‚ด์—์„œ ๋‹ค์–‘ํ•œ ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด๋ฅผ ์กฐ์ž‘ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ฃผ์š” ๋ชฉํ‘œ๋Š” ํ•™์Šต๋œ ์ •์ฑ…์˜ ๋ฏธ๋“ฑ๋ก(unseen) ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ(generalizability)์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡ ์†๊ณผ ๋ฌผ์ฒด ๋ชจ๋‘์˜ ๋†’์€ ์ž์œ ๋„(Degrees of Freedom, DoF) ๋•Œ๋ฌธ์— ๋งค์šฐ ์–ด๋ ค์šด ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.

์ด ์—ฐ๊ตฌ๋Š” ์ผ๋ฐ˜ํ™”๋ฅผ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด 3D ํ‘œํ˜„ ํ•™์Šต(3D representation learning)๊ณผ Reinforcement Learning (RL)์„ ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค. 3D ์ ๊ตฐ(point cloud)์„ ๊ด€์ธก์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ  PointNet ์ธ์ฝ”๋”๋ฅผ ํ†ตํ•ด ์‹œ๊ฐ์  ํ‘œํ˜„์„ ์ถ”์ถœํ•˜์—ฌ ์˜์‚ฌ ๊ฒฐ์ •์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ๊ด‘๋ฒ”์œ„ํ•œ ์‹คํ—˜์„ ํ†ตํ•ด 3D ํ‘œํ˜„ ํ•™์Šต์ด 3D ์ ๊ตฐ ์ž…๋ ฅ์„ ์‚ฌ์šฉํ•˜๋Š” RL์˜ ์˜์‚ฌ ๊ฒฐ์ •์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€์— ๋Œ€ํ•œ ์ƒˆ๋กœ์šด ํ†ต์ฐฐ๋ ฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก  (Core Methodology)

  1. DexArt ๋ฒค์น˜๋งˆํฌ ๊ตฌ์„ฑ:
    • ์ž‘์—…(Task) ์ •์˜: Faucet (์ˆ˜๋„๊ผญ์ง€ ๋Œ๋ฆฌ๊ธฐ), Bucket (์–‘๋™์ด ๋“ค๊ธฐ), Laptop (๋…ธํŠธ๋ถ ์—ด๊ธฐ), Toilet (๋ณ€๊ธฐ ๋šœ๊ป‘ ์—ด๊ธฐ)์˜ ๋„ค ๊ฐ€์ง€ ์ž‘์—…์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ์ž‘์—…์€ ๋กœ๋ด‡ ์†์ด ๋ฌผ์ฒด์˜ ํŠน์ • ๊ฐ€๋™ ๋ถ€๋ถ„๊ณผ ์ƒํ˜ธ์ž‘์šฉํ•˜๋„๋ก ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, Faucet ์ž‘์—…์€ ์ˆ˜๋„๊ผญ์ง€ ์†์žก์ด๋ฅผ ์žก๊ณ  ์•ฝ 90๋„ ํšŒ์ „์‹œํ‚ค๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋ฉฐ, ์ด๋Š” ๋‹ค์ค‘ ์†๊ฐ€๋ฝ ์†์˜ ๋ฏธ์„ธํ•œ ์กฐ์ž‘ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. Bucket ์ž‘์—…์€ ์–‘๋™์ด ์†์žก์ด ์•„๋ž˜๋กœ ์†์„ ๋„ฃ์–ด ์•ˆ์ •์ ์ธ ํ˜•ํƒœ ํ์‡„(form closure)๋ฅผ ๊ตฌ์„ฑํ•˜์—ฌ ๋“ค์–ด ์˜ฌ๋ฆฌ๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.
    • ํ™˜๊ฒฝ ์„ค์ •: SAPIEN ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ 6์ž์œ ๋„(DoF) XArm6 ๋กœ๋ด‡ ํŒ”๊ณผ 16์ž์œ ๋„ Allegro Hand๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
      • ๊ด€์ธก ๊ณต๊ฐ„(Observation Space): ๋‘ ๋ถ€๋ถ„์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.
        • ๊ณ ์œ  ์ˆ˜์šฉ ๋ฐ์ดํ„ฐ(Proprioceptive Data) S_r: ๋กœ๋ด‡ ์ „์ฒด์˜ ํ˜„์žฌ ๊ด€์ ˆ ์œ„์น˜, ์„ ํ˜• ๋ฐ ๊ฐ์†๋„, ๊ทธ๋ฆฌ๊ณ  ๋ง๋‹จ ์ž‘์—…๊ธฐ(end-effector) ์†๋ฐ”๋‹ฅ์˜ ์œ„์น˜ ๋ฐ ์ž์„ธ๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
        • ๋ถ€๋ถ„ ์ ๊ตฐ(Partial Point Cloud) P_o: ๊นŠ์ด ์นด๋ฉ”๋ผ๋กœ ์ดฌ์˜๋œ ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด์™€ ๋กœ๋ด‡์˜ ์ ๊ตฐ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ด ์ ๊ตฐ์€ ๋กœ๋ด‡ ์ž‘์—… ๊ณต๊ฐ„ ๋‚ด์—์„œ ์ž˜๋ฆฌ๊ณ  ๊ท ์ผํ•˜๊ฒŒ ๋‹ค์šด์ƒ˜ํ”Œ๋ง๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋กœ๋ด‡ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ƒ์„ฑ๋œ ๊ฐ€์ƒ ๋กœ๋ด‡ ์ ๊ตฐ(imagined robot point cloud) P_i๋ฅผ P_o์— ์—ฐ๊ฒฐํ•˜์—ฌ ์†๊ฐ€๋ฝ๊ณผ ๊ฐ™์€ ๋กœ๋ด‡์˜ ์„ธ๋ถ€ ์ •๋ณด๋ฅผ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
      • ํ–‰๋™ ๊ณต๊ฐ„(Action Space): 22์ฐจ์› ๋ฒกํ„ฐ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡ ํŒ”์—๋Š” ๋ชฉํ‘œ ์„ ํ˜• ๋ฐ ๊ฐ์†๋„์— ๋Œ€ํ•œ 6์ž์œ ๋„ ์ž‘๋™ ๊ณต๊ฐ„ ์ œ์–ด(operational space control)๋ฅผ ์‚ฌ์šฉํ•˜๊ณ , Allegro Hand์—๋Š” 16๊ฐœ ๊ด€์ ˆ์˜ ๋ชฉํ‘œ ์œ„์น˜๋ฅผ ์ œ์–ดํ•˜๋Š” ๊ด€์ ˆ ์œ„์น˜ ์ œ์–ด๊ธฐ(PD control)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
    • ๋ณด์ƒ ์„ค๊ณ„(Reward Design): ์„ธ ๊ฐ€์ง€ ์›์น™์„ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค: (i) ํ•ฉ๋ฆฌ์ ์ธ ์‹œ๊ฐ„ ๋‚ด ํ•ด๊ฒฐ์„ ์œ„ํ•œ ๋ฐ€์ง‘ ๋ณด์ƒ(dense reward), (ii) ์ž์—ฐ์Šค๋Ÿฝ๊ณ  ์•ˆ์ „ํ•œ ํ–‰๋™ ์œ ๋„, (iii) ์ผ๋ฐ˜์ ์ด๊ณ  ํ‘œ์ค€ํ™”๋œ ๊ตฌ์กฐ. ์ž‘์—…์€ ๊ธฐ๋Šฅ์  ๋ถ€๋ถ„์— ๋„๋‹ฌ, ์†๊ณผ ๋ฌผ์ฒด ๊ฐ„ ์ ‘์ด‰ ํ˜•์„ฑ, ์ž‘์—…๋ณ„ ํ–‰๋™ ์‹คํ–‰์˜ ์„ธ ๋‹จ๊ณ„๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค.
      • ๋„๋‹ฌ ๋ฐ ์žก๊ธฐ ๋‹จ๊ณ„:
        • ๋„๋‹ฌ ๋ณด์ƒ: r_{\text{reach}} = \mathbf{1}(\text{stage} == 1) \min(-\|x_{\text{palm}} - x_{\text{object}}\|, \lambda) ์—ฌ๊ธฐ์„œ \mathbf{1}()๋Š” ์ง€์‹œ ํ•จ์ˆ˜(indicator function), x_{\text{palm}}๊ณผ x_{\text{object}}๋Š” ์†๋ฐ”๋‹ฅ๊ณผ ๋ฌผ์ฒด์˜ 3D ์œ„์น˜, \lambda๋Š” ๋ณด์ƒ ๊ธ‰์ฆ ๋ฐฉ์ง€๋ฅผ ์œ„ํ•œ ์ •๊ทœํ™” ํ•ญ์ž…๋‹ˆ๋‹ค.
        • ์ ‘์ด‰ ๋ณด์ƒ: r_{\text{contact}} = \mathbf{1}(\text{stage} \geq 2) \text{IsContact}(\text{palm, object}) \land \left(\sum_{\text{finger}} \text{IsContact}(\text{finger, object}) \geq 2\right) ์—ฌ๊ธฐ์„œ \text{IsContact}๋Š” ์ถฉ๋Œ ๊ฐ์ง€ ๋ถ€์šธ ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ์†๋ฐ”๋‹ฅ๊ณผ ์ตœ์†Œ ๋‘ ์†๊ฐ€๋ฝ์ด ๋ฌผ์ฒด์— ์ ‘์ด‰ํ•  ๋•Œ ์ข‹์€ ์ ‘์ด‰์ด ํ˜•์„ฑ๋œ ๊ฒƒ์œผ๋กœ ๊ฐ„์ฃผํ•ฉ๋‹ˆ๋‹ค.
      • ๋ถ€๋ถ„ ์กฐ์ž‘ ๋‹จ๊ณ„:
        • ์ง„ํ–‰ ๋ณด์ƒ: r_{\text{progress}} = \mathbf{1}(\text{stage} == 3)\text{Progress}(\text{task}) \text{Progress}๋Š” ์ž‘์—… ์ง„ํ–‰๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ž‘์—…๋ณ„ ํ‰๊ฐ€ ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค.
      • ํŒจ๋„ํ‹ฐ: ๋กœ๋ด‡ ์›€์ง์ž„์˜ ๋ถˆ์•ˆ์ •์„ฑ์„ ์ค„์ด๊ธฐ ์œ„ํ•ด ํ–‰๋™์˜ L_2 norm๊ณผ ์ž‘์—…๋ณ„ ํ•ญ์„ ํฌํ•จํ•˜๋Š” ํŒจ๋„ํ‹ฐ r_{\text{penalty}}๋ฅผ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ณด์ƒ์€ ์ด ๋„ค ๊ฐ€์ง€ ๋ณด์ƒ ํ•ญ์˜ ๊ฐ€์ค‘ ํ•ฉ์ž…๋‹ˆ๋‹ค.
    • ์ž์‚ฐ ์„ ํƒ ๋ฐ ์ฃผ์„: PartNet-Mobility ๋ฐ์ดํ„ฐ์…‹์˜ ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋ฉฐ, ๊ฐ ์ž‘์—…์— ์ ํ•ฉํ•˜๋„๋ก ์ˆ˜๋™์œผ๋กœ ์„ ํƒํ•˜๊ณ , ์Šค์ผ€์ผ ๋ฐ ์ดˆ๊ธฐ ์œ„์น˜๋ฅผ ์ฃผ์„ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡๊ณผ์˜ ์ดˆ๊ธฐ ๊ต์ฐจ๋ฅผ ๋ฐฉ์ง€ํ•˜๊ณ  ๋ชฉํ‘œ ๋‹ฌ์„ฑ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•ด ๋ฌด์ž‘์œ„์„ฑ์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
  2. ์ •์ฑ… ํ•™์Šต ์•„ํ‚คํ…์ฒ˜ ๋ฐ ์‹œ๊ฐ์  ์‚ฌ์ „ ํ•™์Šต(Visual Pre-training):
    • ์ •์ฑ… ํ•™์Šต: ์นดํ…Œ๊ณ ๋ฆฌ ์ˆ˜์ค€์˜ ์ผ๋ฐ˜ํ™”๋ฅผ ์œ„ํ•ด 3D ์ ๊ตฐ์„ ๊ด€์ธก์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ  PPO (Proximal Policy Optimization) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ RL ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค. PointNet์„ ์ ๊ตฐ ํŠน์ง• ์ถ”์ถœ๊ธฐ(feature extractor)๋กœ ์‚ฌ์šฉํ•˜๋ฉฐ, ์ด ํŠน์ง•์€ ๋กœ๋ด‡ ๊ณ ์œ  ์ˆ˜์šฉ ๋ฒกํ„ฐ S_r์—์„œ ์ถ”์ถœ๋œ ํŠน์ง•๊ณผ ๊ฒฐํ•ฉ๋˜์–ด ๊ฐ€์น˜๋ง(value network)๊ณผ ์ •์ฑ…๋ง(policy network)์œผ๋กœ ์ „๋‹ฌ๋ฉ๋‹ˆ๋‹ค.
    • ์ ๊ตฐ ์ƒ์ƒ(Point Cloud Imagination): ๋กœ๋ด‡-๋ฌผ์ฒด ์ƒํ˜ธ์ž‘์šฉ ์‹œ ๋ฐœ์ƒํ•˜๋Š” ํ์ƒ‰(occlusion)๊ณผ ๋ฉ”๋ชจ๋ฆฌ ์ œ์•ฝ์œผ๋กœ ์ธํ•œ ์ €ํ•ด์ƒ๋„ ์ ๊ตฐ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ˆœ๋ฐฉํ–ฅ ์šด๋™ํ•™(forward kinematics)์„ ํ†ตํ•ด ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์˜ ๊ธฐํ•˜ํ•™์  ํ˜•ํƒœ๋ฅผ ๊ณ„์‚ฐํ•˜์—ฌ ๊ฐ€์ƒ ์ ๊ตฐ P_i๋ฅผ ์ƒ˜ํ”Œ๋งํ•˜๊ณ  ๊ด€์ธก ์ ๊ตฐ P_o์™€ ํ•จ๊ป˜ PointNet ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์‹ค์ œ ๋กœ๋ด‡ ํ™˜๊ฒฝ์—์„œ๋„ ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ์ •๋ณด์ž…๋‹ˆ๋‹ค.
    • ์‚ฌ์ „ ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹:
      • DexArt Manipulation Dataset (DAM): ์กฐ์ž‘ ์ž‘์—…๊ณผ ๋™์ผํ•œ ์„ค์ •์œผ๋กœ ๋ Œ๋”๋ง๋œ ์ ๊ตฐ ๊ด€์ธก ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡๊ณผ ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด์˜ ์ƒํƒœ๋ฅผ ๋ฌด์ž‘์œ„๋กœ ์ƒ˜ํ”Œ๋งํ•˜์—ฌ ๊ด€์ธก ๋ฐ ๊ฐ€์ƒ ์ ๊ตฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋ถ„ํ• (segmentation) ์‚ฌ์ „ ํ•™์Šต์„ ์œ„ํ•ด ์ ๊ตฐ์„ ๊ธฐ๋Šฅ ๋ถ€๋ถ„, ๋‚˜๋จธ์ง€ ๋ฌผ์ฒด, ๋กœ๋ด‡ ์†, ๋กœ๋ด‡ ํŒ”์˜ 4๊ฐœ ๊ทธ๋ฃน์œผ๋กœ ๋ ˆ์ด๋ธ”๋งํ•ฉ๋‹ˆ๋‹ค.
      • PartNet-Mobility Manipulation Dataset (PMM): PartNet-Mobility์—์„œ ์ง์ ‘ ๋ Œ๋”๋ง๋˜๋ฉฐ, 46๊ฐœ์˜ ๋ฌผ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ์™€ ๊ฐ ์นดํ…Œ๊ณ ๋ฆฌ๋‹น 1,000๊ฐœ์˜ ์ ๊ตฐ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ๋ฌผ์ฒด ์ƒํƒœ์™€ ์นด๋ฉ”๋ผ ์‹œ์ ์€ ๋ฌด์ž‘์œ„๋กœ ์ƒ˜ํ”Œ๋ง๋ฉ๋‹ˆ๋‹ค. ๋ถ„๋ฅ˜(classification)๋ฅผ ์œ„ํ•ด ๊ฐ ๋ฌผ์ฒด๋Š” ๋™์ผํ•œ ์นดํ…Œ๊ณ ๋ฆฌ ๋ ˆ์ด๋ธ”์„ ๊ณต์œ ํ•˜๋ฉฐ, ๋ถ„ํ• ์„ ์œ„ํ•ด ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด์˜ ๊ธฐ๋Šฅ ๋ถ€๋ถ„์— ๋Œ€ํ•œ ์ •๋‹ต ๋ถ„ํ•  ๋งˆ์Šคํฌ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.
    • ์‚ฌ์ „ ํ•™์Šต ๋ฐฉ๋ฒ•: ์‹œ๊ฐ์  ํŠน์ง• ์ถ”์ถœ๊ธฐ(PointNet)์˜ ์ดˆ๊ธฐํ™”๋ฅผ ์œ„ํ•ด ๋‹ค์–‘ํ•œ 3D ํ‘œํ˜„ ํ•™์Šต ๋ฐฉ๋ฒ•์„ ๋ฒค์น˜๋งˆํ‚นํ•ฉ๋‹ˆ๋‹ค.
      • ์ง€๋„ ํ•™์Šต(Supervised Pre-training):
        • ์˜๋ฏธ ๋ถ„ํ• (Semantic Segmentation): DAM ๋ฐ PMM ๋ฐ์ดํ„ฐ์…‹์—์„œ PointNet์„ ํ•™์Šต์‹œ์ผœ ์ ๊ตฐ์„ ๊ธฐ๋Šฅ ๋ถ€๋ถ„, ๋‚˜๋จธ์ง€ ๋ฌผ์ฒด, ๋กœ๋ด‡ ์†, ๋กœ๋ด‡ ํŒ” ๋“ฑ์œผ๋กœ ๋ถ„ํ• ํ•ฉ๋‹ˆ๋‹ค.
        • ๋ถ„๋ฅ˜(Classification): PMM ๋ฐ์ดํ„ฐ์…‹์—์„œ PointNet์„ ํ•™์Šต์‹œ์ผœ 46๊ฐœ ๋ฌผ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ ์ค‘ ํ•˜๋‚˜๋กœ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค.
      • ์ž๊ธฐ ์ง€๋„ ํ•™์Šต(Self-supervised Pre-training):
        • ์ ๊ตฐ ์žฌ๊ตฌ์„ฑ(Point Cloud Reconstruction): OcCo ์—ฐ๊ตฌ๋ฅผ ๋”ฐ๋ผ DAM ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ธ์ฝ”๋”-๋””์ฝ”๋”(PointNet ์ธ์ฝ”๋” + PCN ๋””์ฝ”๋”) ์•„ํ‚คํ…์ฒ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์›๋ณธ ์ ๊ตฐ์„ ์žฌ๊ตฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์žฌ๊ตฌ์„ฑ ์†์‹ค๋กœ๋Š” Chamfer loss๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
        • SimSiam: DAM ๋ฐ์ดํ„ฐ์…‹์—์„œ PointNet์„ ์‚ฌ์šฉํ•˜์—ฌ siamese ๋„คํŠธ์›Œํฌ๋ฅผ ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค. ๋™์ผํ•œ ์ ๊ตฐ์˜ ๋‘ ๊ฐ€์ง€ ์ฆ๊ฐ•๋œ ๋ทฐ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ PointNet ์ธ์ฝ”๋”๋ฅผ ํ†ต๊ณผ์‹œํ‚จ ํ›„, ํ•œ์ชฝ์—์„œ ์œ ์‚ฌ์„ฑ์„ ์˜ˆ์ธกํ•˜๊ณ  ๋‹ค๋ฅธ ์ชฝ์—์„œ๋Š” ๊ธฐ์šธ๊ธฐ ์ „ํŒŒ๋ฅผ ์ค‘๋‹จํ•˜์—ฌ ์–‘์ชฝ์˜ ์œ ์‚ฌ์„ฑ์„ ์ตœ๋Œ€ํ™”ํ•˜๋„๋ก ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ ๋ฐ ์ฃผ์š” ๊ด€์ฐฐ (Experiments and Key Observations)

  • ์ฃผ์š” ๊ฒฐ๊ณผ: ์ ์ ˆํ•œ ์‹œ๊ฐ์  ์‚ฌ์ „ ํ•™์Šต์ด ์ •์ฑ… ํ•™์Šต์— ์ด์ ์„ ์ œ๊ณตํ•˜๋ฉฐ, ํŠนํžˆ โ€œ๋ถ€๋ถ„ ๋ถ„ํ• (part segmentation)โ€ ์‚ฌ์ „ ํ•™์Šต์€ ๋ชจ๋“  ์ž‘์—…์—์„œ ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” PointNet์ด ๊ธฐ๋Šฅ์  ๋ถ€๋ถ„์„ ๋” ์ž˜ ๊ตฌ๋ณ„ํ•˜๊ณ  ์œ„์น˜๋ฅผ ํŒŒ์•…ํ•˜๊ฒŒ ํ•˜์—ฌ, ์„ฌ์„ธํ•œ ์กฐ์ž‘ ์ž‘์—…์— ํ•„์ˆ˜์ ์ž„์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
  • ์–ด๋ธ”๋ ˆ์ด์…˜ ์—ฐ๊ตฌ(Ablation Study):
    • ํ›ˆ๋ จ์— ์‚ฌ์šฉ๋œ ๋ฌผ์ฒด ์ˆ˜: ๋” ๋งŽ์€ ๋ฏธ๋“ฑ๋ก ๋ฌผ์ฒด๋ฅผ ์‚ฌ์šฉํ•œ ํ›ˆ๋ จ์ด ์ •์ฑ…์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์— ์ค‘์š”ํ•จ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. 50%์˜ ๋“ฑ๋ก๋œ ๋ฌผ์ฒด๋กœ ํ›ˆ๋ จํ•œ ๊ฒฝ์šฐ๋ณด๋‹ค 100%๋ฅผ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋ฏธ๋“ฑ๋ก ๋ฌผ์ฒด์— ๋Œ€ํ•ด ์ผ๊ด€๋˜๊ฒŒ ๋” ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
    • ์‹œ๊ฐ ํŠน์ง• ์ถ”์ถœ๊ธฐ ํฌ๊ธฐ: ๊ฐ€์žฅ ์ž‘์€ PointNet(์€๋‹‰ ๊ณ„์ธต์ด ํ•˜๋‚˜)์ด ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ณ  ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ๋„ ๋›ฐ์–ด๋‚ฌ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์‹œ๊ฐ ๋ถ„์•ผ์—์„œ ๋” ํฐ ๋„คํŠธ์›Œํฌ๊ฐ€ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๊ฒƒ๊ณผ ์ƒ๋ฐ˜๋˜๋Š” ๊ฒฐ๊ณผ๋กœ, RL ์ตœ์ ํ™”์—์„œ ํฐ ์ธ์ฝ”๋”๊ฐ€ ๋” ์–ด๋ ค์šด ๋ฌธ์ œ๋ฅผ ์•ผ๊ธฐํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
    • ๋น„-3D ํ‘œํ˜„(Non-3D Representation): R3M์˜ ResNet-18๊ณผ ๊ฐ™์€ 2D ๊ธฐ๋ฐ˜ ์‚ฌ์ „ ํ•™์Šต ํ‘œํ˜„๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ, PointNet์„ ์‚ฌ์šฉํ•œ 3D ์‹œ๊ฐ ํ‘œํ˜„ ํ•™์Šต์ด ๋“ฑ๋ก ๋ฐ ๋ฏธ๋“ฑ๋ก ๋ฌผ์ฒด ๋ชจ๋‘์—์„œ ๋” ๋‚˜์€ ์กฐ์ž‘ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ์‹œ์  ๋ณ€ํ™”์— ๋Œ€ํ•œ ๊ฒฌ๊ณ ์„ฑ(Robustness to Viewpoint Change): PointNet ๊ธฐ๋ฐ˜ ์ •์ฑ…์€ ์นด๋ฉ”๋ผ ์‹œ์  ๋ณ€ํ™”์— ๋Œ€ํ•ด ๋›ฐ์–ด๋‚œ ๊ฒฌ๊ณ ์„ฑ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํ›ˆ๋ จ ์‹œ์ ๊ณผ ํฌ๊ฒŒ ๋‹ค๋ฅธ ์‹œ์ ์—์„œ๋„ ์„ฑ๊ณต๋ฅ ์ด ์ผ๊ด€๋˜๊ฒŒ ์œ ์ง€๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” PointNet ์•„ํ‚คํ…์ฒ˜์™€ ์ ๊ตฐ ํ‘œํ˜„ ํ•™์Šต์—์„œ ๋น„๋กฏ๋œ ๊ฒƒ์œผ๋กœ ๋ถ„์„๋ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก  (Conclusion)

์ด ์—ฐ๊ตฌ๋Š” ๊ฐ€๋™ํ˜• ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์ •๊ตํ•œ ์กฐ์ž‘์„ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ DexArt๋ฅผ ์ œ์•ˆํ•˜๊ณ , RL ์ •์ฑ…์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ์—ฐ๊ตฌํ–ˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์š” ํ†ต์ฐฐ๋ ฅ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  1. ๋” ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋กœ RL์„ ํ›ˆ๋ จํ•˜๋ฉด ๋” ๋‚˜์€ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  2. RL ํ›ˆ๋ จ์—๋Š” ํฐ ์ธ์ฝ”๋”๊ฐ€ ํ•ญ์ƒ ํ•„์š”ํ•œ ๊ฒƒ์€ ์•„๋‹ˆ๋ฉฐ, ๊ฐ€์žฅ ๋‹จ์ˆœํ•œ PointNet์ด ๊ฐ€์žฅ ์ข‹์€ ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ๊ณผ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
  3. 3D ์‹œ๊ฐ ์ดํ•ด, ํŠนํžˆ ๋ถ€๋ถ„ ๋ถ„ํ•  ์‚ฌ์ „ ํ•™์Šต์€ ๋ฏธ์„ธํ•œ ๊ธฐ๋Šฅ ๋ถ€๋ถ„ ์กฐ์ž‘์— ๋„์›€์ด ๋˜๋ฉฐ, ๋ชจ๋“  ์‹œ๊ฐ ์‚ฌ์ „ ํ•™์Šต ๋ฐฉ๋ฒ•์€ ํฐ ๊ธฐ๋Šฅ ๋ถ€๋ถ„ ์กฐ์ž‘์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
  4. PointNet ํŠน์ง• ์ถ”์ถœ๊ธฐ๋ฅผ ์‚ฌ์šฉํ•œ ๊ธฐํ•˜ํ•™์  ํ‘œํ˜„ ํ•™์Šต์€ ์นด๋ฉ”๋ผ ์‹œ์  ๋ณ€ํ™”์— ๋Œ€ํ•œ ์ •์ฑ…์˜ ๊ฐ•๋ ฅํ•œ ๊ฒฌ๊ณ ์„ฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. DexArt๊ฐ€ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ์ •๊ตํ•œ ์กฐ์ž‘ ๊ธฐ์ˆ  ๋ฐ ์ธ์ง€(perception)์™€ ์˜์‚ฌ ๊ฒฐ์ • ๊ฐ„์˜ ๊ณต๋™ ๋ฐœ์ „์„ ์—ฐ๊ตฌํ•˜๋Š” ํ”Œ๋žซํผ ์—ญํ• ์„ ํ•  ์ˆ˜ ์žˆ๊ธฐ๋ฅผ ๊ธฐ๋Œ€ํ•ฉ๋‹ˆ๋‹ค.

Detail Review

DexArt: ๊ด€์ ˆํ˜• ๊ฐ์ฒด ์„ฌ์„ธ ์กฐ์ž‘์„ ์œ„ํ•œ ๋ฒ”์šฉ ๋ฒค์น˜๋งˆํฌ

๋ฐฐ๊ฒฝ: ๋กœ๋ด‡ ์„ฌ์„ธ ์กฐ์ž‘๊ณผ ๊ด€์ ˆ ๊ฐ์ฒด์˜ ๋„์ „

๊ฐ€์ •์—์„œ ์ธ๊ฐ„์ด ๋‹ค๋ฃจ๋Š” ์ผ์ƒ ๋ฌผ์ฒด๋“ค์˜ ์ƒ๋‹น์ˆ˜๋Š” ๊ด€์ ˆํ˜• ๊ฐ์ฒด(articulated objects)์ž…๋‹ˆ๋‹ค. ๋ฌธ์†์žก์ด, ์ˆ˜๋‚ฉ์žฅ ๋„์–ด, ์ˆ˜๋„๊ผญ์ง€, ๋šœ๊ป‘ ๋“ฑ์€ ๋ชจ๋‘ ํ•˜๋‚˜ ์ด์ƒ์˜ ํšŒ์ „ ๋˜๋Š” ์Šฌ๋ผ์ด๋”ฉ ๊ด€์ ˆ์„ ์ง€๋‹ˆ๊ณ  ์žˆ์–ด, ๋ฌผ์ฒด ์ผ๋ถ€๋ฅผ ์›€์ง์—ฌ์•ผ ์ „์ฒด ๊ธฐ๋Šฅ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌผ์ฒด๋ฅผ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋Šฅ์ˆ™ํ•˜๊ฒŒ ๋‹ค๋ฃจ๋Š” ๋Šฅ๋ ฅ์€ ๋ฒ”์šฉ ๊ฐ€์ •์šฉ ๋กœ๋ด‡์—๊ฒŒ ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋กœ๋ด‡์—๊ฒŒ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ์„ฌ์„ธ ์กฐ์ž‘(dexterous manipulation) ๊ธฐ์ˆ ์„ ํ•™์Šต์‹œํ‚ค๋Š” ์ผ์€ ์‰ฝ์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด ๋กœ๋ด‡ ํŒ”์€ ์ฃผ๋กœ ๋‘ ์†๊ฐ€๋ฝ ์ง‘๊ฒŒ ํ˜•ํƒœ์˜ ํŒจ๋Ÿฌ๋Ÿด ๊ทธ๋ฆฌํผ(parallel gripper)๋ฅผ ์‚ฌ์šฉํ•ด์™”๋Š”๋ฐ, ์ด๋Š” ๊ตฌ์กฐ๊ฐ€ ๋‹จ์ˆœํ•œ ๋Œ€์‹  ์ทจ๊ธ‰ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฌผ์ฒด ํ˜•ํƒœ์— ์ œ์•ฝ์ด ํฌ๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ง‘๊ฒŒํ˜• ๊ทธ๋ฆฌํผ๋กœ๋Š” ์–‘๋™์ด์˜ ์†์žก์ด๋ฅผ ๋“ค์–ด์˜ฌ๋ฆฌ๊ฑฐ๋‚˜ ๋ถˆ๊ทœ์น™ํ•œ ๋ชจ์–‘์˜ ๋šœ๊ป‘์„ ์—ฌ๋Š” ๋“ฑ ๋ณต์žกํ•œ ํ˜•์ƒ์˜ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๊ธฐ๊ฐ€ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๋‹ค์„ฏ ์†๊ฐ€๋ฝ์„ ๊ฐ–์ถ˜ ์ธ๊ฐ„ํ˜• ๋กœ๋ด‡ ์†์„ ์‚ฌ์šฉํ•˜๋ฉด ์ธ๊ฐ„์˜ ์† ๋™์ž‘์„ ๋ณด๋‹ค ๊ฐ€๊น๊ฒŒ ๋ชจ๋ฐฉํ•  ์ˆ˜ ์žˆ์–ด ํ›จ์”ฌ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋ฅผ ์กฐ์ž‘ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค. ๋ฌผ๋ก  ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์† ์ž์ฒด๊ฐ€ ๊ฐ–๋Š” ๋†’์€ ์ž์œ ๋„(DoF) ๋•Œ๋ฌธ์— ์ œ์–ด๊ฐ€ ๋ณต์žกํ•ด์ง€๋ฉฐ, ๊ฑฐ๊ธฐ์— ๋”ํ•ด ๊ด€์ ˆ๋กœ ์—ฐ๊ฒฐ๋œ ๋ฌผ์ฒด์˜ ๋™์ ์ธ ์›€์ง์ž„๊นŒ์ง€ ๋‹ค๋ค„์•ผ ํ•˜๋ฏ€๋กœ ์ƒํƒœ๊ณต๊ฐ„๊ณผ ํ–‰๋™๊ณต๊ฐ„์ด ํญ๋ฐœ์ ์œผ๋กœ ๋Š˜์–ด๋‚˜ ํ•™์Šต์ด ๋งค์šฐ ์–ด๋ ค์šด ๋ฌธ์ œ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค. ์‚ฌ์‹ค ์ตœ๊ทผ๊นŒ์ง€๋„ ๊ฐ•ํ™”ํ•™์Šต ๋“ฑ์„ ํ†ตํ•ด ๋กœ๋ด‡ ์†์˜ ์„ฌ์„ธ ์กฐ์ž‘์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ๋“ค์€ ์ฃผ๋กœ ๊ณต ํ•˜๋‚˜๋ฅผ ์ฅ๊ณ  ํ”๋“ค๊ธฐ, ์†๋ฐ”๋‹ฅ ์œ„์—์„œ ๋ฌผ์ฒด ๋Œ๋ฆฌ๊ธฐ ๋“ฑ์˜ ๋‹จ์ผ ๊ฐ•์ฒด ๋ฌผ์ฒด์— ๊ตญํ•œ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•˜์Šต๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ ๊ด€์ ˆํ˜• ๋„๊ตฌ๋“ค์„ ๋‹ค๋ฃจ๋Š” ๋ฒ”์šฉ ์Šคํ‚ฌ๋กœ ํ™•์žฅํ•˜๋ ค๋ฉด, ์‹œ๊ฐ์ ์ธ ์ธ์‹๊ณผ ๋ณต์žกํ•œ ์ œ์–ด ์‚ฌ์ด์˜ ํ†ตํ•ฉ์  ์ ‘๊ทผ์ด ํ•„์š”ํ•˜๋ฉฐ ์ด์— ๋”ฐ๋ฅธ ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ๋‚œ์ œ๊ฐ€ ์ œ๊ธฐ๋ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์˜ ํ•œ๊ณ„

๊ฐ•ํ™”ํ•™์Šต ๋ฐ ๋กœ๋ด‡ ์ œ์–ด ์—ฐ๊ตฌ์˜ ๋ฐœ์ „์„ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๋กœ๋ด‡ ์กฐ์ž‘ ๋ฒค์น˜๋งˆํฌ๊ฐ€ ์ œ์•ˆ๋˜์–ด ์™”์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, MetaWorld ๋ฒค์น˜๋งˆํฌ๋Š” 50๊ฐœ๊ฐ€ ๋„˜๋Š” ๋‹ค์–‘ํ•œ ์ž‘์—…(task) ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•˜์—ฌ ๊ฐ•ํ™”ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ MetaWorld์˜ ๊ฐ ์ž‘์—…์€ ํ•˜๋‚˜์˜ ํŠน์ • ๋ฌผ์ฒด๋งŒ์„ ๋Œ€์ƒ์œผ๋กœ ์„ค๊ณ„๋˜์–ด ์žˆ์–ด, ๋™์ผ ์ž‘์—…์—์„œ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋กœ์˜ ์ผ๋ฐ˜ํ™”(generalization)๋ฅผ ์ธก์ •ํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋‹ค๋ฃจ๊ธฐ ์œ„ํ•ด ๋‚˜์˜จ ManiSkill ๋ฒค์น˜๋งˆํฌ๋Š” ์—ฌ๋Ÿฌ ์œ ํ˜•์˜ ์กฐ์ž‘ ๊ณผ์ œ์™€ ํ•จ๊ป˜ ๊ณผ์ œ๋‹น ๋‹ค์ˆ˜์˜ ๊ฐ์ฒด ๋ชจ๋ธ์„ ํฌํ•จ์‹œ์ผœ, ํ•œ ์ •์ฑ…์ด ์—ฌ๋Ÿฌ ๊ฐ์ฒด ์ธ์Šคํ„ด์Šค์— ๊ฑธ์ณ ์ž‘๋™ํ•˜๋„๋ก ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡์˜ ๋ฒ”์šฉ์„ฑ์„ ๋†’์ด๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๊ณ ๋ฌด์ ์ด์—ˆ์ง€๋งŒ, ManiSkill์ด ์ทจํ•œ ํŒจ๋Ÿฌ๋Ÿด ๊ทธ๋ฆฌํผ ์‚ฌ์šฉ์ด๋ผ๋Š” ์ „์ œ์—๋Š” ๊ทผ๋ณธ์ ์ธ ์ œ์•ฝ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋‘ ์†๊ฐ€๋ฝ ๊ทธ๋ฆฌํผ๋งŒ์œผ๋กœ๋Š” ๋กœ๋ด‡์ด ํ•  ์ˆ˜ ์žˆ๋Š” ์กฐ์ž‘์˜ ์ข…๋ฅ˜์™€ ๋ฐฉ์‹์ด ์ œํ•œ๋˜๊ธฐ ๋•Œ๋ฌธ์—, ์–‘๋™์ด ์†์žก์ด๋ฅผ ๋“œ๋Š” ๋“ฑ ๋ฉ€ํ‹ฐํ•‘๊ฑฐ ์†์ด ์š”๊ตฌ๋˜๋Š” ์„ฌ์„ธ ์ž‘์—…์„ ๋‹ค๋ฃจ์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€ ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ๋“ค์€ ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ๋ฅผ ์ถฉ๋ถ„ํžˆ ๊ณ ๋ คํ•˜์ง€ ์•Š๊ฑฐ๋‚˜, ๋กœ๋ด‡ ์†์˜ ๋Šฅ๋ ฅ์ด ์ œํ•œ๋˜์–ด ์‹ค์ œ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ํฌ๊ด„ํ•˜์ง€ ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ๊ด€์ ˆํ˜• ๊ฐ์ฒด๋ฅผ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ์ž์œ ๋กญ๊ฒŒ ๋‹ค๋ฃจ๋Š” ๋ฒ”์šฉ์ ์ด๊ณ  ์„ฌ์„ธํ•œ ์กฐ์ž‘ ๊ธฐ์ˆ ์„ ํ‰๊ฐ€ํ•˜๊ณ  ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ์—๋Š” ์—ฌ์ „ํžˆ ์ ์ ˆํ•œ ํ‰๊ฐ€ ํ™˜๊ฒฝ์ด ๋ถ€์กฑํ–ˆ์Šต๋‹ˆ๋‹ค.

DexArt ๋ฒค์น˜๋งˆํฌ: ๊ตฌ์„ฑ๊ณผ ํŠน์ง•

์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž 2023๋…„ CVPR์—์„œ ๋ฐœํ‘œ๋œ DexArt ๋ฒค์น˜๋งˆํฌ๋Š”, ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์†์„ ์ด์šฉํ•ด ๋‹ค์–‘ํ•œ ๊ด€์ ˆํ˜• ๋ฌผ์ฒด๋ฅผ ์กฐ์ž‘ํ•˜๋Š” ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ํ‘œ์ค€์„ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค. DexArt๋Š” ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ ์ •์˜๋œ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์กฐ์ž‘ ๊ณผ์ œ(task)๋“ค๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ์œผ๋ฉฐ, ๊ฐ ๊ณผ์ œ๋งˆ๋‹ค ํ›ˆ๋ จ์šฉ์œผ๋กœ ๋ฏธ๋ฆฌ ๋ณธ ๊ฐ์ฒด(seen)์™€ ํ…Œ์ŠคํŠธ์šฉ์œผ๋กœ ์ฒ˜์Œ ๋ณด๋Š” ๊ฐ์ฒด(unseen)์˜ ๊ตฌ๋ถ„์„ ํ†ตํ•ด ์ •์ฑ…์˜ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ์—„๋ฐ€ํžˆ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฒˆ ๋ฒค์น˜๋งˆํฌ์—์„œ๋Š” ๋Œ€ํ‘œ์ ์ธ 4๊ฐ€์ง€ ์กฐ์ž‘ ๊ณผ์ œ๊ฐ€ ์„ ์ •๋˜์—ˆ๋Š”๋ฐ, ๊ตฌ์ฒด์ ์ธ ๋‚ด์šฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • ์ˆ˜๋„๊ผญ์ง€ ๋Œ๋ฆฌ๊ธฐ (Faucet): ๋กœ๋ด‡ ์†์œผ๋กœ ์ˆ˜๋„๊ผญ์ง€์˜ ์†์žก์ด๋ฅผ ์žก๊ณ  ์•ฝ 90๋„ ์ •๋„ ํšŒ์ „์‹œ์ผœ ๋ฌผ์„ ํŠธ๋Š” ๋™์ž‘์ž…๋‹ˆ๋‹ค. ์ด ์ž‘์—…์—์„œ๋Š” ๋กœ๋ด‡ ํŒ”์˜ ์›€์ง์ž„๊ณผ ๋‹ค๊ด€์ ˆ ์†๊ฐ€๋ฝ์˜ ํ˜‘์‘์ด ๋ชจ๋‘ ํ•„์š”ํ•˜๋ฉฐ, ์„ฑ๊ณต ์—ฌ๋ถ€๋Š” ์ˆ˜๋„๊ผญ์ง€ ์†์žก์ด๋ฅผ ๋Œ๋ฆฐ ๊ฐ๋„๋กœ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. (์ด ๊ณผ์ œ์—๋Š” 18๊ฐœ์˜ ์ˆ˜๋„๊ผญ์ง€ ๋ชจ๋ธ ์ค‘ 11๊ฐœ๋ฅผ ํ›ˆ๋ จ์— ์‚ฌ์šฉํ•˜๊ณ  7๊ฐœ๋กœ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.)
  • ์–‘๋™์ด ๋“ค๊ธฐ (Bucket): ๋กœ๋ด‡ ์†์„ ์–‘๋™์ด์˜ ์ข์€ ์†์žก์ด ๋ฐ‘์œผ๋กœ ์ง‘์–ด๋„ฃ์–ด ์†์žก์ด๋ฅผ ์•„๋ž˜์—์„œ ๋“ค์–ด์˜ฌ๋ ค ๋“œ๋Š” ์ž‘์—…์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์„ ํŽผ์ณ ์†์žก์ด๋ฅผ ์•„๋ž˜์—์„œ ๋ฐ›์น˜๊ณ  ์ฅ๋Š” ํ˜•์ƒ ํ์‡„(form closure)๋ฅผ ๊ตฌํ˜„ํ•ด์•ผ ์•ˆ์ •์ ์œผ๋กœ ๋“ค ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ถฉ๋ถ„ํ•œ ๋งˆ์ฐฐ ์—†์ด๋Š” ์ด ์ž‘์—…์ด ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ํ‰๊ฐ€ ๊ธฐ์ค€์€ ์–‘๋™์ด๋ฅผ ์ผ์ • ๋†’์ด ์ด์ƒ ๋“ค์–ด์˜ฌ๋ ธ๋Š”์ง€๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค. (์ด ์ž‘์—…์—๋Š” ์ด 19๊ฐœ ์–‘๋™์ด ๋ชจ๋ธ ์ค‘ 11๊ฐœ๋ฅผ ํ›ˆ๋ จ์—, 8๊ฐœ๋ฅผ ํ…Œ์ŠคํŠธ์— ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.)
  • ๋…ธํŠธ๋ถ ์—ด๊ธฐ (Laptop): ๋‹ซํžŒ ๋…ธํŠธ๋ถ์˜ ํ™”๋ฉด์„ ์ค‘๊ฐ„ ๋ถ€๋ถ„์—์„œ ์†๊ฐ€๋ฝ๋“ค๋กœ ์ง‘์–ด๋“ค์–ด ๋…ธํŠธ๋ถ์„ ์—ฌ๋Š” ์ž‘์—…์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์œผ๋กœ ํ™”๋ฉด ํŒ์„ ์žก๊ณ  ์ –ํ˜€ ์˜ฌ๋ฆฌ๋Š” ๋™์ž‘์œผ๋กœ, ํ‰ํ–‰ ๊ทธ๋ฆฌํผ๋กœ๋„ ์‹œ๋„ํ•  ์ˆ˜๋Š” ์žˆ์œผ๋‚˜ ๋งค์šฐ ์ •ํ™•ํ•œ ์œ„์น˜๋กœ ํŒŒ์ง€๋ฅผ ํ•ด์•ผ ํ•˜๊ณ  ํฐ ์ž‘์—… ๊ณต๊ฐ„์ด ํ•„์š”ํ•ด ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋‹ค๊ด€์ ˆ ์†์„ ํ™œ์šฉํ•˜๋ฉด ๋ณด๋‹ค ์œ ์—ฐํ•˜๊ฒŒ ํ™”๋ฉด์„ ํŒŒ์ง€ํ•˜๊ณ  ์ –ํž ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์—ด๋ฆผ ๊ฐ๋„์˜ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ง€๊ณ  ์„ฑ๊ณต์„ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค. (๋…ธํŠธ๋ถ ๊ณผ์ œ์—๋Š” 17๊ฐœ ๋ชจ๋ธ ์ค‘ 11๊ฐœ ํ›ˆ๋ จ, 6๊ฐœ ํ…Œ์ŠคํŠธ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.)
  • ๋ณ€๊ธฐ ๋šœ๊ป‘ ์—ด๊ธฐ (Toilet): ๋…ธํŠธ๋ถ ์—ด๊ธฐ์™€ ์œ ์‚ฌํ•˜๊ฒŒ, ๋‹ซํžŒ ์–‘๋ณ€๊ธฐ ๋šœ๊ป‘์„ ๋“ค์–ด์˜ฌ๋ ค ์—ฌ๋Š” ์ž‘์—…์ž…๋‹ˆ๋‹ค. ๋ณ€๊ธฐ ๋šœ๊ป‘์€ ๋ชจ์–‘์ด ํฌ๊ณ  ๋ถˆ๊ทœ์น™ํ•˜์—ฌ ํ™”๋ฉด์ด ํ‰ํ‰ํ•œ ๋…ธํŠธ๋ถ๋ณด๋‹ค ํŒŒ์ง€๊ฐ€ ๊นŒ๋‹ค๋กญ๊ณ  ๋ฌด๊ฑฐ์šด ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•„ ์ž‘์—… ๋‚œ์ด๋„๊ฐ€ ๋†’์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์ด ๋šœ๊ป‘์„ ์ผ์ • ๊ฐ๋„ ์ด์ƒ ์—ด๋ฉด ์„ฑ๊ณต์œผ๋กœ ๊ฐ„์ฃผํ•˜๋ฉฐ, ์ด ์ž‘์—…์„ ํ†ตํ•ด ๋ณด๋‹ค ๋ณต์žกํ•œ ํ˜•์ƒ์˜ ๊ด€์ ˆ๋ฌผ์ฒด ์กฐ์ž‘์— ๋Œ€ํ•œ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. (๋ณ€๊ธฐ ๋šœ๊ป‘์€ 28๊ฐœ ๋ชจ๋ธ ์ค‘ 17๊ฐœ ํ›ˆ๋ จ, 11๊ฐœ๊ฐ€ ํ…Œ์ŠคํŠธ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.)

๊ฐ ๊ณผ์ œ๋งˆ๋‹ค 17~28๊ฐœ์˜ ๋‹ค์–‘ํ•œ ๊ฐ์ฒด ๋ชจ๋ธ์ด ํฌํ•จ๋˜์–ด ์žˆ์œผ๋ฉฐ, ์ด ์ค‘ ์•ฝ 60%๋Š” ํ›ˆ๋ จ์— ์‚ฌ์šฉ๋˜๊ณ  40%๋Š” ํ•œ ๋ฒˆ๋„ ๋ณธ ์  ์—†๋Š” ์ƒˆ๋กœ์šด ๊ฐ์ฒด๋กœ ๋ถ„๋ฆฌ๋˜์–ด ์„ฑ๋Šฅ ํ‰๊ฐ€์— ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ตฌ์„ฑ์œผ๋กœ, ์˜ˆ๋ฅผ ๋“ค์–ด ๋กœ๋ด‡์ด ์ˆ˜๋„๊ผญ์ง€ ๊ณผ์ œ์—์„œ 11๊ฐœ์˜ ์ˆ˜๋„๊ผญ์ง€ ๋ชจ๋ธ์„ ๋ณด๊ณ  ํ•™์Šตํ•œ ํ›„ ์ฒ˜์Œ ๋ณด๋Š” 7๊ฐ€์ง€ ์ƒˆ๋กœ์šด ๋””์ž์ธ์˜ ์ˆ˜๋„๊ผญ์ง€๋ฅผ ์–ผ๋งˆ๋‚˜ ์„ฑ๊ณต์ ์œผ๋กœ ํ‹€ ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ์‹œํ—˜ํ•จ์œผ๋กœ์จ, ๋ฒ”์ฃผ ์ˆ˜์ค€(category-level)์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๊ฐ๊ด€์ ์œผ๋กœ ์ธก์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

DexArt์˜ ๋ชจ๋“  ์ž‘์—… ํ™˜๊ฒฝ์€ SAPIEN ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์— ๊ตฌํ˜„๋˜์—ˆ๊ณ , ๋กœ๋ด‡ ํ”Œ๋žซํผ์œผ๋กœ๋Š” 6์ž์œ ๋„ ์‚ฐ์—…์šฉ ๋กœ๋ด‡ํŒ” XArm6 ๋์— ์ธ๊ฐ„ ์†๊ณผ ๋น„์Šทํ•œ 4์†๊ฐ€๋ฝ ์•Œ๋ ˆ๊ทธ๋กœ ๋กœ๋ด‡ ์†(Allegro Hand)(16์ž์œ ๋„ ์†๊ฐ€๋ฝ ๊ด€์ ˆ)์„ ์žฅ์ฐฉํ•œ ํ˜•ํƒœ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡์ด ๋ฐ›๋Š” ๊ด€์ธก(observation) ์ •๋ณด๋Š” ๋‘ ๋ถ€๋ถ„์œผ๋กœ ๊ตฌ์„ฑ๋˜๋Š”๋ฐ, ์ฒซ์งธ๋Š” ๋กœ๋ด‡ ์ž์ฒด์˜ ๊ด€์ ˆ ๊ฐ๋„, ์†๋„, ํŒ” ๋๋‹จ(์†๋ฐ”๋‹ฅ)์˜ ์œ„์น˜์™€ ์ž์„ธ ๋“ฑ์˜ ํ”„๋ฆฌ์˜คํ”„๋ฆฌ์…‰์…˜(proprioception)์ด๊ณ , ๋‘˜์งธ๋Š” ์žฅ๋ฉด์„ ๋ณด๋Š” ๊นŠ์ด ์นด๋ฉ”๋ผ๋กœ๋ถ€ํ„ฐ ํš๋“ํ•œ ๋ถ€๋ถ„์ ์ธ ํฌ์ธํŠธํด๋ผ์šฐ๋“œ์ž…๋‹ˆ๋‹ค. ์ด 3์ฐจ์› ์ ๊ตฐ์€ ๋กœ๋ด‡ ํŒ”๊ณผ ๋ฌผ์ฒด๊ฐ€ ๋†“์ธ ์ž‘์—…๊ณต๊ฐ„ ์ฃผ์œ„๋กœ ํ•œ์ •ํ•˜๊ณ  ๋‹ค์šด์ƒ˜ํ”Œ๋งํ•˜์—ฌ ์‚ฌ์šฉํ•˜๋ฉฐ, ๊ฑฐ๊ธฐ์— ๋กœ๋ด‡ ์ž์‹ ์˜ ๋ชจ๋ธ์—์„œ ์ƒ์„ฑํ•œ ์ ๊ตฐ๋„ ํ•ฉ์ณ ์ž…๋ ฅ์œผ๋กœ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ 3D ์‹œ๊ฐ ์ •๋ณด๋Š” PointNet ์‹ ๊ฒฝ๋ง์œผ๋กœ ์ฒ˜๋ฆฌ๋˜์–ด ์ค‘์š”ํ•œ ๋ฌผ์ฒด์˜ ํ˜•ํƒœ์™€ ๋ถ€์œ„ ํŠน์„ฑ์„ ์ธ์ฝ”๋”ฉํ•˜๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ •์ฑ…์ด ์˜์‚ฌ๊ฒฐ์ •์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ํ•œํŽธ ํ–‰๋™(action) ๊ณต๊ฐ„์€ ๋กœ๋ด‡ ํŒ”์˜ 6-DoF ์†๋„ ์ œ์–ด ์ง€๋ น๊ณผ ์†๊ฐ€๋ฝ 16๊ฐœ ๊ด€์ ˆ์˜ ๋ชฉํ‘œ ์œ„์น˜๋กœ ์ด๋ฃจ์–ด์ง„ 22์ฐจ์› ์—ฐ์† ๋ฒกํ„ฐ๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ ํŒ”์€ Operational Space Control ๋ฐฉ์‹์œผ๋กœ ์†๋ฐ”๋‹ฅ์˜ ์„ ์†๋„ ๋ฐ ๊ฐ์†๋„๋ฅผ ๋ช…๋ นํ•˜๊ณ , ์†๊ฐ€๋ฝ์€ ๊ฐ ๊ด€์ ˆ์˜ ๋ชฉํ‘œ ๊ฐ๋„(position control)๋ฅผ PD ์ œ์–ด๋กœ ์ˆ˜ํ–‰ํ•˜๋Š” ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ •์˜๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์€ ์ž์œ ๋กญ๊ฒŒ ํŒ”์„ ์›€์ง์—ฌ ๋ฌผ์ฒด๋ฅผ ์ฅ๊ณ  ํž˜์„ ์ค„ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ์† ๋ชจ์–‘์„ ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต์„ ์›ํ™œํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด ๋ณด์ƒ ์„ค๊ณ„์—๋„ ์‹ ๊ฒฝ์„ ์ผ์Šต๋‹ˆ๋‹ค. DexArt์˜ ๋ชจ๋“  ๊ณผ์ œ๋Š” ๊ณตํ†ต์ ์œผ๋กœ 3๋‹จ๊ณ„์˜ ์„ธ๋ถ„ํ™”๋œ ๋ณด์ƒ ๊ตฌ์กฐ๋ฅผ ๊ฐ–๋Š”๋ฐ, ์ด๋ฅผ ํ†ตํ•ด ์—์ด์ „ํŠธ๊ฐ€ ์ ‘๊ทผ โ†’ ํŒŒ์ง€(grasp) โ†’ ์กฐ์ž‘ ์ˆ˜ํ–‰์˜ ์ˆœ์ฐจ ๋‹จ๊ณ„๋ฅผ ๋ฐŸ๋„๋ก ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค. ์ฒซ ๋ฒˆ์งธ ๋‹จ๊ณ„์—์„œ๋Š” ๋กœ๋ด‡ ์†๋ฐ”๋‹ฅ์ด ํ•ด๋‹น ๋ฌผ์ฒด์˜ ๊ธฐ๋Šฅ์  ๋ถ€์œ„(์˜ˆ๋ฅผ ๋“ค์–ด ์ˆ˜๋„๊ผญ์ง€ ์†์žก์ด)์— ์ถฉ๋ถ„ํžˆ ๊ฐ€๊นŒ์ด ์ ‘๊ทผํ•˜๋ฉด ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ˜์˜ ๋ณด์ƒ์„ ์ค๋‹ˆ๋‹ค. ๋‘˜์งธ ๋‹จ๊ณ„์—์„œ๋Š” ์†๋ฐ”๋‹ฅ๊ณผ ์—ฌ๋Ÿฌ ์†๊ฐ€๋ฝ์ด ๋ฌผ์ฒด์™€ ์ ‘์ด‰ํ•˜์—ฌ ์•ˆ์ •์ ์ธ ํŒŒ์ง€๋ฅผ ํ˜•์„ฑํ•˜๋ฉด ์ถ”๊ฐ€ ๋ณด์ƒ์„ ์ง€๊ธ‰ํ•ฉ๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์†๋ฐ”๋‹ฅ(palm)๊ณผ ์ตœ์†Œ ๋‘ ๊ฐœ ์ด์ƒ์˜ ์†๊ฐ€๋ฝ์ด ๋ฌผ์ฒด์™€ ์ ‘์ด‰ํ•œ ์ƒํƒœ๋ฅผ ๋งŒ์กฑ๋„ ๋†’์€ ํŒŒ์ง€๋กœ ๊ฐ„์ฃผํ•˜์—ฌ ๋ณด์ƒํ•˜๋„๋ก ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰ ๋‹จ๊ณ„์—์„œ๋Š” ๋ฌผ์ฒด์˜ ๊ด€์ ˆ์„ ๋ชฉํ‘œ์น˜๊นŒ์ง€ ์‹ค์ œ๋กœ ์›€์ง์—ฌ ๊ณผ์ œ๋ฅผ ์™„์ˆ˜ํ•œ ์ •๋„(์ง„ํ–‰์œจ)์— ๋”ฐ๋ผ ๋ณด์ƒ์„ ๋ถ€์—ฌํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ˆ˜๋„๊ผญ์ง€๋ผ๋ฉด ํ˜„์žฌ ๋ฐธ๋ธŒ ์†์žก์ด๋ฅผ ์–ผ๋งˆ๋‚˜ ๋Œ๋ ธ๋Š”์ง€ ๊ฐ๋„ ๋ณ€ํ™”๋Ÿ‰์„ ๊ณ„์‚ฐํ•˜์—ฌ, 90๋„์— ๊ฐ€๊นŒ์›Œ์งˆ์ˆ˜๋ก ๋†’์€ ๋ณด์ƒ์„ ์ฃผ๋Š” ์‹์ž…๋‹ˆ๋‹ค. ์ถ”๊ฐ€์ ์œผ๋กœ, ๋ถˆํ•„์š”ํ•˜๊ฒŒ ๊ณผ๊ฒฉํ•˜๊ฑฐ๋‚˜ ๋ถˆ์•ˆ์ •ํ•œ ์›€์ง์ž„์„ ํ”ผํ•˜๋„๋ก ํŒจ๋„ํ‹ฐ ํ•ญ๋„ ํฌํ•จ๋˜์—ˆ๋Š”๋ฐ, ์ด๋Š” ํ–‰๋™ ๋ฒกํ„ฐ์˜ ํฌ๊ธฐ์— ๋Œ€ํ•œ L2 ๋…ธ๋ฆ„ ์ œ์žฌ์™€ ๊ณผ์ œ๋ณ„๋กœ ์ •์˜๋œ ์•ฝ๊ฐ„์˜ ๋ฒŒ์  ํ•ญ์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ „์ฒด ๋ณด์ƒ์€ ์ด ์„ธ ๋‹จ๊ณ„ ๋ณด์ƒ๊ณผ ํŒจ๋„ํ‹ฐ๋ฅผ ๊ฐ€์ค‘ํ•ฉํ•˜์—ฌ ๊ณ„์‚ฐ๋˜๋ฉฐ, ๊ฐ ์ž‘์—…์— ๊ฑฐ์˜ ๋™์ผํ•œ ๊ตฌ์กฐ๋ฅผ ์ ์šฉํ•จ์œผ๋กœ์จ ํ•™์Šต ๋‚œ์ด๋„์™€ ๋ณด์ƒ์˜ ์ผ๊ด€์„ฑ์„ ์œ ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์š”์•ฝํ•˜๋ฉด, DexArt๋Š” ๋‹ค์–‘ํ•œ ๊ด€์ ˆํ˜• ๋ฌผ์ฒด ๋ชจ๋ธ๋“ค์„ ํ™œ์šฉํ•œ ๋„ค ๊ฐ€์ง€ ๊ณผ์ œ ์„ธํŠธ์™€, ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์†์„ ํ™œ์šฉํ•œ ํ‘œ์ค€ํ™”๋œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ, ๊ทธ๋ฆฌ๊ณ  ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๊ณ ๋ คํ•œ ํ‰๊ฐ€ ํ”„๋กœํ† ์ฝœ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ์ฒด ๋ชจ๋ธ๋“ค์€ PartNet-Mobility ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ๋ถ€ํ„ฐ ์„ ๋ณ„๋˜์—ˆ์œผ๋ฉฐ, ์ผ๊ด€๋œ ๋ฌผ๋ฆฌ ๋ชจ๋ธ์„ ์œ„ํ•ด ๋ถ€์ ์ ˆํ•œ ๋ชจ๋ธ์€ ์ œ์™ธํ•˜๊ณ  ํฌ๊ธฐ๋‚˜ ์ดˆ๊ธฐ ์œ„์น˜ ๋“ฑ์„ ์‚ฌ๋žŒ์ด ์ง์ ‘ ์กฐ์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ›ˆ๋ จ ์ค‘์—๋„ ์—ํ”ผ์†Œ๋“œ๋งˆ๋‹ค ๊ฐ์ฒด์˜ ์ดˆ๊ธฐ ๋ฐฐ์น˜ ๊ฐ๋„๋‚˜ ์œ„์น˜๋ฅผ ์•ฝ๊ฐ„์”ฉ ๋žœ๋คํ•˜๊ฒŒ ๋ณ€ํ™”์‹œ์ผœ, ์ •์ฑ…์ด ๋ณด๋‹ค ๋‹ค์–‘ํ•œ ์ƒํ™ฉ์— ๋…ธ์ถœ๋˜๋„๋ก ์ฒ˜๋ฆฌํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์„ธ์‹ฌํ•œ ํ™˜๊ฒฝ ๊ตฌ์ถ•์œผ๋กœ, DexArt๋Š” ๊ธฐ์กด์— ๋‹ค๋ฃจ๊ธฐ ์–ด๋ ค์› ๋˜ ๋ฒ”์šฉ ์„ฌ์„ธ ์กฐ์ž‘์˜ ํ•™์Šต์„ ์ฒด๊ณ„์ ์œผ๋กœ ์—ฐ๊ตฌํ•  ์ˆ˜ ์žˆ๋Š” ์žฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์„ฑ๋Šฅ ํ‰๊ฐ€์™€ ์‹คํ—˜ ์„ค์ •

DexArt์—์„œ๋Š” ํ•™์Šต๋œ ์ •์ฑ…์˜ ์„ฑ๋Šฅ์„ ํŒ๋‹จํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ ์—ํ”ผ์†Œ๋“œ๊ฐ€ ์„ฑ๊ณต์ ์œผ๋กœ ์™„๋ฃŒ๋˜์—ˆ๋Š”์ง€์˜ ๋น„์œจ์ธ ์„ฑ๊ณต๋ฅ (success rate)์„ ์ฃผ๋œ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์„ฑ๊ณต ๊ธฐ์ค€์€ ๊ณผ์ œ์— ๋”ฐ๋ผ ์•ž์„œ ์–ธ๊ธ‰ํ•œ ๊ด€์ ˆ ์ด๋™์ด ์ผ์ • ์ž„๊ณ„์น˜ ์ด์ƒ ๋‹ฌ์„ฑ๋˜์—ˆ๋Š”์ง€๋กœ ์ •์˜๋˜๋ฉฐ, ์˜ˆ๋ฅผ ๋“ค์–ด ์ˆ˜๋„๊ผญ์ง€์˜ ๊ฒฝ์šฐ ์ œํ•œ ์‹œ๊ฐ„ ๋‚ด์— ๋ฐธ๋ธŒ๋ฅผ 90๋„ ๊ฐ€๊นŒ์ด ๋Œ๋ ธ๋‹ค๋ฉด ์„ฑ๊ณต์œผ๋กœ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ์ค‘์š”ํ•œ ๊ฒƒ์€ ์ผ๋ฐ˜ํ™” ํ‰๊ฐ€๋กœ์„œ, ํ›ˆ๋ จ์— ์‚ฌ์šฉ๋œ ๋ฌผ์ฒด๋“ค(Seen)์—์„œ์˜ ์„ฑ๊ณต๋ฅ ๋ฟ ์•„๋‹ˆ๋ผ ์ฒ˜์Œ ์ ‘ํ•˜๋Š” ์ƒˆ ๋ฌผ์ฒด(Unseen)๋“ค์—์„œ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณ„๋„๋กœ ์ธก์ •ํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ •์ฑ…์ด ํ›ˆ๋ จ ๋•Œ ๋ณธ ์  ์—†๋Š” ๋ชจ์–‘์˜ ๊ฐ์ฒด์—๋„ ์–ผ๋งˆ๋‚˜ ์ž˜ ๋Œ€์‘ํ•˜๋Š”์ง€๋ฅผ ๊ฐ๊ด€์ ์œผ๋กœ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ์™ธ ๋ณด์กฐ ์ง€ํ‘œ๋กœ ์—ํ”ผ์†Œ๋“œ๋‹น ๋ˆ„์  ๋ณด์ƒ(return)์˜ ํ‰๊ท ๋„ ๋ณด๊ณ ํ•˜๋ฉฐ, ํ•™์Šต ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ์„ ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•ด ํ•™์Šต์ด ์ง„ํ–‰๋จ์— ๋”ฐ๋ผ ์„ฑ๊ณต๋ฅ ์ด ์ƒ์Šนํ•˜๋Š” ๊ณก์„ ์˜ ๊ธฐ์šธ๊ธฐ ๋“ฑ์„ ํ•จ๊ป˜ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋“  ์‹คํ—˜์€ ๋™์ผํ•œ PPO(Proximal Policy Optimization) ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ํŒŒ๋ผ๋ฏธํ„ฐ ์„ธํŒ… ํ•˜์— ๊ณผ์ œ๋ณ„๋กœ 3๊ฐœ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ์‹œ๋“œ๋ฅผ ์‚ฌ์šฉํ•ด ๋ฐ˜๋ณต ํ•™์Šตํ•˜์—ฌ ๊ฒฐ๊ณผ์˜ ์‹ ๋ขฐ๋„๋ฅผ ๋†’์˜€์Šต๋‹ˆ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ํ•™์Šต ์„ค์ •์„ ๋น„๊ต ํ‰๊ฐ€ํ•˜์—ฌ DexArt ๊ณผ์ œ์—์„œ์˜ ์„ฑ๋Šฅ ๋ณ€ํ™”๋ฅผ ์ƒ์„ธํžˆ ๋ถ„์„ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋จผ์ €, ์‹œ๊ฐ ์ธ์ฝ”๋” ์‹ ๊ฒฝ๋ง(PointNet)์— ๋Œ€ํ•ด ์„œ๋กœ ๋‹ค๋ฅธ ์‚ฌ์ „ ํ•™์Šต(pre-training) ๋ฐฉ๋ฒ•๋“ค์„ ์ ์šฉํ•œ ํ›„ ๊ฐ•ํ™”ํ•™์Šต์„ ์ง„ํ–‰ํ•œ ๊ฒฝ์šฐ๋“ค์„ ๋น„๊ตํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, PointNet์„ ์ง€๋„ํ•™์Šต ๋ฐฉ์‹์œผ๋กœ ๊ฐ์ฒด ๋ถ„๋ฅ˜(46๊ฐœ ๋ฒ”์ฃผ์˜ ๊ฐ์ฒด ๋ถ„๋ฅ˜) ๋˜๋Š” ๋ถ€๋ถ„ ๋ถ„ํ• (segmentation) ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋„๋ก ๋ฏธ๋ฆฌ ํ•™์Šต์‹œํ‚ค๊ฑฐ๋‚˜, ์ž๊ธฐ์ง€๋„ํ•™์Šต ๋ฐฉ์‹์œผ๋กœ ํฌ์ธํŠธํด๋ผ์šฐ๋“œ ๋ณต์›(reconstruction)์ด๋‚˜ SimSiam ๋ฐฉ์‹์œผ๋กœ ์‚ฌ์ „ํ•™์Šต์‹œํ‚จ ํ›„, ์ด๋ ‡๊ฒŒ ์–ป์€ ๊ฐ€์ค‘์น˜๋ฅผ ์ดˆ๊ธฐํ™”๊ฐ’์œผ๋กœ ์จ์„œ RL์„ ์ง„ํ–‰ํ•˜๋Š” ์‹คํ—˜๋“ค์ด ์ˆ˜ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด๋“ค๊ณผ ์•„๋ฌด ์‚ฌ์ „ํ•™์Šต ์—†์ด ์ฒ˜์Œ๋ถ€ํ„ฐ ํ•™์Šตํ•œ ๊ฒฝ์šฐ๋ฅผ ๋Œ€๋น„ํ•˜์—ฌ, ์‹œ๊ฐ ํ‘œํ˜„ ํ•™์Šต์˜ ํšจ๊ณผ๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์œผ๋กœ, ํ›ˆ๋ จ์— ์‚ฌ์šฉ๋œ ๊ฐ์ฒด์˜ ์ˆ˜๋ฅผ ์ ˆ๋ฐ˜์œผ๋กœ ์ค„์˜€์„ ๋•Œ์™€ ๋ชจ๋‘ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ๋ฅผ ๋น„๊ตํ•˜์—ฌ, ์ฃผ์–ด์ง„ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ๋‹ค์–‘์„ฑ์ด ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์‹คํ—˜์ ์œผ๋กœ ๊ฒ€์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ˆ˜๋„๊ผญ์ง€ ์ž‘์—…์—์„œ ์›๋ž˜ 11๊ฐœ์˜ ํ›ˆ๋ จ ๊ฐ์ฒด ์ค‘ 5~6๊ฐœ๋งŒ ๊ฐ€์ง€๊ณ  ํ•™์Šต์‹œํ‚จ ์ •์ฑ…๊ณผ 11๊ฐœ ๋ชจ๋‘ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๋ฅผ ๋น„๊ตํ•˜๋Š” ์‹์ž…๋‹ˆ๋‹ค. ์„ธ ๋ฒˆ์งธ๋กœ, PointNet ์‹œ๊ฐ ์ธ์ฝ”๋”์˜ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ž‘๊ฒŒ/์ค‘๊ฐ„/ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€๋กœ ๋ณ€๊ฒฝํ•˜์—ฌ, ์‹ ๊ฒฝ๋ง ์šฉ๋Ÿ‰์— ๋”ฐ๋ฅธ ํ•™์Šต ์†๋„์™€ ์„ฑ๋Šฅ ์ฐจ์ด๋ฅผ ์‚ดํŽด๋ณด์•˜์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ํ•™์Šต๋œ ์ •์ฑ…์˜ ์นด๋ฉ”๋ผ ์‹œ์  ๋ณ€ํ™”์— ๋Œ€ํ•œ ๊ฐ•์ธ์„ฑ์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํ•™์Šต ๋‹น์‹œ ๊ณ ์ •๋œ ์‹œ์ ์ด ์•„๋‹ˆ๋ผ, ์ž„์˜์˜ ์ƒˆ๋กœ์šด ๊ฐ๋„์—์„œ ์ดฌ์˜๋œ ๊นŠ์ด ์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ์–ป์€ ํฌ์ธํŠธํด๋ผ์šฐ๋“œ๋ฅผ ์ž…๋ ฅํ–ˆ์„ ๋•Œ๋„ ์ •์ฑ…์ด ์ž˜ ๋™์ž‘ํ•˜๋Š”์ง€๋ฅผ ๋ณด๋Š” ์‹คํ—˜์ž…๋‹ˆ๋‹ค. ํŠนํžˆ ์ด ์‹คํ—˜์—์„œ๋Š” 3D ํฌ์ธํŠธ๋„ท ๊ธฐ๋ฐ˜ ์ •์ฑ…๊ณผ, ๋Œ€๋น„๊ตฐ์œผ๋กœ 2D ์ด๋ฏธ์ง€ ๊ธฐ๋ฐ˜ ์ •์ฑ…์„ ํ•จ๊ป˜ ์‹œํ—˜ํ•˜์˜€์Šต๋‹ˆ๋‹ค. 2D ์ •์ฑ…์€ RGB ์นด๋ฉ”๋ผ ์˜์ƒ์„ ์ž…๋ ฅ์œผ๋กœ ํ•˜๊ณ  ResNet-18 ์‹ ๊ฒฝ๋ง์„ ์‹œ๊ฐ ๋ฐฑ๋ณธ์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š”๋ฐ, ์‚ฌ์ „ํ•™์Šต์œผ๋กœ R3M (๋Œ€๊ทœ๋ชจ ์ธ๊ฐ„ ๋™์ž‘ ์˜์ƒ์œผ๋กœ ํ•™์Šต๋œ ํ‘œํ˜„) ๋ชจ๋ธ ๊ฐ€์ค‘์น˜๋ฅผ ์ดˆ๊ธฐํ™”ํ•œ ํ›„ DexArt ๊ณผ์ œ๋ฅผ ํ•™์Šต์‹œํ‚จ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋‘ ์ •์ฑ…์„ ๋ชจ๋‘ ๋‹ค์–‘ํ•œ ์‹œ์ ์˜ ์ž…๋ ฅ์— ๋†“์•„๋ณด๋ฉฐ, 3D ๋Œ€ 2D ์‹œ๊ฐ ํ‘œํ˜„์˜ ๊ฒฌ๊ณ ์„ฑ ์ฐจ์ด๋„ ๋ถ„์„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋‹ค์–‘ํ•œ ์‹คํ—˜ ์„ค์ •์€ DexArt ๋ฒค์น˜๋งˆํฌ์˜ ํฌ๊ด„์„ฑ์„ ์ž˜ ๋ณด์—ฌ์ฃผ๋ฉฐ, ๊ฐ๊ฐ ์ •์ฑ…์˜ ํ‘œํ˜„ ํ•™์Šต, ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ, ๋ชจ๋ธ ์„ค๊ณ„, ์ผ๋ฐ˜ํ™” ๋ฐ ๊ฐ•์ธ์„ฑ ์ธก๋ฉด์— ๋Œ€ํ•œ ์œ ์˜๋ฏธํ•œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ฃผ์š” ๊ฒฐ๊ณผ์™€ ํ†ต์ฐฐ

์œ„์™€ ๊ฐ™์€ ๋ฒค์น˜๋งˆํฌ ์‹คํ—˜์„ ํ†ตํ•ด ์—ฌ๋Ÿฌ ํฅ๋ฏธ๋กœ์šด ๊ฒฐ๊ณผ๊ฐ€ ๋„์ถœ๋˜์—ˆ์œผ๋ฉฐ, ํŠนํžˆ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํ•ต์‹ฌ ํ†ต์ฐฐ์„ ์–ป์„ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค:

  • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ์˜ ์ค‘์š”์„ฑ: ํ•œ ์ž‘์—…์— ๋Œ€ํ•ด ํ›ˆ๋ จ์— ์‚ฌ์šฉํ•œ ๊ฐ์ฒด ์ข…๋ฅ˜๊ฐ€ ๋งŽ์„์ˆ˜๋ก ์ƒˆ๋กœ์šด ๊ฐ์ฒด์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์ด ์œ ์˜๋ฏธํ•˜๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ๊ณผ์ œ์—์„œ ํ›ˆ๋ จ์— ํˆฌ์ž…๋œ ๊ฐ์ฒด ์ˆ˜๋ฅผ ์ ˆ๋ฐ˜์œผ๋กœ ์ค„์ธ ๊ฒฝ์šฐ์™€ 100% ๋ชจ๋‘ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๋ฅผ ๋น„๊ตํ•˜๋ฉด, ํ›„์ž๊ฐ€ ํ›ˆ๋ จ ์ค‘ ๋‚ด๋‚ด ํ…Œ์ŠคํŠธ ๊ฐ์ฒด์— ๋Œ€ํ•œ ์„ฑ๊ณต๋ฅ ์ด ๋” ๋†’๊ฒŒ ์œ ์ง€๋˜๋Š” ์–‘์ƒ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฌผ์ฒด๋“ค์„ ๋‘๋ฃจ ๊ฒฝํ—˜ํ•˜๋ฉฐ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด ๋” ๋ฒ”์šฉ์ ์ธ ์‹œ๊ฐ ํ‘œํ˜„์„ ์ตํžˆ๊ฒŒ ํ•จ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ ๊ฐ์ฒด ์ข…๋ฅ˜๊ฐ€ ๋Š˜์–ด๋‚˜๋ฉด ํ•œ๊บผ๋ฒˆ์— ํ•™์Šตํ•ด์•ผ ํ•  ๋ณ€์ˆ˜๊ฐ€ ๋งŽ์•„์ ธ ํ•™์Šต ์†๋„๋Š” ์˜คํžˆ๋ ค ๋А๋ ค์งˆ ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ๊ด€์ฐฐ๋„ ์žˆ์—ˆ๋Š”๋ฐ, ์‹ค์ œ ์‹คํ—˜์—์„œ ํ›ˆ๋ จ ์ดˆ๊ธฐ ์ˆ˜๋ ด ์†๋„๋Š” ์ ์€ ๊ฐ์ฒด๋กœ ํ•™์Šตํ•œ ์ชฝ์ด ๋น ๋ฅด์ง€๋งŒ ์ตœ์ข… ์„ฑ๋Šฅ์€ ๋‹ค์–‘ํ•œ ๊ฐ์ฒด๋ฅผ ์‚ฌ์šฉํ•œ ์ชฝ์ด ๋†’์•˜์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์ถฉ๋ถ„ํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ์ด ์ •์ฑ…์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋†’์ด๋Š” ์—ด์‡ ์ž„์„ ํ™•์ธํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

  • ํฐ ์‹ ๊ฒฝ๋ง์ด ํ•ญ์ƒ ์œ ๋ฆฌํ•œ ๊ฒƒ์€ ์•„๋‹˜: ์‹œ๊ฐ ํŠน์„ฑ์„ ๋ฝ‘๋Š” PointNet์˜ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ๋‹ฌ๋ฆฌํ•œ ์‹คํ—˜์—์„œ ์˜์™ธ์˜ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”์Šต๋‹ˆ๋‹ค. ๋ณต์žกํ•œ ๊ตฌ์กฐ์˜ ๋Œ€ํ˜• ๋ชจ๋ธ๋ณด๋‹ค ๊ฐ„๊ฒฐํ•œ ์†Œํ˜• ๋ชจ๋ธ์ด ์ผ๊ด€๋˜๊ฒŒ ๋” ๋‚˜์€ ํ•™์Šต ์„ฑ๋Šฅ์„ ๋ณด์ธ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ฐ€์žฅ ์ž‘์€ PointNet์ด ๋ชจ๋“  ํ™˜๊ฒฝ์—์„œ ์—ํ”ผ์†Œ๋“œ ์„ฑ๊ณต๋ฅ ๊ณผ ๋ฐ˜ํ™˜๊ฐ’ ์ธก๋ฉด ๋ชจ๋‘ ์ตœ๊ณ  ์„ฑ๊ณผ๋ฅผ ๋ƒˆ๊ณ , ํ•™์Šต๋„ ๊ฐ€์žฅ ํšจ์œจ์ ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ผ๋ฐ˜์ ์ธ ์ปดํ“จํ„ฐ ๋น„์ „ ๊ด€์ ์—์„œ ์ƒ๊ฐํ•˜๋ฉด ๋‹ค์†Œ ๋†€๋ผ์šด ๊ฒฐ๊ณผ์ธ๋ฐ, ๋…ผ๋ฌธ ์ €์ž๋“ค์€ ๋Œ€๊ทœ๋ชจ ์‹ ๊ฒฝ๋ง์€ ๊ฐ•ํ™”ํ•™์Šต์—์„œ ์ตœ์ ํ™”๊ฐ€ ์–ด๋ ค์›Œ์ง€๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์œผ๋ฉฐ ์ด์ „ ์—ฐ๊ตฌ๋“ค์—์„œ๋„ ์œ ์‚ฌํ•œ ๋ณด๊ณ ๊ฐ€ ์žˆ์—ˆ๋‹ค๊ณ  ์–ธ๊ธ‰ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฒˆ ๊ฒฐ๊ณผ๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋ฅผ ์ค„์—ฌ ๋ชจ๋ธ์„ ๋‹จ์ˆœํ™”ํ•˜๋Š” ๊ฒƒ์ด ์˜คํžˆ๋ ค ํƒ์ƒ‰์„ ์šฉ์ดํ•˜๊ฒŒ ํ•˜๊ณ  ๊ณผ์ ํ•ฉ์„ ์ค„์—ฌ, ์ƒ˜ํ”Œ ํšจ์œจ์„ ๋†’์ด๋Š” ํšจ๊ณผ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

  • ๊ฐ์ฒด ๋ถ€์œ„ ์ธ์‹์˜ ์ค‘์š”์„ฑ: ๋ฉ€ํ‹ฐํ•‘๊ฑฐ ๋กœ๋ด‡ ์†์œผ๋กœ ๋ฌผ์ฒด์˜ ์ผ๋ถ€๋ถ„(๊ธฐ๋Šฅ์  ๋ถ€์œ„)์„ ์กฐ์ž‘ํ•ด์•ผ ํ•˜๋Š” ๊ณผ์ œ์˜ ํŠน์„ฑ์ƒ, ์ •์ฑ…์ด ๊ทธ ๋ฌผ์ฒด์˜ ๋ถ€์œ„๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ํŒŒ์•…ํ•˜๋Š” ๋Šฅ๋ ฅ์ด ์„ฑ๋Šฅ์— ํฐ ์˜ํ–ฅ์„ ๋ฏธ์นฉ๋‹ˆ๋‹ค. ์‹คํ—˜์—์„œ ๋ถ€์œ„ ๋ถ„ํ• (segmentation) ๊ณผ์ œ๋กœ PointNet์„ ์‚ฌ์ „ํ•™์Šตํ•œ ๊ฒฝ์šฐ, ๋„ค ๊ฐ€์ง€ ๋ชจ๋“  ์ž‘์—…์—์„œ ๊ฐ€์žฅ ๋†’์€ ์ตœ์ข… ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ–ˆ๊ณ  ํ•™์Šต ์ดˆ๊ธฐ์˜ ํ–ฅ์ƒ ์†๋„๋„ ๋นจ๋ž์Šต๋‹ˆ๋‹ค. ๋‹ค๋ฅธ ์‚ฌ์ „ํ•™์Šต ๋ฐฉ๋ฒ•๋“ค๋„ ๋…ธํŠธ๋ถ ์—ด๊ธฐ ๋“ฑ์˜ ์ผ๋ถ€ ๊ณผ์ œ์—์„œ๋Š” ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๋„์›€์„ ์ฃผ์—ˆ์ง€๋งŒ, ์ž‘์€ ์†์žก์ด์™€ ๊ฐ™์€ ์„ฌ์„ธํ•œ ๋ถ€์œ„๊ฐ€ ์ค‘์š”ํ•œ ์ž‘์—…๋“ค์—์„œ ๋ถ„ํ•  ์‚ฌ์ „ํ•™์Šต์˜ ์ด์ ์ด ํŠนํžˆ ๋‘๋“œ๋Ÿฌ์กŒ์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์ด ์‹œ๊ฐํ™”ํ•œ ๋ฐ”์— ๋”ฐ๋ฅด๋ฉด, ๋ถ„ํ•  ํ•™์Šต์„ ๊ฑฐ์นœ ๋ชจ๋ธ์€ ์ˆ˜๋„๊ผญ์ง€์˜ ์ž‘์€ ์†์žก์ด ๋ถ€๋ถ„์„ ํฌ์ธํŠธํด๋ผ์šฐ๋“œ ์ƒ์—์„œ ์ •ํ™•ํžˆ ๊ตฌ๋ณ„ํ•ด๋‚ด์ง€๋งŒ, ์žฌ๊ตฌ์„ฑ ์œ„์ฃผ๋กœ ํ•™์Šตํ•œ ๋ชจ๋ธ์€ ๋ฌผ์ฒด์˜ ์ „์ฒด ํ˜•ํƒœ๋งŒ ํŒŒ์•…ํ•  ๋ฟ ์„ธ๋ฐ€ํ•œ ๋ถ€๋ถ„์€ ๋†“์น˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ๋ถ€์œ„ ์ธ์ง€ ๋Šฅ๋ ฅ์„ ๊ธฐ๋ฅด๋Š” ์‚ฌ์ „ํ•™์Šต(์˜ˆ: ๊ธฐ๋Šฅ์„ฑ ๋ถ€์œ„์— ๋ผ๋ฒจ์„ ์ค€ 3D ๋ถ„ํ•  ๋ฐ์ดํ„ฐ๋กœ์˜ ํ•™์Šต)์ด ๊ด€์ ˆ ๊ฐ์ฒด ์กฐ์ž‘์— ํŠนํ™”๋œ ์‹œ๊ฐ ํ‘œํ˜„์„ ํ˜•์„ฑํ•˜์—ฌ ์ •์ฑ… ํ•™์Šต์„ ํฌ๊ฒŒ ๋„์™€์ค€๋‹ค๋Š” ๊ฒฐ๋ก ์„ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • 3D ํ‘œํ˜„ ํ•™์Šต์˜ ๊ฐ•์ธ์„ฑ: ํฌ์ธํŠธํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์Šตํ•œ ์ •์ฑ…์€ ์นด๋ฉ”๋ผ ์‹œ์ ์ด ๋‹ฌ๋ผ์ ธ๋„ ์„ฑ๋Šฅ์ด ์•ˆ์ •์ ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ํ•œ ๊ฐ๋„์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์„ ์ „ํ˜€ ๋‹ค๋ฅธ ๋ฐฉํ–ฅ์—์„œ ๋ณธ ์ž…๋ ฅ์œผ๋กœ ์‹คํ–‰ํ•ด๋„ ์„ฑ๊ณต๋ฅ  ์ €ํ•˜๊ฐ€ ๋ฏธ๋ฏธํ–ˆ๊ณ , ์ƒ๋‹นํ•œ ์‹œ์  ๋ณ€ํ™”์—๋„ ์ •ํ™•๋„๊ฐ€ ์œ ์ง€๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๋™์ผํ•œ ์ž‘์—…์„ 2D ์นด๋ฉ”๋ผ ์˜์ƒ์œผ๋กœ ํ•™์Šตํ•œ ResNet-18 ๊ธฐ๋ฐ˜ ์ •์ฑ…์€, ํ›ˆ๋ จ ๋•Œ์™€ ๋‹ค๋ฅธ ๋ทฐํฌ์ธํŠธ์˜ ์ž…๋ ฅ์— ๋Œ€ํ•ด์„œ ์„ฑ๊ณต๋ฅ ์ด ๊ธ‰๊ฒฉํžˆ ๋–จ์–ด์ง€๋Š” ํ˜„์ƒ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” 3์ฐจ์› ํฌ์ธํŠธํด๋ผ์šฐ๋“œ๋กœ ํ•™์Šต๋œ ํ‘œํ˜„์ด ์‹œ๊ฐ์  ๊ด€์  ๋ณ€ํ™”์— ๋ณธ์งˆ์ ์œผ๋กœ ๋ถˆ๋ณ€(invariant)ํ•œ ์„ฑ์งˆ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ฐ˜๋ฉด, ํ‰๋ฉด ์˜์ƒ ๊ธฐ๋ฐ˜ ํ‘œํ˜„์€ ์นด๋ฉ”๋ผ ๊ฐ๋„์˜ ๋ณ€ํ™”์— ๋ฏผ๊ฐํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. DexArt ๊ฒฐ๊ณผ๋Š” ์ด๋Ÿฌํ•œ 3D ํ‘œํ˜„ ํ•™์Šต์˜ ์ด์ ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ์ฆ๋ช…ํ•ด์ฃผ์—ˆ๊ณ , ํŠนํžˆ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค ๋กœ๋ด‡ ๊ฐ„ ์นด๋ฉ”๋ผ ์œ„์น˜ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ ๋“ฑ์—์„œ 3D ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์ด ์–ผ๋งˆ๋‚˜ ์œ ์šฉํ•œ์ง€ ๊ฐ•์กฐํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ๋กœ๋ด‡์— ์ •์ฑ…์„ ์ด์‹ํ•  ๋•Œ ์นด๋ฉ”๋ผ ์บ˜๋ฆฌ๋ธŒ๋ ˆ์ด์…˜์ด๋‚˜ ์‹œ์  ๋ณ€ํ™”๋กœ ์ธํ•œ ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ์ตœ์†Œํ™”ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์—์„œ, ๊ธฐํ•˜ํ•™์  3D ํ‘œํ˜„์˜ ํ™œ์šฉ์€ ํฐ ๊ฐ•์ ์œผ๋กœ ์ž‘์šฉํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ด ์™ธ์—๋„ ์‹คํ—˜์—์„œ 2D ๋Œ€ 3D ์ž…๋ ฅ์˜ ์ ˆ๋Œ€ ์„ฑ๋Šฅ ๋น„๊ต๋ฅผ ๋ณด๋ฉด, ๋™์ผํ•œ ๊ฐ•ํ™”ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๋น„์Šทํ•œ ์‚ฌ์ „ํ•™์Šต์„ ํ–ˆ์„ ๋•Œ PointNet(3D) ๊ธฐ๋ฐ˜ ์ •์ฑ…์ด ResNet-18(2D) ๊ธฐ๋ฐ˜ ์ •์ฑ…๋ณด๋‹ค ํ›ˆ๋ จ์ด ์ž˜ ๋˜๊ณ  ์ตœ์ข… ์„ฑ๊ณต๋ฅ ๋„ ๋†’์•˜์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ด€์ ˆ ์กฐ์ž‘๊ณผ ๊ฐ™์ด ์ •ํ™•ํ•œ ํ˜•์ƒ ํŒŒ์•…์ด ํ•„์š”ํ•œ ์ž‘์—…์—๋Š” 3D ์ •๋ณด๊ฐ€ ํ›จ์”ฌ ์œ ๋ฆฌํ•จ์„ ๋ณด์—ฌ์ฃผ๋Š” ๊ฒฐ๊ณผ์ž…๋‹ˆ๋‹ค. ์ „๋ฐ˜์ ์œผ๋กœ DexArt๋ฅผ ํ†ตํ•ด ์–ป์€ ํ†ต์ฐฐ๋“ค์€ ํ–ฅํ›„ ๋กœ๋ด‡ ํ•™์Šต ์—ฐ๊ตฌ์—์„œ ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ, ํ‘œํ˜„ ํ•™์Šต ๊ธฐ๋ฒ•, ๋ชจ๋ธ ๊ตฌ์กฐ ์„ ํƒ, ์ž…๋ ฅ ํ˜•ํƒœ ๊ฒฐ์ • ๋“ฑ์— ์ค‘์š”ํ•œ ์ง€์นจ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

ํ•œ๊ณ„์  ๋ฐ ํ–ฅํ›„ ๊ณผ์ œ

DexArt ๋ฒค์น˜๋งˆํฌ์™€ ์—ฐ๊ตฌ๋Š” ๋ฒ”์šฉ ๋กœ๋ด‡ ์„ฌ์„ธ ์กฐ์ž‘์„ ํ–ฅํ•ด ๋‚˜์•„๊ฐ€๋Š” ์˜๋ฏธ์žˆ๋Š” ์ง„์ „์„ ์ด๋ฃจ์—ˆ์ง€๋งŒ, ๋™์‹œ์— ๋ช‡ ๊ฐ€์ง€ ์ œ์•ฝ๊ณผ ํ–ฅํ›„ ๊ณผ์ œ๋ฅผ ๋‚จ๊ฒจ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ, ๋ณธ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋“ค์€ ๋ชจ๋‘ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ํ™˜๊ฒฝ์—์„œ ์–ป์–ด์ง„ ๊ฒƒ์ด๋ฏ€๋กœ, ์ด๋ฅผ ์‹ค์ œ ๋กœ๋ด‡์— ์ ์šฉํ•˜๊ธฐ ์œ„ํ•ด ๋„˜์–ด์•ผ ํ•  ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„ ๊ฒฉ์ฐจ(sim-to-real gap)๊ฐ€ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ํ˜„์‹ค์—์„œ๋Š” ์„ผ์„œ ์žก์Œ, ์ •ํ™•ํ•œ ๋ฌผ๋ฆฌ ํŒŒ๋ผ๋ฏธํ„ฐ ์ฐจ์ด, ๋งˆ์ฐฐ ๋“ฑ ์—ฌ๋Ÿฌ ๋ถˆํ™•์‹ค์„ฑ์ด ์ถ”๊ฐ€๋˜๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ์ฒ˜๋Ÿผ ์นด๋ฉ”๋ผ ์‹œ์ ์„ ์ด์ƒ์ ์œผ๋กœ ๋งž์ถ”๊ธฐ๋„ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ํ•™์Šต๋œ ์ •์ฑ…์„ ์‹ค์ œ ๋กœ๋ด‡์— ์ด์‹ํ•˜์—ฌ ์‹คํ—˜ํ•˜๊ณ , ํ•„์š”ํ•œ ๋„๋ฉ”์ธ ์ ์‘์ด๋‚˜ ๋ณด์ • ๊ธฐ๋ฒ•์„ ์—ฐ๊ตฌํ•˜๋Š” ๊ฒƒ์ด ๋‹ค์Œ ๋‹จ๊ณ„๋กœ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋‘˜์งธ, DexArt์—์„œ ๋‹ค๋ฃฌ ์ž‘์—… ์œ ํ˜•์ด ์•„์ง์€ ์ œํ•œ์ ์ž…๋‹ˆ๋‹ค. ์ฃผ๋กœ ํšŒ์ „ ๊ด€์ ˆ(ํžŒ์ง€ ํ˜•ํƒœ)์˜ ์›€์ง์ž„์„ ๋‹ค๋ฃจ๋Š” ๊ณผ์ œ๋“ค๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋Š”๋ฐ, ์„œ๋ž์„ ์—ฌ๋Š” ์Šฌ๋ผ์ด๋”ฉ ๊ด€์ ˆ ์กฐ์ž‘์ด๋‚˜ ๊ฐ€์œ„ ์‚ฌ์šฉ์ฒ˜๋Ÿผ ๋ณตํ•ฉ์ ์ธ ๋‹ค๋‹จ๊ณ„ ์ž‘์—… ๋“ฑ์€ ํฌํ•จ๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ํ–ฅํ›„ ๋ฒค์น˜๋งˆํฌ๋ฅผ ํ™•์žฅํ•˜๋ฉด์„œ ์ด๋Ÿฌํ•œ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ์ผ์ƒ ์กฐ์ž‘ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ์ถ”๊ฐ€ํ•œ๋‹ค๋ฉด, ๋กœ๋ด‡์˜ ๋ฒ”์šฉ ๋Šฅ๋ ฅ์„ ๋”์šฑ ํญ๋„“๊ฒŒ ํ‰๊ฐ€ํ•˜๊ณ  ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ๊ฐ ๊ณผ์ œ๋งˆ๋‹ค ๋ณ„๋„์˜ ์ •์ฑ…์„ ํ•™์Šต์‹œ์ผฐ์ง€๋งŒ, ์‹ค์ œ๋กœ๋Š” ํ•œ ๋กœ๋ด‡์ด ์—ฌ๋Ÿฌ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ํ•™์Šต์œผ๋กœ ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ์กฐ์ž‘ ๊ธฐ์ˆ ์„ ๋‹จ์ผ ์ •์ฑ…์— ํ†ตํ•ฉํ•˜๊ฑฐ๋‚˜, ํ˜น์€ ์‚ฌ๋žŒ์˜ ์‹œ๋ฒ” ์—†์ด ์Šค์Šค๋กœ ํ•™์Šตํ•˜๋„๋ก ํ•˜๋Š” ์ž์œจํ•™์Šต ๊ธฐ์ˆ  ๋“ฑ์œผ๋กœ ๋ฐœ์ „์‹œํ‚ฌ ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ณด์ƒ ์„ค๊ณ„์˜ ๋ถ€๋‹ด์„ ์ค„์ด๊ณ  ๋”์šฑ ์ผ๋ฐ˜์ ์ธ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๋‚˜์•„๊ฐ€๋Š” ์—ฐ๊ตฌ๊ฐ€ ์ด์–ด์งˆ ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค. DexArt๊ฐ€ ์ œ์‹œํ•œ ํ™˜๊ฒฝ๊ณผ ํ‰๊ฐ€ ์ฒด๊ณ„๋Š” ์ด๋Ÿฌํ•œ ํ–ฅํ›„ ์—ฐ๊ตฌ๋ฅผ ์ด‰์ง„ํ•˜๋Š” ๋ฐœํŒ์ด ๋  ๊ฒƒ์ด๋ฉฐ, ๊ถ๊ทน์ ์œผ๋กœ ๊ฐ€์ •์šฉ ๋กœ๋ด‡์ด ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋‹ค์–‘ํ•œ ๋ฌผ๊ฑด์„ ๋Šฅ์ˆ™ํ•˜๊ฒŒ ๋‹ค๋ฃจ๋Š” ๋‚ ์„ ์•ž๋‹น๊ธฐ๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

Copyright 2024, Jung Yeon Lee