Curieux.JY
  • JungYeon Lee
  • Post
  • Note

On this page

  • ๐Ÿ” Ping Review
  • ๐Ÿ”” Ring Review
    • 1. ์„œ๋ก : ์ด‰๊ฐ์ด๋ผ๋Š” ๊ฐ๊ฐ, ๊ทธ๋ฆฌ๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ํ•œ๊ณ„
    • 2. ๋ฐฉ๋ฒ•๋ก : Tacmap์˜ ๊ตฌ์กฐ์™€ ์ž‘๋™ ์›๋ฆฌ
      • 2.1 ํ•ต์‹ฌ ์ง๊ด€: โ€œ์ธก์ • ๋‹จ์œ„๋ฅผ ๋งž์ถ”๋ฉด ๋น„๊ต๊ฐ€ ๋œ๋‹คโ€
      • 2.2 ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ธก: ํšจ์œจ์ ์ธ ์นจํˆฌ ๊นŠ์ด ๊ณ„์‚ฐ
      • 2.3 ์‹ค์ œ ์„ธ๊ณ„ ์ธก: ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘๊ณผ ๋ณ€ํ™˜ ๋ชจ๋ธ
      • 2.4 ์ „์ฒด ์‹œ์Šคํ…œ ํŒŒ์ดํ”„๋ผ์ธ
    • 3. ๊ธฐ์ˆ ์  ์„ธ๋ถ€ ์‚ฌํ•ญ: ๊ฐ ๊ตฌ์„ฑ ์š”์†Œ ์‹ฌ์ธต ๋ถ„์„
      • 3.1 ์™œ โ€œ์นจํˆฌ ๊นŠ์ดโ€์ธ๊ฐ€?
      • 3.2 ๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„์˜ ์ค‘์š”์„ฑ
      • 3.3 ๋ณ€ํ™˜ ๋ชจ๋ธ์˜ ์—ญํ• 
    • 4. ์‹คํ—˜: ๋ฌด์—‡์„ ์ธก์ •ํ•˜๊ณ , ์–ด๋–ค ๊ฒฐ๊ณผ๋ฅผ ์–ป์—ˆ๋‚˜
      • 4.1 ์‹คํ—˜ ์„ค์ •
      • 4.2 ์‹คํ—˜ 1: ๋ณ€ํ˜• ๋งต์˜ ์ •ํ™•๋„ ํ‰๊ฐ€
      • 4.3 ์‹คํ—˜ 2: In-hand ๊ตฌ ํšŒ์ „ ํƒœ์Šคํฌ (Zero-Shot Transfer)
      • 4.4 ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‚ด ์‹ค์ œ ๋ฐ์ดํ„ฐ ๋ฆฌํ”Œ๋ ˆ์ด
    • 5. ๊ด€๋ จ ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต
      • 5.1 ๊ธฐ์กด ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋ถ„๋ฅ˜
      • 5.2 Taxim๊ณผ์˜ ๋น„๊ต
      • 5.3 TACTO์™€์˜ ๋น„๊ต
      • 5.4 TacSL๊ณผ์˜ ๋น„๊ต
      • 5.5 Taccel๊ณผ์˜ ๊ด€๊ณ„
    • 6. ๋น„ํŒ์  ๊ณ ์ฐฐ: ๊ฐ•์ ๊ณผ ํ•œ๊ณ„
      • 6.1 ๊ฐ•์ 
      • 6.2 ํ•œ๊ณ„์™€ ๋ฏธํ•ด๊ฒฐ ์งˆ๋ฌธ
      • 6.3 ๋ฏธ๋ž˜ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ
    • 7. Allegro Hand ์—ฐ๊ตฌ์ž๋ฅผ ์œ„ํ•œ ํ•จ์˜
    • 8. ์š”์•ฝ ๋ฐ ๊ฒฐ๋ก 
    • ์ฐธ๊ณ  ์ž๋ฃŒ ๋ฐ ๊ด€๋ จ ๋…ผ๋ฌธ

๐Ÿ“ƒTacmap ๋ฆฌ๋ทฐ

tactile
dexterity
depth
sim-to-real
Bridging the Tactile Sim-to-Real Gap via Geometry-Consistent Penetration Depth Map
Published

March 19, 2026

  • Paper Link
  • Project Link
  1. ๐Ÿ—บ๏ธ Tacmap์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ธ๊ณ„ ๊ฐ„์˜ Tactile sim-to-real gap์„ ํ•ด์†Œํ•˜๊ธฐ ์œ„ํ•ด ๊ธฐํ•˜ํ•™์ ์œผ๋กœ ์ผ๊ด€๋œ penetration depth map์ธ โ€™deform mapโ€™์„ ๋„์ž…ํ•œ ๊ณ ์ •๋ฐ€, ๊ณ ํšจ์œจ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค.
  2. ๐Ÿ”„ ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ 3D intersection volume์„ depth map์œผ๋กœ ๊ณ„์‚ฐํ•˜๊ณ , ์‹ค์ œ ์„ธ๊ณ„์—์„œ๋Š” ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์žฅ๋น„๋ฅผ ํ†ตํ•ด raw tactile image์—์„œ ground-truth depth map์œผ๋กœ์˜ ๋งคํ•‘์„ ํ•™์Šตํ•จ์œผ๋กœ์จ ๋‘ ๋„๋ฉ”์ธ์„ ํ†ต์ผ๋œ ๊ธฐํ•˜ํ•™์  ๊ณต๊ฐ„์œผ๋กœ ์ •๋ ฌํ•ฉ๋‹ˆ๋‹ค.
  3. ๐Ÿค– Tacmap์€ ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—…์—์„œ sim-to-real zero-shot transfer๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜์—ฌ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ›ˆ๋ จ๋œ ์ •์ฑ…์ด ๋ฌผ๋ฆฌ์  ๋กœ๋ด‡์— ์ง์ ‘ ์ ์šฉ๋  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ” Ping Review

๐Ÿ” Ping โ€” A light tap on the surface. Get the gist in seconds.

Tacmap์€ Vision-Based Tactile Sensors (VBTS)์˜ ์‹ฌํˆฌ๋ฆฌ์–ผ ๊ฐญ(sim-to-real gap)์„ ํ•ด์†Œํ•˜๊ธฐ ์œ„ํ•ด ๊ณ ์•ˆ๋œ ๊ณ ์ถฉ์‹ค๋„ ๋ฐ ๊ณ„์‚ฐ ํšจ์œจ์ ์ธ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์€ ๋‹จ์ˆœํ™”๋œ ๊ธฐํ•˜ํ•™์  ํˆฌ์˜ ๋ฐฉ์‹์ด ๋ฌผ๋ฆฌ์  ์ง„์ •์„ฑ(physical authenticity)์ด ๋ถ€์กฑํ•˜๊ฑฐ๋‚˜, ๊ณ ์ถฉ์‹ค๋„ Finite Element Methods (FEM) ๋ฐฉ์‹์ด Reinforcement Learning (RL)์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ ํ•™์Šต์— ๊ณ„์‚ฐ์ ์œผ๋กœ ๊ฐ๋‹นํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ๋”œ๋ ˆ๋งˆ์— ์ง๋ฉดํ•ด ์žˆ์Šต๋‹ˆ๋‹ค. Tacmap์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋ถ€ํ”ผ ์นจํˆฌ ๊นŠ์ด(volumetric penetration depth)๋ฅผ ํ•ต์‹ฌ์œผ๋กœ ํ•˜๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ธ๊ณ„๋ฅผ ๊ณตํ†ต์˜ deform map ํ‘œํ˜„์„ ํ†ตํ•ด ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค.

์ด ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํ•ต์‹ฌ ํ†ต์ฐฐ์€ ์›์‹œ ์ด‰๊ฐ ์ด๋ฏธ์ง€๊ฐ€ ์„ผ์„œ ํŠน์œ ์˜ ๊ด‘ํ•™์  ๋ณต์žก์„ฑ์„ ๊ฐ€์ง€๋Š” ๋ฐ˜๋ฉด, ๊ธฐ์ €์˜ ๋ณ€ํ˜• ๋งต(deform map)์€ ์ ‘์ด‰ ๋ฌผ๋ฆฌํ•™์„ ์œ„ํ•œ ๋ณดํŽธ์ ์ธ ํ”„๋ก์‹œ(proxy) ์—ญํ• ์„ ํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. Tacmap์€ ์ด ๋ณ€ํ˜• ๋งต์„ ์ค‘์‹ฌ์œผ๋กœ Sim-to-Real ๊ฐ„์˜ ์ •๋ ฌ์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ๋„๋ฉ”์ธ ์‹œํ”„ํŠธ๋ฅผ ์ตœ์†Œํ™”ํ•˜๊ณ  ๋ฌผ๋ฆฌ์  ์ผ๊ด€์„ฑ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก : ํ†ตํ•ฉ๋œ Deform Map (Tacmap)

Tacmap์€ ์ˆœ ํž˜(Net Force, F), ์ ‘์ด‰ ์œ„์น˜(Contact Position, P), ๊ทธ๋ฆฌ๊ณ  ํ•ต์‹ฌ์ ์ธ deform map (M)์ด๋ผ๋Š” ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ์ด‰๊ฐ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. deform map์€ ํ”ฝ์…€๋ณ„ ์นจํˆฌ ๊นŠ์ด๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, ๋ฏธ์„ธํ•œ ์กฐ์ž‘์— ํ•„์ˆ˜์ ์ธ ๊ณ ํ•ด์ƒ๋„ ๋กœ์ปฌ ๊ธฐํ•˜ํ•™์  ์ •๋ณด๋ฅผ ํฌ์ฐฉํ•ฉ๋‹ˆ๋‹ค.

  1. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ Deform Map ์ƒ์„ฑ: Tacmap์€ FEM์˜ ๋ง‰๋Œ€ํ•œ ๊ณ„์‚ฐ ๋น„์šฉ์„ ์šฐํšŒํ•˜๋ฉด์„œ ๊ณ ์ถฉ์‹ค๋„ ๊ธฐํ•˜ํ•™์  ๋ Œ๋”๋ง ํŒŒ์ดํ”„๋ผ์ธ์„ ๋„์ž…ํ•ฉ๋‹ˆ๋‹ค. ์„ผ์„œ์˜ ์—˜๋ผ์Šคํ† ๋จธ(elastomer) ๊ธฐํ•˜ํ•™์€ โ€™๋ณ€ํ˜•๋˜์ง€ ์•Š์€ ์„ผ์„œ ํ‘œ๋ฉด(undeformed sensor surface, S_u)โ€™๊ณผ ์„ผ์„œ ์™ธ๋ถ€์— ๊ณ ์ •๋œ ์˜คํ”„์…‹์œผ๋กœ ์œ„์น˜ํ•œ โ€™๊ฐ€์ƒ ๊ฐ์ง€ ํ‘œ๋ฉด(virtual sensing surface, S_s)โ€™์ด๋ผ๋Š” ๋‘ ๊ฐ€์ง€ ์ค‘์š”ํ•œ ๊ฒฝ๊ณ„๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ •์˜๋ฉ๋‹ˆ๋‹ค. Deform map ์ƒ์„ฑ์„ ์œ„ํ•ด, ๊ฐ์ง€ ํ‘œ๋ฉด S_s๋ฅผ H x W ๊ทธ๋ฆฌ๋“œ๋กœ ์ด์‚ฐํ™”ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ๊ทธ๋ฆฌ๋“œ ํฌ์ธํŠธ (u, v)์— ๋Œ€ํ•ด, ์„ผ์„œ ๋‚ด๋ถ€๋ฅผ ํ–ฅํ•ด ํ‘œ๋ฉด ๋…ธ๋ฉ€(surface normal)์„ ๋”ฐ๋ผ S_s๋กœ๋ถ€ํ„ฐ ํˆฌ์˜ ๊ด‘์„ (projection ray) r_{u,v}๋ฅผ ๋ฐœ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๋ณ€ํ˜• ๊ฐ’ d(u, v)๋Š” ์ด ๊ด‘์„  ์ƒ์—์„œ ๊ฐ์ฒด O์˜ ์ ์œ (occupancy)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐ๋ฉ๋‹ˆ๋‹ค: d(u, v) = \max(0, z_s - \max(z_u, z_o)) ์—ฌ๊ธฐ์„œ z_s๋Š” ๊ฐ์ง€ ํ‘œ๋ฉด S_s ์ƒ์—์„œ ๊ด‘์„ ์˜ ์‹œ์ž‘์ ์˜ ์ขŒํ‘œ, z_u๋Š” ๋ณ€ํ˜•๋˜์ง€ ์•Š์€ ๋ฌผ๋ฆฌ์  ์„ผ์„œ ํ‘œ๋ฉด S_u์˜ ์ขŒํ‘œ, ๊ทธ๋ฆฌ๊ณ  z_o๋Š” ๊ด‘์„  r_{u,v}์™€ ๊ฐ์ฒด ๋ฉ”์‹œ(object mesh) O ์‚ฌ์ด์˜ ์ฒซ ๋ฒˆ์งธ ๊ต์ฐจ์ ์˜ ์ขŒํ‘œ์ž…๋‹ˆ๋‹ค. ์ด ์ ‘๊ทผ ๋ฐฉ์‹์€ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์„ ์ˆœ์ˆ˜ํ•˜๊ฒŒ ๊ธฐํ•˜ํ•™์ ์ธ deform map์œผ๋กœ ์ถ”์ƒํ™”ํ•˜์—ฌ, ๊ธฐ์ €์˜ ์ ‘์ด‰ ๋ฌผ๋ฆฌํ•™์„ ์„ผ์„œ ํŠน์œ ์˜ ๊ด‘ํ•™์  ์•„ํ‹ฐํŒฉํŠธ(optical artifacts)๋กœ๋ถ€ํ„ฐ ๋ถ„๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

  2. ์‹ค์„ธ๊ณ„์—์„œ Deform Map ์ƒ์„ฑ: ์‹ค์„ธ๊ณ„์—์„œ ๋กœ๋ด‡์ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ๋™์ผํ•œ ๋ณ€ํ˜• ํ‘œํ˜„์„ ์ธ์‹ํ•˜๋„๋ก ํ•˜๊ธฐ ์œ„ํ•ด, Tacmap์€ ์›์‹œ ์ด‰๊ฐ ํ”„๋ ˆ์ž„์—์„œ deform map์„ ์ถ”๋ก ํ•˜๋Š” ๋ณ€ํ™˜ ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์‹œ์Šคํ…œ์„ ํ†ตํ•ด ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ๊ณ ์ •๋ฐ€ 3์ถ• ๋ชจ์…˜ ์Šคํ…Œ์ด์ง€(3-axis motion stage)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์„ผ์„œ์™€ ๋‹ค์–‘ํ•œ ๊ธฐํ•˜ํ•™์  ์••์ž…๊ธฐ(geometric indenters) ๊ฐ„์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ์ œ์–ด๋œ ์กฐ๊ฑด์—์„œ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ์••์ถ•์— ๋Œ€ํ•ด, ์••์ž…๊ธฐ์˜ ์ •ํ™•ํ•œ 3D ์ž์„ธ T_{tool}์€ ์„ผ์„œ์˜ ๊ธฐ์ค€ ํ”„๋ ˆ์ž„์— ๋Œ€ํ•œ ์Šคํ…Œ์ด์ง€์˜ ์ธ์ฝ”๋”(encoder)๋ฅผ ํ†ตํ•ด ๊ธฐ๋ก๋ฉ๋‹ˆ๋‹ค. ์‹ค์„ธ๊ณ„ deform map์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋งต๊ณผ ๋™์ผํ•œ ๊ธฐํ•˜ํ•™์  ํˆฌ์˜ ๋…ผ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ณ„์‚ฐ๋˜์–ด, D = \{(I^{(i)}_{raw}, M^{(i)}_{gt})\}_{i=1}^N ํ˜•ํƒœ์˜ ๋™๊ธฐํ™”๋œ ๋ฐ์ดํ„ฐ์…‹์„ ํ˜•์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ˆ˜์ง‘๋œ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ, ResNet ๊ธฐ๋ฐ˜ ์ธ์ฝ”๋”-๋””์ฝ”๋”(encoder-decoder) ์•„ํ‚คํ…์ฒ˜์ธ ๋ณ€ํ™˜ ๋„คํŠธ์›Œํฌ \Phi๊ฐ€ ํ›ˆ๋ จ๋˜์–ด ๋‹จ์ผ ์ด‰๊ฐ ์ด๋ฏธ์ง€ I_{raw}๋กœ๋ถ€ํ„ฐ deform map \hat{M} = \Phi(I_{raw})์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋„คํŠธ์›Œํฌ๋Š” ์˜ˆ์ธก๋œ \hat{M}๊ณผ ์šด๋™ํ•™์ ์œผ๋กœ ํŒŒ์ƒ๋œ M_{gt} ๊ฐ„์˜ ํ”ฝ์…€๋ณ„ ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ(MSE)๋ฅผ ์ตœ์†Œํ™”ํ•˜๋„๋ก ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ์‹ค์„ธ๊ณ„ ๋„คํŠธ์›Œํฌ๋ฅผ ๊ธฐํ•˜ํ•™์  ๊นŠ์ด๋กœ ์ง€๋„ํ•จ์œผ๋กœ์จ ์„ผ์„œ์˜ ๊ด‘ํ•™์  ํŠน์„ฑ์„ ์ ‘์ด‰ ๋ฌผ๋ฆฌํ•™์œผ๋กœ๋ถ€ํ„ฐ ๋ถ„๋ฆฌํ•˜๊ณ , M_{sim}๊ณผ \hat{M}์ด ๋™์ผํ•œ ๋ฌผ๋ฆฌ์  ๊ธฐ์ค€(์นจํˆฌ ๊นŠ์ด)์— ๊ณ ์ •๋˜๋„๋ก ํ•˜์—ฌ ๊ณตํ†ต์˜ ๋„๋ฉ”์ธ ๋ถˆ๋ณ€ ๊ณต๊ฐ„์— ์กด์žฌํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

๊ตฌํ˜„ ๋ฐ ์‹คํ—˜ ๊ฒฐ๊ณผ:

Tacmap์€ Isaac Lab๊ณผ MuJoCo ๋ชจ๋‘์— ํ†ตํ•ฉ๋˜์–ด ๊ด‘๋ฒ”์œ„ํ•œ ํ˜ธํ™˜์„ฑ๊ณผ ํ™•์žฅ์„ฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์‹œ์Šคํ…œ ์ดˆ๊ธฐํ™” ์‹œ, Multi-Mesh Ray Caster๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ณ€ํ˜•๋˜์ง€ ์•Š์€ ์„ผ์„œ ํ‘œ๋ฉด์— ์ด‰๊ฐ ๊ฐ์ง€ ํฌ์ธํŠธ(Tactile Sensing Points)์™€ ๊ฐ์ง€ ๋ฐฉํ–ฅ(Sensing Directions)์˜ ๋ฐ€์ง‘ ๊ทธ๋ฆฌ๋“œ๋ฅผ ๋ฏธ๋ฆฌ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. ๋Ÿฐํƒ€์ž„์—๋Š” GPU ๊ฐ€์† Ray-casting์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ธฐํ•˜ํ•™์  ์ƒํ˜ธ ์นจํˆฌ(interpenetration)๋ฅผ ๋ณ‘๋ ฌ๋กœ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜์—์„œ๋Š” SharpaWave ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ํ•ธ๋“œ(dexterous hand)์— ์žฅ์ฐฉ๋œ Vision-based Tactile Sensors (DTC)๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

  1. Sim-to-Real ์ถฉ์‹ค๋„: ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ธ๊ณ„ ๊ฐ„์˜ ์ˆœ ํž˜ ์ •๋ ฌ(Net Force Alignment)์—์„œ ๋†’์€ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๋ณด์˜€๊ณ , deform map์˜ ์‹œ๊ฐํ™”๋Š” ๋†€๋ผ์šด ๊ตฌ์กฐ์  ์œ ์‚ฌ์„ฑ์„ ๋‚˜ํƒ€๋ƒˆ์Šต๋‹ˆ๋‹ค. ์ •๋Ÿ‰์  ํ‰๊ฐ€์—์„œ Tacmap์€ Contact Position Error (์ตœ๋Œ€ 0.96mm), Deform Depth Error (์ตœ๋Œ€ 18.53%), Net Force L2 Error (์ตœ๋Œ€ 0.61N), Deform IoU (์ตœ์†Œ 85.67%) ๋“ฑ ๋‚ฎ์€ ๋„๋ฉ”์ธ ๋ถˆ์ผ์น˜๋ฅผ ๋ณด์—ฌ์ฃผ์–ด, ์ œ๋กœ์ƒท ์ •์ฑ… ์ „์ด(zero-shot policy transfer)์— ์ถฉ๋ถ„ํ•œ ์ˆ˜์ค€์ž„์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.
  2. ๊ณ„์‚ฐ ํšจ์œจ์„ฑ: Isaac Lab ํ”„๋ ˆ์ž„์›Œํฌ ๋‚ด์—์„œ GPU ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์€ Ray-casting ๋ฐฉ์‹ ๋•๋ถ„์— ๊ฑฐ์˜ ์„ ํ˜•์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜๋ฉฐ(Fig 6. ์ขŒ์ธก), ์ „์ฒด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ฒ˜๋ฆฌ๋Ÿ‰(throughput)์— ๋Œ€ํ•œ ๋ Œ๋”๋ง์˜ ์˜ํ–ฅ์€ ๋ฏธ๋ฏธํ•˜์—ฌ(Fig 6. ์šฐ์ธก), ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ RL์— ์ ํ•ฉํ•œ ์Šคํ… ์ฃผํŒŒ์ˆ˜(stepping frequency)๋ฅผ ์œ ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค.
  3. Sim-to-Real ์ ์šฉ: Tacmap์˜ ์‹ค์šฉ์  ์œ ์šฉ์„ฑ์€ ๋ณต์žกํ•œ ์†์•ˆ ๊ฐ์ฒด ํšŒ์ „(in-hand object rotation) ์ž‘์—…์„ ํ†ตํ•ด ์ž…์ฆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Tacmap ์ŠคํŠธ๋ฆผ์„ ๊ด€์ธก ๊ณต๊ฐ„์œผ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ Proximal Policy Optimization (PPO)์œผ๋กœ ํ›ˆ๋ จ๋œ ์ •์ฑ…์€ ์‹ค์ œ ์„ธ๊ณ„ SharpaWave ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ํ•ธ๋“œ์— ์•„๋ฌด๋Ÿฐ ๋„๋ฉ”์ธ ์ ์‘(domain adaptation) ์—†์ด ์ œ๋กœ์ƒท์œผ๋กœ ๋ฐฐํฌ๋˜์–ด ์„ฑ๊ณต์ ์œผ๋กœ ์ž‘๋™ํ–ˆ์Šต๋‹ˆ๋‹ค.

ํ•œ๊ณ„ ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ:

Tacmap์€ ๋…ธ๋ฉ€ ์นจํˆฌ ๊นŠ์ด์— ์ค‘์ ์„ ๋‘์ง€๋งŒ, ์—˜๋ผ์Šคํ† ๋จธ ํ‘œ๋ฉด์„ ๊ฐ€๋กœ์ง€๋ฅด๋Š” ์ ‘์„ ๋ ฅ ๋ถ„ํฌ(tangential force distribution), ์ฆ‰ ์ „๋‹จ ๋ณ€ํ˜•๋ฅ (shear strain)์„ ๋ช…์‹œ์ ์œผ๋กœ ๋ชจ๋ธ๋งํ•˜์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฏธ์„ธํ•œ ๋ฏธ๋„๋Ÿฌ์ง(micro-slips)๊ณผ ์ธก๋ฉด ํž˜์„ ํฌ์ฐฉํ•˜๋Š” ๋ฐ ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ํ•˜๋“œ์›จ์–ด ์„ผ์„œ์™€ Tacmap ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ณต๋™์œผ๋กœ ์„ค๊ณ„ํ•˜์—ฌ ๋‹ค์ฐจ์› ํž˜ ํ•„๋“œ ํ‘œํ˜„์„ ํ†ตํ•ฉํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ฐ์ฒด ๋ฉ”์‹œ(object meshes)์˜ ๋ณต์žก์„ฑ์ด ์ฆ๊ฐ€ํ•จ์— ๋”ฐ๋ผ Ray-casting ์˜ค๋ฒ„ํ—ค๋“œ๊ฐ€ ์ฆ๊ฐ€ํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์—์„œ ์นจํˆฌ ๊นŠ์ด ๊ณ„์‚ฐ์˜ ์ง€์—ฐ ์‹œ๊ฐ„(latency)์„ ๋”์šฑ ์ค„์ด๊ธฐ ์œ„ํ•œ ๊ณ ๊ธ‰ ๊ฐ€์† ๊ตฌ์กฐ์ฒด(acceleration structures) ํƒ์ƒ‰์„ ๊ณ ๋ คํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ, Tacmap์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ธ๊ณ„๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ๊ณ ์ถฉ์‹ค๋„ ๋ฐ ๊ณ„์‚ฐ ํšจ์œจ์ ์ธ ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํˆดํ‚ท์„ ์ œ๊ณตํ•˜๋ฉฐ, ๋ณต์žกํ•œ ๋กœ๋ด‡ ์กฐ์ž‘์— ํ•„์š”ํ•œ ํ•„์ˆ˜ ์ ‘์ด‰ ํŠน์„ฑ์„ ํšจ๊ณผ์ ์œผ๋กœ ํฌ์ฐฉํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”” Ring Review

๐Ÿ”” Ring โ€” An idea that echoes. Grasp the core and its value.

1. ์„œ๋ก : ์ด‰๊ฐ์ด๋ผ๋Š” ๊ฐ๊ฐ, ๊ทธ๋ฆฌ๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ํ•œ๊ณ„

์†์œผ๋กœ ๋ฌผ๊ฑด์„ ์žก์„ ๋•Œ ์šฐ๋ฆฌ๊ฐ€ ๋ฌด์˜์‹์ ์œผ๋กœ ํ•˜๋Š” ์ผ์„ ์ƒ๊ฐํ•ด๋ณด์ž. ์†๊ฐ€๋ฝ ๋์˜ ํ”ผ๋ถ€๊ฐ€ ๋ฏธ์„ธํ•˜๊ฒŒ ๋ˆŒ๋ฆฌ๊ณ , ๊ทธ ์••๋ ฅ ๋ถ„ํฌ๋ฅผ ํ†ตํ•ด ๋ฌผ์ฒด์˜ ํ˜•์ƒ, ๋ฏธ๋„๋Ÿฌ์ง ์—ฌ๋ถ€, ์ ‘์ด‰์ด ์–ผ๋งˆ๋‚˜ ์•ˆ์ •์ ์ธ์ง€๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ํŒŒ์•…ํ•œ๋‹ค. ๋ˆˆ์„ ๊ฐ๊ณ ๋„ ๋‹ฌ๊ฑ€์„ ๊นจ๋œจ๋ฆฌ์ง€ ์•Š๊ณ  ๋“ค ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์€ ์ˆœ์ „ํžˆ ์ด ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ ๋•๋ถ„์ด๋‹ค.

๋กœ๋ด‡๋„ ์ด ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”์–ด์•ผ ํ•œ๋‹ค. ํŠนํžˆ ๋‹ค์ง€ ์กฐ์ž‘(dexterous manipulation)์„ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” ์—ฐ๊ตฌ์—์„œ, ์‹œ๊ฐ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ(Vision-Based Tactile Sensor, VBTS)๋Š” ํ•ต์‹ฌ ํ•˜๋“œ์›จ์–ด๊ฐ€ ๋˜์—ˆ๋‹ค. GelSight, DIGIT ๋“ฑ์˜ VBTS๋Š” ํƒ„์„ฑ ๊ฒ”ํŒจ๋“œ(elastomer gel pad)๊ฐ€ ์ ‘์ด‰ ์‹œ ๋ณ€ํ˜•๋˜๋Š” ๋ชจ์Šต์„ ๋‚ด์žฅ ์นด๋ฉ”๋ผ๋กœ ์ดฌ์˜ํ•ด ๊ณ ํ•ด์ƒ๋„์˜ ์ ‘์ด‰ ์ง€ํ˜•๋„๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ์ ‘์ด‰ ๋ฉด์ , ๋ฒ•์„ ๋ ฅ ๋ถ„ํฌ, ์‹ฌ์ง€์–ด ์ „๋‹จ๋ ฅ(shear force)์— ์˜ํ•œ ๋งˆ์ปค ์ด๋™๊นŒ์ง€ ํฌ์ฐฉํ•  ์ˆ˜ ์žˆ๋‹ค.

๋ฌธ์ œ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์— ์žˆ๋‹ค. ๊ฐ•ํ™”ํ•™์Šต(RL)์œผ๋กœ ์ด‰๊ฐ ๊ธฐ๋ฐ˜ ์ •์ฑ…์„ ํ›ˆ๋ จํ•˜๋ ค๋ฉด ์ˆ˜๋ฐฑ๋งŒ ๋ฒˆ์˜ ์ ‘์ด‰ ๊ฒฝํ—˜์ด ํ•„์š”ํ•œ๋ฐ, ์‹ค์ œ ํ•˜๋“œ์›จ์–ด๋กœ ์ด๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š” ๊ฒƒ์€ ๋น„ํ˜„์‹ค์ ์ด๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•œ ์ด์œ ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๋œ ์ด‰๊ฐ ์‹ ํ˜ธ๋ฅผ ์‹ค์ œ ์„ผ์„œ์— ๊ทธ๋Œ€๋กœ ์ ์šฉํ•˜๋ฉด ์ •์ฑ…์ด ์ œ๋Œ€๋กœ ๋™์ž‘ํ•˜์ง€ ์•Š๋Š”๋‹ค. ์ด๊ฒƒ์ด ์ด‰๊ฐ sim-to-real ๊ฐ„๊ทน(tactile sim-to-real gap)์ด๋‹ค.

์ด ๊ฐ„๊ทน์„ ๋ฉ”์šฐ๊ธฐ ์œ„ํ•œ ๊ธฐ์กด ์ ‘๊ทผ๋ฒ•์€ ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€์˜€๋‹ค:

  1. ๊ฒฝํ—˜์  ๋ฐฉ๋ฒ•(Empirical, e.g., Taxim): ์‹ค์ œ ๋ฐ์ดํ„ฐ๋กœ ๋ชจ๋ธ์„ ํ•™์Šต. ๋ถ„ํฌ๋ฅผ ๋ฒ—์–ด๋‚˜๋ฉด ์ผ๋ฐ˜ํ™”์— ์•ฝํ•จ.
  2. ํ•ด์„์  ๋ฐฉ๋ฒ•(Analytical, e.g., TACTO): ํ‘œ์ค€ ๋ž˜์Šคํ„ฐ๋ผ์ด์ €๋กœ ๊นŠ์ด ๋งต์„ ๋ Œ๋”๋ง. ๋น ๋ฅด์ง€๋งŒ ์—˜๋ผ์Šคํ† ๋จธ์˜ ์ฒด์  ๋ณด์กด(volume-preserving) ํŠน์„ฑ์„ ๋ฌด์‹œํ•ด ๋ฌผ๋ฆฌ์  ์ง„์‹ค์„ฑ์ด ๋‚ฎ์Œ.
  3. ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•(Physics-based, e.g., FEM): ์œ ํ•œ์š”์†Œ๋ฒ•์œผ๋กœ ๊ณ ์ •๋ฐ€ ๋ณ€ํ˜• ๊ณ„์‚ฐ. ์ •ํ™•ํ•˜์ง€๋งŒ RL์— ์“ฐ๊ธฐ์—” ๋น„ํ˜„์‹ค์ ์œผ๋กœ ๋А๋ฆผ.

์ด ๋”œ๋ ˆ๋งˆ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋“ฑ์žฅํ•œ ๋…ผ๋ฌธ์ด ๋ฐ”๋กœ Tacmap์ด๋‹ค.

ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ๋‹จ์ˆœํ•˜์ง€๋งŒ ๊ฐ•๋ ฅํ•˜๋‹ค: ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ธ๊ณ„๋ฅผ ํ•˜๋‚˜์˜ ๊ณตํ†ต ํ‘œํ˜„ ๊ณต๊ฐ„(shared representation space)์œผ๋กœ ํ†ต์ผ์‹œํ‚ค์ž. ๊ทธ ๊ณต๊ฐ„์€ ๋ฐ”๋กœ ์นจํˆฌ ๊นŠ์ด ๊ธฐ๋ฐ˜์˜ ๋ณ€ํ˜• ๋งต(penetration depth-based deform map)์ด๋‹ค.


2. ๋ฐฉ๋ฒ•๋ก : Tacmap์˜ ๊ตฌ์กฐ์™€ ์ž‘๋™ ์›๋ฆฌ

2.1 ํ•ต์‹ฌ ์ง๊ด€: โ€œ์ธก์ • ๋‹จ์œ„๋ฅผ ๋งž์ถ”๋ฉด ๋น„๊ต๊ฐ€ ๋œ๋‹คโ€

๋ฌผ๋ฆฌํ•™์—์„œ ๋‹จ์œ„๊ณ„๋ฅผ ํ†ต์ผํ•˜๋Š” ๊ฒƒ๋งŒํผ ์ค‘์š”ํ•œ ์ผ์ด ์—†๋‹ค. ์„ญ์”จ์™€ ํ™”์”จ๋ฅผ ์ง์ ‘ ๋น„๊ตํ•˜๋ฉด ์˜๋ฏธ๊ฐ€ ์—†๋“ฏ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๊นŠ์ด ๋ฒ„ํผ(depth buffer)์™€ ์‹ค์ œ ์นด๋ฉ”๋ผ ์ด๋ฏธ์ง€์˜ RGB ํ”ฝ์…€์„ ์ง์ ‘ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์€ ๋ถˆ๊ฐ€๋Šฅ์— ๊ฐ€๊น๋‹ค.

Tacmap์€ ์ด ๋ฐœ์ƒ์„ ๋’ค์ง‘๋Š”๋‹ค. โ€œ์›์‹œ ์ด‰๊ฐ ์ด๋ฏธ์ง€๋Š” ์„ผ์„œ๋งˆ๋‹ค ๋‹ค๋ฅด๊ณ  ๊ด‘ํ•™์ ์œผ๋กœ ๋ณต์žกํ•˜์ง€๋งŒ, ๊ทธ ์ด๋ฉด์˜ ์ ‘์ด‰ ๋ณ€ํ˜• ๋งต(deformation map)์€ ๋ฌผ๋ฆฌ์  ์ ‘์ด‰์˜ ๋ณดํŽธ์  ๋Œ€๋ฆฌ์ž(universal proxy)๊ฐ€ ๋  ์ˆ˜ ์žˆ๋‹ค.โ€

์ฆ‰: - ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋„๋ฉ”์ธ: ๊ฐ•์ฒด ๋ฌผ์ฒด์™€ ์„ผ์„œ ์—˜๋ผ์Šคํ† ๋จธ ์‚ฌ์ด์˜ 3D ์นจํˆฌ ๋ถ€ํ”ผ(intersection volume)๋ฅผ ๊นŠ์ด ๋งต์œผ๋กœ ๊ณ„์‚ฐ โ†’ Tacmap ์ƒ์„ฑ - ์‹ค์ œ ๋„๋ฉ”์ธ: ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์žฅ์น˜(automated data-collection rig)๋กœ ์‹ค์ œ ์ ‘์ด‰ ์‹œ์˜ ground-truth ๋ณ€ํ˜•์„ ์ธก์ •ํ•˜๊ณ , ์ด๋ฅผ ์ด์šฉํ•ด ์›์‹œ ์ด‰๊ฐ ์ด๋ฏธ์ง€ โ†’ ๋ณ€ํ˜• ๋งต ๋ณ€ํ™˜ ๋ชจ๋ธ์„ ํ•™์Šต

๋‘ ๋„๋ฉ”์ธ ๋ชจ๋‘ ๊ฐ™์€ โ€œ๋ณ€ํ˜• ๋งตโ€ ๊ณต๊ฐ„์œผ๋กœ ํˆฌ์˜๋˜๋ฏ€๋กœ, ๋„๋ฉ”์ธ ์‹œํ”„ํŠธ(domain shift)๊ฐ€ ํฌ๊ฒŒ ์ค„์–ด๋“ ๋‹ค.

[Simulation Domain]                     [Real World Domain]
   Physics Engine                          VBTS Raw Image
       |                                         |
   Intersection                          Translation Model
   Volume Calc.                          (image -> deform)
       |                                         |
   Tacmap (deform map) <-------- same space -----> Tacmap (deform map)
       |                                         |
   RL Policy Training                       Policy Deployment

2.2 ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ธก: ํšจ์œจ์ ์ธ ์นจํˆฌ ๊นŠ์ด ๊ณ„์‚ฐ

์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ Tacmap์„ ์ƒ์„ฑํ•˜๋Š” ํŒŒ์ดํ”„๋ผ์ธ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

์ดˆ๊ธฐํ™” ๋‹จ๊ณ„: Multi-Mesh Ray Caster

์‹œ์Šคํ…œ ์ดˆ๊ธฐํ™” ์‹œ, ๋ณ€ํ˜• ์ „ ์„ผ์„œ ํ‘œ๋ฉด(undeformed sensor surface) ์œ„์— ์ด‰๊ฐ ๊ฐ์ง€์ (Tactile Sensing Points)์˜ ๋ฐ€์ง‘ ๊ฒฉ์ž(dense grid)์™€ ํ•ด๋‹น ๊ฐ์ง€ ๋ฐฉํ–ฅ(Sensing Directions)์„ ๋ฏธ๋ฆฌ ์ •์˜ํ•œ๋‹ค.

์ด ์„ค๊ณ„์˜ ํ•ต์‹ฌ์€ ์ด‰๊ฐ ๊ฐ์ง€์˜ ๊ธฐํ•˜ํ•™์  ํ•ด์ƒ๋„๋ฅผ ๋ฌผ๋ฆฌ ์ถฉ๋Œ ๋ฉ”์‹œ(physics collision mesh)๋กœ๋ถ€ํ„ฐ ๋ถ„๋ฆฌ(decouple)ํ•œ๋‹ค๋Š” ์ ์ด๋‹ค. ๋•๋ถ„์— ๋ฌผ๋ฆฌ ์†”๋ฒ„์˜ ์ˆ˜์น˜ ์•ˆ์ •์„ฑ์„ ํฌ์ƒํ•˜์ง€ ์•Š๊ณ  ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.

์นจํˆฌ ๊นŠ์ด ๊ณ„์‚ฐ: ๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„(Normal Projection Space)

๊ธฐ์กด ํ‰๋ฉด ์„ผ์„œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋“ค์€ Z์ถ• ๋ฐฉํ–ฅ์œผ๋กœ์˜ ๋‹จ์ˆœ ํˆฌ์˜์„ ์‚ฌ์šฉํ•œ๋‹ค. ์ด ๋ฐฉ์‹์€ ํ‰๋ฉด ์„ผ์„œ์—๋Š” ์–ด๋А ์ •๋„ ์ ํ•ฉํ•˜์ง€๋งŒ, ๊ณก๋ฉด ์„ผ์„œ(curved fingertip)์—๋Š” ํฐ ํˆฌ์˜ ์˜ค์ฐจ(projection artifact)๋ฅผ ์œ ๋ฐœํ•œ๋‹ค.

Tacmap์€ ๊ฐ ๊ฐ์ง€์ ์—์„œ ํ‘œ๋ฉด ๋ฒ•์„  ๋ฐฉํ–ฅ(surface normal direction)์œผ๋กœ ๋ ˆ์ด๋ฅผ ์˜์•„ ๋ฌผ์ฒด์™€์˜ ๊ต์ฐจ ๊นŠ์ด๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ์ผ๋ฐ˜ํ™”๋œ ๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„์„ ์‚ฌ์šฉํ•œ๋‹ค.

d(\mathbf{p}) = \max\left(0,\ \mathbf{n}(\mathbf{p}) \cdot (\mathbf{x}_{\text{obj}} - \mathbf{p})\right)

์—ฌ๊ธฐ์„œ: - \mathbf{p}: ์„ผ์„œ ํ‘œ๋ฉด ์œ„์˜ ๊ฐ์ง€์  ์œ„์น˜ - \mathbf{n}(\mathbf{p}): ํ•ด๋‹น ์ ์—์„œ์˜ ํ‘œ๋ฉด ๋ฒ•์„  ๋ฒกํ„ฐ - \mathbf{x}_{\text{obj}}: ๋ฌผ์ฒด ํ‘œ๋ฉด์—์„œ ํ•ด๋‹น ๋ ˆ์ด๊ฐ€ ๊ต์ฐจํ•˜๋Š” ์ 

์ด ๊ณต์‹์€ ๋ฌผ์ฒด๊ฐ€ ์–ผ๋งˆ๋‚˜ โ€œํŒŒ๊ณ ๋“ค์—ˆ๋Š”์ง€โ€๋ฅผ ๋ฒ•์„  ๋ฐฉํ–ฅ์œผ๋กœ ์ธก์ •ํ•œ๋‹ค. ํ‰๋ฉด ์„ผ์„œ์˜ ๊ฒฝ์šฐ ๋ชจ๋“  ๋ฒ•์„ ์ด Z์ถ•๊ณผ ๊ฐ™์œผ๋ฏ€๋กœ ๊ธฐ์กด ๋ฐฉ๋ฒ•๊ณผ ๋™์ผํ•ด์ง€๊ณ , ๊ณก๋ฉด ์„ผ์„œ์˜ ๊ฒฝ์šฐ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์ผ๋ฐ˜ํ™”๋œ๋‹ค.

๋ฒกํ„ฐํ™” ํŒŒ์ดํ”„๋ผ์ธ๊ณผ GPU ๊ฐ€์†

์›์‹œ ๊ต์ฐจ ๋ฐ์ดํ„ฐ๋Š” ๋ฒกํ„ฐํ™”๋œ ํŒŒ์ดํ”„๋ผ์ธ(vectorized pipeline)์„ ํ†ตํ•ด ๋ณ€ํ˜• ๋งต์œผ๋กœ ํ•ฉ์„ฑ๋œ๋‹ค.

  • Isaac Lab: ๊ณ ์„ฑ๋Šฅ Raycaster API๋ฅผ ํ™œ์šฉํ•ด ์ˆ˜์ฒœ ๊ฐœ์˜ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์—์„œ ๋Œ€๊ทœ๋ชจ ๋ Œ๋”๋ง ์ง€์›
  • MuJoCo: mj ์ „์šฉ ํˆดํ‚ท์œผ๋กœ ๊ตฌํ˜„

์ „์ฒด ๋ Œ๋”๋ง ํ”„๋กœ์„ธ์Šค๋ฅผ GPU์— ์˜คํ”„๋กœ๋“œํ•จ์œผ๋กœ์จ ๋†’์€ ์ฃผํŒŒ์ˆ˜์˜ ๋ Œ๋”๋ง์„ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ๋„ ์‹ค์ œ ๋ฌผ๋ฆฌ ์ธก์ •๊ณผ์˜ ๊ตฌ์กฐ์  ์ •๋ ฌ(structural alignment)์„ ์œ ์ง€ํ•œ๋‹ค.

์ด์ค‘ ํ‘œ๋ฉด ๊ธฐํ•˜ ๋ชจ๋ธ(Dual-Surface Geometric Model)

์ ‘์ด‰ ์‹œ ์„ผ์„œ ๊ฒ”ํŒจ๋“œ๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ณ€ํ˜•๋˜๋Š”์ง€๋ฅผ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์œ„ํ•ด ์ด์ค‘ ํ‘œ๋ฉด ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ์ด ๋ชจ๋ธ์€ ์ ‘์ด‰ ์˜์—ญ์—์„œ์˜ ๊ฒ”ํŒจ๋“œ ๋ณ€ํ˜•์„ ๊ธฐํ•˜ํ•™์ ์œผ๋กœ ๊ทผ์‚ฌํ•˜๋ฉฐ, Isaac Lab ๋ฐ MuJoCo ๋‚ด์—์„œ ๋ฌผ๋ฆฌ ์—”์ง„์— ์ง์ ‘ ์ธ์Šคํ„ด์Šคํ™”๋œ๋‹ค.

2.3 ์‹ค์ œ ์„ธ๊ณ„ ์ธก: ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘๊ณผ ๋ณ€ํ™˜ ๋ชจ๋ธ

์‹ค์ œ VBTS๊ฐ€ ์ถœ๋ ฅํ•˜๋Š” ๊ฒƒ์€ ์›์‹œ RGB ์ด๋ฏธ์ง€๋‹ค. ์ด๊ฒƒ์„ ๋ณ€ํ˜• ๋งต์œผ๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ ์œ„ํ•ด ๋‘ ๋‹จ๊ณ„๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

Ground-Truth ํš๋“: ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์žฅ์น˜

๋…ผ๋ฌธ์—์„œ๋Š” ์‹ค์ œ ๋ฌผ์ฒด์™€ ์„ผ์„œ์˜ ์ ‘์ด‰ ์ค‘์— ground-truth ๋ณ€ํ˜•์„ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์žฅ์น˜(automated data-collection rig)๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ์ด ์žฅ์น˜๋Š” ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด, ๋‹ค์–‘ํ•œ ์ ‘์ด‰ ๊ฐ๋„์™€ ๊นŠ์ด์—์„œ ๋Œ€๊ทœ๋ชจ ์Œ(pair) ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•œ๋‹ค:

\mathcal{D} = \{(I_{\text{raw}}^{(i)},\ \mathbf{D}_{\text{gt}}^{(i)})\}_{i=1}^{N}

์—ฌ๊ธฐ์„œ I_{\text{raw}}๋Š” ์›์‹œ ์ด‰๊ฐ ์ด๋ฏธ์ง€, \mathbf{D}_{\text{gt}}๋Š” ์‹ค์ œ ๋ณ€ํ˜• ๋งต์ด๋‹ค.

๋ณ€ํ™˜ ๋ชจ๋ธ ํ•™์Šต

์ด ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ f_\theta: I_{\text{raw}} \to \hat{\mathbf{D}} ๋ฅผ ํ•™์Šตํ•œ๋‹ค. ์‹ค์ œ ๋ฐฐํฌ ์‹œ์—๋Š”:

\hat{\mathbf{D}}_{\text{real}} = f_\theta(I_{\text{raw}})

๋กœ ์›์‹œ ์ด๋ฏธ์ง€๋ฅผ ๋ณ€ํ˜• ๋งต์œผ๋กœ ์‹ค์‹œ๊ฐ„ ๋ณ€ํ™˜ํ•˜๊ณ , ์ด๋ฅผ RL ์ •์ฑ…์˜ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค.

2.4 ์ „์ฒด ์‹œ์Šคํ…œ ํŒŒ์ดํ”„๋ผ์ธ

flowchart LR
    subgraph SIM["Simulation Domain (Isaac Lab / MuJoCo)"]
        A["Physics Engine\nContact State"] --> B["Multi-Mesh\nRay Caster"]
        B --> C["Normal Projection\nDepth Calculation"]
        C --> D["Vectorized Pipeline\n(GPU)"]
        D --> E["Tacmap\n(Deform Map)"]
    end

    subgraph REAL["Real World Domain"]
        F["VBTS\nRaw RGB Image"] --> G["Translation Model\nf_theta"]
        G --> H["Tacmap\n(Deform Map)"]
    end

    subgraph TRAINING["Policy Training"]
        E --> I["RL Policy\nPPO Training"]
    end

    subgraph DEPLOY["Deployment"]
        H --> J["Trained Policy\nInference"]
    end

    subgraph RIG["Data Collection Rig"]
        K["Automated\nData Collection"] --> L["Paired Dataset\n(image, gt_deform)"]
        L --> G
    end

    I -.->|"Zero-Shot Transfer"| J


3. ๊ธฐ์ˆ ์  ์„ธ๋ถ€ ์‚ฌํ•ญ: ๊ฐ ๊ตฌ์„ฑ ์š”์†Œ ์‹ฌ์ธต ๋ถ„์„

3.1 ์™œ โ€œ์นจํˆฌ ๊นŠ์ดโ€์ธ๊ฐ€?

FEM์€ ์ ‘์ด‰ ์—ญํ•™์„ ๋งค์šฐ ์ •ํ™•ํžˆ ๊ณ„์‚ฐํ•˜์ง€๋งŒ, ๊ฐ ๋…ธ๋“œ์˜ ๋ณ€์œ„๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ํ’€์–ด์•ผ ํ•˜๋ฏ€๋กœ ์ˆ˜์ฒœ ๊ฐœ์˜ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์—์„œ๋Š” ์‚ฌ์šฉ ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค. ๋ฐ˜๋ฉด ๋‹จ์ˆœ ๋ž˜์Šคํ„ฐ๋ผ์ด์ €๋Š” ์—˜๋ผ์Šคํ† ๋จธ๊ฐ€ โ€œ๋ฌผ์ฒ˜๋Ÿผโ€ ๋ณ€ํ˜•ํ•œ๋‹ค๋Š” ๋น„ํ˜„์‹ค์  ๊ฐ€์ •์„ ๋‚ดํฌํ•œ๋‹ค.

์นจํˆฌ ๊นŠ์ด๋Š” ์ค‘๊ฐ„ ์ง€์ ์„ ์ฐพ๋Š” ์˜๋ฆฌํ•œ ์„ ํƒ์ด๋‹ค. ๊ฐ•์ฒด(rigid body)์™€ ๋‹ค๋ฅธ ๊ฐ•์ฒด๊ฐ€ ๊ฒน์น˜๋Š” ๋ถ€๋ถ„์˜ ๊นŠ์ด๋Š”, FEM ์—†์ด๋„ ๋ฌผ๋ฆฌ ์—”์ง„์˜ ์ถฉ๋Œ ๊ฐ์ง€ ๋‹จ๊ณ„์—์„œ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค. ์ด ๊ฐ’์€ ์—˜๋ผ์Šคํ† ๋จธ๊ฐ€ ๋ฌผ์ฒด์— ์˜ํ•ด ์–ผ๋งˆ๋‚˜ ์••์ถ•๋˜์—ˆ๋Š”์ง€์— ๋Œ€ํ•œ ๊ธฐํ•˜ํ•™์  ๊ทผ์‚ฌ์ด๋ฉฐ, ์‹ค์ œ ์—˜๋ผ์Šคํ† ๋จธ์˜ ๋ณ€ํ˜•๊ณผ ๋†’์€ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๋ณด์ธ๋‹ค.

3.2 ๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„์˜ ์ค‘์š”์„ฑ

๊ธฐ์กด์˜ ํ‰๋ฉด ์„ผ์„œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ(TACTO ๋“ฑ)๋Š” ์•”๋ฌต์ ์œผ๋กœ ๋ชจ๋“  ํ”ฝ์…€์˜ ๊ฐ์ง€ ๋ฐฉํ–ฅ์ด ๋™์ผํ•˜๋‹ค๊ณ  ๊ฐ€์ •ํ•œ๋‹ค. ์ด๋Š” GelSight ๊ฐ™์€ ํ‰ํŒํ˜• ์„ผ์„œ์—๋Š” ๋ฌด๋‚œํ•˜์ง€๋งŒ, ์†๊ฐ€๋ฝ ๋(fingertip)์ฒ˜๋Ÿผ ๊ณก๋ฉด์„ ๊ฐ€์ง„ ์„ผ์„œ์—๋Š” ์‹ฌ๊ฐํ•œ ๊ธฐํ•˜ํ•™์  ์™œ๊ณก์„ ์ดˆ๋ž˜ํ•œ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด, ๊ตฌํ˜• fingertip ์„ผ์„œ์˜ ๊ฐ€์žฅ์ž๋ฆฌ์—์„œ ๋ฐœ์ƒํ•œ ์ ‘์ด‰์„ Z์ถ•์œผ๋กœ ํˆฌ์˜ํ•˜๋ฉด, ์‹ค์ œ ์ ‘์ด‰ ๊นŠ์ด๋ณด๋‹ค ํ›จ์”ฌ ์ž‘๊ฒŒ ์ธก์ •๋œ๋‹ค. ์ด๋Š” ์ •์ฑ… ํ•™์Šต์— ์ฒด๊ณ„์ ์ธ ํŽธํ–ฅ(systematic bias)์„ ์œ ๋ฐœํ•œ๋‹ค.

๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„์„ ์‚ฌ์šฉํ•˜๋ฉด ๊ฐ ๊ฐ์ง€์ ์ด ์ž์‹ ์˜ ๋ฒ•์„  ๋ฐฉํ–ฅ์œผ๋กœ ์ธก์ •ํ•˜๋ฏ€๋กœ, ์„ผ์„œ ํ‘œ๋ฉด์˜ ํ˜•์ƒ์— ๋ฌด๊ด€ํ•˜๊ฒŒ ์ผ๊ด€๋œ ๋ฌผ๋ฆฌ์  ์˜๋ฏธ๋ฅผ ๊ฐ–๋Š” ์นจํˆฌ ๊นŠ์ด๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.

3.3 ๋ณ€ํ™˜ ๋ชจ๋ธ์˜ ์—ญํ• 

์‹ค์ œ VBTS ์ด๋ฏธ์ง€์—๋Š” ์กฐ๋ช…, ๋งˆ์ปค, ๊ฒ”ํŒจ๋“œ์˜ ๊ด‘ํ•™์  ํŠน์„ฑ ๋“ฑ ๋ฌผ๋ฆฌ ์ ‘์ด‰ ์ด์™ธ์˜ ์ˆ˜๋งŽ์€ ์š”์†Œ๊ฐ€ ๋‹ด๊ฒจ ์žˆ๋‹ค. ๋ณ€ํ™˜ ๋ชจ๋ธ f_\theta๋Š” ์ด โ€œ๊ด‘ํ•™์  ๋…ธ์ด์ฆˆโ€๋ฅผ ์ œ๊ฑฐํ•˜๊ณ , ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์˜๋ฏธ ์žˆ๋Š” ๋ณ€ํ˜• ์ •๋ณด๋งŒ ์ถ”์ถœํ•˜๋Š” ์—ญํ• ์„ ํ•œ๋‹ค.

ํ•ต์‹ฌ์€ ์ด ๋ณ€ํ™˜์ด ํ•™์Šตํ•˜๊ธฐ ์‰ฝ๋‹ค๋Š” ์ ์ด๋‹ค. ์ธํ’‹(์›์‹œ ์ด๋ฏธ์ง€)๊ณผ ํƒ€๊ฒŸ(ground-truth ๋ณ€ํ˜• ๋งต) ๋ชจ๋‘ ๋™์ผํ•œ ์ ‘์ด‰ ์ด๋ฒคํŠธ์—์„œ ๋‚˜์˜จ ๊ฒƒ์ด๋ฏ€๋กœ, ๊ฐ•ํ•œ ๋Œ€์‘ ๊ด€๊ณ„(strong correspondence)๊ฐ€ ์กด์žฌํ•œ๋‹ค. ํ•™์Šต ๋ฐ์ดํ„ฐ๋Š” ์ž๋™ํ™”๋œ ์žฅ์น˜๋กœ ๋Œ€๊ทœ๋ชจ๋กœ ์ˆ˜์ง‘ํ•  ์ˆ˜ ์žˆ์–ด ์ˆ˜๋™ ๋ ˆ์ด๋ธ”๋ง์ด ํ•„์š” ์—†๋‹ค.


4. ์‹คํ—˜: ๋ฌด์—‡์„ ์ธก์ •ํ•˜๊ณ , ์–ด๋–ค ๊ฒฐ๊ณผ๋ฅผ ์–ป์—ˆ๋‚˜

4.1 ์‹คํ—˜ ์„ค์ •

๊ตฌ์„ฑ ์š”์†Œ ์„ธ๋ถ€ ์‚ฌํ•ญ
ํ•˜๋“œ์›จ์–ด ํ”Œ๋žซํผ SharpaWave ๋‹ค์ง€ ํ•ธ๋“œ (DTC ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ ํƒ‘์žฌ)
์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ Isaac Lab, MuJoCo (Tacmap ํ†ตํ•ฉ)
๋น„๊ต ์ง€ํ‘œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ vs ์‹ค์ œ์˜ ๋ณ€ํ˜• ๋งต ์ •๋Ÿ‰์  ๋น„๊ต
๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ In-hand ๊ตฌ ํšŒ์ „(ball rotation)
์ •์ฑ… ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ PPO (Proximal Policy Optimization)
๋ฌผ์ฒด ๋ฐ์ดํ„ฐ์…‹ ๋‹ค์–‘ํ•œ ํ˜•์ƒ์˜ ๋ฌผ์ฒด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (์‹ค๋ฆฐ๋”, ์ •์‚ฌ๊ฐํ˜• ๋“ฑ)

4.2 ์‹คํ—˜ 1: ๋ณ€ํ˜• ๋งต์˜ ์ •ํ™•๋„ ํ‰๊ฐ€

์„ค์ •: ๋™์ผํ•œ ์ƒ๋Œ€์  ์ ‘์ด‰ ์œ„์น˜์—์„œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ธ๊ณ„์˜ ๋ณ€ํ˜• ๋งต์„ ์ง์ ‘ ๋น„๊ต.

๊ฒฐ๊ณผ: Tacmap์˜ ๋ณ€ํ˜• ๋งต์ด ์‹ค์ œ ์ธก์ •๊ฐ’์„ ๋ฐ€์ ‘ํ•˜๊ฒŒ ๋ฐ˜์˜ํ•จ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ํ™•์ธํ–ˆ๋‹ค. ํŠนํžˆ: - ์‹ค๋ฆฐ๋”(cylinder) ์ ‘์ด‰๊ณผ ์ •์‚ฌ๊ฐํ˜•(square) ์ ‘์ด‰ ๋ชจ๋‘์—์„œ ์ˆœ ํž˜(net force) ๋น„๊ต๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ์„ธ๊ณ„ ๊ฐ„์— ๋†’์€ ์ผ์น˜๋„๋ฅผ ๋ณด์˜€๋‹ค (Figure 4 ์ฐธ์กฐ). - ๋‹ค์–‘ํ•œ ์ ‘์ด‰ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ๋ณ€ํ˜• ๋งต์˜ ๊ณต๊ฐ„์  ํŒจํ„ด(spatial pattern)์ด ์ž˜ ๋ณด์กด๋œ๋‹ค.

์˜๋ฏธ: ๊ธฐ์กด TACTO ์Šคํƒ€์ผ์˜ ๋‹จ์ˆœ ๊นŠ์ด ๋ฒ„ํผ ๋ Œ๋”๋ง์€ ์—˜๋ผ์Šคํ† ๋จธ์˜ ์ฒด์  ๋ณด์กด ํŠน์„ฑ์„ ๋ฌด์‹œํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ ‘์ด‰ ๊ฐ€์žฅ์ž๋ฆฌ์—์„œ ๋ณ€ํ˜•์ด ์‹ค์ œ๋ณด๋‹ค ๊ณผ์žฅ๋˜๊ฑฐ๋‚˜ ๊ณผ์†Œ ํ‘œํ˜„๋œ๋‹ค. Tacmap์˜ ์นจํˆฌ ๊นŠ์ด ๊ธฐ๋ฐ˜ ๊ณ„์‚ฐ์€ ์ด ํŽธํ–ฅ์„ ํ˜„์ €ํžˆ ์ค„์ธ๋‹ค.

4.3 ์‹คํ—˜ 2: In-hand ๊ตฌ ํšŒ์ „ ํƒœ์Šคํฌ (Zero-Shot Transfer)

์ด ์‹คํ—˜์ด ๋…ผ๋ฌธ์˜ ํ•˜์ด๋ผ์ดํŠธ๋‹ค. ๋ณต์žกํ•œ contact-rich ํƒœ์Šคํฌ์—์„œ sim-to-real ์ „์ด๊ฐ€ ์‹ค์ œ๋กœ ๊ฐ€๋Šฅํ•œ์ง€ ๊ฒ€์ฆํ•œ๋‹ค.

ํƒœ์Šคํฌ ์ •์˜: ๋‹ค์ง€ ํ•ธ๋“œ๊ฐ€ ๊ตฌํ˜• ๋ฌผ์ฒด๋ฅผ ์—ฐ์†์ ์œผ๋กœ ํšŒ์ „์‹œํ‚ค๋ฉด์„œ ํŒŒ์ง€ ์•ˆ์ •์„ฑ์„ ์œ ์ง€. ์ด ํƒœ์Šคํฌ๋Š” ๋ฏธ์„ธํ•œ ์ ‘์ด‰ ์ „ํ™˜(contact transition)๊ณผ ์‹ค์‹œ๊ฐ„ ํž˜ ์กฐ์ ˆ์ด ํ•„์š”ํ•œ ๊ณ ๋‚œ์ด๋„ ์กฐ์ž‘์ด๋‹ค.

ํ›ˆ๋ จ: ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋งŒ PPO๋กœ ํ›ˆ๋ จ. ๊ด€์ธก ๊ณต๊ฐ„์—๋Š” ์‹ค์‹œ๊ฐ„ Tacmap ์ŠคํŠธ๋ฆผ์ด ํฌํ•จ๋˜์–ด, ์—์ด์ „ํŠธ๊ฐ€ ์ ‘์ด‰ ๋‹ค์–‘์ฒด(contact manifold)์˜ ๋ฐ€์ง‘ ๊ธฐํ•˜ ์ •๋ณด๋ฅผ ๋ฐ›๋Š”๋‹ค. ๊ณ ์ฒ˜๋ฆฌ๋Ÿ‰ ๋ Œ๋”๋ง ๋•๋ถ„์— ์ˆ˜๋ฐฑ๋งŒ ๊ฑด์˜ ๋‹ค์–‘ํ•œ ์ ‘์ด‰ ์ƒํ˜ธ์ž‘์šฉ์— ๋…ธ์ถœ๋œ๋‹ค.

๋ฐฐํฌ: ์‹ค์ œ SharpaWave ํ•ธ๋“œ์— ์–ด๋– ํ•œ fine-tuning์ด๋‚˜ ๋„๋ฉ”์ธ ์ ์‘ ์—†์ด ์ง์ ‘ ๋ฐฐํฌ.

๊ฒฐ๊ณผ: - ์—์ด์ „ํŠธ๊ฐ€ ๋ณ€ํ™˜ ๋ชจ๋ธ์„ ํ†ตํ•ด ์‹ค์ œ ์ด‰๊ฐ ์ด๋ฏธ์ง€๋ฅผ ๋ณ€ํ˜• ๋งต์œผ๋กœ ํ•ด์„ํ•˜๊ณ , ๊ตฌ ํšŒ์ „ ํƒœ์Šคํฌ๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•จ. - ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‚ด์—์„œ ์‹ค์ œ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฆฌํ”Œ๋ ˆ์ด(replay)ํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์ด ์‹ค์ œ์™€ ์ผ๊ด€์„ฑ์„ ๊ฐ€์ง์„ ์žฌ์ฐจ ๊ฒ€์ฆ (Figure 1(f)).

sequenceDiagram
    participant Sim as Simulation (PPO Training)
    participant Policy as Trained Policy
    participant Real as Real Robot (SharpaWave)
    participant TransModel as Translation Model

    Sim->>Policy: Train with Tacmap stream (millions of steps)
    Note over Sim,Policy: Only simulation data used

    Real->>TransModel: Raw VBTS image (DTC sensor)
    TransModel->>Policy: Deform map (same space as sim)
    Policy->>Real: Motor commands
    Real->>Real: Successful ball rotation (zero-shot)

4.4 ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‚ด ์‹ค์ œ ๋ฐ์ดํ„ฐ ๋ฆฌํ”Œ๋ ˆ์ด

๋…ผ๋ฌธ์˜ Figure 1(f)์— ํ•ด๋‹นํ•˜๋Š” ๊ฒ€์ฆ ์‹คํ—˜๋„ ์ธ์ƒ์ ์ด๋‹ค. ์‹ค์ œ ๋กœ๋ด‡ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ์ดํ„ฐ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ ๋‚ด์—์„œ ๋ฆฌํ”Œ๋ ˆ์ดํ•จ์œผ๋กœ์จ, Tacmap์ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ธก์—์„œ๋„ ์‹ค์ œ ๋ฌผ๋ฆฌ ์ธก์ •๊ณผ ์ผ๊ด€์„ฑ์ด ์žˆ์Œ์„ ๋ณด์ธ๋‹ค. ์ด๋Š” ๋‹จ๋ฐฉํ–ฅ(simโ†’real)์ด ์•„๋‹Œ ์–‘๋ฐฉํ–ฅ ๊ฒ€์ฆ์„ ์ œ๊ณตํ•œ๋‹ค.


5. ๊ด€๋ จ ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต

5.1 ๊ธฐ์กด ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋ถ„๋ฅ˜

๋ฐฉ๋ฒ• ๋Œ€ํ‘œ ์—ฐ๊ตฌ ์†๋„ ๋ฌผ๋ฆฌ ์ •ํ™•๋„ ๊ณก๋ฉด ์ง€์› RL ์ ํ•ฉ์„ฑ
๊ฒฝํ—˜์  Taxim ๋น ๋ฆ„ ์ค‘๊ฐ„ ์ œํ•œ์  ๋ถ€๋ถ„์ 
ํ•ด์„์  TACTO ๋งค์šฐ ๋น ๋ฆ„ ๋‚ฎ์Œ ๋‚ฎ์Œ ์ ํ•ฉ
FEM ๊ธฐ๋ฐ˜ Narang et al., Ding et al. ๋งค์šฐ ๋А๋ฆผ ๋งค์šฐ ๋†’์Œ ๊ฐ€๋Šฅ ๋ถ€์ ํ•ฉ
GPU ๊ฐ€์† + ํ•ด์„์  TacSL ๋งค์šฐ ๋น ๋ฆ„ ์ค‘๊ฐ„ ์ค‘๊ฐ„ ์ ํ•ฉ
์นจํˆฌ ๊นŠ์ด Tacmap (๋ณธ ๋…ผ๋ฌธ) ๋น ๋ฆ„ ๋†’์Œ ๋„ค์ดํ‹ฐ๋ธŒ ์ง€์› ์ ํ•ฉ

5.2 Taxim๊ณผ์˜ ๋น„๊ต

Taxim์€ GelSight ์„ผ์„œ์— ํŠนํ™”๋œ ๊ฒฝํ—˜์  ๋ชจ๋ธ๋กœ, ๋‹คํ•ญ์‹ ๋ฃฉ์—… ํ…Œ์ด๋ธ”(polynomial look-up table)์„ ์ด์šฉํ•ด ์ ‘์ด‰ ๊ธฐํ•˜๋ฅผ ํ”ฝ์…€ ๊ฐ•๋„๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค. ๋งˆ์ปค ์šด๋™ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๋„ ํฌํ•จํ•˜์—ฌ ํฌ๊ด„์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜ ํŠน์ • ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์— ์˜์กดํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ํ•™์Šต ์‹œ ๋ณด์ง€ ๋ชปํ•œ ๋ฌผ์ฒด ํ˜•์ƒ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™”๊ฐ€ ๋–จ์–ด์ง„๋‹ค. ๋˜ํ•œ GelSight ๊ณ„์—ด ์„ผ์„œ์— ํŠนํ™”๋˜์–ด ์žˆ์–ด ๋‹ค๋ฅธ ์„ผ์„œ๋กœ์˜ ์ „์ด๊ฐ€ ์–ด๋ ต๋‹ค.

Tacmap์€ ๋ฐ์ดํ„ฐ ์˜์กด์„ฑ์„ ์ตœ์†Œํ™”ํ•˜๋ฉด์„œ๋„(์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ธก์€ ์ˆœ์ˆ˜ ๊ธฐํ•˜ ๊ณ„์‚ฐ) ์‹ค์ œ ๋„๋ฉ”์ธ๊ณผ์˜ ์ •๋ ฌ์„ ํ•™์Šต๋œ ๋ณ€ํ™˜ ๋ชจ๋ธ๋กœ ๋‹ฌ์„ฑํ•œ๋‹ค.

5.3 TACTO์™€์˜ ๋น„๊ต

TACTO๋Š” PyBullet ๋“ฑ์˜ ๊ฐ•์ฒด ๋ฌผ๋ฆฌ ์—”์ง„์— ํ‘œ์ค€ ๋ž˜์Šคํ„ฐ๋ผ์ด์ €๋ฅผ ๊ฒฐํ•ฉํ•œ ํ•ด์„์  ๋ฐฉ๋ฒ•์ด๋‹ค. ํ™•์žฅ์„ฑ ์žˆ๋Š” ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•˜์ง€๋งŒ, ์—˜๋ผ์Šคํ† ๋จธ ๋ณ€ํ˜•์„ ๋‹จ์ˆœ ๊นŠ์ด ๋งคํ•‘์œผ๋กœ ๋‹จ์ˆœํ™”ํ•˜์—ฌ ๋ฌผ๋ฆฌ์  ์ง„์‹ค์„ฑ์ด ๋‚ฎ๋‹ค. ํŠนํžˆ ์—˜๋ผ์Šคํ† ๋จธ์˜ ์ธก๋ฉด ๋ณ€ํ˜•(lateral deformation)๊ณผ ์ฒด์  ๋ณด์กด ํšจ๊ณผ๋ฅผ ์ „ํ˜€ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•œ๋‹ค.

Tacmap์€ ์ด ์ง€์ ์—์„œ ๋ช…ํ™•ํžˆ ์•ž์„ ๋‹ค. ๋ฒ•์„  ๋ฐฉํ–ฅ ์นจํˆฌ ๊นŠ์ด ๊ณ„์‚ฐ์€ TACTO์˜ ๊นŠ์ด ๋ฒ„ํผ๋ณด๋‹ค ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์˜๋ฏธ ์žˆ๋Š” ํ‘œํ˜„์ด๋ฉฐ, ๊ณก๋ฉด ์„ผ์„œ์—์„œ์˜ ํˆฌ์˜ ์•„ํ‹ฐํŒฉํŠธ๋„ ์ œ๊ฑฐ๋œ๋‹ค.

5.4 TacSL๊ณผ์˜ ๋น„๊ต

TacSL์€ NVIDIA Isaac Gym์„ ํ™œ์šฉํ•œ GPU ๊ฐ€์† ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋กœ, 200ร— ์ด์ƒ์˜ CPU ๋Œ€๋น„ ์†๋„ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ•œ๋‹ค. Kelvin-Voigt ์ ‘์ด‰ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด ๋ฌผ๋ฆฌ์  ๋ณ€ํ˜•์„ ๊ทผ์‚ฌํ•˜๊ณ , ํ…์„œํ™”๋œ ๊นŠ์ด-RGB ๋งคํ•‘์œผ๋กœ ์ด๋ฏธ์ง€๋ฅผ ํ•ฉ์„ฑํ•œ๋‹ค.

TacSL์€ ๋งค์šฐ ์ธ์ƒ์ ์ธ ์„ฑ๋Šฅ์„ ๋ณด์ด์ง€๋งŒ, ์—˜๋ผ์Šคํ† ๋จธ๋ฅผ ๋‹จ์ˆœ ์Šคํ”„๋ง-๋Œํผ ์‹œ์Šคํ…œ์œผ๋กœ ๋ชจ๋ธ๋งํ•˜์—ฌ ๋ณต์žกํ•œ ์ ‘์ด‰ ์‹œ ๊ตญ์†Œ ๋””ํ…Œ์ผ์ด ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ๋‹ค. ๋˜ํ•œ RGB ์ด๋ฏธ์ง€๋ฅผ ์ตœ์ข… ์ถœ๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•˜๋ฏ€๋กœ, ๊ด‘ํ•™์  ๋ Œ๋”๋ง์˜ ๋ณต์žก์„ฑ์ด ์—ฌ์ „ํžˆ sim-to-real ๊ฐ„๊ทน์˜ ์š”์ธ์ด ๋œ๋‹ค.

Tacmap์€ ๊ด‘ํ•™์  ๋ Œ๋”๋ง ์ž์ฒด๋ฅผ ์šฐํšŒํ•œ๋‹ค. ๋ณ€ํ˜• ๋งต์ด๋ผ๋Š” ์ค‘๊ฐ„ ํ‘œํ˜„์„ ํ†ตํ•ด ์„ผ์„œ๋ณ„ ๊ด‘ํ•™ ํŠน์„ฑ์„ ๋ถ„๋ฆฌ(decouple)ํ•จ์œผ๋กœ์จ ๋” ๋ฒ”์šฉ์ ์ธ ์ ‘๊ทผ์„ ์ œ๊ณตํ•œ๋‹ค.

5.5 Taccel๊ณผ์˜ ๊ด€๊ณ„

์ตœ๊ทผ NeurIPS 2025์—์„œ ๋ฐœํ‘œ๋œ Taccel์€ FEM ๊ธฐ๋ฐ˜ ๊ณ ์ •๋ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ GPU๋กœ ๊ฐ€์†ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ ‘๊ทผํ•œ๋‹ค. Allegro Hand์— 4๊ฐœ์˜ VBTS๋ฅผ ์žฅ์ฐฉํ•œ ์ •๋ฐ€ ํŒŒ์ง€ ์‹คํ—˜์—์„œ ๊นŠ์ด ๋งต ๊ธฐ๋ฐ˜์˜ ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์„ ์‹œ์—ฐํ–ˆ๋‹ค. FEM์˜ ์ •ํ™•๋„๋ฅผ ํฌ๊ธฐํ•˜์ง€ ์•Š์œผ๋ฉด์„œ ๋ณ‘๋ ฌํ™”๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ๋‹ค.

Taccel์ด โ€œFEM์˜ ์ •ํ™•๋„๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ ์†๋„๋ฅผ ๋†’์ด์žโ€๋ผ๋Š” ๋ฐฉํ–ฅ์ด๋ผ๋ฉด, Tacmap์€ โ€œFEM ์—†์ด๋„ sim-to-real์— ์ถฉ๋ถ„ํ•œ ์ •ํ™•๋„๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ํ‘œํ˜„์„ ์ฐพ์žโ€๋ผ๋Š” ๋ฐฉํ–ฅ์ด๋‹ค. ๋‘ ์ ‘๊ทผ์€ ์ƒํ˜ธ ๋ณด์™„์ ์ด๋‹ค.


6. ๋น„ํŒ์  ๊ณ ์ฐฐ: ๊ฐ•์ ๊ณผ ํ•œ๊ณ„

6.1 ๊ฐ•์ 

1) ์šฐ์•„ํ•œ ๋ฌธ์ œ ์žฌ์ •์˜

๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์ด โ€œ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ์‹ค์ œ์ฒ˜๋Ÿผ ๋ณด์ด๊ฒŒ ํ•  ๊ฒƒ์ธ๊ฐ€โ€๋ฅผ ๋ฌผ์—ˆ๋‹ค๋ฉด, Tacmap์€ โ€œ๋‘ ๋„๋ฉ”์ธ์ด ๋™์˜ํ•  ์ˆ˜ ์žˆ๋Š” ํ‘œํ˜„์€ ๋ฌด์—‡์ธ๊ฐ€โ€๋ฅผ ๋ฌผ์—ˆ๋‹ค. ์ด ๋ฐœ์ƒ์˜ ์ „ํ™˜์€ ๊ด‘ํ•™ ๋ Œ๋”๋ง์˜ ๋ณต์žก์„ฑ์„ ํ†ต์งธ๋กœ ์šฐํšŒํ•œ๋‹ค. ์ด๊ฒƒ์ด ์ด ๋…ผ๋ฌธ์˜ ๊ฐ€์žฅ ํฐ ๊ธฐ์—ฌ๋‹ค.

2) ๊ธฐํ•˜ํ•™์  ๋ฒ”์šฉ์„ฑ(Geometry-Agnostic)

๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„์„ ์‚ฌ์šฉํ•จ์œผ๋กœ์จ ํ‰๋ฉด/๊ณก๋ฉด ์„ผ์„œ๋ฅผ ๋‹จ์ผ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ฒ˜๋ฆฌํ•œ๋‹ค. ์ด๋Š” ์†๊ฐ€๋ฝ ๋ ํ˜•ํƒœ์˜ VBTS๊ฐ€ ์ ์  ๋ณดํŽธํ™”๋˜๋Š” ์‹œ๋Œ€์— ์ค‘์š”ํ•œ ์žฅ์ ์ด๋‹ค. ๊ธฐ์กด TACTO ๊ธฐ๋ฐ˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋“ค์ด ๊ณก๋ฉด ์„ผ์„œ ์ง€์›์— ์–ด๋ ค์›€์„ ๊ฒช์—ˆ๋˜ ์ ์„ ์ƒ๊ฐํ•˜๋ฉด ์˜๋ฏธ ์žˆ๋Š” ์ง„์ „์ด๋‹ค.

3) Isaac Lab + MuJoCo ๋™์‹œ ์ง€์›

๋‘ ์ฃผ์š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋ชจ๋‘ ์ง€์›ํ•จ์œผ๋กœ์จ ๊ธฐ์กด RL ์ธํ”„๋ผ์— ์‰ฝ๊ฒŒ ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ๋‹ค. ์—ฐ๊ตฌ ์ปค๋ฎค๋‹ˆํ‹ฐ ์ ‘๊ทผ์„ฑ ์ธก๋ฉด์—์„œ ๋†’์€ ์ ์ˆ˜๋ฅผ ๋ฐ›๋Š” ๋ถ€๋ถ„์ด๋‹ค.

4) ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘

๋ณ€ํ™˜ ๋ชจ๋ธ ํ•™์Šต์— ํ•„์š”ํ•œ ์‹ค์ œ ๋ฐ์ดํ„ฐ๋ฅผ ์ž๋™ํ™” ์žฅ์น˜๋กœ ์ˆ˜์ง‘ํ•จ์œผ๋กœ์จ ์ˆ˜๋™ ๋ ˆ์ด๋ธ”๋ง์˜ ๋ถ€๋‹ด์„ ์—†์•ค๋‹ค. ์ด๋Š” ์‹ค์šฉ์  ํ™•์žฅ์„ฑ(practical scalability)์˜ ํ•ต์‹ฌ์ด๋‹ค.

5) ๊ฒ€์ฆ ๋ฐฉ๋ฒ•์˜ ๋‹ค์–‘์„ฑ

์ •๋Ÿ‰์  ๋ณ€ํ˜• ๋งต ๋น„๊ต, ๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ(ball rotation) zero-shot ์ „์ด, ๊ทธ๋ฆฌ๊ณ  ์‹ค์ œ ๋ฐ์ดํ„ฐ์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‚ด ๋ฆฌํ”Œ๋ ˆ์ด๋ผ๋Š” ์„ธ ๊ฐ€์ง€ ๋‹ค๋ฅธ ๊ฐ๋„์—์„œ ๊ฒ€์ฆํ–ˆ๋‹ค.

6.2 ํ•œ๊ณ„์™€ ๋ฏธํ•ด๊ฒฐ ์งˆ๋ฌธ

1) ์ „๋‹จ๋ ฅ(Shear Force) ๋ชจ๋ธ๋ง์˜ ๋ถ€์žฌ

์นจํˆฌ ๊นŠ์ด ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์€ ๋ณธ์งˆ์ ์œผ๋กœ ๋ฒ•์„  ๋ฐฉํ–ฅ(normal direction)์˜ ๋ณ€ํ˜•์„ ํฌ์ฐฉํ•œ๋‹ค. ์‹ค์ œ ์ ‘์ด‰์—์„œ ๋งค์šฐ ์ค‘์š”ํ•œ ์ „๋‹จ๋ ฅ์— ์˜ํ•œ ์ธก๋ฉด ๋ณ€ํ˜•(lateral deformation)โ€”GelSight์˜ ๋งˆ์ปค ์ด๋™ ํŒจํ„ดโ€”์€ ์ด ํ”„๋ ˆ์ž„์›Œํฌ์—์„œ ๋ช…์‹œ์ ์œผ๋กœ ๋‹ค๋ฃจ์–ด์ง€์ง€ ์•Š๋Š”๋‹ค. ๋ฏธ๋„๋Ÿผ ๊ฐ์ง€(slip detection)๋‚˜ ์ „๋‹จ๋ ฅ ๊ธฐ๋ฐ˜ ์ •๋ฐ€ ์กฐ์ž‘์—์„œ ์ด๊ฒƒ์ด ๋ณ‘๋ชฉ์ด ๋  ์ˆ˜ ์žˆ๋‹ค.

2) ๋ณ€ํ™˜ ๋ชจ๋ธ์˜ ์ผ๋ฐ˜ํ™” ๋ฒ”์œ„

ํ•™์Šต๋œ ๋ณ€ํ™˜ ๋ชจ๋ธ f_\theta๊ฐ€ ํ›ˆ๋ จ ๋ถ„ํฌ๋ฅผ ํฌ๊ฒŒ ๋ฒ—์–ด๋‚œ ์ ‘์ด‰ ์‹œ๋‚˜๋ฆฌ์˜ค(์˜ˆ: ํ›ˆ๋ จ ์‹œ ์‚ฌ์šฉํ•˜์ง€ ์•Š์€ ์žฌ์งˆ์˜ ๋ฌผ์ฒด, ๊ทน๋‹จ์ ์ธ ์ ‘์ด‰ ๊นŠ์ด)์—์„œ ์–ผ๋งˆ๋‚˜ ์ž˜ ์ผ๋ฐ˜ํ™”๋˜๋Š”์ง€ ๋ช…ํ™•ํ•˜์ง€ ์•Š๋‹ค. Taxim์ด ๊ฒช์—ˆ๋˜ ๊ฒƒ๊ณผ ์œ ์‚ฌํ•œ ๋ถ„ํฌ ์™ธ ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ๋ฅผ ๊ณต์œ ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ๋‹ค.

3) ๊ฒ€์ฆ ํƒœ์Šคํฌ์˜ ๋ฒ”์œ„

Zero-shot transfer ์‹คํ—˜์ด ๊ตฌ ํšŒ์ „(ball rotation) ํ•˜๋‚˜์˜ ํƒœ์Šคํฌ์— ํ•œ์ •๋œ๋‹ค. ์ด๊ฒƒ์€ ์ƒ์ง•์ ์ธ ํƒœ์Šคํฌ์ด์ง€๋งŒ, ๋‚˜์‚ฌ ์‚ฝ์ž…(peg insertion), ๋ฌผ์ฒด ์ง‘๊ธฐ(object grasping), ๋ฌผ์ฒด ์ž์„ธ ์•ˆ์ •ํ™” ๋“ฑ ๋” ๋‹ค์–‘ํ•œ contact-rich ํƒœ์Šคํฌ์—์„œ์˜ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค. ์ผ๋ฐ˜ํ™” ์ฃผ์žฅ์„ ๊ฐ•ํ™”ํ•˜๋ ค๋ฉด ํƒœ์Šคํฌ ๋‹ค์–‘์„ฑ์ด ํ•„์š”ํ•˜๋‹ค.

4) ๋ Œ๋”๋ง ์†๋„์˜ ์ •๋Ÿ‰์  ๋ณด๊ณ  ๋ถ€์žฌ

TacSL์ด 200ร— CPU ๋Œ€๋น„ ์†๋„ ํ–ฅ์ƒ์„ ๋ช…์‹œ์ ์œผ๋กœ ๋ณด๊ณ ํ•œ ๊ฒƒ๊ณผ ๋‹ฌ๋ฆฌ, Tacmap์€ ๋ Œ๋”๋ง ์†๋„(FPS)๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ์ œ์‹œํ•˜์ง€ ์•Š๋Š”๋‹ค. โ€œ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ RL ํ›ˆ๋ จ์„ ์ง€์›ํ•œ๋‹คโ€๋Š” ์ฃผ์žฅ์ด ์žˆ์ง€๋งŒ, ๊ตฌ์ฒด์ ์ธ ์ˆ˜์น˜๊ฐ€ ์—†์–ด ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๊ณผ์˜ ์ง์ ‘ ๋น„๊ต๊ฐ€ ์–ด๋ ต๋‹ค.

5) ๋ณ€ํ™˜ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜ ๋ฐ ํ›ˆ๋ จ ์„ธ๋ถ€ ์‚ฌํ•ญ

๋ณ€ํ™˜ ๋ชจ๋ธ f_\theta์˜ ๊ตฌ์ฒด์ ์ธ ์•„ํ‚คํ…์ฒ˜(CNN? UNet? Transformer?), ํ›ˆ๋ จ ์†์‹ค ํ•จ์ˆ˜, ํ•™์Šต ๋ฐ์ดํ„ฐ ํฌ๊ธฐ ๋“ฑ์ด ๋ช…ํ™•ํžˆ ๊ธฐ์ˆ ๋˜์–ด ์žˆ์ง€ ์•Š๋‹ค. ์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ(reproducibility) ์ธก๋ฉด์—์„œ ์•„์‰ฌ์šด ๋ถ€๋ถ„์ด๋‹ค.

6) ๋‹จ์ผ ์„ผ์„œ ํ”Œ๋žซํผ

์‹คํ—˜์— ์‚ฌ์šฉ๋œ SharpaWave DTC ์„ผ์„œ๊ฐ€ ๋‹ค์†Œ ์ƒ์†Œํ•œ ํ”Œ๋žซํผ์ด๋‹ค. GelSight, DIGIT, TacTip ๊ฐ™์€ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ์„ผ์„œ์—์„œ์˜ ๊ฒ€์ฆ์ด ์ถ”๊ฐ€๋œ๋‹ค๋ฉด ์ผ๋ฐ˜ํ™” ์ฃผ์žฅ์ด ๋” ๊ฐ•ํ™”๋  ๊ฒƒ์ด๋‹ค.

6.3 ๋ฏธ๋ž˜ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ „๋‹จ๋ ฅ ํ™•์žฅ: ๋ฒ•์„  ์นจํˆฌ ๊นŠ์ด์— ๋”ํ•ด ์ ‘์„  ๋ฐฉํ–ฅ(tangential direction)์˜ ์ƒ๋Œ€ ๋ณ€์œ„๋ฅผ ์ถ”๊ฐ€ํ•˜๋ฉด ์ „๋‹จ๋ ฅ ์ •๋ณด๋ฅผ ํฌ์ฐฉํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Š” ๋งˆ์ปค ์ด๋™ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ๊ฒฐํ•ฉํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋ฐœ์ „ ๊ฐ€๋Šฅํ•˜๋‹ค.

๋ณ€ํ™˜ ๋ชจ๋ธ์˜ ๋„๋ฉ”์ธ ์ผ๋ฐ˜ํ™”: ๋‹ค์–‘ํ•œ ์„ผ์„œ ํƒ€์ž…๊ณผ ๋ฌผ์ฒด์—์„œ ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ๋กœ ํ›ˆ๋ จ๋œ ๋” ๊ฐ•๊ฑดํ•œ ๋ณ€ํ™˜ ๋ชจ๋ธ์€ ์„ผ์„œ ๋ฌด๊ด€(sensor-agnostic) ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๋ฐœ์ „ํ•  ์ˆ˜ ์žˆ๋‹ค.

Allegro Hand ๋“ฑ ํ‘œ์ค€ ์—ฐ๊ตฌ ํ”Œ๋žซํผ ์ ์šฉ: Tacmap์ด Allegro Hand๋‚˜ Shadow Hand ๊ฐ™์€ ์—ฐ๊ตฌ ์ปค๋ฎค๋‹ˆํ‹ฐ์—์„œ ๋„๋ฆฌ ์‚ฌ์šฉํ•˜๋Š” ํ”Œ๋žซํผ์— ์ ์šฉ๋œ๋‹ค๋ฉด ์˜ํ–ฅ๋ ฅ์ด ํฌ๊ฒŒ ํ™•๋Œ€๋  ๊ฒƒ์ด๋‹ค.


7. Allegro Hand ์—ฐ๊ตฌ์ž๋ฅผ ์œ„ํ•œ ํ•จ์˜

๋‹ค์ง€ ์กฐ์ž‘ ์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ํ”Œ๋žซํผ์œผ๋กœ Allegro Hand๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์—ฐ๊ตฌ์ž๋“ค์—๊ฒŒ Tacmap์ด ์ฃผ๋Š” ์‹œ์‚ฌ์ ์„ ์ •๋ฆฌํ•œ๋‹ค.

๊ธ์ •์  ํ•จ์˜: - ์†๊ฐ€๋ฝ ๋์ด ํ‰๋ฉด์ด ์•„๋‹Œ Allegro Hand V4์˜ ๊ณก๋ฉด fingertip์— VBTS(์˜ˆ: DIGIT, GelSight Mini)๋ฅผ ์žฅ์ฐฉํ•  ๊ฒฝ์šฐ, Tacmap์˜ ๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„ ์ ‘๊ทผ์ด ๊ธฐ์กด TACTO๋ณด๋‹ค ์ ํ•ฉํ•  ์ˆ˜ ์žˆ๋‹ค. - Isaac Lab ํ†ตํ•ฉ์ด ์ด๋ฏธ ๊ตฌํ˜„๋˜์–ด ์žˆ์–ด, Allegro Hand + Isaac Lab RL ํŒŒ์ดํ”„๋ผ์ธ์— ํ†ตํ•ฉํ•˜๊ธฐ ์šฉ์ดํ•˜๋‹ค. - ๋ณ€ํ˜• ๋งต์ด๋ผ๋Š” ์„ผ์„œ ๋ฌด๊ด€ ํ‘œํ˜„์€ ์—ฌ๋Ÿฌ ์†๊ฐ€๋ฝ์— ์„œ๋กœ ๋‹ค๋ฅธ VBTS๋ฅผ ์žฅ์ฐฉํ•˜๋Š” ๊ฒฝ์šฐ์—๋„ ์ผ๊ด€๋œ ๊ด€์ธก ๊ณต๊ฐ„์„ ๊ตฌ์„ฑํ•˜๋Š” ๋ฐ ์œ ๋ฆฌํ•˜๋‹ค.

์ฃผ์˜ ์‚ฌํ•ญ: - ๋ณ€ํ™˜ ๋ชจ๋ธ ํ•™์Šต์„ ์œ„ํ•œ ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์žฅ์น˜ ๊ตฌ์ถ•์ด ์ถ”๊ฐ€์ ์ธ ์—”์ง€๋‹ˆ์–ด๋ง ๋ถ€๋‹ด์„ ์ˆ˜๋ฐ˜ํ•œ๋‹ค. - ์ „๋‹จ๋ ฅ ์ •๋ณด ์—†์ด ์ˆœ์ˆ˜ ๋ฒ•์„  ๋ณ€ํ˜• ๋งต๋งŒ์œผ๋กœ ๊ณ ๋‚œ์ด๋„ ์ •๋ฐ€ ์กฐ์ž‘(๋‚˜์‚ฌ ์กฐ์ž„, ์นด๋“œ ๋„˜๊ธฐ๊ธฐ ๋“ฑ)์ด ๊ฐ€๋Šฅํ•œ์ง€๋Š” ๋ณ„๋„ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค.


8. ์š”์•ฝ ๋ฐ ๊ฒฐ๋ก 

Tacmap์€ ์ด‰๊ฐ sim-to-real ๋ฌธ์ œ๋ฅผ ๋ฐ”๋ผ๋ณด๋Š” ๊ด€์ ์„ ๋ฐ”๊พธ๋Š” ๋…ผ๋ฌธ์ด๋‹ค.

๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์ด โ€œ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ๋” ์‹ค์ œ์ฒ˜๋Ÿผ ๋ณด์ด๊ฒŒ ๋งŒ๋“ค์žโ€๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ ‘๊ทผํ–ˆ๋‹ค๋ฉด, Tacmap์€ โ€œ๋‘ ๋„๋ฉ”์ธ์ด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋™์˜ํ•˜๋Š” ๊ณต๊ฐ„์„ ์ฐพ์žโ€๋Š” ๋” ๊ทผ๋ณธ์ ์ธ ์งˆ๋ฌธ์„ ๋˜์ง„๋‹ค. ๊ทธ ๋‹ต์œผ๋กœ ์ œ์•ˆ๋œ ์นจํˆฌ ๊นŠ์ด ๊ธฐ๋ฐ˜์˜ ๋ณ€ํ˜• ๋งต(deform map)์€ FEM ์—†์ด๋„ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์˜๋ฏธ ์žˆ๋Š” ์ ‘์ด‰ ํ‘œํ˜„์„ ์ œ๊ณตํ•˜๋ฉฐ, ์ž๋™ํ™”๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘๊ณผ ํ•™์Šต๋œ ๋ณ€ํ™˜ ๋ชจ๋ธ์„ ํ†ตํ•ด ์‹ค์ œ ๋„๋ฉ”์ธ๊ณผ์˜ ์ •๋ ฌ์„ ๋‹ฌ์„ฑํ•œ๋‹ค.

ํŠนํžˆ ๊ณก๋ฉด ์„ผ์„œ๋ฅผ ๋„ค์ดํ‹ฐ๋ธŒ๋กœ ์ง€์›ํ•˜๋Š” ์ผ๋ฐ˜ํ™”๋œ ๋ฒ•์„  ํˆฌ์˜ ๊ณต๊ฐ„, Isaac Lab๊ณผ MuJoCo ๋ชจ๋‘์— ํ†ตํ•ฉ๋œ GPU ๊ฐ€์† ํŒŒ์ดํ”„๋ผ์ธ, ๊ทธ๋ฆฌ๊ณ  ๊ตฌ ํšŒ์ „ ํƒœ์Šคํฌ์—์„œ์˜ zero-shot ์ „์ด ์‹ค์ฆ์€ ์‹ค์šฉ์  ๊ธฐ์—ฌ๋กœ์„œ ๊ฐ€์น˜๊ฐ€ ๋†’๋‹ค.

๋ฌผ๋ก  ์ „๋‹จ๋ ฅ ๋ชจ๋ธ๋ง์˜ ๋ถ€์žฌ, ์ œํ•œ๋œ ํƒœ์Šคํฌ ๋‹ค์–‘์„ฑ, ๋ Œ๋”๋ง ์†๋„์˜ ์ •๋Ÿ‰์  ๋ฏธ๊ธฐ์ˆ  ๋“ฑ ๋ณด์™„์ด ํ•„์š”ํ•œ ๋ถ€๋ถ„๋„ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๋…ผ๋ฌธ์ด ์ œ์•ˆํ•˜๋Š” ๊ณต์œ  ๊ธฐํ•˜ ๊ณต๊ฐ„์„ ํ†ตํ•œ ๋„๋ฉ”์ธ ์ •๋ ฌ(domain alignment via shared geometric space)์ด๋ผ๋Š” ์›์น™์€, ๋‹จ์ง€ ์ด‰๊ฐ ์„ผ์„œ์— ๊ตญํ•œ๋˜์ง€ ์•Š๊ณ  ๋” ๋„“์€ sim-to-real ๋ฌธ์ œ์— ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ณดํŽธ์  ์•„์ด๋””์–ด๋กœ ๋ฐœ์ „ํ•  ์ž ์žฌ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค.

์ด‰๊ฐ ๊ฐ์ง€๋ฅผ ์—ฐ๊ตฌํ•˜๋Š” ๋กœ๋ด‡๊ณตํ•™์ž์—๊ฒŒ, ๊ทธ๋ฆฌ๊ณ  sim-to-real ๊ฐ„๊ทน์„ ์ขํžˆ๋ ค๋Š” ๋ชจ๋“  ์—ฐ๊ตฌ์ž์—๊ฒŒ ์ผ๋…์„ ๊ถŒํ•œ๋‹ค.


์ฐธ๊ณ  ์ž๋ฃŒ ๋ฐ ๊ด€๋ จ ๋…ผ๋ฌธ

๋…ผ๋ฌธ ์—ญํ• 
GelSight (Yuan et al.) ๋Œ€ํ‘œ์  VBTS ํ•˜๋“œ์›จ์–ด ๊ธฐ๋ฐ˜
DIGIT (Lambeta et al.) ์†Œํ˜• VBTS ํ•˜๋“œ์›จ์–ด
TACTO (Wang et al.) ํ•ด์„์  ์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋น„๊ต ๋Œ€์ƒ
Taxim (Si & Yuan) ๊ฒฝํ—˜์  ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋น„๊ต ๋Œ€์ƒ
TacSL (Akinola et al.) GPU ๊ฐ€์† ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋น„๊ต ๋Œ€์ƒ
Taccel (Li et al., NeurIPS 2025) FEM ๊ธฐ๋ฐ˜ GPU ๋ณ‘๋ ฌํ™” ์ ‘๊ทผ
TacEx (Nguyen et al., CoRL 2024) Isaac Sim ๊ธฐ๋ฐ˜ soft-body + visuotactile ํ†ตํ•ฉ
SaTA (2025) ๊ณต๊ฐ„์ ์œผ๋กœ ์•ต์ปค๋œ ์ด‰๊ฐ ์ธ์‹ ํ”„๋ ˆ์ž„์›Œํฌ

Copyright 2026, JungYeon Lee