Curieux.JY
  • JungYeon Lee
  • Post
  • Projects
  • Note

On this page

  • ๐Ÿ” Ping Review
  • ๐Ÿ”” Ring Review
    • ์„œ๋ก : ์™œ ์šฐ๋ฆฌ๋Š” ์•„์ง๋„ ๋ฌผ๊ฑด์„ ์ œ๋Œ€๋กœ ๋ชป ์ง‘๋Š”๊ฐ€?
      • ๊ธฐ์กด ๋กœ๋ด‡ ์†์˜ ๋”œ๋ ˆ๋งˆ
      • ์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ์งˆ๋ฌธ
    • ์„ค๊ณ„ ์ฒ ํ•™: Co-Design์˜ ์•„๋ฆ„๋‹ค์›€
      • ๊ธฐ๊ตฌํ•™ ์„ค๊ณ„: ์ธ๊ฐ„ ์†๊ณผ์˜ ํƒ€ํ˜‘
      • ๊ตฌ๋™ ์‹œ์Šคํ…œ: Quasi-Direct Drive์˜ ๋งˆ๋ฒ•
    • ์ด‰๊ฐ ์„ผ์‹ฑ: GelSim(ple)์˜ ํ˜์‹ 
      • ์™œ Vision-based Tactile Sensing์ธ๊ฐ€?
      • GelSim(ple): ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์นœํ™”์  ์„ค๊ณ„
    • ๋ชจ๋ฐฉ ํ•™์Šต: ACT์™€ Vision Dropout ์ „๋žต
      • Action Chunking with Transformers (ACT) ๊ฐœ์š”
      • Vision Dropout ์ „๋žต: ์ด‰๊ฐ์˜ ๊ฐ€์น˜๋ฅผ ๊นจ๋‹ซ๊ฒŒ ํ•˜๊ธฐ
      • ์ •์ฑ… ๋„คํŠธ์›Œํฌ ์ƒ์„ธ
    • ์‹คํ—˜ ๋ฐ ๊ฒฐ๊ณผ
      • ํ‰๊ฐ€ ์ž‘์—… ์„ค๊ณ„
      • ์‹คํ—˜ ํ”„๋กœํ† ์ฝœ
      • ๊ฒฐ๊ณผ ๋ถ„์„
    • ๋น„ํŒ์  ๊ณ ์ฐฐ
      • ๊ฐ•์ 
      • ์•ฝ์  ๋ฐ ํ•œ๊ณ„
      • ์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ ๋ฐ ํ™•์žฅ์„ฑ
      • ๊ด€๋ จ ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต
    • ๋ฏธ๋ž˜ ๋ฐฉํ–ฅ ์ œ์•ˆ
      • ํ•˜๋“œ์›จ์–ด ๊ฐœ์„ 
      • ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ์„ 
      • ์‘์šฉ ํ™•์žฅ
    • ์š”์•ฝ ๋ฐ ๊ฒฐ๋ก 
      • ํ•ต์‹ฌ ๊ธฐ์—ฌ
      • ํ•ต์‹ฌ ํ•œ๊ณ„
      • ๋กœ๋ด‡๊ณตํ•™์— ๋Œ€ํ•œ ์‹œ์‚ฌ์ 
  • โ›๏ธ Dig Review
  • EyeSight Hand: ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ํ†ตํ•ฉํ•œ ์ปดํ”Œ๋ผ์ด์–ธํŠธ ์™„์ „๊ตฌ๋™ ๋กœ๋ด‡ ์† (์‹ฌ์ธต ๋ฆฌ๋ทฐ)
    • ์„œ๋ก : ์ธ๊ฐ„ ์†์˜ ์ง€๋Šฅ์„ ๋กœ๋ด‡์— ๋‹ด๊ธฐ ์œ„ํ•œ ๋„์ „
    • ๋ฐฉ๋ฒ•: EyeSight Hand์˜ ์„ค๊ณ„์™€ ์ œ์–ด ๊ธฐ๋ฒ•
      • EyeSight Hand์˜ ๊ตฌ์กฐ ์„ค๊ณ„์™€ ์ค€-์ง์ ‘ ๊ตฌ๋™
      • ํ†ตํ•ฉ ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ: GelSim(ple)
      • ์ œ์–ด ์•Œ๊ณ ๋ฆฌ์ฆ˜: ๋ชจ๋ฐฉ ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ •์ฑ…
    • ์‹คํ—˜: ํ•™์Šต์„ ํ†ตํ•œ ์„ธ ๊ฐ€์ง€ ์ž‘์—… ์ˆ˜ํ–‰
      • ์‹คํ—˜ ๊ฒฐ๊ณผ: ์ด‰๊ฐ ํ†ตํ•ฉ์˜ ์œ„๋ ฅ
    • ๋น„ํŒ์  ๊ณ ์ฐฐ: ๋ฌด์—‡์ด ๋›ฐ์–ด๋‚˜๊ณ , ๋ฌด์—‡์ด ๋‚จ์•˜๋‚˜
    • ์š”์•ฝ ๋ฐ ๊ฒฐ๋ก 

๐Ÿ“ƒEyeSight Hand ๋ฆฌ๋ทฐ

tactile
touch
transformer
il
Design of a Fully-Actuated Dexterous Robot Hand with Integrated Vision-Based Tactile Sensors and Compliant Actuation
Published

January 15, 2026

๐Ÿ” Ping. ๐Ÿ”” Ring. โ›๏ธ Dig. A tiered review series: quick look, key ideas, deep dive.

  • Paper Link (IROS 2024 (RoboCup Best Paper Finalist))
  • Project
  1. โœจ ๋ณธ ๋…ผ๋ฌธ์€ Vision-based tactile sensor์™€ Compliant actuation์ด ํ†ตํ•ฉ๋œ 7-DoF Humanoid Hand์ธ EyeSight Hand๋ฅผ ์†Œ๊ฐœํ•˜๋ฉฐ, ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ๊ฐ•๋„, ์†๋„, ๊ทธ๋ฆฌ๊ณ  ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์„ ์œ„ํ•œ ๊ฒฌ๊ณ ์„ฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  2. ๐Ÿค– EyeSight Hand๋Š” ์ƒˆ๋กœ์šด GelSim(ple) ์ด‰๊ฐ ์„ผ์„œ ๋””์ž์ธ๊ณผ Quasi-direct drive Actuation Scheme์„ ํ™œ์šฉํ•˜์—ฌ Bottle opening, Plasticine cutting, Plate pick and place์™€ ๊ฐ™์€ ๋ณต์žกํ•œ ์ž‘์—…์—์„œ Whole-hand manipulation์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
  3. ๐Ÿ“ˆ ๋ชจ๋ฐฉ ํ•™์Šต ๋ชจ๋ธ์„ ํ†ตํ•œ ์‹คํ—˜ ๊ฒฐ๊ณผ๋Š” Vision dropout strategy์™€ ๊ฒฐํ•ฉ๋œ Tactile sensing์ด ๋‹ค์–‘ํ•œ Contact-rich ์ž‘์—…์—์„œ Robot์˜ task success rate๋ฅผ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ด์„ ์ •๋Ÿ‰์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

๐Ÿ” Ping Review

๐Ÿ” Ping โ€” A light tap on the surface. Get the gist in seconds.

๋ณธ ๋…ผ๋ฌธ์€ ํ†ตํ•ฉ๋œ vision-based tactile sensor์™€ compliant actuation์„ ํŠน์ง•์œผ๋กœ ํ•˜๋Š” 7 ์ž์œ ๋„(DoF) humanoid ๋กœ๋ด‡ ์†์ธ โ€œEyeSight Handโ€๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ์ด ๋กœ๋ด‡ ์†์€ ๊ฐ•ํ™”๋œ whole-hand manipulation์„ ์œ„ํ•ด ์„ค๊ณ„๋˜์—ˆ์œผ๋ฉฐ, human-like strength์™€ ์†๋„๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ large-scale data collection์„ ์œ„ํ•œ ๊ฒฌ๊ณ ์„ฑ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•ด quasi-direct drive actuation ๋ฐฉ์‹์„ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค.

I. ๊ธฐ๊ณ„ ์„ค๊ณ„ (Mechanical Design)

EyeSight Hand๋Š” ์ธ๊ฐ„ ์†์˜ ํ•ด๋ถ€ํ•™์  ๊ตฌ์กฐ์™€ ์šด๋™ํ•™์„ ์ตœ๋Œ€ํ•œ ๋ชจ๋ฐฉํ•˜์—ฌ ์ง๊ด€์ ์ธ teleoperation๊ณผ ์ธ๊ฐ„ ๋ฐ์ดํ„ฐ ํ™œ์šฉ์„ ์šฉ์ดํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

  • ์šด๋™ํ•™ (Kinematics): ์ธ๊ฐ„ ์†์˜ ์šด๋™ํ•™์  ๊ตฌ์กฐ๋ฅผ ๋”ฐ๋ฅด์ง€๋งŒ, index/middle finger์˜ metacarpophalangeal (MCP) joints์™€ distal interphalangeal (DIP) joints, ๊ทธ๋ฆฌ๊ณ  thumb์˜ MCP joint์—์„œ๋Š” ๋‹จ์ˆœํ™”๋ฅผ ํ†ตํ•ด ๋‹ค๋ฅธ ๊ธฐ๋Šฅ๋“ค์„ ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, DIP joint์™€ index/middle finger์˜ MCP joint์˜ lateral axis๋Š” ์ƒ๋žต๋˜์—ˆ์œผ๋ฉฐ, thumb์˜ MCP joint๋„ ์ƒ๋žต๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ๊ตฌ๋™ (Actuation): Compliance๋ฅผ ์ œ๊ณตํ•˜๊ธฐ ์œ„ํ•ด ๋‘ ๊ฐ€์ง€ ์œ ํ˜•์˜ actuator๊ฐ€ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. worm drive (30:1 N20 Micro DC Motor with 20:1 worm gear reduction)๋Š” ๋†’์€ ๊ฐ์†๋น„์™€ self-locking ํŠน์„ฑ์œผ๋กœ PIP joint (index/middle finger) ๋˜๋Š” IP joint (thumb)๋ฅผ ๊ตฌ๋™ํ•ฉ๋‹ˆ๋‹ค. BLDC motor (TMotor GL40 KV210 KV210 with 5.23:1 planetary reduction)๋Š” MCP joint (index/middle finger) ๋˜๋Š” TM joint (thumb)์˜ ๊ตด๊ณก ์ถ•์„ ๊ตฌ๋™ํ•ฉ๋‹ˆ๋‹ค. ์ด actuator๋“ค์€ ์ง์ ‘์ ์œผ๋กœ ๋˜๋Š” four-bar linkage๋ฅผ ํ†ตํ•ด joint๋ฅผ ๊ตฌ๋™ํ•˜์—ฌ tendon-driven ๋ฐฉ์‹๋ณด๋‹ค ํ›จ์”ฌ ๊ฒฌ๊ณ ํ•ฉ๋‹ˆ๋‹ค. ๋‚ฎ์€ BLDC motor ๊ฐ์†๋น„๋Š” transmission ๋งˆ์ฐฐ๊ณผ reflected inertia๋ฅผ ์ค„์—ฌ ์™ธ๋ถ€ ํž˜์— ๋Œ€ํ•œ ์ €ํ•ญ์„ ๊ฐ์†Œ์‹œํ‚ค๊ณ  ํŒŒ์† ์œ„ํ—˜์„ ์ค„์ž…๋‹ˆ๋‹ค. ์ด ๊ตฌ๋™ ๋ฐฉ์‹์€ ์ถ”์ •์น˜๋กœ 19N์˜ ์—ฐ์†์ ์ธ fingertip force์™€ ์ตœ๋Œ€ 57N์˜ fingertip force, ๊ทธ๋ฆฌ๊ณ  420 RPM์˜ ์ตœ๋Œ€ ์†๋„๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์ง€์†์ ์ธ ์‚ฌ์šฉ์—๋„ ๊ณผ์—ด๋˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค.
  • ์ „์ž ์žฅ์น˜ (Electronics): BLDC actuator๋Š” MJBOTS Moteus N1 Brushless Controller์— ์˜ํ•ด ์ œ์–ด๋˜๋ฉฐ, AMS AS5047P 14-bit magnetic encoder๋ฅผ ํ†ตํ•ด rotor ์œ„์น˜๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ํ†ต์‹ ์€ 5MBPS CAN-FD๋ฅผ ํ†ตํ•ด 1kHz๋กœ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. Micro DC motor๋Š” TI DRV8876์— ์˜ํ•ด ์ œ์–ด๋˜๋ฉฐ, Teensy 4.1์„ ํ†ตํ•ด serial ํ†ต์‹ ์„ ํ•ฉ๋‹ˆ๋‹ค.

II. ์ด‰๊ฐ ์„ผ์„œ ์„ค๊ณ„ (Tactile Sensor Design)

EyeSight Hand๋Š” 7๊ฐœ์˜ tactile surface๋ฅผ ๊ฐ€์ง€๋ฉฐ, ๊ฐ finger segment์™€ palm์— 8๊ฐœ์˜ ์ด๋ฏธ์ง€๋ฅผ ์ŠคํŠธ๋ฆฌ๋ฐํ•˜๋Š” GelSim(ple)์ด๋ผ๋Š” ์ƒˆ๋กœ์šด vision-based tactile sensor๋ฅผ ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค.

  • ์กฐ๋ช… (Illumination): GelSim(ple)์€ ์ƒˆ๋กœ์šด ์กฐ๋ช… ์ „๋žต์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. diffuser์˜ perimeter๋ฅผ side-illuminatingํ•˜์—ฌ semi-specular sensing surface์— non-directional overhead lighting์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ทธ๋ฆผ์ž ๋ฌธ์ œ๋ฅผ ์ œ๊ฑฐํ•˜๊ณ  ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ๋Ÿ‰์„ ๋Š˜๋ ค ๋‹จ์ผ channel ์ด๋ฏธ์ง€๋ฅผ ์ „์†กํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. simulation์„ ์œ„ํ•ด, pixel-wise inference๋Š” MLP๋ฅผ ํ†ตํ•ด ์ˆ˜ํ–‰๋˜๋ฉฐ, surface normal, viewing direction, ๊ทธ๋ฆฌ๊ณ  simulated deformation์˜ positional encoding์„ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ์ถ”์ •๋œ RGB ๊ฐ’์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค.
  • ๊ตฌํ˜„ ์„ธ๋ถ€ ์‚ฌํ•ญ (Implementation Details): GelSim(ple)์€ Arducam B0286 IMX219 Camera Module๊ณผ 220๋„ fisheye lens๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์นด๋ฉ”๋ผ์™€ sensing module์€ 3D ํ”„๋ฆฐํŒ…๋œ ๋ถ€ํ’ˆ์— ํ†ตํ•ฉ๋ฉ๋‹ˆ๋‹ค. ์กฐ๋ช…์€ SuperLightingLed Narrowest 3mm COB LED White Light Strip์„ ์‚ฌ์šฉํ•˜๋ฉฐ, sensing surface๋Š” SILICONES, INC. XP-565์™€ Print-Onยฎ Clear Silicone Ink, aluminum pigment๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ๊ฐ ์นด๋ฉ”๋ผ๋Š” Arducam B0439 Sensor Extension Cable์„ ํ†ตํ•ด ์›๊ฒฉ์œผ๋กœ ์—ฐ๊ฒฐ๋˜๋ฉฐ, 8๊ฐœ์˜ ์นด๋ฉ”๋ผ ๋ชจ๋“ˆ์€ ๋‘ ๊ฐœ์˜ Raspberry Pi 4๋ฅผ ํ†ตํ•ด ์ธํ„ฐํŽ˜์ด์Šค๋ฉ๋‹ˆ๋‹ค. ๋‹จ์ผ channel ์ด๋ฏธ์ง€๋Š” ZeroMQ๋ฅผ ํ†ตํ•ด 60Hz๋กœ 640x480 ํ•ด์ƒ๋„๋กœ ํ˜ธ์ŠคํŠธ ์ปดํ“จํ„ฐ์— ์ „์†ก๋ฉ๋‹ˆ๋‹ค.

III. ์‹คํ—˜ ์„ค์ • (Experiment Setup)

EyeSight Hand์˜ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ์„ธ ๊ฐ€์ง€ ๋„์ „์ ์ธ ์ž‘์—…(bottle opening, plasticine cutting, plate pick and place)์— ๋Œ€ํ•ด imitation learning์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • Teleoperation: 3D Guidance trakStar tracking system์„ ์‚ฌ์šฉํ•˜์—ฌ teleoperation์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ธ๊ฐ„ ์†์˜ 4๊ฐœ ์„ผ์„œ ์œ„์น˜์—์„œ ์–ป์€ 6-DoF pose๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ Task Space Vector (TSV) optimization [26, 13, 4]์„ ํ†ตํ•ด ๋กœ๋ด‡์˜ joint angle์„ ์ถ”์ •ํ•ฉ๋‹ˆ๋‹ค. ์ตœ์ ํ™” ๋ฃจํ‹ด์€ JAX [6]์—์„œ Sequential Least-Squares Quadratic Programming (SLSQP) [19, 16]๊ณผ Automatic Differentiation for rigid-body-dynamics AlgorithMs (ADAM) [2] ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ตฌํ˜„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ตœ์ ํ™” ์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค: \min_{Q(t)} \sum_{i \neq j} \|r_{ij}(Q(t)) - h_{ij}\|^2 + \alpha \|Q(t) - Q(t')\|^2 ์—ฌ๊ธฐ์„œ Q(t)๋Š” ํ˜„์žฌ ์‹œ๊ฐ„ ์Šคํ…์˜ ๋กœ๋ด‡ joint angle, Q(t')๋Š” ์ด์ „ ์‹œ๊ฐ„ ์Šคํ…์˜ joint angle, r_{ij}์™€ h_{ij}๋Š” ๊ฐ๊ฐ ๋กœ๋ด‡๊ณผ ์ธ๊ฐ„ ์†์˜ task space vector๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, \alpha๋Š” ์ด์ „ ์‹œ๊ฐ„ ์Šคํ…๊ณผ ํ˜„์žฌ ์‹œ๊ฐ„ ์Šคํ… ๊ฐ„์˜ joint angle ๋ณ€ํ™” ์ค‘์š”๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ€์ค‘์น˜์ž…๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ 125Hz๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.
  • ์ž‘์—… ์‚ฌ์–‘ (Task Specification): ๊ฐ ์ž‘์—…์— ๋Œ€ํ•ด EyeSight Hand์™€ UR5 ๋กœ๋ด‡์˜ proprioceptive data, global camera, wrist camera, ๊ทธ๋ฆฌ๊ณ  tactile sensor๋กœ๋ถ€ํ„ฐ ์ด๋ฏธ์ง€๋ฅผ 30Hz๋กœ ์ˆ˜์ง‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ์ž‘์—…์— ๋Œ€ํ•ด 100๊ฐœ์˜ demonstration์ด ์ˆ˜์ง‘๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
    • Bottle Opening: ๋ฌด์ž‘์œ„๋กœ ๋ฐฐ์น˜๋œ ketchup bottle์˜ ๋šœ๊ป‘์„ ์—ด๊ธฐ ์œ„ํ•ด, ๋กœ๋ด‡์€ ๋ณ‘์„ ๊ณ ์ •ํ•˜๊ณ  ์—„์ง€ ์†๊ฐ€๋ฝ์œผ๋กœ ๋šœ๊ป‘์„ ์™„์ „ํžˆ ์—ด์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
    • Plate Pick and Place: ์Œ“์—ฌ์žˆ๋Š” ๋‘ ๊ฐœ์˜ ์ ‘์‹œ ์ค‘ ์ƒ๋‹จ ์ ‘์‹œ๋ฅผ ๋ฐ€์–ด graspable ์œ„์น˜์— ๋†“์€ ๋‹ค์Œ ๋“ค์–ด์˜ฌ๋ ค ์˜†์— ๋†“์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค.
    • Plasticine Cutting: ์ƒ์ž์— ๋ณด๊ด€๋œ ์นผ์„ ๊บผ๋‚ด plasticine roll์„ ์™„์ „ํžˆ ๋ฐ˜์œผ๋กœ ์ž˜๋ผ์•ผ ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ชจ๋ฐฉ ํ•™์Šต (Imitation Learning): Action Chunking with Transformers (ACT) [47]๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ dexterous manipulation์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ACT๋Š” CVAE (conditional variational autoencoder) ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง€๋ฉฐ, encoder๋Š” hidden style variable์„ ํ•™์Šตํ•˜๊ณ  decoder๋Š” ํ˜„์žฌ ๊ด€์ธก๊ฐ’๊ณผ style variable์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฏธ๋ž˜ action trajectory๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.
    • ์ž…๋ ฅ (Input): global camera์™€ wrist camera์˜ ์ด๋ฏธ์ง€๋Š” ๊ณต์œ  vision encoder๋ฅผ ํ†ตํ•ด ์ฒ˜๋ฆฌ๋ฉ๋‹ˆ๋‹ค. 8๊ฐœ์˜ tactile image๋Š” 2x2 super-image๋กœ ๊ฒฐํ•ฉ๋œ ๋‘ ๊ฐœ์˜ subset์œผ๋กœ ๋‚˜๋‰˜์–ด ๊ณต์œ  tactile encoder๋ฅผ ํ†ตํ•ด ์ฒ˜๋ฆฌ๋ฉ๋‹ˆ๋‹ค. ์‹œ๊ฐ ๋ฐ ์ด‰๊ฐ feature๋Š” ๋กœ๋ด‡ joint position ๋ฐ style variable๊ณผ ํ•จ๊ป˜ transformer network์— ์ž…๋ ฅ๋˜์–ด joint space์˜ ๋ฏธ๋ž˜ action trajectory๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.
    • ์ •์ฑ… ๋ณ€ํ˜• (Policy Variants): ์„ธ ๊ฐ€์ง€ ACT ๋ณ€ํ˜•์ด ํ›ˆ๋ จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค: Vision-only ACT (์‹œ๊ฐ ์ด๋ฏธ์ง€2๋งŒ ์‚ฌ์šฉ), Vision-tactile ACT (์‹œ๊ฐ ๋ฐ ์ด‰๊ฐ ์ด๋ฏธ์ง€ ๋ชจ๋‘ ์‚ฌ์šฉ), Vision-tactile ACT with vision dropout (ํ›ˆ๋ จ ์ค‘ vision encoder ์ž…๋ ฅ์— 30% ํ™•๋ฅ ๋กœ ๋ฌด์ž‘์œ„ dropout ์ ์šฉ, ์ฆ‰ ์‹œ๊ฐ ์ด๋ฏธ์ง€๋ฅผ 0์œผ๋กœ ์„ค์ •ํ•˜์—ฌ ์ด‰๊ฐ ์‹ ํ˜ธ ํ™œ์šฉ์„ ์žฅ๋ ค).
    • ๊ตฌํ˜„ ์„ธ๋ถ€ ์‚ฌํ•ญ (Implementation Details): ๋ชจ๋“  ์‹œ๊ฐ ๋ฐ ์ด‰๊ฐ super-image๋Š” 320x480์œผ๋กœ resize๋˜์—ˆ๊ณ , ResNet-18 [14]์ด vision ๋ฐ tactile encoder๋กœ ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Joint position vector๋Š” UR5 arm์˜ 6 DoF์™€ Hand์˜ 7 DoF๋ฅผ ํฌํ•จํ•œ 13์ฐจ์›์ž…๋‹ˆ๋‹ค. Action trajectory๋Š” ๋‹ค์Œ 20 timesteps์— ๋Œ€ํ•ด ์˜ˆ์ธก๋˜๋ฉฐ, ์˜ˆ์ธก ์ฃผํŒŒ์ˆ˜๋Š” 15Hz์ž…๋‹ˆ๋‹ค. ํ›ˆ๋ จ์€ Nvidia A6000 GPU์—์„œ batch size 48, learning rate 1e-5๋กœ 500 epochs ๋™์•ˆ ์ง„ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

IV. ์‹คํ—˜ ๊ฒฐ๊ณผ (Experimental Results)

๊ฐ ์ •์ฑ… ๋ณ€ํ˜•์˜ ์„ฑ๊ณต๋ฅ ์€ 10ํšŒ ์‹คํ—˜์„ ํ†ตํ•ด ํ‰๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

  • Plate Pick and Place: Vision-only ์ •์ฑ…์€ 50%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋‚˜, tactile sensing์„ ํ†ตํ•ฉํ•˜์ž 100%๋กœ ์ฆ๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. Tactile sensing์ด ์—†์œผ๋ฉด plate๋ฅผ ๋ฐ€ ๋•Œ ์ ‘์ด‰ ์‹คํŒจ๋‚˜ ๋ถˆ์ถฉ๋ถ„ํ•œ ํž˜ ์ ์šฉ, ๋˜๋Š” ๋ถˆ์•ˆ์ •ํ•œ grasp๋กœ ์ธํ•œ slip์ด ์ฃผ์š” ์‹คํŒจ ์›์ธ์ด์—ˆ์Šต๋‹ˆ๋‹ค.
  • Plasticine Cutting: Vision-only ์ •์ฑ…์€ 50%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๊ณ , ์ผ๋ฐ˜์ ์ธ tactile sensing ํ†ตํ•ฉ ๋ฐฉ์‹์œผ๋กœ๋Š” 70%๋กœ ๊ฐœ์„ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Vision dropout training strategy๋ฅผ ์ ์šฉํ•˜์ž 90%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด‰๊ฐ ์„ผ์„œ๊ฐ€ ์—†์„ ๊ฒฝ์šฐ ๋ถ€๋ถ„์ ์ธ ์ ˆ๋‹จ์ด ๋งŽ์•˜์œผ๋ฉฐ, ์ด‰๊ฐ ์„ผ์„œ ํ†ตํ•ฉ์€ ๋ถ€๋ถ„ ์ ˆ๋‹จ์„ ์ค„์ด๊ณ  ๊ณผ๋„ํ•œ ํž˜ ์ ์šฉ์„ ๋ฐฉ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค. Vision dropout์€ ์ด‰๊ฐ ์„ผ์„œ์— ๋Œ€ํ•œ ์ •์ฑ…์˜ ์˜์กด๋„๋ฅผ ๋”์šฑ ๋†’์˜€์Šต๋‹ˆ๋‹ค.
  • Bottle Opening: ์ด ์ž‘์—…์€ ํŠนํžˆ ์–ด๋ ค์› ์œผ๋ฉฐ, Vision-only ์ •์ฑ…๊ณผ vanilla Vision-tactile ์ •์ฑ… ๋ชจ๋‘ ๋ณ‘์„ ์—ฌ๋Š” ๋ฐ ์‹คํŒจํ–ˆ์Šต๋‹ˆ๋‹ค. Vision dropout training strategy๋ฅผ ์ ์šฉํ–ˆ์„ ๋•Œ 30%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‹œ๊ฐ ์ •๋ณด๋งŒ์œผ๋กœ๋Š” ๋šœ๊ป‘ ์—ฌ๋Š” ๊ณผ์ •์— ๋Œ€ํ•œ ๋‹จ์„œ๊ฐ€ ์ œํ•œ์ ์ด๋ฉฐ, dropout ์ „๋žต์ด ๋„คํŠธ์›Œํฌ๊ฐ€ action ์˜ˆ์ธก ์‹œ ์ด‰๊ฐ sensing์— ๋” ๋งŽ์ด ์˜์กดํ•˜๋„๋ก ์œ ๋„ํ–ˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

V. ๊ฒฐ๋ก  (Conclusion)

EyeSight Hand๋Š” ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์„ผ์„œ์™€ compliant actuation์„ ๊ฐ–์ถ˜ fully-actuated 7-DoF ๋กœ๋ด‡ ์†์ž…๋‹ˆ๋‹ค. ์ด ๋””์ž์ธ์€ ํ’๋ถ€ํ•œ sensing ๋Šฅ๋ ฅ, ์ถฉ๋Œ์— ๋Œ€ํ•œ ๊ฒฌ๊ณ ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ์ธ๊ฐ„ ์†๊ณผ ์œ ์‚ฌํ•œ ํ˜•ํƒœ ๋•๋ถ„์— ๋กœ๋ด‡ ํ•™์Šต ์ปค๋ฎค๋‹ˆํ‹ฐ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ imitation learning baseline์„ ๊ฐœ๋ฐœํ•˜๊ณ , EyeSight Hand์˜ ํ’๋ถ€ํ•œ ์ด‰๊ฐ sensing์ด ์—ฌ๋Ÿฌ ๋„์ „์ ์ธ real-world task์—์„œ ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ด์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ์†์— ์ถ”๊ฐ€์ ์ธ fingers๋ฅผ ํ†ตํ•ฉํ•˜๊ณ  ํ’๋ถ€ํ•œ ์ด‰๊ฐ sensing์„ ๋” ์ž˜ ํ™œ์šฉํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํƒ๊ตฌํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค.


๐Ÿ”” Ring Review

๐Ÿ”” Ring โ€” An idea that echoes. Grasp the core and its value.

์„œ๋ก : ์™œ ์šฐ๋ฆฌ๋Š” ์•„์ง๋„ ๋ฌผ๊ฑด์„ ์ œ๋Œ€๋กœ ๋ชป ์ง‘๋Š”๊ฐ€?

์—ฌ๋Ÿฌ๋ถ„, ์ž ์‹œ ์†์„ ํ•œ๋ฒˆ ๋ด์ฃผ์„ธ์š”. ์ง€๊ธˆ ์ปคํ”ผ์ž”์„ ์ง‘์–ด๋“ค๊ฑฐ๋‚˜, ์Šค๋งˆํŠธํฐ์„ ๋งŒ์ง€์ž‘๊ฑฐ๋ฆฌ๊ฑฐ๋‚˜, ํ˜น์€ ํŽœ์„ ๋Œ๋ฆฌ๊ณ  ๊ณ„์‹ค์ง€๋„ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋“  ๋™์ž‘์€ ์—ฌ๋Ÿฌ๋ถ„์—๊ฒŒ ์•„๋ฌด๊ฒƒ๋„ ์•„๋‹Œ ๊ฒƒ์ฒ˜๋Ÿผ ๋А๊ปด์ง€๊ฒ ์ง€๋งŒ, ๋กœ๋ด‡๊ณตํ•™์ž๋“ค์—๊ฒŒ๋Š” 30๋…„ ๋„˜๊ฒŒ ํ’€์ง€ ๋ชปํ•œ ๋‚œ์ œ์ž…๋‹ˆ๋‹ค.

์ธ๊ฐ„์˜ ์†์€ ์ •๋ง ๊ฒฝ์ด๋กœ์šด ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค. ๋ณต์žกํ•œ ์šด๋™ํ•™์  ๊ตฌ์กฐ, ๊ทผ์œก๊ณผ ํž˜์ค„์ด ์ œ๊ณตํ•˜๋Š” ์ปดํ”Œ๋ผ์ด์–ธ์Šค(compliance), ๊ทธ๋ฆฌ๊ณ  ํ”ผ๋ถ€์— ๋ฐ€์ง‘๋œ ์ด‰๊ฐ ์„ผ์„œ๋“ค์˜ ์กฐํ•ฉโ€”์ด๊ฒƒ์ด ๋ฐ”๋กœ ์šฐ๋ฆฌ๊ฐ€ ๋‚ ๊ณ„๋ž€์„ ๊นจ๋œจ๋ฆฌ์ง€ ์•Š๊ณ  ์ง‘์„ ์ˆ˜ ์žˆ๋Š” ์ด์œ ์ด๋ฉฐ, ๋™์‹œ์— ๋ฌด๊ฑฐ์šด ๋ฌธ๊ณ ๋ฆฌ๋ฅผ ๋Œ๋ฆด ์ˆ˜ ์žˆ๋Š” ์ด์œ ์ž…๋‹ˆ๋‹ค.

MIT์˜ Branden Romero, Hao-Shu Fang, Pulkit Agrawal, Edward Adelson ์—ฐ๊ตฌํŒ€์€ IROS 2024์—์„œ ๋ฐœํ‘œํ•œ EyeSight Hand๋ฅผ ํ†ตํ•ด ์ด ๋ฌธ์ œ์— ๋Œ€ํ•œ ํ†ตํ•ฉ์  ํ•ด๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ RoboCup Best Paper Finalist์— ์„ ์ •๋˜์—ˆ์œผ๋ฉฐ, ๋กœ๋ด‡ ์† ์„ค๊ณ„์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด ๋กœ๋ด‡ ์†์˜ ๋”œ๋ ˆ๋งˆ

๋กœ๋ด‡๊ณตํ•™์—์„œ โ€œ์ข‹์€ ์†โ€์„ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด์„œ๋Š” ์„ธ ๊ฐ€์ง€ ์š”์†Œ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค:

  1. ์ปดํ”Œ๋ผ์ด์–ธ์Šค(Compliance): ์™ธ๋ถ€ ์ถฉ๊ฒฉ์— ์œ ์—ฐํ•˜๊ฒŒ ๋Œ€์‘ํ•˜๋Š” ๋Šฅ๋ ฅ
  2. ์ด‰๊ฐ ์„ผ์‹ฑ(Tactile Sensing): ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์ •๋ฐ€ํ•˜๊ฒŒ ๊ฐ์ง€ํ•˜๋Š” ๋Šฅ๋ ฅ
  3. ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ํ˜•ํƒœ(Anthropomorphic Design): ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜๊ณผ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์˜ ์šฉ์ด์„ฑ

๋ฌธ์ œ๋Š”, ๊ธฐ์กด์˜ ๋กœ๋ด‡ ์†๋“ค์ด ์ด ์„ธ ๊ฐ€์ง€ ์ค‘ ๊ธฐ๊ปํ•ด์•ผ ํ•˜๋‚˜ ๋˜๋Š” ๋‘˜๋งŒ ๋งŒ์กฑ์‹œํ‚จ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค.

Table 1: ๊ธฐ์กด ๋กœ๋ด‡ ์†๊ณผ EyeSight Hand์˜ ๋น„๊ต
๋กœ๋ด‡ ์† ๊ฐ€๊ฒฉ(USD) DoF ์ปดํ”Œ๋ผ์ด์–ธ์Šค ์ด‰๊ฐ ์„ผ์‹ฑ ์ธ๊ฐ„ํ˜• ํ˜•ํƒœ
Shadow Hand ~100,000+ 24 ๋†’์Œ (ํ…๋˜) ์ œํ•œ์  ๋†’์Œ
Allegro Hand ~15,000 16 ๋‚ฎ์Œ (๊ณ ๊ธฐ์–ด๋น„) ์—†์Œ ๋ณดํ†ต
LEAP Hand ~2,000 16 ๋‚ฎ์Œ ์—†์Œ ๋†’์Œ
RBO Hand ~์ €๊ฐ€ ์ œํ•œ์  ๋†’์Œ (์†Œํ”„ํŠธ) ์ œํ•œ์  ๋†’์Œ
EyeSight Hand ~2,500 7 ๋†’์Œ (QDD) 8๊ฐœ ์„ผ์„œ ๋†’์Œ

Shadow Hand๋Š” ํ…๋˜ ๊ธฐ๋ฐ˜์œผ๋กœ ์ปดํ”Œ๋ผ์ด์–ธ์Šค๋Š” ์ข‹์ง€๋งŒ, 10๋งŒ ๋‹ฌ๋Ÿฌ๊ฐ€ ๋„˜๊ณ  ์œ ์ง€๋ณด์ˆ˜๊ฐ€ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. Allegro Hand๋Š” ๋ชจํ„ฐ๊ฐ€ ์ง์ ‘ ๊ด€์ ˆ์„ ๊ตฌ๋™ํ•˜์ง€๋งŒ, ๋†’์€ ๊ธฐ์–ด๋น„๋กœ ์ธํ•ด reflected inertia๊ฐ€ ์ปค์„œ ์™ธ๋ถ€ ํž˜์— ๋ปฃ๋ปฃํ•˜๊ฒŒ ๋ฐ˜์‘ํ•ฉ๋‹ˆ๋‹ค. ์†Œํ”„ํŠธ ํ•ธ๋“œ(RBO Hand ๋“ฑ)๋Š” ์ปดํ”Œ๋ผ์ด์–ธํŠธํ•˜์ง€๋งŒ ์ •๋ฐ€ ์ œ์–ด๊ฐ€ ์–ด๋ ต๊ณ  ์ด‰๊ฐ ์„ผ์„œ ํ†ตํ•ฉ์ด ํž˜๋“ญ๋‹ˆ๋‹ค.

์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ์งˆ๋ฌธ

EyeSight Hand๋Š” ๋‹ค์Œ ์งˆ๋ฌธ์— ๋‹ตํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค:

โ€œ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์„ ์œ„ํ•œ ๊ฐ•๊ฑด์„ฑ, ๋ชจ๋ฐฉ ํ•™์Šต์„ ์œ„ํ•œ ์ง๊ด€์  ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜, ๊ทธ๋ฆฌ๊ณ  ์ธ๊ฐ„ ์† ๋ฐ์ดํ„ฐ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋™์‹œ์— ๋งŒ์กฑ์‹œํ‚ค๋Š” ๋กœ๋ด‡ ์†์„ ์–ด๋–ป๊ฒŒ ์„ค๊ณ„ํ•  ์ˆ˜ ์žˆ์„๊นŒ?โ€

์„ค๊ณ„ ์ฒ ํ•™: Co-Design์˜ ์•„๋ฆ„๋‹ค์›€

EyeSight Hand์˜ ๊ฐ€์žฅ ํฐ ๊ฐ•์ ์€ ๊ตฌ๋™(actuation), ์„ผ์‹ฑ(sensing), ๊ธฐ๊ตฌํ•™(kinematics)์„ ๋™์‹œ์— ๊ณ ๋ คํ•œ ํ†ตํ•ฉ ์„ค๊ณ„์— ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ฐ ์š”์†Œ๋ฅผ ๊ฐœ๋ณ„์ ์œผ๋กœ ์ตœ์ ํ™”ํ•˜๋Š” ๊ฒƒ๊ณผ๋Š” ์งˆ์ ์œผ๋กœ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์ž…๋‹ˆ๋‹ค.

๊ธฐ๊ตฌํ•™ ์„ค๊ณ„: ์ธ๊ฐ„ ์†๊ณผ์˜ ํƒ€ํ˜‘

flowchart TD
    subgraph THUMB["์—„์ง€ (2 DoF)"]
        T_CMC["CMC ๊ด€์ ˆ<br/>(Abduction/Adduction)"]
        T_MCP["MCP ๊ด€์ ˆ<br/>(Flexion/Extension)"]
        T_CMC --> T_MCP
    end
    
    subgraph INDEX["๊ฒ€์ง€ (2 DoF)"]
        I_MCP["MCP ๊ด€์ ˆ<br/>(Coupled F/E)"]
        I_PIP["PIP+DIP ๊ด€์ ˆ<br/>(Coupled)"]
        I_MCP --> I_PIP
    end
    
    subgraph MIDDLE["์ค‘์ง€ (2 DoF)"]
        M_MCP["MCP ๊ด€์ ˆ<br/>(Coupled F/E)"]
        M_PIP["PIP+DIP ๊ด€์ ˆ<br/>(Coupled)"]
        M_MCP --> M_PIP
    end
    
    subgraph WRIST["์†๋ชฉ (1 DoF)"]
        W["์†๋ชฉ ํšŒ์ „<br/>(Pronation/Supination)"]
    end
    
    WRIST --> THUMB
    WRIST --> INDEX
    WRIST --> MIDDLE
Figure 1: EyeSight Hand์˜ ๊ธฐ๊ตฌํ•™์  ๊ตฌ์กฐ

์ธ๊ฐ„์˜ ์†์€ ์•ฝ 27๊ฐœ์˜ ์ž์œ ๋„๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์™„๋ฒฝํžˆ ๋ณต์ œํ•˜๋Š” ๊ฒƒ์€ ๋น„ํ˜„์‹ค์ ์ด๋ฏ€๋กœ, EyeSight Hand๋Š” 7 DoF๋กœ ์ถ•์†Œํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•ต์‹ฌ ํƒ€ํ˜‘์ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

MCP ๊ด€์ ˆ์˜ ๋‹จ์ˆœํ™”: ์ธ๊ฐ„์˜ MCP ๊ด€์ ˆ์€ ๊ตด๊ณก/์‹ ์ „(flexion/extension)๊ณผ ๋‚ด์ „/์™ธ์ „(abduction/adduction) ๋‘ ๊ฐ€์ง€ ์ž์œ ๋„๋ฅผ ๊ฐ€์ง‘๋‹ˆ๋‹ค. EyeSight Hand๋Š” ๊ฒ€์ง€์™€ ์ค‘์ง€์˜ MCP์—์„œ ๋‚ด์ „/์™ธ์ „์„ ์ƒ๋žตํ–ˆ์Šต๋‹ˆ๋‹ค.

DIP ๊ด€์ ˆ์˜ ์ปคํ”Œ๋ง: ์›์œ„์ง€์ ˆ๊ฐ„(DIP) ๊ด€์ ˆ์„ ๊ทผ์œ„์ง€์ ˆ๊ฐ„(PIP) ๊ด€์ ˆ๊ณผ ๊ธฐ๊ณ„์ ์œผ๋กœ ์ปคํ”Œ๋ง์‹œ์ผœ, ํ•˜๋‚˜์˜ ๋ชจํ„ฐ๋กœ ๋‘ ๊ด€์ ˆ์„ ๋™์‹œ์— ๊ตฌ๋™ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ธ๊ฐ„ ์†์˜ โ€œ๊ตด๊ณก ์‹œ๋„ˆ์ง€(flexion synergy)โ€๋ฅผ ๋ชจ์‚ฌํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

3์†๊ฐ€๋ฝ ๊ตฌ์„ฑ: ์•ฝ์ง€์™€ ์†Œ์ง€๋ฅผ ์ œ๊ฑฐํ•˜์—ฌ ์„ค๊ณ„๋ฅผ ๋‹จ์ˆœํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์ผ์ƒ์  ์กฐ์ž‘ ์ž‘์—…์—์„œ ์—„์ง€-๊ฒ€์ง€-์ค‘์ง€์˜ โ€œtripod gripโ€์ด ์ง€๋ฐฐ์ ์ด๋ผ๋Š” ๊ด€์ฐฐ์— ๊ธฐ๋ฐ˜ํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋‹จ์ˆœํ™”์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์†์˜ ์ „์ฒด ํฌ๊ธฐ์™€ ๋น„์œจ์€ ์ธ๊ฐ„ ์†๊ณผ ๋งค์šฐ ์œ ์‚ฌํ•˜๊ฒŒ ์œ ์ง€๋ฉ๋‹ˆ๋‹ค(๋„ˆ๋น„ ์•ฝ 90mm, ๊ธธ์ด ์•ฝ 190mm). ์ด๊ฒƒ์ด ์ค‘์š”ํ•œ ์ด์œ ๋Š” ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜ ์‹œ ์กฐ์ž‘์ž๊ฐ€ ์ž์‹ ์˜ ์† ์›€์ง์ž„์„ ๋กœ๋ด‡ ์†์— ์ง๊ด€์ ์œผ๋กœ ๋งคํ•‘ํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

๊ตฌ๋™ ์‹œ์Šคํ…œ: Quasi-Direct Drive์˜ ๋งˆ๋ฒ•

EyeSight Hand์˜ ๊ตฌ๋™ ์‹œ์Šคํ…œ์€ ์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ๊ธฐ์ˆ ์  ๊ธฐ์—ฌ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ Quasi-Direct Drive(QDD)๋ผ๋Š” ๊ฐœ๋…์„ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด ๊ตฌ๋™ ๋ฐฉ์‹์˜ ๋ฌธ์ œ

์ „ํ†ต์ ์ธ ๋กœ๋ด‡ ์†(์˜ˆ: Allegro Hand)์€ ์ž‘์€ DC ์„œ๋ณด๋ชจํ„ฐ์™€ ๋†’์€ ๊ธฐ์–ด๋น„(100:1 ์ด์ƒ)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฉ์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค:

๋†’์€ Reflected Inertia: ๊ธฐ์–ด๋น„ N์œผ๋กœ ๊ฐ์†ํ•˜๋ฉด, ๋ชจํ„ฐ ๊ด€์„ฑ J_m์ด ์ถœ๋ ฅ์ถ•์—์„œ N^2 \cdot J_m์œผ๋กœ ๋А๊ปด์ง‘๋‹ˆ๋‹ค. ๊ธฐ์–ด๋น„๊ฐ€ 100์ด๋ฉด, ๊ด€์„ฑ์ด 10,000๋ฐฐ๋กœ ์ฆํญ๋ฉ๋‹ˆ๋‹ค!

J_{reflected} = N^2 \cdot J_m

๋‚ฎ์€ Backdrivability: ๊ธฐ์–ด๋ฐ•์Šค์˜ ๋งˆ์ฐฐ๋กœ ์ธํ•ด ์™ธ๋ถ€์—์„œ ํž˜์„ ๊ฐ€ํ•ด๋„ ๋ชจํ„ฐ๊ฐ€ ์‰ฝ๊ฒŒ ๋Œ์•„๊ฐ€์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ถฉ๋Œ ์‹œ ์†์ด๋‚˜ ๋ฌผ์ฒด๊ฐ€ ํŒŒ์†๋  ์œ„ํ—˜์„ ๋†’์ž…๋‹ˆ๋‹ค.

๋ฐœ์—ด ๋ฌธ์ œ: ์ง€์†์ ์ธ ํž˜ ์ถœ๋ ฅ์„ ์œ„ํ•ด ๋ชจํ„ฐ๊ฐ€ stall ์ƒํƒœ์— ๊ฐ€๊น๊ฒŒ ์ž‘๋™ํ•˜๋ฉด, ๊ถŒ์„ ์ด ๊ณผ์—ด๋ฉ๋‹ˆ๋‹ค.

QDD ์†”๋ฃจ์…˜

QDD๋Š” ๋‚ฎ์€ ๊ธฐ์–ด๋น„(5~10:1)์˜ ๊ณ ํ† ํฌ BLDC ๋ชจํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. EyeSight Hand๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ตฌ์„ฑ์„ ์ฑ„ํƒํ–ˆ์Šต๋‹ˆ๋‹ค:

BLDC ์•ก์ถ”์—์ดํ„ฐ ์ŠคํŽ™:

Table 2: QDD ์•ก์ถ”์—์ดํ„ฐ ์‚ฌ์–‘
ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐ’
๊ธฐ์–ด๋น„ 9:1 (ํ–‰์„ฑ๊ธฐ์–ด)
์—ฐ์† ํ•‘๊ฑฐํŒ ํž˜ 19N
์ตœ๋Œ€ ํ•‘๊ฑฐํŒ ํž˜ 57N
์ตœ๋Œ€ ์†๋„ 420 RPM
ํ†ต์‹  CAN-FD @ 5Mbps, 1kHz
์ปจํŠธ๋กค๋Ÿฌ MJBOTS Moteus N1

๋‚ฎ์€ ๊ธฐ์–ด๋น„ ๋•๋ถ„์—:

  1. Reflected inertia๊ฐ€ ๋‚ฎ์Œ: ์™ธ๋ถ€ ํž˜์— ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋”ฐ๋ผ๊ฐ
  2. Backdrivable: ์ถฉ๋Œ ์‹œ ์†์ด โ€œ๋ฐ€๋ ค๋‚จโ€
  3. ํ† ํฌ ํˆฌ๋ช…์„ฑ: ์ „๋ฅ˜ ์„ผ์‹ฑ์œผ๋กœ ์ •ํ™•ํ•œ ํ† ํฌ ์ถ”์ • ๊ฐ€๋Šฅ

ํŠนํžˆ ์„ธ ๋ฒˆ์งธ ํŠน์„ฑ์€ ์ด‰๊ฐ ์„ผ์‹ฑ์ด ์—†๋Š” ์ƒํ™ฉ์—์„œ๋„ ํž˜ ํ”ผ๋“œ๋ฐฑ์„ ์–ป์„ ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค:

\tau_{output} = K_t \cdot I_{motor} \cdot N

์—ฌ๊ธฐ์„œ K_t๋Š” ํ† ํฌ ์ƒ์ˆ˜, I_{motor}๋Š” ๋ชจํ„ฐ ์ „๋ฅ˜, N์€ ๊ธฐ์–ด๋น„์ž…๋‹ˆ๋‹ค.

๊ธฐ๊ณ„์  ํŠธ๋žœ์Šค๋ฏธ์…˜: ๋ฒจํŠธ vs ๋งํ‚ค์ง€

๋ชจ๋“  ๊ด€์ ˆ์ด ๋™์ผํ•œ ํŠธ๋žœ์Šค๋ฏธ์…˜์„ ์‚ฌ์šฉํ•˜์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค. EyeSight Hand๋Š” ์ ์žฌ์ ์†Œ์— ๋‹ค๋ฅธ ๋ฐฉ์‹์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค:

ํƒ€์ด๋ฐ ๋ฒจํŠธ: ๊ฒ€์ง€/์ค‘์ง€์˜ MCP ๊ด€์ ˆ์— ์‚ฌ์šฉ. ๋ชจํ„ฐ๋ฅผ ์†๋ฐ”๋‹ฅ ์ชฝ์— ๋ฐฐ์น˜ํ•˜๊ณ , ๋ฒจํŠธ๋กœ ํšŒ์ „๋ ฅ์„ ์ „๋‹ฌํ•ฉ๋‹ˆ๋‹ค. ์žฅ์ ์€ ๊ฐ€๋ณ๊ณ  ์กฐ์šฉํ•˜๋‹ค๋Š” ๊ฒƒ.

4์ ˆ ๋งํ‚ค์ง€(Four-bar linkage): ์†๊ฐ€๋ฝ ๊ตด๊ณก ๊ด€์ ˆ์— ์‚ฌ์šฉ. ํ•˜๋‚˜์˜ ๋ชจํ„ฐ๋กœ PIP์™€ DIP ๊ด€์ ˆ์„ ๋™์‹œ์— ์ปคํ”Œ๋งํ•˜๋ฉด์„œ๋„, ์ธ๊ฐ„ ์†๊ฐ€๋ฝ์˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ๊ตด๊ณก ๊ถค์ ์„ ๋ชจ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

flowchart LR
    subgraph MOTOR["์•ก์ถ”์—์ดํ„ฐ"]
        M["BLDC ๋ชจํ„ฐ"]
    end
    
    subgraph FOURBAR["4์ ˆ ๋งํ‚ค์ง€"]
        L1["Ground Link<br/>(์†๋ฐ”๋‹ฅ)"]
        L2["Input Link<br/>(Proximal)"]
        L3["Coupler Link"]
        L4["Output Link<br/>(Distal)"]
        L1 --- L2
        L2 --- L3
        L3 --- L4
        L4 --- L1
    end
    
    M --> L2
    L3 --> FT["์†๊ฐ€๋ฝ ๋"]
Figure 2: ์†๊ฐ€๋ฝ ๊ตด๊ณก ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ 4์ ˆ ๋งํ‚ค์ง€

๋งˆ์ดํฌ๋กœ DC ๋ชจํ„ฐ: ์—„์ง€์˜ MCP ๊ตด๊ณก๊ณผ ์†๋ชฉ ํšŒ์ „์—๋Š” ๊ณต๊ฐ„ ์ œ์•ฝ์œผ๋กœ ์ธํ•ด ์ž‘์€ DC ๋ชจํ„ฐ(TI DRV8876 ๋“œ๋ผ์ด๋ฒ„, Teensy 4.1 ์ปจํŠธ๋กค๋Ÿฌ)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

์ด‰๊ฐ ์„ผ์‹ฑ: GelSim(ple)์˜ ํ˜์‹ 

์™œ Vision-based Tactile Sensing์ธ๊ฐ€?

์ด‰๊ฐ ์„ผ์‹ฑ ๊ธฐ์ˆ ์€ ํฌ๊ฒŒ ๋‘ ๊ฐ€์ง€๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค:

  1. ์ „ํ†ต์  ๋ฐฉ์‹: ์ €ํ•ญ์‹, ์ •์ „์‹, ์••์ „์‹ ์„ผ์„œ ์–ด๋ ˆ์ด
  2. ๋น„์ „ ๊ธฐ๋ฐ˜ ๋ฐฉ์‹: ์นด๋ฉ”๋ผ๋กœ ํƒ„์„ฑ์ฒด ํ‘œ๋ฉด์˜ ๋ณ€ํ˜•์„ ์ดฌ์˜

GelSight๋กœ ๋Œ€ํ‘œ๋˜๋Š” ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ๋Š” ๋ช‡ ๊ฐ€์ง€ ๊ฒฐ์ •์  ์žฅ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค:

  • ๊ณ ํ•ด์ƒ๋„: ์ˆ˜์ฒœ ๊ฐœ์˜ โ€œ์ด‰๊ฐ ํ”ฝ์…€โ€์„ ๋‹จ์ผ ์นด๋ฉ”๋ผ๋กœ ํš๋“
  • ๋‹ค์ค‘ ๋ชจ๋‹ฌ: ๊นŠ์ด, ์ „๋‹จ๋ ฅ, ๋ฏธ๋„๋Ÿฌ์ง์„ ๋™์‹œ์— ์ถ”๋ก  ๊ฐ€๋Šฅ
  • ๋ฒ”์šฉ์„ฑ: ์ƒˆ๋กœ์šด ์ ‘์ด‰ ์œ ํ˜•์— ๋Œ€ํ•ด ํ•™์Šต์œผ๋กœ ๋Œ€์‘ ๊ฐ€๋Šฅ

๊ทธ๋Ÿฌ๋‚˜ ๊ธฐ์กด GelSight ์„ผ์„œ๋Š” ํ‰ํ‰ํ•œ ํ‘œ๋ฉด์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์†๊ฐ€๋ฝ ๋์˜ ๊ณก๋ฉด์ด๋‚˜ ์†๋ฐ”๋‹ฅ์˜ ๋ณต์žกํ•œ ํ˜•์ƒ์— ์ ์šฉํ•˜๊ธฐ ์–ด๋ ค์› ์ฃ .

GelSim(ple): ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์นœํ™”์  ์„ค๊ณ„

EyeSight Hand๋Š” ์ƒˆ๋กœ์šด ์ด‰๊ฐ ์„ผ์„œ GelSim(ple)์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฆ„์—์„œ ์•Œ ์ˆ˜ ์žˆ๋“ฏ์ด, โ€œsimpleโ€ํ•˜๋ฉด์„œ๋„ โ€œsimulationโ€์— ์นœํ™”์ ์ธ ์„ค๊ณ„๊ฐ€ ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.

๊ธฐ์กด GelSight์˜ ์กฐ๋ช… ๋ฌธ์ œ

์›๋ž˜ GelSight๋Š” Photometric Stereo ์›๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. 3๊ฐœ์˜ ๋‹ค๋ฅธ ์ƒ‰(RGB)์˜ ๋ฐฉํ–ฅ์„ฑ ๊ด‘์›์„ ํ‘œ๋ฉด์— ๋น„์ถ”๊ณ , ๊ฐ ํ”ฝ์…€์—์„œ ์ƒ‰์ƒ ๋น„์œจ์„ ๋ถ„์„ํ•˜์—ฌ ํ‘œ๋ฉด ๋ฒ•์„ (surface normal)์„ ์ถ”์ •ํ•ฉ๋‹ˆ๋‹ค.

\vec{n}(x,y) = f(R, G, B)

์ด ๋ฐฉ์‹์˜ ๋ฌธ์ œ์ :

  1. ๊ณก๋ฉด ์ ์šฉ ์–ด๋ ค์›€: ๊ด‘์› ๋ฐฐ์น˜๊ฐ€ ๊ธฐํ•˜ํ•™์ ์œผ๋กœ ์ œํ•œ๋จ
  2. ๊ทธ๋ฆผ์ž ๋ฌธ์ œ: ๋Œ์ถœ๋œ ๋ฌผ์ฒด๊ฐ€ ๊ทธ๋ฆผ์ž๋ฅผ ๋งŒ๋“ค์–ด ๋…ธ์ด์ฆˆ ๋ฐœ์ƒ
  3. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ณต์žก์„ฑ: RGB-to-normal ๋งคํ•‘๊ณผ ๊ทธ๋ฆผ์ž๋ฅผ ์ •ํ™•ํžˆ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•ด์•ผ ํ•จ

GelSim(ple)์˜ ์ƒˆ๋กœ์šด ์กฐ๋ช… ์ „๋žต

GelSim(ple)์€ ๋น„๋ฐฉํ–ฅ์„ฑ ์ธก๋ฉด ์กฐ๋ช…(non-directional side illumination)์„ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค:

flowchart TB
    subgraph OPTICAL["๊ด‘ํ•™ ์‹œ์Šคํ…œ"]
        CAM["Arducam B0286<br/>220ยฐ ์–ด์•ˆ๋ Œ์ฆˆ"]
        DIFF["3M 3635-70<br/>๋””ํ“จ์ €"]
        LED["3mm COB LED ์ŠคํŠธ๋ฆฝ<br/>(์ธก๋ฉด ์กฐ๋ช…)"]
        GEL["์‹ค๋ฆฌ์ฝ˜ ์ ค<br/>(XP-565)"]
        COAT["์€์ƒ‰ ์•Œ๋ฃจ๋ฏธ๋Š„ ์ฝ”ํŒ…<br/>(๋ฐ˜์‚ฌ๋ฉด)"]
    end
    
    CAM --> |"๊ด€์ฐฐ"| DIFF
    LED --> |"์ธก๋ฉด ์กฐ๋ช…"| DIFF
    DIFF --> |"ํ™•์‚ฐ๊ด‘"| GEL
    GEL --> COAT
    COAT --> |"๋ฐ˜์‚ฌ"| CAM
Figure 3: GelSim(ple) ์„ผ์„œ ๊ตฌ์กฐ

ํ•ต์‹ฌ ์„ค๊ณ„ ๊ฒฐ์ •:

  1. COB LED ์ŠคํŠธ๋ฆฝ์„ ํƒ„์„ฑ์ฒด ๋‘˜๋ ˆ์— ๋ฐฐ์น˜ํ•˜์—ฌ ์ธก๋ฉด์—์„œ ์กฐ๋ช…
  2. ๋””ํ“จ์ €๊ฐ€ ๋น›์„ ํ™•์‚ฐ์‹œ์ผœ ๊ท ์ผํ•œ ์˜ค๋ฒ„ํ—ค๋“œ ์กฐ๋ช… ์ƒ์„ฑ
  3. ์•Œ๋ฃจ๋ฏธ๋Š„ ์ฝ”ํŒ…๋œ ๋ฐ˜์‚ฌ๋ฉด์ด ์ ‘์ด‰์ ์—์„œ์˜ ๊ธฐ์šธ๊ธฐ ๋ณ€ํ™”๋ฅผ ๋ฐ๊ธฐ ๋ณ€ํ™”๋กœ ๋ณ€ํ™˜

์ด ๋ฐฉ์‹์˜ ์žฅ์ :

  • ๊ทธ๋ฆผ์ž ์ œ๊ฑฐ: ๋น„๋ฐฉํ–ฅ์„ฑ ์กฐ๋ช…์œผ๋กœ ๊ทธ๋ฆผ์ž๊ฐ€ ๊ฑฐ์˜ ์—†์Œ
  • ๋‹จ์ผ ์ฑ„๋„: ์ปฌ๋Ÿฌ RGB ๋Œ€์‹  ๊ทธ๋ ˆ์ด์Šค์ผ€์ผ๋งŒ ํ•„์š” โ†’ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ๋Ÿ‰ 3๋ฐฐ ๊ฐ์†Œ
  • ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์šฉ์ด: ๋‹จ์ˆœํ•œ ๊ธฐํ•˜ํ•™์  ๋ณ€ํ™˜์œผ๋กœ ๊ทผ์‚ฌ ๊ฐ€๋Šฅ

์„ผ์„œ ์‚ฌ์–‘ ๋ฐ ๋ฐฐ์น˜

EyeSight Hand์—๋Š” ์ด 8๊ฐœ์˜ GelSim(ple) ์„ผ์„œ๊ฐ€ ์žฅ์ฐฉ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค:

Table 3: GelSim(ple) ์„ผ์„œ ๋ฐฐ์น˜
์œ„์น˜ ์„ผ์„œ ์ˆ˜ ํŠน์ง•
์—„์ง€ ๋ 1 ๊ตฌํ˜• ํ˜•ํƒœ
๊ฒ€์ง€ ๋ 1 ๊ตฌํ˜• ํ˜•ํƒœ
์ค‘์ง€ ๋ 1 ๊ตฌํ˜• ํ˜•ํƒœ
๊ฒ€์ง€ Proximal 1 ์›ํ†ตํ˜•
์ค‘์ง€ Proximal 1 ์›ํ†ตํ˜•
์†๋ฐ”๋‹ฅ 2 ํ‰๋ฉดํ˜•

๋ชจ๋“  ์„ผ์„œ๋Š” 30Hz๋กœ ์ด๋ฏธ์ง€๋ฅผ ์ŠคํŠธ๋ฆฌ๋ฐํ•˜๋ฉฐ, ์ „์ฒด ์‹œ์Šคํ…œ์˜ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ํŒŒ์ดํ”„๋ผ์ธ๊ณผ ๋™๊ธฐํ™”๋ฉ๋‹ˆ๋‹ค.

์ด‰๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜

์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์ด‰๊ฐ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์€ sim-to-real ์ „์ด ํ•™์Šต์— ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. GelSim(ple)์˜ ๋‹จ์ˆœํ•œ ์กฐ๋ช… ๊ตฌ์กฐ ๋•๋ถ„์—, ์ ‘์ด‰ ๋ฉด์˜ ๊นŠ์ด ๋งต(depth map)์„ ์ง์ ‘ ๋ฐ๊ธฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค:

I(x,y) \propto \frac{\partial z}{\partial x} + \frac{\partial z}{\partial y} + \text{ambient}

์—ฌ๊ธฐ์„œ z(x,y)๋Š” ํƒ„์„ฑ์ฒด์˜ ๋ณ€ํ˜• ๊นŠ์ด์ž…๋‹ˆ๋‹ค. ์ด๋Š” ํ‘œ๋ฉด ๋ฒ•์„ ์˜ ์ˆ˜ํ‰ ์„ฑ๋ถ„๊ณผ ๋ฐ๊ธฐ๊ฐ€ ๋น„๋ก€ํ•œ๋‹ค๋Š” ๊ทผ์‚ฌ์— ๊ธฐ๋ฐ˜ํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋ฐฉ ํ•™์Šต: ACT์™€ Vision Dropout ์ „๋žต

Action Chunking with Transformers (ACT) ๊ฐœ์š”

EyeSight Hand์˜ ํ‰๊ฐ€์—๋Š” ACT(Action Chunking with Transformers) ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ 2023๋…„ RSS์—์„œ Tony Zhao ๋“ฑ์— ์˜ํ•ด ๋ฐœํ‘œ๋˜์—ˆ์œผ๋ฉฐ, ์ •๋ฐ€ ์กฐ์ž‘ ์ž‘์—…์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค.

์ „ํ†ต์  Behavior Cloning์˜ ๋ฌธ์ œ

์ผ๋ฐ˜์ ์ธ Behavior Cloning(BC)์€ ํ˜„์žฌ ๊ด€์ฐฐ o_t์—์„œ ๋‹ค์Œ ํ–‰๋™ a_t๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค:

\pi_\theta(a_t | o_t)

์ด ๋ฐฉ์‹์˜ ๋ฌธ์ œ๋Š” ๋ˆ„์  ์˜ค์ฐจ(compounding error)์ž…๋‹ˆ๋‹ค. ์ •์ฑ…์ด ์กฐ๊ธˆ์ด๋ผ๋„ ๋ฒ—์–ด๋‚˜๋ฉด, ํ•™์Šต ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์—์„œ ๋ฉ€์–ด์ง„ ์ƒํƒœ์— ๋„๋‹ฌํ•˜๊ณ , ๊ฑฐ๊ธฐ์„œ ๋” ๋‚˜์œ ์˜ˆ์ธก์„ ํ•˜์—ฌ ๋น ๋ฅด๊ฒŒ ์‹คํŒจํ•ฉ๋‹ˆ๋‹ค.

ํŠนํžˆ 50Hz ์ œ์–ด๊ฐ€ ํ•„์š”ํ•œ ์ •๋ฐ€ ์กฐ์ž‘์—์„œ, 10์ดˆ์งœ๋ฆฌ ์ž‘์—…์€ 500 ์Šคํ…์˜ ๊ฒฐ์ •์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ์Šคํ…์—์„œ 1%๋งŒ ํ‹€๋ ค๋„ ๋ˆ„์ ๋˜๋ฉด ์น˜๋ช…์ ์ž…๋‹ˆ๋‹ค.

Action Chunking ์•„์ด๋””์–ด

ACT๋Š” ๋‹จ์ผ ํ–‰๋™ ๋Œ€์‹  ํ–‰๋™ ์ฒญํฌ(action chunk)โ€”ํ–ฅํ›„ k ์Šคํ…์˜ ํ–‰๋™ ์‹œํ€€์Šคโ€”๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค:

\pi_\theta(a_{t:t+k} | o_t)

์ด๋ ‡๊ฒŒ ํ•˜๋ฉด:

  1. ์œ ํšจ ํ˜ธ๋ผ์ด์ฆŒ ๊ฐ์†Œ: 500 ์Šคํ… ์ž‘์—…์ด k=100์ด๋ฉด 5๋ฒˆ์˜ ๊ฒฐ์ •์œผ๋กœ ์ค„์–ด๋“ฆ
  2. ์ผ๊ด€์„ฑ ํ–ฅ์ƒ: ํ•œ ์ฒญํฌ ๋‚ด์—์„œ๋Š” ์—ฐ์†์ ์ด๊ณ  ์ผ๊ด€๋œ ๋™์ž‘ ๋ณด์žฅ
  3. ์ธ๊ฐ„ ์‹œ์—ฐ ๋ชจ์‚ฌ: ์ธ๊ฐ„๋„ ํ–‰๋™์„ โ€œ๋ฉ์–ด๋ฆฌโ€๋กœ ๊ณ„ํšํ•จ (์‹ ๊ฒฝ๊ณผํ•™์  ๊ทผ๊ฑฐ)

CVAE ๊ตฌ์กฐ

ACT๋Š” Conditional Variational Autoencoder(CVAE) ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค:

flowchart TB
    subgraph ENCODER["CVAE ์ธ์ฝ”๋”<br/>(ํ•™์Šต ์‹œ์—๋งŒ)"]
        A["ํ–‰๋™ ์‹œํ€€์Šค<br/>a_{1:k}"]
        O1["๊ด€์ ˆ ์œ„์น˜"]
        CLS["[CLS] ํ† ํฐ"]
        TE["Transformer<br/>์ธ์ฝ”๋”"]
        Z["์ž ์žฌ ๋ณ€์ˆ˜ z<br/>~N(ฮผ, ฯƒยฒ)"]
        
        A --> TE
        O1 --> TE
        CLS --> TE
        TE --> Z
    end
    
    subgraph DECODER["CVAE ๋””์ฝ”๋”<br/>(์ •์ฑ…)"]
        IMG["RGB ์ด๋ฏธ์ง€<br/>(4๊ฐœ ๋ทฐ)"]
        RES["ResNet18<br/>ํŠน์ง• ์ถ”์ถœ"]
        O2["๊ด€์ ˆ ์œ„์น˜"]
        Z2["z (ํ•™์Šต ์‹œ) ๋˜๋Š”<br/>0 (์ถ”๋ก  ์‹œ)"]
        TD["Transformer<br/>๋””์ฝ”๋”"]
        AP["ํ–‰๋™ ์˜ˆ์ธก<br/>รข_{1:k}"]
        
        IMG --> RES
        RES --> TD
        O2 --> TD
        Z2 --> TD
        TD --> AP
    end
    
    Z --> |"ํ•™์Šต ์‹œ"| Z2
Figure 4: ACT ์ •์ฑ… ์•„ํ‚คํ…์ฒ˜

ํ•™์Šต ์‹œ: ์ธ์ฝ”๋”๊ฐ€ ์‹ค์ œ ํ–‰๋™ ์‹œํ€€์Šค๋ฅผ ์ž ์žฌ ๋ณ€์ˆ˜ z๋กœ ์••์ถ•ํ•ฉ๋‹ˆ๋‹ค. ์ด z๋Š” ํ–‰๋™์˜ โ€œ์Šคํƒ€์ผโ€์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹คโ€”๊ฐ™์€ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ• ์ค‘ ์–ด๋–ค ๊ฒƒ์ธ์ง€๋ฅผ ์ธ์ฝ”๋”ฉํ•ฉ๋‹ˆ๋‹ค.

์ถ”๋ก  ์‹œ: ์ธ์ฝ”๋”๋Š” ๋ฒ„๋ ค์ง€๊ณ , z๋Š” ๋‹จ์ˆœํžˆ 0์œผ๋กœ ์„ค์ •๋ฉ๋‹ˆ๋‹ค. ๋””์ฝ”๋”๋Š” ํ˜„์žฌ ๊ด€์ฐฐ๋งŒ์œผ๋กœ ํ–‰๋™ ์ฒญํฌ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

์†์‹ค ํ•จ์ˆ˜๋Š”:

\mathcal{L} = \underbrace{\mathbb{E}_{q_\phi(z|a,o)}[\log p_\theta(a|o,z)]}_{\text{์žฌ๊ตฌ์„ฑ ์†์‹ค (L1)}} - \underbrace{\beta \cdot D_{KL}(q_\phi(z|a,o) || p(z))}_{\text{KL ์ •๊ทœํ™”}}

Temporal Ensembling

ACT์˜ ๋˜ ๋‹ค๋ฅธ ๊ธฐ๋ฒ•์€ ์‹œ๊ฐ„์  ์•™์ƒ๋ธ”(temporal ensembling)์ž…๋‹ˆ๋‹ค. ๋งค ์Šคํ…๋งˆ๋‹ค ์ƒˆ ์ฒญํฌ๋ฅผ ์˜ˆ์ธกํ•˜๋ฉด, ์ค‘์ฒฉ๋˜๋Š” ์˜ˆ์ธก๋“ค์ด ์ƒ๊น๋‹ˆ๋‹ค. ์ด๋“ค์„ ์ง€์ˆ˜ ๊ฐ€์ค‘ ํ‰๊ท ์œผ๋กœ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค:

a_t^{final} = \sum_{i} w_i \cdot a_t^{(i)} \quad \text{where} \quad w_i \propto \exp(-\lambda \cdot \Delta t_i)

์—ฌ๊ธฐ์„œ \Delta t_i๋Š” ํ•ด๋‹น ์˜ˆ์ธก์ด ์ƒ์„ฑ๋œ ํ›„ ๊ฒฝ๊ณผํ•œ ์‹œ๊ฐ„์ž…๋‹ˆ๋‹ค. ์ตœ๊ทผ ์˜ˆ์ธก์ผ์ˆ˜๋ก ๊ฐ€์ค‘์น˜๊ฐ€ ๋†’์Šต๋‹ˆ๋‹ค.

Vision Dropout ์ „๋žต: ์ด‰๊ฐ์˜ ๊ฐ€์น˜๋ฅผ ๊นจ๋‹ซ๊ฒŒ ํ•˜๊ธฐ

EyeSight Hand ๋…ผ๋ฌธ์˜ ์ค‘์š”ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์  ๊ธฐ์—ฌ๋Š” Vision Dropout ์ „๋žต์ž…๋‹ˆ๋‹ค.

๋ฌธ์ œ: ์‹œ๊ฐ์— ๋Œ€ํ•œ ๊ณผ์˜์กด

๋ชจ๋ฐฉ ํ•™์Šต์—์„œ ์‹œ๊ฐ ์ •๋ณด์™€ ์ด‰๊ฐ ์ •๋ณด๋ฅผ ๋ชจ๋‘ ์ œ๊ณตํ•˜๋ฉด, ๋ชจ๋ธ์€ ์‹œ๊ฐ์— ๊ณผ๋„ํ•˜๊ฒŒ ์˜์กดํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์™œ๋ƒํ•˜๋ฉด:

  1. ์‹œ๊ฐ์€ ์ „์—ญ์ (global) ์ •๋ณด๋ฅผ ์ œ๊ณตโ€”๋ฌผ์ฒด ์œ„์น˜, ์† ์ž์„ธ ๋“ฑ
  2. ์ด‰๊ฐ์€ ๊ตญ์†Œ์ (local) ์ •๋ณด๋งŒ ์ œ๊ณตโ€”์ ‘์ด‰์ ์˜ ํž˜, ๋ฏธ๋„๋Ÿฌ์ง ๋“ฑ
  3. ๋Œ€๋ถ€๋ถ„์˜ ์‹œ๊ฐ„์— ์‹œ๊ฐ๋งŒ์œผ๋กœ ์ถฉ๋ถ„ํ•œ ์ •๋ณด๊ฐ€ ์žˆ์Œ

๊ฒฐ๊ณผ์ ์œผ๋กœ, ์ด‰๊ฐ์ด ๊ฒฐ์ •์ ์œผ๋กœ ํ•„์š”ํ•œ ์ˆœ๊ฐ„(์˜ˆ: ๋šœ๊ป‘ ๋น„ํ‹€๊ธฐ)์— ๋ชจ๋ธ์ด ์ด‰๊ฐ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•˜์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค.

ํ•ด๊ฒฐ: ํ•™์Šต ์‹œ ์‹œ๊ฐ ๋“œ๋กญ์•„์›ƒ

Vision Dropout์€ ํ•™์Šต ์ค‘ ์ผ์ • ํ™•๋ฅ ๋กœ ์‹œ๊ฐ ์ž…๋ ฅ์„ ๋งˆ์Šคํ‚นํ•ฉ๋‹ˆ๋‹ค:

o_t^{visual} = \begin{cases} \text{RGB ์ด๋ฏธ์ง€} & \text{ํ™•๋ฅ  } 1-p \\ \mathbf{0} & \text{ํ™•๋ฅ  } p \end{cases}

์ด ๊ฐ„๋‹จํ•œ ๊ธฐ๋ฒ•์˜ ํšจ๊ณผ:

  • ๋ชจ๋ธ์ด ์ด‰๊ฐ๋งŒ์œผ๋กœ๋„ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šต
  • ์‹œ๊ฐ์ด ์žˆ์„ ๋•Œ๋Š” ์‹œ๊ฐ๊ณผ ์ด‰๊ฐ์„ ์ƒํ˜ธ๋ณด์™„์ ์œผ๋กœ ์‚ฌ์šฉ
  • ๊ฒฐ๊ณผ์ ์œผ๋กœ ์‹œ๊ฐ-์ด‰๊ฐ ์œตํ•ฉ ํ’ˆ์งˆ ํ–ฅ์ƒ

์ •์ฑ… ๋„คํŠธ์›Œํฌ ์ƒ์„ธ

EyeSight Hand์˜ ์ „์ฒด ์ •์ฑ… ๋„คํŠธ์›Œํฌ ์ž…๋ ฅ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

flowchart LR
    subgraph VISUAL["์‹œ๊ฐ ์ž…๋ ฅ"]
        GC["์ „์—ญ ์นด๋ฉ”๋ผ<br/>(480ร—640)"]
        WC["์†๋ชฉ ์–ด์•ˆ ์นด๋ฉ”๋ผ<br/>(480ร—640)"]
    end
    
    subgraph TACTILE["์ด‰๊ฐ ์ž…๋ ฅ"]
        T1["์—„์ง€ ์ด‰๊ฐ<br/>(480ร—640)"]
        T2["๊ฒ€์ง€ ์ด‰๊ฐ<br/>(480ร—640)"]
        T3["์ค‘์ง€ ์ด‰๊ฐ<br/>(480ร—640)"]
        T4["๊ฒ€์ง€ Proximal"]
        T5["์ค‘์ง€ Proximal"]
        T6["์†๋ฐ”๋‹ฅ 1"]
        T7["์†๋ฐ”๋‹ฅ 2"]
    end
    
    subgraph PROP["๊ณ ์œ ๊ฐ๊ฐ"]
        JP["๊ด€์ ˆ ์œ„์น˜<br/>(13 dim)"]
        RP["๋กœ๋ด‡ ํŒ” ์œ„์น˜<br/>(6 dim)"]
    end
    
    VISUAL --> RESNET["ResNet18<br/>ํŠน์ง• ์ถ”์ถœ"]
    TACTILE --> RESNET
    RESNET --> CONCAT["์—ฐ๊ฒฐ"]
    PROP --> CONCAT
    CONCAT --> POLICY["ACT ์ •์ฑ…"]
Figure 5: ์ •์ฑ… ๋„คํŠธ์›Œํฌ ์ž…๋ ฅ ๊ตฌ์กฐ

์ž…๋ ฅ ์š”์•ฝ:

Table 4: ์ •์ฑ… ๋„คํŠธ์›Œํฌ ์ž…๋ ฅ
๋ชจ๋‹ฌ๋ฆฌํ‹ฐ ์ฑ„๋„ ํ•ด์ƒ๋„/์ฐจ์› ์ฃผํŒŒ์ˆ˜
์ „์—ญ ์นด๋ฉ”๋ผ 1 480ร—640 30Hz
์†๋ชฉ ์นด๋ฉ”๋ผ 1 480ร—640 30Hz
์ด‰๊ฐ (ร—8) 8 480ร—640 30Hz
๊ด€์ ˆ ์œ„์น˜ - 13 1kHz
๋กœ๋ด‡ ํŒ” ์œ„์น˜ - 6 1kHz

์‹คํ—˜ ๋ฐ ๊ฒฐ๊ณผ

ํ‰๊ฐ€ ์ž‘์—… ์„ค๊ณ„

EyeSight Hand๋Š” ์„ธ ๊ฐ€์ง€ ๋„์ „์  ์ž‘์—…์—์„œ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ๊ฐ ์ž‘์—…์€ ๋‹ค๋ฅธ ์œ ํ˜•์˜ ์กฐ์ž‘ ๋Šฅ๋ ฅ์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค:

์ž‘์—… 1: ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ (Bottle Opening)

flowchart LR
    A["1. ์ ‘๊ทผ<br/>(Approach)"] --> B["2. ๋ณ‘ ๊ณ ์ •<br/>(Constrain)"]
    B --> C["3. ๋šœ๊ป‘ ํŒŒ์ง€<br/>(Grasp lid)"]
    C --> D["4. ๋น„ํ‹€๊ธฐ<br/>(Twist)"]
    D --> E["5. ์—ด๊ธฐ<br/>(Open)"]
    
    style C fill:#f9d5d3
    style D fill:#f9d5d3
Figure 6: ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ ์ž‘์—…์˜ ๋‹จ๊ณ„๋ณ„ ๋ถ„ํ•ด

์ด ์ž‘์—…์˜ ํ•ต์‹ฌ ๋„์ „:

  • Non-prehensile manipulation: ๋ณ‘์„ ๊ฒ€์ง€, ์ค‘์ง€, ์†๋ฐ”๋‹ฅ์œผ๋กœ โ€œ๋ˆŒ๋Ÿฌโ€ ๊ณ ์ •
  • ์ ‘์ด‰๋ ฅ ์กฐ์ ˆ: ๋šœ๊ป‘์— ์ถฉ๋ถ„ํ•œ ๋งˆ์ฐฐ๋ ฅ์„ ๊ฐ€ํ•˜๋ฉด์„œ๋„ ๋ฏธ๋„๋Ÿฌ์ง€์ง€ ์•Š๊ฒŒ
  • ์‹œ๊ฐ ๊ฐ€๋ฆผ(occlusion): ๋šœ๊ป‘ ๋น„ํ‹€๊ธฐ ๋‹จ๊ณ„์—์„œ ์†์ด ๋šœ๊ป‘์„ ๊ฐ€๋ฆผ

์ด‰๊ฐ์˜ ํ•„์ˆ˜์„ฑ: ๋šœ๊ป‘ ๋น„ํ‹€๊ธฐ ๋‹จ๊ณ„์—์„œ ์‹œ๊ฐ๋งŒ์œผ๋กœ๋Š” ์—„์ง€๊ฐ€ ๋šœ๊ป‘ ์œ„์— ์ œ๋Œ€๋กœ ์œ„์น˜ํ–ˆ๋Š”์ง€, ์ถฉ๋ถ„ํ•œ ํž˜์ด ๊ฐ€ํ•ด์ง€๊ณ  ์žˆ๋Š”์ง€ ์•Œ ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.

์ž‘์—… 2: ํ”Œ๋ผ์Šคํ‹ฐ์‹  ์ž๋ฅด๊ธฐ (Plasticine Cutting)

flowchart LR
    A["1. ์นผ ์ง‘๊ธฐ<br/>(Pick knife)"] --> B["2. ์ž์„ธ ์กฐ์ •<br/>(Reorient)"]
    B --> C["3. ์œ„์น˜ ์„ ์ •<br/>(Position)"]
    C --> D["4. ์ž๋ฅด๊ธฐ<br/>(Cut)"]
    
    style D fill:#f9d5d3
Figure 7: ํ”Œ๋ผ์Šคํ‹ฐ์‹  ์ž๋ฅด๊ธฐ ์ž‘์—…

์ด ์ž‘์—…์˜ ํ•ต์‹ฌ ๋„์ „:

  • ๋„๊ตฌ ์‚ฌ์šฉ(Tool use): ์† ์ž์ฒด๊ฐ€ ์•„๋‹Œ ๋„๊ตฌ๋กœ ํž˜ ์ „๋‹ฌ
  • ํž˜ ์กฐ์ ˆ: ํ”Œ๋ผ์Šคํ‹ฐ์‹ ์„ ์™„์ „ํžˆ ์ž๋ฅด๋˜, ํ…Œ์ด๋ธ”์„ ์†์ƒ์‹œํ‚ค์ง€ ์•Š๊ฒŒ
  • ์ •๋ฐ€ ๊ถค์ : ์ผ์ •ํ•œ ์†๋„๋กœ ์ง์„  ์ด๋™

์ž‘์—… 3: ์ ‘์‹œ ์ง‘์–ด ์˜ฎ๊ธฐ๊ธฐ (Plate Pick and Place)

flowchart LR
    A["1. ์ ‘๊ทผ<br/>(Approach)"] --> B["2. ์Šฌ๋ผ์ด๋”ฉ<br/>(Slide)"]
    B --> C["3. ๋“ค์–ด์˜ฌ๋ฆฌ๊ธฐ<br/>(Lift)"]
    C --> D["4. ์ด๋™<br/>(Transport)"]
    D --> E["5. ๋†“๊ธฐ<br/>(Place)"]
    
    style B fill:#f9d5d3
    style C fill:#f9d5d3
Figure 8: ์ ‘์‹œ ์ง‘์–ด ์˜ฎ๊ธฐ๊ธฐ ์ž‘์—…

์ด ์ž‘์—…์˜ ํ•ต์‹ฌ ๋„์ „:

  • Extrinsic dexterity: ํ…Œ์ด๋ธ” ํ‘œ๋ฉด์„ ํ™œ์šฉํ•˜์—ฌ ์ ‘์‹œ ๊ฐ€์žฅ์ž๋ฆฌ ํ™•๋ณด
  • ๋ฏธ๋„๋Ÿฌ์ง ๊ฐ์ง€: ์ ‘์‹œ๊ฐ€ ๋ฏธ๋„๋Ÿฌ์ง€๋Š” ์ˆœ๊ฐ„์„ ๊ฐ์ง€ํ•˜์—ฌ ์žฌํŒŒ์ง€
  • ์–‡๊ณ  ๊นจ์ง€๊ธฐ ์‰ฌ์šด ๋ฌผ์ฒด: ๊ณผ๋„ํ•œ ํž˜์œผ๋กœ ์ ‘์‹œ ํŒŒ์† ๋ฐฉ์ง€

์‹คํ—˜ ํ”„๋กœํ† ์ฝœ

๊ฐ ์ž‘์—…์— ๋Œ€ํ•ด ๋‹ค์Œ ์กฐ๊ฑด์œผ๋กœ ์‹คํ—˜ํ•ฉ๋‹ˆ๋‹ค:

๋ฐ์ดํ„ฐ ์ˆ˜์ง‘: ์ธ๊ฐ„ ์กฐ์ž‘์ž๊ฐ€ ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜์œผ๋กœ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘

์ •์ฑ… ๋ณ€ํ˜•:

Table 5: ํ‰๊ฐ€๋œ ์ •์ฑ… ๋ณ€ํ˜•
์ •์ฑ… ์•ฝ์–ด ์„ค๋ช…
Vision Only VO ์ด‰๊ฐ ์ž…๋ ฅ ์—†์ด ์‹œ๊ฐ๋งŒ ์‚ฌ์šฉ
Vision + Tactile VT ์‹œ๊ฐ๊ณผ ์ด‰๊ฐ ๋ชจ๋‘ ์‚ฌ์šฉ
Vision + Tactile + Augmentation VTA Vision Dropout ์ ์šฉ

ํ•™์Šต: ๊ฐ ์ž‘์—…๋‹น 50ํšŒ์˜ ์‹œ์—ฐ์œผ๋กœ ACT ์ •์ฑ… ํ•™์Šต

ํ‰๊ฐ€: 10ํšŒ ๋กค์•„์›ƒ์œผ๋กœ ์„ฑ๊ณต๋ฅ  ์ธก์ •

๊ฒฐ๊ณผ ๋ถ„์„

์ •๋Ÿ‰์  ๊ฒฐ๊ณผ

Table 6: ์ž‘์—…๋ณ„ ์„ฑ๊ณต๋ฅ  (%)
์ž‘์—… VO VT VTA ํ–ฅ์ƒ (VOโ†’VTA)
๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ 0% 0% 30% +30%p
ํ”Œ๋ผ์Šคํ‹ฐ์‹  ์ž๋ฅด๊ธฐ 40% 40% 70% +30%p
์ ‘์‹œ ์ง‘์–ด ์˜ฎ๊ธฐ๊ธฐ 50% 100% 100% +50%p

๊ฒฐ๊ณผ ํ•ด์„

๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ: ๊ฐ€์žฅ ์–ด๋ ค์šด ์ž‘์—…์œผ๋กœ, ์‹œ๊ฐ๋งŒ์œผ๋กœ๋Š” ์™„์ „ํžˆ ์‹คํŒจํ•ฉ๋‹ˆ๋‹ค. ์‹ฌ์ง€์–ด ์ด‰๊ฐ์„ ์ถ”๊ฐ€ํ•ด๋„(VT) ๊ฐœ์„ ์ด ์—†์Šต๋‹ˆ๋‹ค! ์ด๋Š” ๋ชจ๋ธ์ด ์ด‰๊ฐ ์ •๋ณด๋ฅผ ์ œ๋Œ€๋กœ ํ™œ์šฉํ•˜์ง€ ๋ชปํ•จ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. Vision Dropout(VTA)์„ ์ ์šฉํ•ด์•ผ ๋น„๋กœ์†Œ 30% ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

์‹คํŒจ ๋ชจ๋“œ ๋ถ„์„: - VO/VT: ๋šœ๊ป‘์— ์ ‘์ด‰ํ•˜์ง€ ์•Š๊ฑฐ๋‚˜, ์ž˜๋ชป๋œ ๋ฐฉํ–ฅ์œผ๋กœ ํž˜์„ ๊ฐ€ํ•จ - VTA (์‹คํŒจ ์‹œ): ์ดˆ๊ธฐ ํŒŒ์ง€๊ฐ€ ๋ถˆ์•ˆ์ •ํ•˜์—ฌ ๋น„ํ‹€๊ธฐ ์ค‘ ๋ฏธ๋„๋Ÿฌ์ง

ํ”Œ๋ผ์Šคํ‹ฐ์‹  ์ž๋ฅด๊ธฐ: ๋„๊ตฌ ์‚ฌ์šฉ ์ž‘์—…์—์„œ๋„ ์ด‰๊ฐ + Vision Dropout ์กฐํ•ฉ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. 70%๋กœ ๊ฐ€์žฅ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์ด์ง€๋งŒ, ์—ฌ์ „ํžˆ 30%๋Š” ์‹คํŒจํ•ฉ๋‹ˆ๋‹ค. ์ฃผ์š” ์‹คํŒจ ์›์ธ์€ ์นผ์ด ํ”Œ๋ผ์Šคํ‹ฐ์‹ ์„ ์™„์ „ํžˆ ๊ด€ํ†ตํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ ‘์‹œ ์ง‘์–ด ์˜ฎ๊ธฐ๊ธฐ: ์ด ์ž‘์—…์—์„œ ์ด‰๊ฐ์˜ ํšจ๊ณผ๊ฐ€ ๊ฐ€์žฅ ๊ทน์ ์ž…๋‹ˆ๋‹ค. VO์˜ 50%์—์„œ VT/VTA์˜ 100%๋กœ ๋„์•ฝํ•ฉ๋‹ˆ๋‹ค. ํฅ๋ฏธ๋กญ๊ฒŒ๋„, ์ด ์ž‘์—…์—์„œ๋Š” Vision Dropout ์—†์ด๋„ ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹คโ€”์•„๋งˆ๋„ ์Šฌ๋ผ์ด๋”ฉ ๋™์ž‘์—์„œ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์ด ๋งค์šฐ ์ง๊ด€์ ์ด๊ธฐ ๋•Œ๋ฌธ์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ด‰๊ฐ ์„ผ์‹ฑ์˜ ์—ญํ• ์— ๋Œ€ํ•œ ํ†ต์ฐฐ

์‹คํ—˜ ๊ฒฐ๊ณผ์—์„œ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ํ•ต์‹ฌ ํ†ต์ฐฐ:

  1. ์ด‰๊ฐ ์„ผ์‹ฑ ์ž์ฒด๋Š” ํ•„์š”์กฐ๊ฑด์ด์ง€ ์ถฉ๋ถ„์กฐ๊ฑด์ด ์•„๋‹˜: VT๊ฐ€ VO์™€ ๋™์ผํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์Œ (๋ณ‘๋šœ๊ป‘, ํ”Œ๋ผ์Šคํ‹ฐ์‹ )
  2. ๋ชจ๋ธ์ด ์ด‰๊ฐ์„ ํ™œ์šฉํ•˜๋„๋ก โ€œ๊ฐ•์ œโ€ํ•ด์•ผ ํ•จ: Vision Dropout์ด ์ด ์—ญํ• ์„ ์ˆ˜ํ–‰
  3. ์ž‘์—… ํŠน์„ฑ์— ๋”ฐ๋ผ ์ด‰๊ฐ์˜ ๊ธฐ์—ฌ๋„๊ฐ€ ๋‹ค๋ฆ„: ์ ‘์‹œ ์ž‘์—…์ฒ˜๋Ÿผ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์ด ์ง๊ด€์ ์ธ ๊ฒฝ์šฐ ์ž๋™์œผ๋กœ ํ™œ์šฉ๋จ
  4. QDD์˜ ์ปดํ”Œ๋ผ์ด์–ธ์Šค๊ฐ€ ํ•™์Šต์„ ์•ˆ์ •ํ™”: ์ˆ˜๋ฐฑ ํšŒ์˜ ์‹œํ–‰์ฐฉ์˜ค์—๋„ ํ•˜๋“œ์›จ์–ด ์†์ƒ ์—†์Œ

๋น„ํŒ์  ๊ณ ์ฐฐ

๊ฐ•์ 

ํ†ตํ•ฉ์  Co-Design: ๊ตฌ๋™, ์„ผ์‹ฑ, ๊ธฐ๊ตฌํ•™์˜ ๋™์‹œ ์ตœ์ ํ™”๋Š” ๋กœ๋ด‡ ์† ์„ค๊ณ„์˜ ์ƒˆ๋กœ์šด ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ๊ฐœ๋ณ„ ์š”์†Œ์˜ ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค, ์ „์ฒด ์‹œ์Šคํ…œ์˜ ์กฐํ™”๊ฐ€ ์ค‘์š”ํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์‹ค์šฉ์  ๋น„์šฉ: $2,500 ์ดํ•˜์˜ ๊ฐ€๊ฒฉ์€ ํ•™๊ณ„์—์„œ ์ถฉ๋ถ„ํžˆ ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ์ˆ˜์ค€์ž…๋‹ˆ๋‹ค. Shadow Hand์˜ 1/40, Allegro Hand์˜ 1/6 ๊ฐ€๊ฒฉ์ž…๋‹ˆ๋‹ค.

GelSim(ple)์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์นœํ™”์„ฑ: ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ์˜ ๊ฐ€์žฅ ํฐ ์•ฝ์ ์ธ sim-to-real gap์„ ์ค„์ผ ์ˆ˜ ์žˆ๋Š” ์‹ค์šฉ์  ์„ค๊ณ„์ž…๋‹ˆ๋‹ค.

Vision Dropout์˜ ๋‹จ์ˆœํ•จ๊ณผ ํšจ๊ณผ: ๋ณต์žกํ•œ attention ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด๋‚˜ ๋ณ„๋„์˜ fusion ๋ชจ๋“ˆ ์—†์ด, ๋‹จ์ˆœํ•œ ๋“œ๋กญ์•„์›ƒ๋งŒ์œผ๋กœ ์‹œ๊ฐ-์ด‰๊ฐ ์œตํ•ฉ์„ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค.

์•ฝ์  ๋ฐ ํ•œ๊ณ„

์ œํ•œ๋œ ์ž์œ ๋„: 7 DoF๋Š” ๋งŽ์€ ์กฐ์ž‘ ์ž‘์—…์— ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ in-hand manipulation(์† ์•ˆ์—์„œ ๋ฌผ์ฒด ํšŒ์ „ ๋“ฑ)์—๋Š” ๋” ๋งŽ์€ DoF๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

3์†๊ฐ€๋ฝ ๊ตฌ์„ฑ: ์•ฝ์ง€์™€ ์†Œ์ง€์˜ ๋ถ€์žฌ๋Š” power grasp์˜ ์•ˆ์ •์„ฑ์„ ์ œํ•œํ•ฉ๋‹ˆ๋‹ค. ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋‚˜ ํฐ ๋ฌผ์ฒด ์กฐ์ž‘์— ๋ถˆ๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

๋‚ฎ์€ ์„ฑ๊ณต๋ฅ : ๊ฐ€์žฅ ์–ด๋ ค์šด ์ž‘์—…(๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ)์—์„œ 30% ์„ฑ๊ณต๋ฅ ์€ ์‹ค์šฉ์  ์‘์šฉ์— ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. ๋ฌผ๋ก  ์ด๋Š” ์ •์ฑ… ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ•œ๊ณ„์ผ ์ˆ˜ ์žˆ์ง€๋งŒ, ํ•˜๋“œ์›จ์–ด๊ฐ€ ๋” ํ’๋ถ€ํ•œ ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ–ˆ๋‹ค๋ฉด ๊ฐœ์„ ๋  ์—ฌ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

์„ผ์„œ ํ•ด์ƒ๋„ vs ์ปค๋ฒ„๋ฆฌ์ง€ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„: 8๊ฐœ์˜ ์„ผ์„œ๊ฐ€ ์† ์ „์ฒด๋ฅผ ์ปค๋ฒ„ํ•˜์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ์†๊ฐ€๋ฝ ์ธก๋ฉด๊ณผ ์†๋“ฑ์€ ์„ผ์‹ฑ ์‚ฌ๊ฐ์ง€๋Œ€์ž…๋‹ˆ๋‹ค.

์‹ค์‹œ๊ฐ„ ์ฒ˜๋ฆฌ ๋ถ€๋‹ด: 8๊ฐœ์˜ 480ร—640 ์ด๋ฏธ์ง€๋ฅผ 30Hz๋กœ ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฒƒ์€ ์ƒ๋‹นํ•œ ๊ณ„์‚ฐ ์ž์›์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค.

์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ ๋ฐ ํ™•์žฅ์„ฑ

๋…ผ๋ฌธ์—์„œ ๋ช…์‹œ์ ์œผ๋กœ ๊ณต๊ฐœ๋œ ์ž๋ฃŒ:

  • ํ”„๋กœ์ ํŠธ ์›น์‚ฌ์ดํŠธ: https://eyesighthand.github.io/
  • ํ•˜๋“œ์›จ์–ด ์„ค๊ณ„๋„: (ํ™•์ธ ํ•„์š”)
  • ์ฝ”๋“œ: (ํ™•์ธ ํ•„์š”)

์žฌํ˜„์„ ์œ„ํ•ด ํ•„์š”ํ•œ ์ฃผ์š” ์š”์†Œ:

  1. ๊ธฐ๊ณ„ ๊ฐ€๊ณต: ๊ธˆ์† ๋ถ€ํ’ˆ(๋ชจํ„ฐ ๋งˆ์šดํŠธ ๋“ฑ)์€ CNC ๊ฐ€๊ณต ํ•„์š”
  2. 3D ํ”„๋ฆฐํŒ…: ์†๊ฐ€๋ฝ ์„ธ๊ทธ๋จผํŠธ, ์„ผ์„œ ํ•˜์šฐ์ง•
  3. ์ „์ž ๋ถ€ํ’ˆ: MJBOTS Moteus N1, Arducam ๋ชจ๋“ˆ ๋“ฑ
  4. ์กฐ๋ฆฝ ์ „๋ฌธ์„ฑ: QDD ์‹œ์Šคํ…œ๊ณผ ๋ฒจํŠธ ํ…์…”๋‹์€ ๊ฒฝํ—˜์ด ํ•„์š”ํ•จ

๊ด€๋ จ ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต

LEAP Hand์™€์˜ ๋น„๊ต

ํŠน์„ฑ EyeSight Hand LEAP Hand
DoF 7 16
๊ฐ€๊ฒฉ ~$2,500 ~$2,000
์ด‰๊ฐ ์„ผ์‹ฑ 8๊ฐœ GelSim(ple) ์—†์Œ
๊ตฌ๋™ ๋ฐฉ์‹ QDD + DC ์ง์ ‘ ๊ตฌ๋™
์ธ๊ฐ„ํ˜• ์ •๋„ ๋ณดํ†ต (3์†๊ฐ€๋ฝ) ๋†’์Œ (4์†๊ฐ€๋ฝ)

LEAP Hand๋Š” ๋” ๋งŽ์€ DoF์™€ ์ธ๊ฐ„ํ˜• ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง€์ง€๋งŒ, ์ด‰๊ฐ ์„ผ์‹ฑ์ด ์—†์Šต๋‹ˆ๋‹ค. EyeSight Hand๋Š” DoF๋ฅผ ํฌ์ƒํ•˜์—ฌ ์ด‰๊ฐ ์„ผ์‹ฑ์„ ํ†ตํ•ฉํ–ˆ์Šต๋‹ˆ๋‹ค.

GelSight ๊ณ„์—ด ์„ผ์„œ์™€์˜ ๋น„๊ต

์„ผ์„œ ํ˜•ํƒœ ์กฐ๋ช… ์ถœ๋ ฅ ์‹œ๋ฎฌ๋ ˆ์ด์…˜
GelSight (์›๋ณธ) ํ‰๋ฉด RGB ๋ฐฉํ–ฅ์„ฑ ๊นŠ์ด๋งต ์–ด๋ ค์›€
GelSlim ์Šฌ๋ฆผ ํ‰๋ฉด RGB ๋ฐฉํ–ฅ์„ฑ ๊นŠ์ด๋งต ์–ด๋ ค์›€
GelSight Wedge ์๊ธฐํ˜• RGB ๋ฐฉํ–ฅ์„ฑ ๊นŠ์ด๋งต ์–ด๋ ค์›€
Digit ์ปดํŒฉํŠธ RGB ๊นŠ์ด๋งต ๋ณดํ†ต
GelSim(ple) ๋‹ค์–‘ ๋น„๋ฐฉํ–ฅ์„ฑ ๊ทธ๋ ˆ์ด์Šค์ผ€์ผ ์‰ฌ์›€

GelSim(ple)์€ ๊นŠ์ด ๋งต ๋Œ€์‹  ๊ทธ๋ ˆ์ด์Šค์ผ€์ผ ์ด๋ฏธ์ง€๋ฅผ ์ถœ๋ ฅํ•˜์—ฌ ํ•ด์ƒ๋„ ์ •๋ณด๋ฅผ ์ผ๋ถ€ ํฌ๊ธฐํ•˜์ง€๋งŒ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์šฉ์ด์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

๋ฏธ๋ž˜ ๋ฐฉํ–ฅ ์ œ์•ˆ

ํ•˜๋“œ์›จ์–ด ๊ฐœ์„ 

DoF ํ™•์žฅ: ์•ฝ์ง€ ์ถ”๊ฐ€ ๋˜๋Š” ๊ธฐ์กด ์†๊ฐ€๋ฝ์˜ ๋‚ด์ „/์™ธ์ „ ์ž์œ ๋„ ์ถ”๊ฐ€๋ฅผ ํ†ตํ•ด ์กฐ์ž‘ ๋‹ค์–‘์„ฑ์„ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Š” ์„ผ์„œ ํ†ตํ•ฉ๊ณผ ์ œ์–ด ๋ณต์žก๋„ ์ฆ๊ฐ€๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

์„ผ์„œ ์ปค๋ฒ„๋ฆฌ์ง€ ํ™•๋Œ€: ์†๊ฐ€๋ฝ ์ธก๋ฉด์— ์ถ”๊ฐ€ ์„ผ์„œ๋ฅผ ๋ฐฐ์น˜ํ•˜๊ฑฐ๋‚˜, ์ „์ฒด ์†๋“ฑ์„ ์ปค๋ฒ„ํ•˜๋Š” ๋Œ€๋ฉด์  ์„ผ์„œ๋ฅผ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋” ๊ฐ€๋ฒผ์šด ์„ค๊ณ„: ํ˜„์žฌ ์„ค๊ณ„์—์„œ ์„ผ์„œ ๋ชจ๋“ˆ์˜ ๋ฌด๊ฒŒ๊ฐ€ ์ƒ๋‹น ๋ถ€๋ถ„์„ ์ฐจ์ง€ํ•ฉ๋‹ˆ๋‹ค. ์†Œํ˜•ํ™”๋œ ์นด๋ฉ”๋ผ ๋ชจ๋“ˆ๊ณผ ๋” ์–‡์€ ํƒ„์„ฑ์ฒด๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๊ด€์„ฑ์„ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ์„ 

๋‹ค์ค‘ ๋ชจ๋‹ฌ ํ‘œํ˜„ ํ•™์Šต: Vision Dropout์€ ํœด๋ฆฌ์Šคํ‹ฑํ•œ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์‹œ๊ฐ๊ณผ ์ด‰๊ฐ์˜ ์ƒํ˜ธ๋ณด์™„์  ํ‘œํ˜„์„ ํ•™์Šตํ•˜๋Š” contrastive learning์ด๋‚˜ mutual information maximization ๊ธฐ๋ฒ•์„ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ณ„์ธต์  ์ •์ฑ…: ์ €์ˆ˜์ค€ ์ด‰๊ฐ ๋ฐ˜์‚ฌ(์˜ˆ: ๋ฏธ๋„๋Ÿฌ์ง ๊ฐ์ง€ ์‹œ ํž˜ ์ฆ๊ฐ€)์™€ ๊ณ ์ˆ˜์ค€ ์ž‘์—… ๊ณ„ํš์„ ๋ถ„๋ฆฌํ•˜๋Š” ๊ณ„์ธต์  ๊ตฌ์กฐ๊ฐ€ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Sim-to-Real ์ „์ด: GelSim(ple)์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์šฉ์ด์„ฑ์„ ํ™œ์šฉํ•˜์—ฌ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ๋Œ€๊ทœ๋ชจ ํ•™์Šต ํ›„ ์‹ค์„ธ๊ณ„ ๋ฏธ์„ธ์กฐ์ • ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์‘์šฉ ํ™•์žฅ

ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡ ํ†ตํ•ฉ: EyeSight Hand์˜ ์ปดํŒฉํŠธํ•œ ์„ค๊ณ„์™€ QDD ๊ตฌ๋™์€ ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡์˜ ์†์œผ๋กœ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

์›๊ฒฉ ์กฐ์ž‘ ์‹œ์Šคํ…œ: ํ’๋ถ€ํ•œ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์€ ์›๊ฒฉ ์ˆ˜์ˆ ์ด๋‚˜ ์œ„ํ—˜ ํ™˜๊ฒฝ ์›๊ฒฉ ์กฐ์ž‘์— ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ณด์กฐ ๊ธฐ๊ธฐ: ์ €๋น„์šฉ๊ณผ ์ปดํ”Œ๋ผ์ด์–ธ์Šค๋Š” ์˜์ˆ˜(prosthetic hand) ์‘์šฉ์—๋„ ์œ ๋งํ•ฉ๋‹ˆ๋‹ค.

์š”์•ฝ ๋ฐ ๊ฒฐ๋ก 

EyeSight Hand๋Š” ๋กœ๋ด‡ ์† ์„ค๊ณ„์˜ ์„ธ ๊ฐ€์ง€ ํ•ต์‹ฌ ์š”์†Œโ€”์ปดํ”Œ๋ผ์ด์–ธ์Šค, ์ด‰๊ฐ ์„ผ์‹ฑ, ์ธ๊ฐ„ํ˜• ํ˜•ํƒœโ€”๋ฅผ $2,500 ์ดํ•˜์˜ ๋น„์šฉ์œผ๋กœ ํ†ตํ•ฉํ•œ ์˜๋ฏธ ์žˆ๋Š” ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. Quasi-Direct Drive ๊ตฌ๋™ ์‹œ์Šคํ…œ: ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ํž˜๊ณผ ์†๋„๋ฅผ ์ œ๊ณตํ•˜๋ฉด์„œ๋„ backdrivableํ•˜๊ณ  ๊ฐ•๊ฑดํ•œ ๊ตฌ๋™

  2. GelSim(ple) ์ด‰๊ฐ ์„ผ์„œ: ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์— ์ ์‘ ๊ฐ€๋Šฅํ•˜๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ์šฉ์ดํ•œ ์ƒˆ๋กœ์šด ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ

  3. Vision Dropout ํ•™์Šต ์ „๋žต: ๋‹จ์ˆœํ•˜์ง€๋งŒ ํšจ๊ณผ์ ์ธ ์‹œ๊ฐ-์ด‰๊ฐ ์œตํ•ฉ ๊ธฐ๋ฒ•

  4. ํ†ตํ•ฉ ์„ค๊ณ„ ํ”„๋ ˆ์ž„์›Œํฌ: ๊ตฌ๋™, ์„ผ์‹ฑ, ๊ธฐ๊ตฌํ•™์˜ co-design ๋ฐฉ๋ฒ•๋ก 

ํ•ต์‹ฌ ํ•œ๊ณ„

  1. ์ œํ•œ๋œ ์ž์œ ๋„ (7 DoF)๋กœ ์ธํ•œ ์กฐ์ž‘ ๋‹ค์–‘์„ฑ ์ œ์•ฝ
  2. ๊ฐ€์žฅ ์–ด๋ ค์šด ์ž‘์—…์—์„œ 30%์˜ ๋‚ฎ์€ ์„ฑ๊ณต๋ฅ 
  3. ์„ผ์„œ ์ปค๋ฒ„๋ฆฌ์ง€์˜ ํ•œ๊ณ„

๋กœ๋ด‡๊ณตํ•™์— ๋Œ€ํ•œ ์‹œ์‚ฌ์ 

EyeSight Hand๊ฐ€ ๋ณด์—ฌ์ฃผ๋Š” ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ตํ›ˆ์€, ์ด‰๊ฐ ์„ผ์‹ฑ์˜ ๊ฐ€์น˜๋Š” ๊ทธ๊ฒƒ์„ ํ™œ์šฉํ•˜๋„๋ก ํ•™์Šต ์‹œ์Šคํ…œ์„ ์„ค๊ณ„ํ•ด์•ผ๋งŒ ๋ฐœํ˜„๋œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ์„ผ์„œ๋ฅผ ์ถ”๊ฐ€ํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋Š” ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค.

๋˜ํ•œ, ํ•˜๋“œ์›จ์–ด์™€ ์†Œํ”„ํŠธ์›จ์–ด์˜ co-design์ด ๊ฐ๊ฐ์˜ ๊ฐœ๋ณ„ ์ตœ์ ํ™”๋ณด๋‹ค ๋” ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ๋‚ผ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. GelSim(ple)์˜ ์กฐ๋ช… ์„ค๊ณ„๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์šฉ์ด์„ฑ์„ ์œ„ํ•ด ํ•ด์ƒ๋„๋ฅผ ์ผ๋ถ€ ํฌ๊ธฐํ–ˆ์ง€๋งŒ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋” ์‹ค์šฉ์ ์ธ ์‹œ์Šคํ…œ์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ๋กœ๋ด‡ ํ•™์Šต ์—ฐ๊ตฌ์—์„œ ํ•˜๋“œ์›จ์–ด์˜ ์ค‘์š”์„ฑ์„ ์ƒ๊ธฐ์‹œ์ผœ์ค๋‹ˆ๋‹ค. ์•„๋ฌด๋ฆฌ ์ข‹์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋„ ์ ์ ˆํ•œ ์„ผ์‹ฑ๊ณผ ๊ตฌ๋™ ์—†์ด๋Š” ๋ณต์žกํ•œ ์กฐ์ž‘์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. EyeSight Hand๋Š” ๊ทธ ๊ท ํ˜•์ ์„ ์ฐพ์œผ๋ ค๋Š” ์˜๋ฏธ ์žˆ๋Š” ์‹œ๋„์ž…๋‹ˆ๋‹ค.

์ฐธ๊ณ  ๋ฌธํ—Œ

  • Romero, B., Fang, H.-S., Agrawal, P., & Adelson, E. (2024). EyeSight Hand: Design of a Fully-Actuated Dexterous Robot Hand with Integrated Vision-Based Tactile Sensors and Compliant Actuation. IROS 2024.
  • Zhao, T. Z., Kumar, V., Levine, S., & Finn, C. (2023). Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware. RSS 2023.
  • Shaw, K. (2023). LEAP Hand: Low-Cost, Efficient, and Anthropomorphic Hand for Robot Learning. RSS 2023.
  • Yuan, W., et al. (2017). GelSight: High-Resolution Robot Tactile Sensors for Estimating Geometry and Force. Sensors.

โ›๏ธ Dig Review

โ›๏ธ Dig โ€” Go deep, uncover the layers. Dive into technical detail.

EyeSight Hand: ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ํ†ตํ•ฉํ•œ ์ปดํ”Œ๋ผ์ด์–ธํŠธ ์™„์ „๊ตฌ๋™ ๋กœ๋ด‡ ์† (์‹ฌ์ธต ๋ฆฌ๋ทฐ)

์„œ๋ก : ์ธ๊ฐ„ ์†์˜ ์ง€๋Šฅ์„ ๋กœ๋ด‡์— ๋‹ด๊ธฐ ์œ„ํ•œ ๋„์ „

์ธ๊ฐ„์˜ ์†์€ ์ •๊ตํ•œ ๊ตฌ์กฐ์™€ ์œ ์—ฐํ•œ ๊ตฌ๋™ ๊ทธ๋ฆฌ๊ณ  ์ด‰๊ฐ ์„ผ์‹ฑ์˜ ์ ˆ๋ฌ˜ํ•œ ๊ฒฐํ•ฉ์œผ๋กœ ๋†€๋ผ์šด ๋‹ค์žฌ๋‹ค๋Šฅํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ˆ˜์‹ญ ๊ฐœ์˜ ๊ด€์ ˆ๊ณผ ๊ทผ์œก, ํž˜์ค„์ด ๋งŒ๋“ค์–ด๋‚ด๋Š” ํƒ„์„ฑ์  ์›€์ง์ž„ ๋•๋ถ„์— ์šฐ๋ฆฌ๋Š” ๊ณ„๋ž€๊ป์งˆ์ฒ˜๋Ÿผ ์—ฐ์•ฝํ•œ ๋ฌผ์ฒด๋ถ€ํ„ฐ ๋‹จ๋‹จํ•œ ๋„๊ตฌ๊นŒ์ง€ ์„ฌ์„ธํ•˜๊ฑฐ๋‚˜ ๊ฐ•๋ ฅํ•˜๊ฒŒ ์กฐ์ž‘ํ•  ์ˆ˜ ์žˆ์ฃ . ๋˜ํ•œ ์†๋ฐ”๋‹ฅ๊ณผ ์†๊ฐ€๋ฝ ๊ณณ๊ณณ์— ๋ถ„ํฌํ•œ ๋†’์€ ๋ฐ€๋„์˜ ์ด‰๊ฐ ์ˆ˜์šฉ๊ธฐ๋Š” ์ ‘์ด‰ํ•œ ๋ฌผ์ฒด์˜ ๋ชจ์–‘๊ณผ ํž˜์„ ๊ฐ์ง€ํ•˜์—ฌ ์ •๋ฐ€ ์ œ์–ด๋ฅผ ๊ฐ€๋Šฅ์ผ€ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณตํ•ฉ์ ์ธ ๋Šฅ๋ ฅ์„ ๊ธฐ๊ณ„๋กœ ๊ตฌํ˜„ํ•˜๋Š” ๊ฒƒ์€ ๋กœ๋ด‡๊ณตํ•™์˜ ์˜ค๋žœ ๋„์ „ ๊ณผ์ œ์˜€์Šต๋‹ˆ๋‹ค.

๊ธฐ์กด์˜ ๋กœ๋ด‡ ์† ์—ฐ๊ตฌ๋“ค์€ ์ธ๊ฐ„ ์†์˜ ์ผ๋ถ€ ์ธก๋ฉด๋งŒ์„ ๋ชจ๋ฐฉํ•ด์™”์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์™„์ „ ๊ตฌ๋™(fully-actuated) ๋กœ๋ด‡ ์†๋“ค์€ ๋ชจ๋“  ๊ด€์ ˆ์„ ๋ชจํ„ฐ๋กœ ์›€์ง์ด์ง€๋งŒ ๋†’์€ ๊ธฐ์–ด ๊ฐ์†๋น„๋กœ ์ธํ•ด ์—ญ๊ตฌ๋™์„ฑ(backdrivability)์ด ๋‚ฎ๊ณ  ์™ธ๋ถ€ ํž˜์— ์ˆœ์‘ํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•˜์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ถฉ๋Œ์ด๋‚˜ ์™ธ๋ ฅ์— ์ทจ์•ฝํ•˜๊ณ  ์œ ์—ฐํ•œ ์กฐ์ž‘์— ํ•œ๊ณ„๋ฅผ ์ฃผ์ฃ . ๋ฐ˜๋Œ€๋กœ, ๊ณต๊ธฐ์••์ด๋‚˜ ์†Œํ”„ํŠธ ์†Œ์žฌ๋กœ ๋งŒ๋“  ์œ ์—ฐ ์†(soft hand)๋“ค์€ ์ถฉ๊ฒฉ์—๋Š” ๊ฐ•ํ•˜์ง€๋งŒ ์ •๊ตํ•œ ์ œ์–ด๊ฐ€ ์–ด๋ ต๊ณ , ๋งŽ์€ ์ž์œ ๋„๋ฅผ ๋…๋ฆฝ์ ์œผ๋กœ ๊ตฌ๋™ํ•˜์ง€ ๋ชปํ•˜๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์† ์ „์ฒด์— ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ๋นฝ๋นฝ์ด ๋„ฃ๋Š” ๊ฒƒ์€ ๋”์šฑ ์–ด๋ ค์›Œ์„œ, ๊ธฐ์กด์—๋Š” ์†๊ฐ€๋ฝ ๋ ์ผ๋ถ€์— ์ €ํ•ด์ƒ๋„ ์„ผ์„œ๋ฅผ ๋ถ™์ด๋Š” ์ •๋„์— ๊ทธ์น˜๊ฑฐ๋‚˜ ์•„์˜ˆ ์ด‰๊ฐ ์—†์ด ์‹œ๊ฐ์— ์˜์กดํ•œ ์‚ฌ๋ก€๊ฐ€ ๋งŽ์•˜์Šต๋‹ˆ๋‹ค. Denseํ•œ ์ด‰๊ฐ์ •๋ณด๋ฅผ ์–ป๊ธฐ ์œ„ํ•œ ์‹œ๊ฐ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ(์˜ˆ: GelSight)๋ฅผ ์†์— ์ ์šฉํ•˜๋ ค๋Š” ์‹œ๋„๋„ ์žˆ์—ˆ์ง€๋งŒ, ๋Œ€์ฒด๋กœ 2~3์ž์œ ๋„์˜ ๊ฐ„๋‹จํ•œ ๊ทธ๋ฆฌํผ๋‚˜ ์†๋์— ์ œํ•œ์ ์œผ๋กœ ๋ถ€์ฐฉํ•˜๋Š” ์ˆ˜์ค€์ด์—ˆ์ฃ .

์™œ ์ด๋Ÿฐ ์š”์†Œ๋“ค์ด ์ค‘์š”ํ• ๊นŒ์š”? ๋กœ๋ด‡์ด ์ธ๊ฐ„์ฒ˜๋Ÿผ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๋ ค๋ฉด ์ถฉ๋Œ์ด๋‚˜ ํฐ ํž˜์—๋„ ๋ถ€์„œ์ง€์ง€ ์•Š๋Š” ํ•˜๋“œ์›จ์–ด์  ํƒ„์„ฑ์ด ํ•„์š”ํ•˜๊ณ , ์ •๋ฐ€ํ•œ ์กฐ์ž‘์—๋Š” ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ธ๊ฐ„ ์†๊ณผ ์œ ์‚ฌํ•œ ํ˜•ํƒœ์™€ ์›€์ง์ž„ ๋ฒ”์œ„๋ฅผ ๊ฐ€์ง€๋ฉด ์‚ฌ๋žŒ์ด ์ง์ ‘ ๋กœ๋ด‡ ์†์„ ์กฐ์ข…(teleoperation)ํ•˜์—ฌ ์‹œ๋ฒ”์„ ๋ณด์ด๊ฑฐ๋‚˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ธฐ๋„ ์ˆ˜์›”ํ•ฉ๋‹ˆ๋‹ค. ์ตœ๊ทผ ์ธ๊ณต์ง€๋Šฅ ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์œผ๋กœ ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ๋ณต์žกํ•œ ์กฐ์ž‘์„ ํ•™์Šตํ•˜๊ฒŒ ํ•˜๋ ค๋ฉด, ๋Œ€๋Ÿ‰์˜ ์‹œ๋ฒ” ๋ฐ์ดํ„ฐ์™€ ์‹คํ—˜์„ ๋ฒ„ํ…จ๋‚ผ ํŠผํŠผํ•˜๊ณ  ๋ฏผ๊ฐํ•œ ๋กœ๋ด‡ ์†์ด ์š”๊ตฌ๋ฉ๋‹ˆ๋‹ค.

EyeSight Hand๋Š” ์ด๋Ÿฌํ•œ ์š”๊ตฌ๋ฅผ ๋ชจ๋‘ ๋งŒ์กฑ์‹œํ‚ค๋ ค๋Š” ์•ผ์‹ฌ์ฐฌ ์‹œ๋„๋กœ ๋“ฑ์žฅํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์—์„œ๋Š” MIT์™€ Toyota Research Institute ์—ฐ๊ตฌ์ง„์ด ๊ฐœ๋ฐœํ•œ 7์ž์œ ๋„(7-DoF)์˜ ์ธ๊ฐ„ํ˜• ๋กœ๋ด‡ ์† EyeSight Hand๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ์ด ๋กœ๋ด‡ ์†์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํŠน์ง•๊ณผ ๊ธฐ์—ฌ๋ฅผ ๋‚ด์„ธ์šฐ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค:

  • ์ค€-์ง์ ‘ ๊ตฌ๋™(quasi-direct drive) ๋ฐฉ์‹์„ ์ธ๊ฐ„ํ˜• ์†์— ํ†ตํ•ฉํ•˜์—ฌ, ๋†’์€ ํž˜๊ณผ ์†๋„๋ฅผ ๋‚ด๋ฉด์„œ๋„ ํƒ„๋ ฅ์ (compliant)์œผ๋กœ ์›€์ง์ด๋Š” ๊ตฌ๋™๊ณ„๋ฅผ ์„ค๊ณ„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‰ฝ๊ฒŒ ๋งํ•ด, ์‚ฌ๋žŒ ์†๊ฐ€๋ฝ์ฒ˜๋Ÿผ ์™ธ๋ ฅ์ด ๊ฐ€ํ•ด์ง€๋ฉด ์ ์ ˆํžˆ โ€œ๋ฌผ๋Ÿฌ์ฃผ๋ฉฐโ€ ๋ถ€์„œ์ง€์ง€ ์•Š๊ณ , ๋‹ค์‹œ ๋น ๋ฅด๊ฒŒ ์ œ์ž๋ฆฌ๋กœ ์›€์ง์ผ ์ˆ˜ ์žˆ๋Š” ์†๊ฐ€๋ฝ์ž…๋‹ˆ๋‹ค.
  • ์ƒˆ๋กœ์šด ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ์ธ GelSim(ple)์„ ์„ค๊ณ„ํ•˜์—ฌ, ์†๊ฐ€๋ฝ๊ณผ ์†๋ฐ”๋‹ฅ์„ ํฌํ•จํ•œ ์† ์ „์ฒด 8๊ตฐ๋ฐ์— ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์„ผ์‹ฑ์„ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์œผ๋กœ ์น˜๋ฉด ์† ๋๋ฟ ์•„๋‹ˆ๋ผ ์†๋ฐ”๋‹ฅ๊นŒ์ง€ ํ”ผ๋ถ€ ๊ฐ๊ฐ์„ ๋ถ€์—ฌํ•œ ์…ˆ์ž…๋‹ˆ๋‹ค. ์ด ์„ผ์„œ๋Š” ์ด์ „ ์„ธ๋Œ€ GelSight ์ˆ˜์ค€์˜ ๋ฏผ๊ฐ๋„๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ ์—ฌ๋Ÿฌ ๊ณก๋ฉด ํ˜•ํƒœ์— ๋งž๊ฒŒ ์ ์šฉํ•  ์ˆ˜ ์žˆ๊ณ , ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ๋„ ์žฌํ˜„ํ•˜๊ธฐ ์‰ฝ๊ฒŒ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค.
  • ์ด๋Ÿฌํ•œ ๊ตฌ๋™๊ณ„์™€ ์„ผ์„œ๋ฅผ ํ†ตํ•ฉํ•˜๋ฉด์„œ๋„ ์†์˜ ํฌ๊ธฐ์™€ ํ˜•ํƒœ๋ฅผ ์ธ๊ฐ„ ์†๊ณผ ๊ฐ€๊น๊ฒŒ ๋””์ž์ธํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๋ณต์žกํ•œ ์ขŒํ‘œ ๋ณ€ํ™˜ ์—†์ด๋„ ์‚ฌ๋žŒ ์†์˜ ๋™์ž‘์„ ๋กœ๋ด‡ ์†์— ์ง๊ด€์ ์œผ๋กœ ๋Œ€์‘์‹œํ‚ฌ ์ˆ˜ ์žˆ์–ด, ํŠน๋ณ„ํ•œ ์žฅ์น˜๋‚˜ ๋ณต์žกํ•œ ์—ฐ์‚ฐ ์—†์ด๋„ ์žฅ๊ฐ‘์„ ๋ผ๊ณ  ๋ฐ”๋กœ ๋กœ๋ด‡ ์†์„ ์›๊ฒฉ ์กฐ์ž‘ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋์œผ๋กœ, EyeSight Hand์˜ ๋Šฅ๋ ฅ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ์„ธ ๊ฐ€์ง€ ๋„์ „์  ์ž‘์—…(์ผ€์ฐน ๋ณ‘ ๋šœ๊ป‘ ์—ด๊ธฐ, ์ ‘์‹œ ๋ฐ€์–ด ์ง‘์–ด ์˜ฎ๊ธฐ๊ธฐ, ๊ณต์ž‘์šฉ ์ ํ†  ์ž๋ฅด๊ธฐ)์„ ์„ค๊ณ„ํ•˜์—ฌ ์ˆ˜๋ฐฑ ํšŒ์— ์ด๋ฅด๋Š” ์‹คํ—˜์„ ์ง„ํ–‰ํ–ˆ๊ณ , ์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ๋ชจ๋ฐฉ ํ•™์Šต(imitation learning) ๊ธฐ๋ฐ˜์˜ ์ œ์–ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ›ˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ํ•™์Šต ๊ณผ์ •์—์„œ ์‹œ๊ฐ ์ •๋ณด ๋“œ๋กญ์•„์›ƒ(vision dropout)์ด๋ผ๋Š” ๊ธฐ๋ฒ•์„ ๋„์ž…ํ•˜์—ฌ, ๋กœ๋ด‡์ด ์ด‰๊ฐ ์ •๋ณด์— ์˜์กดํ•˜๋„๋ก ์œ ๋„ํ•˜์˜€๊ณ , ๊ทธ ๊ฒฐ๊ณผ ์ด‰๊ฐ ํ†ตํ•ฉ์˜ ํšจ๊ณผ๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

๋ณธ ๋ฆฌ๋ทฐ์—์„œ๋Š” EyeSight Hand ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ๋‚ด์šฉ๊ณผ ๊ทธ ์˜๋ฏธ๋ฅผ ๋กœ๋ด‡๊ณตํ•™์ž์˜ ์‹œ๊ฐ์—์„œ ๊นŠ์ด ์žˆ๊ฒŒ ๋ถ„์„ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ์šฐ์„  ํ•˜๋“œ์›จ์–ด ์„ค๊ณ„์™€ ์ด‰๊ฐ ์„ผ์„œ ๊ธฐ์ˆ ์„ ์‚ดํŽด๋ณธ ๋’ค, ์ œ์–ด ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ํ•™์Šต ๋ฐฉ๋ฒ•์„ ๋“ค์—ฌ๋‹ค๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ด์–ด์„œ ์‹คํ—˜ ์„ค์ •๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์†Œ๊ฐœํ•˜๋ฉฐ, ๋งˆ์ง€๋ง‰์œผ๋กœ ์ด ์ ‘๊ทผ์˜ ๊ฐ•์ ๊ณผ ํ•œ๊ณ„๋ฅผ ์งš์–ด๋ณด๊ณ  ํ–ฅํ›„ ๋ฐœ์ „ ๊ฐ€๋Šฅ์„ฑ์„ ๋…ผ์˜ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. Richard Feynman ๊ต์ˆ˜๊ฐ€ ๋ณต์žกํ•œ ๊ฐœ๋…์„ ์•Œ๊ธฐ ์‰ฝ๊ฒŒ ํ’€์–ด์ฃผ๋“ฏ, ์ตœ๋Œ€ํ•œ ์นœ์ ˆํ•˜๊ณ  ์ง๊ด€์ ์ธ ์„ค๋ช…์„ ๊ณ๋“ค์—ฌ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๋ฐฉ๋ฒ•: EyeSight Hand์˜ ์„ค๊ณ„์™€ ์ œ์–ด ๊ธฐ๋ฒ•

EyeSight Hand์˜ ๊ตฌ์กฐ ์„ค๊ณ„์™€ ์ค€-์ง์ ‘ ๊ตฌ๋™

EyeSight Hand์˜ ๋ชฉํ‘œ๋Š” ์ธ๊ฐ„ ์†์˜ ์šด๋™ ๋ฒ”์œ„์™€ ํž˜, ํƒ„์„ฑ์„ ์ตœ๋Œ€ํ•œ ๊ตฌํ˜„ํ•˜๋ฉด์„œ๋„ ๋‚ด๊ตฌ์„ฑ๊ณผ ์ •๋ฐ€ ์ œ์–ด๋ฅผ ์–‘๋ฆฝํ•˜๋Š” ๊ฒƒ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์—ฐ๊ตฌ์ง„์€ ์ธ๊ฐ„ ์†์˜ ์šด๋™ํ•™์  ๊ตฌ์กฐ๋ฅผ ๋ฉด๋ฐ€ํžˆ ๋ถ„์„ํ•˜๊ณ  ์ผ๋ถ€ ์ ˆ์ถฉ์„ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„ ์†์€ ๊ฐ ์†๊ฐ€๋ฝ์— ์—ฌ๋Ÿฌ ๊ด€์ ˆ์ด ์žˆ์ง€๋งŒ, EyeSight Hand์—์„œ๋Š” ์„ค๊ณ„ ๋‹จ์ˆœํ™”๋ฅผ ์œ„ํ•ด ์ผ๋ถ€ ๊ด€์ ˆ์„ ์ƒ๋žตํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๊ฒ€์ง€์™€ ์ค‘์ง€์—๋Š” ๊ตฝํž˜ ๊ด€์ ˆ์ธ PIP(๊ทผ์œ„์ง€์ ˆ๊ด€์ ˆ)๋งŒ ์›€์ง์ด๊ณ  ๊ทธ ๋ ๋งˆ๋”” DIP(์›์œ„์ง€์ ˆ๊ด€์ ˆ)๋Š” ๊ณ ์ •๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์ด๋“ค ์†๊ฐ€๋ฝ์˜ ์˜†์œผ๋กœ ๋ฒŒ๋ฆฌ๋Š” ๊ด€์ ˆ(MCP์˜ ์ธก๋ฉด ํšŒ์ „)๋„ ์—†์Šต๋‹ˆ๋‹ค. ์—„์ง€์˜ ๊ฒฝ์šฐ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, ์†๋ฐ”๋‹ฅ๊ณผ ๋งŒ๋‚˜๋Š” ๊ธฐ์ € ๊ด€์ ˆ(MCP)์„ ์ƒ๋žตํ•˜๊ณ  ์—„์ง€ ๋๋งˆ๋””(IP)์™€ ์†๋ชฉ ์ชฝ ์•ˆ์žฅ๊ด€์ ˆ(TM)๋งŒ์„ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ ˆ์ถฉ์œผ๋กœ EyeSight Hand๋Š” ์ด 7๊ฐœ์˜ ์ž์œ ๋„๋ฅผ ๊ฐ–์Šต๋‹ˆ๋‹ค (๊ฒ€์ง€ 2, ์ค‘์ง€ 2, ์—„์ง€ 3). ๋น„๋ก ์ธ๊ฐ„ ์†๋ณด๋‹ค ๊ด€์ ˆ ์ˆ˜๋Š” ์ค„์—ˆ์ง€๋งŒ, ํ•ต์‹ฌ์ ์ธ ์ง‘๊ธฐ์™€ ์ฅ๊ธฐ ๋™์ž‘์„ ์žฌํ˜„ํ•˜๊ธฐ์—๋Š” ์ถฉ๋ถ„ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ตฌ๋™๊ณ„(Actuation)๋Š” EyeSight Hand์˜ ๊ฐ€์žฅ ํฐ ํ˜์‹  ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ์‚ฌ๋žŒ ์†๊ฐ€๋ฝ์„ ๊ฐ€๋งŒํžˆ ๋ˆŒ๋Ÿฌ๋ณด๋ฉด, ๋๋งˆ๋”” ๊ด€์ ˆ์€ ๋น„๊ต์  ๋ปฃ๋ปฃํ•˜๊ฒŒ ๋ฒ„ํ‹ฐ์ง€๋งŒ ์†๊ฐ€๋ฝ ๋ฟŒ๋ฆฌ ๊ด€์ ˆ์€ ๋ฌผ๋Ÿฌ๋‚˜๋Š” ๊ฒƒ์„ ๋А๋‚„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ชจ๋ฐฉํ•˜์—ฌ, EyeSight Hand๋Š” ํ•œ ์†๊ฐ€๋ฝ์— ๋‘ ์ข…๋ฅ˜์˜ ๋ชจํ„ฐ๋ฅผ ์ง๋ ฌ๋กœ ๋ฐฐ์น˜ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ž‘์€ DC ๋ชจํ„ฐ๊ฐ€ ๊ณ ๊ฐ์†๋น„์˜ ์›œ๊ธฐ์–ด(worm gear)๋ฅผ ๊ตฌ๋™ํ•˜์—ฌ ์†๊ฐ€๋ฝ์˜ PIP/IP ๊ด€์ ˆ์„ ์›€์ง์ด๊ณ , ํฐ BLDC ๋ชจํ„ฐ๊ฐ€ ๋‚ฎ์€ ๊ฐ์†๋น„(5.23:1)์˜ ํ”Œ๋ž˜๋‹ˆํ„ฐ๋ฆฌ ๊ธฐ์–ด๋ฅผ ํ†ตํ•ด MCP/TM ๊ด€์ ˆ์„ ์›€์ง์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๊ตฌ์„ฑ์—์„œ ์†๊ฐ€๋ฝ ๋ ๊ด€์ ˆ(PIP/IP)์€ ์›œ๊ธฐ์–ด์˜ ์ž๊ธฐ์ž ๊ธˆ ํŠน์„ฑ ๋•๋ถ„์— ์™ธ๋ ฅ์— ์‰ฝ๊ฒŒ ๋ฐ€๋ฆฌ์ง€ ์•Š๊ณ  ๋ฒ„ํ‹ฐ๋Š” ๋ฐ˜๋ฉด, ์†๊ฐ€๋ฝ ๋ฟŒ๋ฆฌ ๊ด€์ ˆ(MCP/TM)์€ ๋‚ฎ์€ ๊ฐ์†๋น„ BLDC ๋•๋ถ„์— ์™ธ๋ ฅ์— ๋Œ€ํ•ด ์‰ฝ๊ฒŒ ์–‘๋ณดํ•˜๋ฉฐ ๋’ค๋กœ ๋Œ์•„๊ฐ€๋Š” ํƒ„์„ฑ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ๋งˆ์น˜ ์†๊ฐ€๋ฝ ๋์€ ๋‹จ๋‹จํžˆ ์žก๊ณ , ์†๊ฐ€๋ฝ ๋ฟŒ๋ฆฌ๋Š” ์Šคํ”„๋ง์ฒ˜๋Ÿผ ์ถฉ๊ฒฉ์„ ํก์ˆ˜ํ•˜๋Š” ํšจ๊ณผ๋ฅผ ๋‚ธ ๊ฒƒ์ด์ฃ . ์ด๋Ÿฌํ•œ ์ค€-์ง์ ‘ ๊ตฌ๋™ ๋ฐฉ์‹์€ ์†์— ๊ฐ€ํ•ด์ง€๋Š” ํฐ ํž˜์„ ๋ชจํ„ฐ์— ๋ถ„์‚ฐ์‹œํ‚ค๋ฏ€๋กœ ๊ณ ์žฅ์— ๊ฐ•ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์›œ๊ธฐ์–ด๋Š” ๋†’์€ ๊ฐ์†๋น„๋กœ ํฐ ํ† ํฌ๋ฅผ ์ž‘์€ ๊ณต๊ฐ„์—์„œ ์ œ๊ณตํ•˜๋ฉฐ ์Šค์Šค๋กœ ์ž ๊ฒจ(PIP ๊ด€์ ˆ ๊ณ ์ •) ์ถฉ๊ฒฉ์„ BLDC๋กœ ์ „๋‹ฌํ•ด์ค๋‹ˆ๋‹ค. BLDC ๋ชจํ„ฐ๋Š” ๋‚ฎ์€ ๊ธฐ์–ด๋น„๋กœ ์ธํ•ด ๋งˆ์ฐฐ๊ณผ ๊ด€์„ฑ์ด ์ž‘์•„ ์™ธ๋ ฅ์— ์ˆœ์‘ํ•˜๊ณ  ์—ญ๋ฐฉํ–ฅ ๊ตฌ๋™์ด ์šฉ์ดํ•˜๋ฉฐ, ํ”Œ๋ž˜๋‹ˆํ„ฐ๋ฆฌ ๊ธฐ์–ด ๊ตฌ์กฐ๋กœ ํ•˜์ค‘์„ ์—ฌ๋Ÿฌ ๊ธฐ์–ด์— ๋ถ„์‚ฐํ•˜์—ฌ ๋‚ด๊ตฌ์„ฑ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ์š”์•ฝํ•˜๋ฉด, ์ž‘์€ ๋ชจํ„ฐ+์›œ๊ธฐ์–ด ์กฐํ•ฉ์ด ๊ฐ•์ธํ•œ ํž˜๊ณผ ๊ณ ์ •์„ฑ์„, ํฐ ๋ชจํ„ฐ+์ €๊ฐ์† ๊ธฐ์–ด๊ฐ€ ๋น ๋ฅธ ์‘๋‹ต์„ฑ๊ณผ ํƒ„์„ฑ์„ ๋‹ด๋‹นํ•˜๋Š” ์ด์› ๊ตฌ์กฐ์ž…๋‹ˆ๋‹ค.

๊ทธ๋ฆผ 1: EyeSight Hand์˜ ๊ธฐ๊ณ„์  ์„ค๊ณ„. (a) ์ธ๊ฐ„ ์†๊ณผ EyeSight Hand์˜ ํฌ๊ธฐ ๋น„๊ต โ€“ ์ธ๊ฐ„ ์†์— ๋น„ํ•ด ์•ฝ๊ฐ„ ์ž‘์ง€๋งŒ ๋น„์Šทํ•œ ๋น„์œจ์„ ๊ฐ€์ง. (b) EyeSight Hand์˜ ์™ธํ˜•๊ณผ ์ฃผ์š” ์น˜์ˆ˜. (c) ๊ฒ€์ง€/์ค‘์ง€์˜ ๋‚ด๋ถ€ ๊ตฌ์กฐ: ์ดˆ๋ก์ƒ‰์œผ๋กœ ํ‘œ์‹œ๋œ ์ž‘์€ DC ๋ชจํ„ฐ+์›œ๊ธฐ์–ด๊ฐ€ PIP ๊ด€์ ˆ์„ ๊ตฌ๋™ํ•˜๊ณ , ๋…ธ๋ž€์ƒ‰์œผ๋กœ ํ‘œ์‹œ๋œ BLDC ๋ชจํ„ฐ(5:1 ๊ธฐ์–ด๊ฐ์†)๊ฐ€ MCP ๊ด€์ ˆ์„ ๊ตฌ๋™ํ•จ. (d) ์—„์ง€์˜ ๋‚ด๋ถ€ ๊ตฌ์กฐ: DC ์›œ๋“œ๋ผ์ด๋ธŒ๊ฐ€ ์—„์ง€ IP ๊ด€์ ˆ์„, BLDC ๋ชจํ„ฐ๊ฐ€ ์—„์ง€์˜ ์•ˆ์žฅ๊ด€์ ˆ(TM)์˜ ๋‘ ์ถ•์„ ๋™์‹œ์— ๊ตฌ๋™ํ•˜๋„๋ก ์„ค๊ณ„๋จ. ์ด์ฒ˜๋Ÿผ ํ•˜๋‚˜์˜ ์†๊ฐ€๋ฝ์— ์„œ๋กœ ๋‹ค๋ฅธ ํŠน์ง•์˜ ๊ตฌ๋™๊ธฐ๋ฅผ ๋ฐฐ์น˜ํ•˜์—ฌ ํž˜๊ณผ ์†๋„, ํƒ„์„ฑ์„ ๋ชจ๋‘ ๋งŒ์กฑ์‹œํ‚จ๋‹ค.

์ด ๊ตฌ๋™๊ณ„์˜ ์„ฑ๋Šฅ์€ ์ธ์ƒ์ ์ž…๋‹ˆ๋‹ค. ์†๊ฐ€๋ฝ ๋์œผ๋กœ ์ง€์†์ ์œผ๋กœ 19N ์ •๋„๋ฅผ ๋ˆŒ๋Ÿฌ๋„ ๊ฒฌ๋”œ ์ˆ˜ ์žˆ๊ณ , ์ตœ๋Œ€ 57N์˜ ํž˜๊นŒ์ง€ ๋‚ด๋ฉฐ, ์ตœ๋Œ€ ์†๋„๋Š” ๋ถ„๋‹น 420ํšŒ์ „(RPM)์— ๋‹ฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ธ๊ฐ„ ์†๊ฐ€๋ฝ์˜ ํž˜๊ณผ ์†๋„ ๋ฒ”์ฃผ์— ๊ทผ์ ‘ํ•œ ์ˆ˜์น˜์ž…๋‹ˆ๋‹ค. ๋ฌด์—‡๋ณด๋‹ค๋„, ๊ณ ํ† ํฌ ๊ตฌ๋™๊ธฐ์˜ ์—ฌ์œ ๋กœ์šด ์‚ฌ์–‘ ๋•๋ถ„์— ์—ฐ์† ์ž‘๋™์‹œ ๋ฐœ์—ด์ด๋‚˜ ๊ณผ๋ถ€ํ•˜ ์—†์ด ์•ˆ์ •์ ์œผ๋กœ ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ์†Œํ˜• ์„œ๋ณด ๊ธฐ๋ฐ˜ ์†๋“ค์ด ์ง€์† ๊ตฌ๋™์‹œ ๊ณผ์—ด๋˜๊ฑฐ๋‚˜ ํฐ ํž˜์—์„œ ๊ธฐ์–ด๊ฐ€ ์†์ƒ๋˜๊ธฐ ์‰ฌ์› ๋˜ ๊ฒƒ๊ณผ ๋Œ€์กฐ์ ์ด์ฃ . EyeSight Hand๋Š” ๋‚ฎ์€ ๊ฐ€๊ฒฉ(๋ถ€ํ’ˆ๋น„ \$2500 ์ดํ•˜)์œผ๋กœ ์ด๋Ÿฌํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜์—ฌ, ์—ฐ๊ตฌ ๋ชฉ์ ์œผ๋กœ ๋Œ€๋Ÿ‰์˜ ์‹คํ—˜์„ ๊ฒฌ๋”œ ์ˆ˜ ์žˆ๋Š” ์‹ค์šฉ์ ์ธ ํ”Œ๋žซํผ์„ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, EyeSight Hand๋Š” ํŠผํŠผํ•œ ์ง๋™ ์—ฐ๊ฒฐ๊ณผ ๋งํฌ๊ธฐ๊ตฌ๋กœ ๊ด€์ ˆ์„ ๊ตฌ๋™ํ•˜์—ฌ, ๋ณต์žกํ•œ ํ…๋˜(ํž˜์ค„) ๊ตฌ๋™์„ ์“ฐ๋Š” ๋กœ๋ด‡ ์†๋“ค๋ณด๋‹ค ๊ตฌ์กฐ์  ๊ฒฌ๊ณ ํ•จ์ด ๋†’์Šต๋‹ˆ๋‹ค. ํ…๋˜์„ ์‚ฌ์šฉํ•˜๋Š” Shadow Hand ๋“ฑ์˜ ํ”Œ๋žซํผ์€ ์—ฌ๋Ÿฌ ์ž์œ ๋„๋ฅผ ์ œ๊ณตํ•˜์ง€๋งŒ ์ค„์ด ๋Š์–ด์ง€๊ฑฐ๋‚˜ ๋งˆ์ฐฐ๋กœ ๋งˆ๋ชจ๋˜๊ธฐ ์‰ฌ์›Œ ์‹ ๋ขฐ์„ฑ์ด ๋–จ์–ด์กŒ๋Š”๋ฐ, EyeSight Hand๋Š” ์ง๊ฒฐ ๊ตฌ๋™์œผ๋กœ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ๊ฐ์†Œ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก , ํ˜„์žฌ๋Š” ๊ฒ€์ง€์™€ ์ค‘์ง€๋งŒ ๊ตฌํ˜„๋˜์—ˆ๊ณ  ์•ฝ์ง€๋‚˜ ์ƒˆ๋ผ์†๊ฐ€๋ฝ์€ ์—†์–ด ์™„์ „ํ•œ ์˜ค์ง€(ไบ”ๆŒ‡)๋Š” ์•„๋‹ˆ์ง€๋งŒ, ์—ฐ๊ตฌ์ง„์€ ํ–ฅํ›„ ์ถ”๊ฐ€์ ์ธ ์†๊ฐ€๋ฝ์„ ๋ถ™์—ฌ ๋‚˜๊ฐˆ ๊ณ„ํš์ด๋ผ๊ณ  ๋ฐํžˆ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ํ†ตํ•ฉ ๋น„์ „ ๊ธฐ๋ฐ˜ ์ด‰๊ฐ ์„ผ์„œ: GelSim(ple)

EyeSight Hand์˜ ๋˜ ํ•˜๋‚˜์˜ ๋ˆˆ์— ๋„๋Š” ํŠน์ง•์€ ์† ์ „์ฒด๋ฅผ ๊ฐ์‹ธ๋Š” ์ด‰๊ฐ ํ”ผ๋ถ€์ž…๋‹ˆ๋‹ค. ์†๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์†๊ฐ€๋ฝ ๋งˆ๋”” ๋งˆ๋””๊นŒ์ง€ 7๊ฐœ์˜ ์ด‰๊ฐ ์„ผ์„œ๋ฉด์ด ๋ถ„ํฌ๋˜์–ด ์žˆ๊ณ , ์ด๋กœ๋ถ€ํ„ฐ 8๊ฐœ์˜ ์˜์ƒ์ด ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ž…๋ ฅ๋ฉ๋‹ˆ๋‹ค. (์†๊ฐ€๋ฝ ๋งˆ๋””๋งˆ๋‹ค ํ•œ ๊ฐœ์”ฉ, ์†๋ฐ”๋‹ฅ์— ๋‘ ๊ฐœ์˜ ์„ผ์„œ๊ฐ€ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค.) ์ด๋Š” ๋งˆ์น˜ ๋กœ๋ด‡ ์† ํ‘œ๋ฉด ์•„๋ž˜์— ์ž‘์€ ์นด๋ฉ”๋ผ๋“ค์„ ๋„ฃ์–ด๋‘” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋ฌผ์ฒด์™€ ์ ‘์ด‰ํ•˜๋ฉด ์ ค๋ฆฌ ๊ฐ™์€ ํˆฌ๋ช…์ธต์ด ๋ˆŒ๋ฆฌ๋ฉด์„œ ๊ทธ ๋ณ€ํ˜•์ด ์นด๋ฉ”๋ผ ์˜์ƒ์œผ๋กœ ํฌ์ฐฉ๋˜๋Š”๋ฐ, ์ด ์˜์ƒ์—๋Š” ์ ‘์ด‰ํ•œ ๋ฌผ์ฒด์˜ ๋ฏธ์„ธํ•œ ํ˜•์ƒ ์ •๋ณด์™€ ํž˜ ๋ถ„ํฌ๊ฐ€ ๋‹ด๊ฒจ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์˜ ํ”ผ๋ถ€๊ฐ€ ์‹ ๊ฒฝ ์‹ ํ˜ธ๋กœ ์ ‘์ด‰์„ ๋А๋ผ๋“ฏ์ด, EyeSight Hand๋Š” ์นด๋ฉ”๋ผ ์˜์ƒ์„ ํ†ตํ•ด ์ด‰๊ฐ์„ โ€œ์‹œ๊ฐ์ ์œผ๋กœโ€ ๊ฐ์ง€ํ•˜๋Š” ๊ฒƒ์ด์ฃ .

ํ•˜์ง€๋งŒ ๊ธฐ์กด์˜ GelSight ๊ณ„์—ด ์„ผ์„œ๋ฅผ ๊ทธ๋Œ€๋กœ ์†๊ฐ€๋ฝ๋งˆ๋‹ค ๋„ฃ๊ธฐ๋Š” ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. GelSight๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์„ธ ๊ฐ€์ง€ ์ƒ‰์ƒ์˜ LED ์กฐ๋ช…์„ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉํ–ฅ์—์„œ ๋น„์ถ”์–ด ๋ฌผ์ฒด์˜ 3์ฐจ์› ํ˜•์ƒ์„ ์ถ”์ •ํ•˜๋Š”๋ฐ, ์„ผ์„œ๊ฐ€ ํ‰ํ‰ํ•œ ๊ฒฝ์šฐ์— ์ ํ•ฉํ•˜์ง€ ๊ตฝ์€ ์†๊ฐ€๋ฝ์—๋Š” ์ ์šฉ์ด ํž˜๋“ค๊ณ  ๊ตฌ์กฐ๊ฐ€ ๋ณต์žกํ•ด์ง‘๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ทธ๋ฆผ์ž๊ฐ€ ์ƒ๊ธฐ๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ๋ชจ์‚ฌํ•˜๊ธฐ๋„ ๊นŒ๋‹ค๋กญ์ฃ . ์—ฐ๊ตฌ์ง„์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด GelSim(ple)๋ผ๋Š” ๋‹จ์ˆœํ™”๋œ ์ด‰๊ฐ ์„ผ์„œ ์„ค๊ณ„๋ฅผ ๊ณ ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค.

GelSim(ple)์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ์กฐ๋ช… ๋ฐฉ์‹์„ ๋ฐ”๊พธ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์„ผ์„œ ํ‘œ๋ฉด์— ๊ณ ๋ฅด๊ฒŒ ๋ฐ๊ธฐ๋ฅผ ์ฃผ๊ธฐ ์œ„ํ•ด, ์—ฌ๋Ÿฌ ์ƒ‰์„ ์“ฐ๋Š” ๋Œ€์‹  ํˆฌ๋ช…ํ•œ ํ™•์‚ฐํŒ(diffuser)์˜ ์ฃผ๋ณ€์„ ํ•˜์–€ LED๋กœ ๋‘˜๋Ÿฌ์‹ธ ์ธก๋ฉด์—์„œ ๊ท ์ผํ•˜๊ฒŒ ๋ฐํžˆ๋Š” ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์„ผ์„œ ํ‘œ๋ฉด ์ „์ฒด์— ๊ทธ๋ฆผ์ž ์—†์ด ๊ณ ๋ฅธ ์กฐ๋ช…์ด ๋“ค์–ด์˜ต๋‹ˆ๋‹ค. ํ‘œ๋ฉด์—๋Š” ์•ฝ๊ฐ„์˜ ๋ฐ˜์‚ฌ์„ฑ ์ฝ”ํŒ…(half-mirror)์„ ํ•ด์„œ ๋ˆŒ๋ฆฐ ๋ถ€๋ถ„์˜ ๋ฐ๊ธฐ ๋ณ€ํ™”๋กœ๋„ ํ˜•ํƒœ๋ฅผ ์•Œ ์ˆ˜ ์žˆ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ์š”์•ฝํ•˜๋ฉด, ํ•œ ๊ฐ€์ง€ ์ƒ‰ ๊ด‘์›์œผ๋กœ ์œ„์—์„œ ๋น„์ถ”๋Š” ํšจ๊ณผ๋ฅผ ๋‚ด์ฃผ์–ด, ์ ‘์ด‰ ํ˜•์ƒ์˜ ์œค๊ณฝ์„ ์„ ๋ช…ํ•˜๊ณ  ๋‹จ์ˆœํ•˜๊ฒŒ ํฌ์ฐฉํ•˜๋„๋ก ํ•œ ๊ฒƒ์ด์ฃ . ๋•๋ถ„์— ์ถœ๋ ฅ ์˜์ƒ์€ ์‚ฌ์‹ค์ƒ ๋‹จ์ผ ์ฑ„๋„(gray-scale)๋กœ ์ถฉ๋ถ„ํ–ˆ๊ณ , ๋ฐ์ดํ„ฐ ์ „์†ก๋Ÿ‰๋„ ์ค„์˜€์Šต๋‹ˆ๋‹ค.

๋˜ํ•œ ์ด ์ ‘๊ทผ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์‰ฝ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค. ์ƒ‰์ƒ์ด ๋‹จ์ˆœํ•˜๊ณ  ๊ทธ๋ฆผ์ž๊ฐ€ ์—†์œผ๋‹ˆ, ์„ผ์„œ ํ‘œ๋ฉด์˜ ๋ณ€ํ˜• โ†’ ์˜์ƒ ๋ฐ๊ธฐ ๋งคํ•‘์„ ํ•™์Šต๋œ MLP ๋ชจ๋ธ๋กœ ๊ฐ€๊นŒ์Šค๋กœ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ๋ฌผ์ฒด๋กœ ๋ˆŒ๋ฆฐ ์„ผ์„œ์˜ ํ‘œ๋ฉด ๋ฒ•์„  ๋ฒกํ„ฐ์™€ ์นด๋ฉ”๋ผ ์‹œ์•ผ๊ฐ ๋“ฑ์„ ์ž…๋ ฅํ•˜๋ฉด ํ”ฝ์…€ RGB๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ์ž‘์€ ์‹ ๊ฒฝ๋ง์„ ํ›ˆ๋ จํ•˜์—ฌ, ์‹ค์ œ ์„ผ์„œ ์˜์ƒ๊ณผ ์œ ์‚ฌํ•œ ์ถœ๋ ฅ์„ ๋‚ด๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋กœ์จ ๊ฐ€์ƒ ํ™˜๊ฒฝ์—์„œ ์ด‰๊ฐ ์„ผ์„œ ์ถœ๋ ฅ์„ ํ‰๋‚ด๋‚ผ ์ˆ˜ ์žˆ์–ด, ์ถ”ํ›„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ์ „์ด(sim2real) ์—ฐ๊ตฌ์—๋„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ฆผ 2: EyeSight Hand์— ํ†ตํ•ฉ๋œ GelSim(ple) ์ด‰๊ฐ ์„ผ์„œ ๊ตฌ์กฐ. (a) ์„ผ์„œ ๋ชจ๋“ˆ์˜ ํญ๋ฐœ๋„์™€ ํฌ๊ธฐ: 22ร—23 mm ํฌ๊ธฐ์˜ ๋ฒ ์ด์Šค์— ๋†’์ด 37.5 mm์˜ ๋” ํ˜•ํƒœ๋กœ, ์–ด์•ˆ ์นด๋ฉ”๋ผ(๊ฒ€์ •์ƒ‰)์™€ ์ด๋ฅผ ๊ฐ์‹ธ๋Š” ์นด๋ฉ”๋ผ ํ™€๋”(ํšŒ์ƒ‰), ์ฃผ๋ณ€์„ ๋‘˜๋Ÿฌ์‹ผ COB LED ์ŠคํŠธ๋ฆฝ(๋…ธ๋ž€์ƒ‰)๊ณผ ์ฐจ๊ด‘ํŒ(blinder), ๋ฐ˜๊ตฌํ˜• ํ™•์‚ฐํŒ(diffuser), ๊ทธ๋ฆฌ๊ณ  ํˆฌ๋ช… ์‹ค๋ฆฌ์ฝ˜ ์ ค(PDMS)์— ๋ฐ˜๋ฐ˜์‚ฌ ์ฝ”ํŒ…(semispecular coating)์„ ํ•œ ์„ผ์‹ฑ ํ‘œ๋ฉด์œผ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค. (b) GelSim(ple) ์„ผ์„œ ์ถœ๋ ฅ ์˜ˆ์‹œ: ์œ„ ํ–‰์€ ์‹ค์ œ ์„ผ์„œ์— ๋ฌผ์ฒด๋ฅผ ๋ˆŒ๋ €์„ ๋•Œ ์–ป๋Š” ์ด‰๊ฐ ์˜์ƒ์ด๊ณ , ์•„๋ž˜ ํ–‰์€ ๋™์ผ ๋ณ€ํ˜•์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ์˜ˆ์ธกํ•œ ์˜์ƒ์ด๋‹ค. ๋™๊ทธ๋ผ๋ฏธ, ์‚ผ๊ฐํ˜•, ์‚ฌ๊ฐํ˜• ๋ชจ์–‘์˜ ๋ฌผ์ฒด๋ฅผ ๋ˆŒ๋ €์„ ๋•Œ์˜ ์ž๊ตญ์ด ์‹ค์ œ์™€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์œ ์‚ฌํ•˜๊ฒŒ ๋‚˜ํƒ€๋‚จ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฐ 1์ฑ„๋„ ์˜์ƒ์œผ๋กœ๋„ ์ ‘์ด‰ ์ง€ํ˜•์„ ์ฝ์–ด๋‚ผ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ทธ๋ฆผ์ž ๋“ฑ์ด ์—†๊ธฐ์— ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋กœ ํ•™์Šต๋œ ๋ชจ๋ธ์ด ํ”ฝ์…€ ๋‹จ์œ„๋กœ RGB ๊ฐ’์„ ๋น„๊ต์  ์ •ํ™•ํžˆ ์ถ”์ •ํ•ด๋‚ธ๋‹ค.

์„ผ์„œ ํ•˜๋“œ์›จ์–ด ๊ตฌํ˜„์„ ์ž์„ธํžˆ ๋“ค์—ฌ๋‹ค๋ณด๋ฉด, Raspberry Pi ์นด๋ฉ”๋ผ ๋ชจ๋“ˆ (Arducam IMX219)์— 220๋„ ์–ด์•ˆ ๋ Œ์ฆˆ๋ฅผ ๋‹ฌ์•„ ๋„“์€ ์‹œ์•ผ๋กœ ์ ค ํ‘œ๋ฉด์„ ๊ด€์ฐฐํ•ฉ๋‹ˆ๋‹ค. ์นด๋ฉ”๋ผ๋Š” 3D ํ”„๋ฆฐํŠธ๋œ ์†๊ฐ€๋ฝ ๋ผˆ๋Œ€์— ๋ผ์›Œ ๋„ฃ๊ณ , ๊ทธ ์•ž์— LED๋ฅผ ๋‘๋ฅธ ํ™•์‚ฐํŒ+์ ค ๊ตฌ์กฐ๋ฌผ์„ ๋‚˜์‚ฌ๋กœ ๊ณ ์ •ํ•ฉ๋‹ˆ๋‹ค. LED๋Š” ํญ 3mm์˜ ์–‡์€ COB LED ์ŠคํŠธ๋ฆฝ์„ ์ž˜๋ผ์„œ ์„ผ์„œ ๋‘˜๋ ˆ ๋ชจ์–‘๋Œ€๋กœ ๋ถ™์˜€๊ณ , ๊ทธ ์•ž์œผ๋กœ ๋ถˆํ•„์š”ํ•œ ๊ด‘์ด ์ƒˆ์ง€ ์•Š๋„๋ก ์ฐจ๊ด‘ํŒ์„ ๋ฎ์—ˆ์Šต๋‹ˆ๋‹ค. ์ ค์€ ํˆฌ๋ช… ์‹ค๋ฆฌ์ฝ˜(SILICONE XP-565)์„ ๊ตณํ˜€ ๋งŒ๋“ค๊ณ , ํ‘œ๋ฉด์— ๋ฏธ์„ธ ์•Œ๋ฃจ๋ฏธ๋Š„ ์ž…์ž๊ฐ€ ์„ž์ธ ๋ฐ˜ํˆฌ๋ช… ์ž‰ํฌ ์ฝ”ํŒ…์„ ์ž…ํ˜€์„œ ๋ฐ˜์ง์ž„๊ณผ ํ™•์‚ฐ ํŠน์„ฑ์„ ์กฐ์ ˆํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ์นด๋ฉ”๋ผ๋Š” Arducam ๋‹ค์ค‘ ์นด๋ฉ”๋ผ ์–ด๋Œ‘ํ„ฐ (CamArray HAT)๋ฅผ ํ†ตํ•ด ๋ผ์ฆˆ๋ฒ ๋ฆฌํŒŒ์ด 4 ๋‘ ๋Œ€์— 4๊ฐœ์”ฉ ๋‚˜๋‰˜์–ด ์—ฐ๊ฒฐ๋˜์–ด, ์ด 8๊ฐœ์˜ ์ด‰๊ฐ ์˜์ƒ์ด ๋™๊ธฐํ™”๋˜์–ด ์ˆ˜์ง‘๋ฉ๋‹ˆ๋‹ค. ํ•ด์ƒ๋„ 640x480์˜ ์˜์ƒ์„ ๊ฐ Pi์—์„œ 60Hz๋กœ ์ŠคํŠธ๋ฆฌ๋ฐํ•˜๋ฉด, ํ˜ธ์ŠคํŠธ PC์—์„œ๋Š” ์•ฝ 30Hz๋กœ ๋ชจ๋“  ์ด‰๊ฐ/์นด๋ฉ”๋ผ/๊ด€์ ˆ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์•„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ ๊ตฌ์„ฑ์€ ์‹ค์‹œ๊ฐ„์œผ๋กœ ํ’๋ถ€ํ•œ ์ด‰๊ฐ+์‹œ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ทจ๋“ํ•˜๊ธฐ ์œ„ํ•จ์œผ๋กœ, EyeSight Hand๊ฐ€ ๋‹จ์ˆœํžˆ ํ•˜๋“œ์›จ์–ด๊ฐ€ ์•„๋‹ˆ๋ผ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ํ”Œ๋žซํผ์œผ๋กœ๋„ ์ตœ์ ํ™”๋˜์—ˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ œ์–ด ์•Œ๊ณ ๋ฆฌ์ฆ˜: ๋ชจ๋ฐฉ ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ •์ฑ…

ํ•˜๋“œ์›จ์–ด๊ฐ€ ์ค€๋น„๋˜์—ˆ๋‹ค๋ฉด, ์ด์ œ ์ด ์†์„ ์–ด๋–ป๊ฒŒ ์›€์ง์ผ ๊ฒƒ์ธ๊ฐ€๊ฐ€ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. EyeSight Hand ๋…ผ๋ฌธ์˜ ์ค‘์š”ํ•œ ์ถ•์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ํ•™์Šต๋œ ์ •์ฑ…(policy)์œผ๋กœ ๋ณต์žกํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‚ฌ๋žŒ ์†์ฒ˜๋Ÿผ ์„ฌ์„ธํ•œ ์ œ์–ด๋ฅผ ์ผ์ผ์ด ์ˆ˜์‹ ๋ชจ๋ธ๋กœ ์„ค๊ณ„ํ•˜๊ธฐ๋Š” ์–ด๋ ค์šฐ๋ฏ€๋กœ, ๋ชจ๋ฐฉ ํ•™์Šต์„ ํ†ตํ•ด ์‚ฌ๋žŒ์ด ์‹œ์—ฐํ•œ ํ–‰๋™์„ ๋กœ๋ด‡์ด ๋ฐฐ์šฐ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ด ์—ฐ๊ตฌ์—์„œ๋Š” ACT (Action Chunking with Transformers)๋ผ๋Š” ์ตœ์‹  ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ–ˆ๋Š”๋ฐ์š”, ์ด๋ฅผ ๊ฐ„๋‹จํžˆ ํ’€์–ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

ACT๋Š” ์กฐ๊ฑด๋ถ€ ๋ณ€๋ถ„ ์˜คํ† ์ธ์ฝ”๋”(CVAE) ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ๋ณต์žกํ•˜๊ฒŒ ๋“ค๋ฆฌ์ง€๋งŒ, ์‰ฝ๊ฒŒ ๋งํ•ด ์‹œ๋ฒ” ๋ฐ์ดํ„ฐ(์‚ฌ๋žŒ์˜ ์›๊ฒฉ์กฐ์ž‘ ํ–‰๋™)๋ฅผ ๋ณด๊ณ  ๊ทธ์™€ ๋น„์Šทํ•œ ํ–‰๋™ ์‹œํ€€์Šค๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•™์Šตํ•˜๋Š” ์‹ ๊ฒฝ๋ง์ž…๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ๋Š”, ์ธ์ฝ”๋” ๋„คํŠธ์›Œํฌ๊ฐ€ ์‹œ๋ฒ” ํ–‰๋™์˜ โ€œ์Šคํƒ€์ผโ€์„ ํ•˜๋‚˜์˜ ์ž ์žฌ ๋ฒกํ„ฐ z๋กœ ์••์ถ•ํ•˜๊ณ , ๋””์ฝ”๋” ๋„คํŠธ์›Œํฌ(์ •์ฑ…)๊ฐ€ ํ˜„์žฌ ๊ด€์ธก์„ ๋ณด๊ณ  ์ด z์— ๋”ฐ๋ผ ์•ž์œผ๋กœ ์ทจํ•  ์ผ๋ จ์˜ ํ–‰๋™๋“ค์„ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ z๋Š” ์‚ฌ๋žŒ์ด ๊ฐ™์€ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•ด๋„ ์•ฝ๊ฐ„์”ฉ ๋‹ค๋ฅธ ๊ถค์ ์„ ๋ณด์ผ ์ˆ˜ ์žˆ๋Š” ๋‹ค์–‘์„ฑ์„ ํ‘œํ˜„ํ•ด์ฃผ๋ฉฐ, ์ผ์ข…์˜ ์ˆจ๊ฒจ์ง„ ์˜๋„๋‚˜ ๋ฐฉ์‹์„ ์ƒ์ง•ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ด ๋ชจ๋ธ์€ ํ•˜๋‚˜์˜ ๊ด€์ธก ์ƒํ™ฉ์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ ํ•ฉ๋ฆฌ์ ์ธ ํ–‰๋™ ๊ฒฝ๋กœ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๊ณ , ๋ฐ์ดํ„ฐ์— ๋‚ด์žฌ๋œ ๋‹ค์–‘ํ•œ ์ธ๊ฐ„ ์ „๋žต์„ ๋ชจ๋ฐฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ •์ฑ… ๋„คํŠธ์›Œํฌ ๊ตฌ์กฐ๋Š” ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ์ž…๋ ฅ์„ ์ฒ˜๋ฆฌํ•˜๋„๋ก ๊ตฌ์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ „์—ญ ์นด๋ฉ”๋ผ ์˜์ƒ(์™ธ๋ถ€์—์„œ ๋ณธ ์žฅ๋ฉด)๊ณผ ์†๋ชฉ ์นด๋ฉ”๋ผ ์˜์ƒ(๋กœ๋ด‡ ํŒ”์— ๋‹ฌ๋ฆฐ ์–ด์•ˆ ์นด๋ฉ”๋ผ)์€ Vision ์ธ์ฝ”๋”(ResNet-18)๋ฅผ ๊ฑฐ์ณ ํŠน์ง•์„ ๋ฝ‘์•„๋‚ด๊ณ , 8๊ฐœ์˜ ์ด‰๊ฐ ์˜์ƒ์€ 4์žฅ์”ฉ ๋ฌถ์–ด ๋งŒ๋“  ๋‘ ์žฅ์˜ โ€œ์Šˆํผ ์ด๋ฏธ์ง€โ€๋ฅผ Tactile ์ธ์ฝ”๋”(๋˜ ๋‹ค๋ฅธ ResNet-18)๋กœ ์ฒ˜๋ฆฌํ•ด ํŠน์ง•์„ ์–ป์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์— EyeSight Hand์™€ ๋กœ๋ด‡ ํŒ”(UR5)์˜ ๊ด€์ ˆ๊ฐ๋„๋“ค์ด ํ•˜๋‚˜์˜ ๋ฒกํ„ฐ๋กœ ํ•จ๊ป˜ ๊ฒฐํ•ฉ๋ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ ์•ž์„œ ๋งํ•œ ์Šคํƒ€์ผ ์ž ์žฌ ๋ณ€์ˆ˜ z๊นŒ์ง€ ์ด ๋ชจ๋“  ์ •๋ณด๋ฅผ Transformer ๋„คํŠธ์›Œํฌ์— ์ž…๋ ฅํ•˜๋ฉด, ์•ž์œผ๋กœ ๋ช‡ ๊ฐœ์˜ ์‹œ๊ฐ„ ์Šคํ…์— ๊ฑธ์ณ ๋กœ๋ด‡์ด ์ทจํ•  ๋ฏธ๋ž˜์˜ ๊ด€์ ˆ ๋ช…๋ น ์‹œํ€€์Šค๋ฅผ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ Transformer๋Š” ์‹œํ€€์Šค ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์ธ๋ฐ, ํ”ํžˆ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์— ์“ฐ์ด๋Š” ๊ฒƒ์„ ๋กœ๋ด‡ ํ–‰๋™ ์˜ˆ์ธก์— ์‘์šฉํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•œ ๋ฒˆ ์˜ˆ์ธก์œผ๋กœ ์ตœ๋Œ€ 20 ์Šคํ… ๋ถ„๋Ÿ‰์˜ ํ–‰๋™์„ ๋‚ด๋‹ค๋ณด๊ฒŒ ํ–ˆ๋Š”๋ฐ, ์ด๋ก ์ ์œผ๋กœ ์•ฝ 1.3์ดˆ ๋ถ„๋Ÿ‰์„ ๋ฏธ๋ฆฌ ๊ณ„ํšํ•˜๋Š” ์…ˆ์ด๋ฉฐ, ์ œ์–ด ์ฃผ๊ธฐ๋Š” 15Hz (0.067์ดˆ๋งˆ๋‹ค ์ƒˆ ๊ณ„ํš)๋กœ ์„ค์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡์ด ๋‹จ์ˆœํžˆ ํ˜„์žฌ ์˜ค์ฐจ๋ฅผ ๋ฐ”๋กœ์žก๋Š” ๋ฐ˜์‘ํ˜• ์ œ์–ด๊ฐ€ ์•„๋‹ˆ๋ผ, ์•ž์œผ๋กœ์˜ ๋™์ž‘์„ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ์ด์–ด๋‚˜๊ฐ€๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

๊ทธ๋ฆผ 3: EyeSight Hand ์ œ์–ด ์ •์ฑ…(ACT ๊ธฐ๋ฐ˜)์˜ ์ž…๋ ฅ๊ณผ ๋ชจ๋ธ ๊ตฌ์กฐ. ์ƒ๋‹จ์€ ์ •์ฑ…๋ง์— ๋“ค์–ด๊ฐ€๋Š” ์—ฌ๋Ÿฌ ์„ผ์„œ ๊ด€์ธก๋“ค๋กœ, ์ „์—ญ ์นด๋ฉ”๋ผ ์˜์ƒ๊ณผ ์†๋ชฉ ์นด๋ฉ”๋ผ ์˜์ƒ, ๊ทธ๋ฆฌ๊ณ  8๊ฐœ์˜ ์ด‰๊ฐ ์˜์ƒ๋“ค์ด 4๊ฐœ์”ฉ ๋‘ ๋ฌถ์Œ์œผ๋กœ ํ•ฉ์ณ์ ธ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹œ๊ฐ ์˜์ƒ๋“ค์€ ๊ณต์œ ๋œ Vision ์ธ์ฝ”๋”(์ดˆ๋ก์ƒ‰ ๋„คํŠธ์›Œํฌ ์•„์ด์ฝ˜)๋กœ ์ฒ˜๋ฆฌ๋˜๊ณ , ์ด‰๊ฐ ์˜์ƒ ๋ฌถ์Œ๋“ค์€ Tactile ์ธ์ฝ”๋”(์ฃผํ™ฉ์ƒ‰ ์•„์ด์ฝ˜)๋กœ ํŠน์ง•์„ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. ์ถ”์ถœ๋œ ์‹œ๊ฐ ํŠน์ง• (๋…น์ƒ‰), ์ด‰๊ฐ ํŠน์ง• (์ฃผํ™ฉ์ƒ‰), ๊ทธ๋ฆฌ๊ณ  ๋กœ๋ด‡ ํŒ”+์†์˜ ๊ด€์ ˆ๊ฐ ์ •๋ณด(ํšŒ์ƒ‰)๋ฅผ ๋ชจ๋‘ Transformer ์ธ์ฝ”๋”์— ํˆฌ์ž…ํ•ฉ๋‹ˆ๋‹ค. ์ด Transformer์˜ ๋””์ฝ”๋” ๋ถ€๋ถ„์€ ๊ฐ ์‹œ๊ฐ„ ๋‹จ๊ณ„๋ณ„ ํฌ์ง€์…˜ ์ž„๋ฒ ๋”ฉ(ํŒŒ๋ž€์ƒ‰)์„ ์ฐธ๊ณ ํ•˜์—ฌ ๋‹ค์Œ ์—ฌ๋Ÿฌ ์‹œ์ ์˜ ํ–‰๋™์„ ์ˆœ์ฐจ์ ์œผ๋กœ ๋งŒ๋“ค์–ด๋ƒ…๋‹ˆ๋‹ค. ์ด๋•Œ ์Šคํƒ€์ผ ๋ณ€์ˆ˜ z(๋ถ„ํ™์ƒ‰)๊ฐ€ ๋””์ฝ”๋”์— ์˜ํ–ฅ์„ ์ฃผ์–ด, ํ–‰๋™ ์‹œํ€€์Šค์˜ ์ „๋ฐ˜์ ์ธ ํŒจํ„ด์„ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ตœ์ข… ์ถœ๋ ฅ์€ ํ–ฅํ›„ ๋ช‡ ๊ฐœ ์Šคํ…์— ๋Œ€ํ•œ ๋กœ๋ด‡ ์† ๊ด€์ ˆ ๋ช…๋ น ์‹œํ€€์Šค(๋…ธ๋ž€์ƒ‰)์ž…๋‹ˆ๋‹ค. ํ•™์Šต ์‹œ์—๋Š” CVAE ๊ตฌ์กฐ ๋•๋ถ„์— ์‚ฌ๋žŒ์ด ๋ณด์ธ ์‹ค์ œ ํ–‰๋™ ์‹œํ€€์Šค์™€ ์ƒ์„ฑํ•œ ์‹œํ€€์Šค๊ฐ€ ์œ ์‚ฌํ•ด์ง€๋„๋ก ํ›ˆ๋ จ๋˜๊ณ , ์‹คํ–‰ ์‹œ์—๋Š” ๊ด€์ธก์— ๋งž๋Š” ์ ์ ˆํ•œ ํ–‰๋™์„ ์ƒ์„ฑํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

๋ˆˆ์น˜์ฑ„์…จ๊ฒ ์ง€๋งŒ, ์ด ์ •์ฑ…๋ง์€ ์นด๋ฉ”๋ผ๋กœ๋ถ€ํ„ฐ ๋ณด์ด๋Š” ๊ฒƒ(vision)๊ณผ ์†์ด ๋А๋ผ๋Š” ๊ฒƒ(tactile)์„ ๋ชจ๋‘ ํ™œ์šฉํ•˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ ๊ตฌ์กฐ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ๋‘ ๊ฐ๊ฐ ์ค‘ ๋ฌด์—‡์„ ๋” ์‹ ๋ขฐํ•˜๊ฒŒ ๋ ๊นŒ์š”? ์‚ฌ๋žŒ๋„ ์ฒ˜์Œ ํ•  ๋•Œ๋Š” ๋ˆˆ์œผ๋กœ ๋ณด์ง€๋งŒ, ๋ง‰์ƒ ๋ณด์ด์ง€ ์•Š๋Š” ์ƒํ™ฉ์—์„  ๊ฐ๊ฐ์œผ๋กœ ์†๋์˜ ํž˜์„ ์กฐ์ ˆํ•˜๊ณค ํ•ฉ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์ดˆ๊ธฐ ์‹คํ—˜์—์„œ ์‹œ๊ฐ+์ด‰๊ฐ ๋ชจ๋‘ ์ž…๋ ฅํ•œ ๋ชจ๋ธ์ด ์ •์ž‘ ์ด‰๊ฐ ์‹ ํ˜ธ๋ฅผ ๋ฌด์‹œํ•ด๋ฒ„๋ฆฌ๋Š” ๊ฒฝํ–ฅ์„ ๊ด€์ฐฐํ–ˆ์Šต๋‹ˆ๋‹ค. ์•„๋ฌด๋ž˜๋„ ์˜์ƒ ์ •๋ณด๋งŒ์œผ๋กœ๋„ ์–ด๋А ์ •๋„ ํŒ๋‹จ์ด ๊ฐ€๋Šฅํ•˜๋‹ˆ, ๋„คํŠธ์›Œํฌ๊ฐ€ ์ด‰๊ฐ์˜ ๋ฏธ๋ฌ˜ํ•œ ์‹ ํ˜ธ ๋Œ€์‹  ์‹œ๊ฐ์— ์˜์กดํ•˜๋ ค ํ•œ ๊ฒƒ์ด์ฃ . ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๊ธฐ๋ฐœํ•œ ํŠธ๋ฆญ์ด Vision Dropout์ž…๋‹ˆ๋‹ค. ํ•™์Šต ๋‹จ๊ณ„์—์„œ 30% ํ™•๋ฅ ๋กœ ์นด๋ฉ”๋ผ ์˜์ƒ์„ ์•„์˜ˆ ๊นœ๊นœํ•˜๊ฒŒ(0์œผ๋กœ) ๋งŒ๋“ค์–ด ๋ฒ„๋ฆฌ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•œ๋งˆ๋””๋กœ ๋กœ๋ด‡์„ ๋ˆˆ๊ฐ๊ณ  ์—ฐ์Šต์‹œํ‚ค๋Š” ์…ˆ์ด์ฃ ! ๊ทธ๋ ‡๊ฒŒ ํ•˜๋ฉด ๊ฐ€๋”์”ฉ์€ ์˜ค์ง ์ด‰๊ฐ ์ •๋ณด์— ์˜์กดํ•ด์„œ๋„ ์ž„๋ฌด๋ฅผ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋ฏ€๋กœ, ์ •์ฑ…๋ง์ด ์ด‰๊ฐ์˜ ์œ ์šฉํ•œ ํŠน์ง•์„ ์žก์•„๋‚ด๋Š” ๋ฒ•์„ ๋ฐฐ์šฐ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๋‹น์—ฐํžˆ ํ…Œ์ŠคํŠธ(์‹ค์ œ ์‹คํ–‰)ํ•  ๋•Œ๋Š” ์‹œ๊ฐ์„ ์ œ๋Œ€๋กœ ๋„ฃ์–ด์ฃผ์ง€๋งŒ, ์ด๋ฏธ ์ด‰๊ฐ์˜ ์ค‘์š”์„ฑ์„ ํ•™์Šตํ•œ ๋•๋ถ„์— ๋‘ ๊ฐ๊ฐ์„ ๋ชจ๋‘ ํ™œ์šฉํ•˜๋Š” ๊ท ํ˜• ์žกํžŒ ํŒ๋‹จ์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

ํ•™์Šต ๊ณผ์ •์€ ์ˆ˜์ง‘ํ•œ ์‹œ๋ฒ” ๋ฐ์ดํ„ฐ 300๊ฐœ(๊ฐ ์ž‘์—…๋ณ„ 100๊ฐœ)๋กœ ์œ„์˜ ACT ๋„คํŠธ์›Œํฌ๋ฅผ ๊ต์‚ฌ ๊ฐ•์š”(supervised learning) ๋ฐฉ์‹์œผ๋กœ ํ›ˆ๋ จํ•˜๋Š” ๊ฒƒ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ์‹œ๊ฐ„์˜ ๊ด€์ธก(์‹œ๊ฐ+์ด‰๊ฐ+๊ด€์ ˆ)๊ณผ ๊ทธ ๋‹ค์Œ์— ์ธ๊ฐ„ ์กฐ์ข…์ž๊ฐ€ ์ทจํ•œ ํ–‰๋™(๋กœ๋ด‡ ํŒ”/์† ๊ด€์ ˆ ์†๋„ ๋ช…๋ น ์‹œํ€€์Šค)์„ ๋ฌถ์–ด ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋กœ, ํ‰๊ท ์ œ๊ณฑ์˜ค์ฐจ ๋“ฑ ์†์‹ค์„ ์ตœ์†Œํ™”ํ•˜๋„๋ก ๋„คํŠธ์›Œํฌ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์—…๋ฐ์ดํŠธ ํ•ฉ๋‹ˆ๋‹ค. 500 epoch์— ๊ฑธ์นœ ํ›ˆ๋ จ ๋์—, ์ฃผ์–ด์ง„ ๊ด€์ธก์„ ๋ณด๊ณ  ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ํ–‰๋™์„ ์˜ˆ์ธกํ•˜๋Š” ์ •์ฑ…์ด ์™„์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์š”์•ฝํ•˜๋ฉด, EyeSight Hand์˜ ๋‘๋‡Œ๋Š” ์‚ฌ๋žŒ์˜ ์‹œ์—ฐ์„ ๋ณธ๋–ด์ง€๋งŒ ์นด๋ฉ”๋ผ์™€ ํ”ผ๋ถ€๊ฐ๊ฐ์„ ๊ณ ๋ฃจ ํ™œ์šฉํ•˜๋Š” ํ•™์Šต๋œ ์‹ ๊ฒฝ๋ง์ธ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์‹คํ—˜: ํ•™์Šต์„ ํ†ตํ•œ ์„ธ ๊ฐ€์ง€ ์ž‘์—… ์ˆ˜ํ–‰

์—ฐ๊ตฌ์ง„์€ EyeSight Hand์˜ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ์„ธ ๊ฐ€์ง€ ๋Œ€ํ‘œ ์ž‘์—…์„ ์„ค์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ๊ฐ ๋„๊ตฌ ์‚ฌ์šฉ, ๋น„์ „+์ด‰๊ฐ ํ†ตํ•ฉ, ํž˜ ์กฐ์ ˆ์ด ํ•„์š”ํ•œ ๊ณผ์ œ๋“ค๋กœ, ๊ตฌ์ฒด์ ์œผ๋กœ๋Š” (1) ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ, (2) ์ ‘์‹œ ๋ฐ€์–ด์„œ ์ง‘์–ด ์˜ฎ๊ธฐ๊ธฐ, (3) ๊ณต์ž‘์šฉ ์ ํ†  ์ž๋ฅด๊ธฐ์ž…๋‹ˆ๋‹ค. ์ด ์ž‘์—…๋“ค์€ ๋ชจ๋‘ ์ผ์ƒ์—์„œ ์ธ๊ฐ„์ด ์†์žฌ์ฃผ๋ฅผ ๋ฐœํœ˜ํ•˜๋Š” ์žฅ๋ฉด๋“ค์ธ๋ฐ, ๋กœ๋ด‡ ์†์—๊ฒŒ๋Š” ์ƒ๋‹นํžˆ ๊นŒ๋‹ค๋กœ์šด ๋„์ „์ž…๋‹ˆ๋‹ค. ํ•œ ๋ฒˆ์”ฉ ๋‚ด์šฉ์„ ์‚ดํŽด๋ณด์ฃ .

  • ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ (Bottle Opening): ๋กœ๋ด‡์€ ์ฑ…์ƒ ์œ„์— ๋†“์ธ ์ผ€์ฐน ๋ณ‘์˜ ๋šœ๊ป‘์„ ์—ด์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ „๋žต์€ ๋จผ์ € ๋ณ‘์˜ ๋ชธํ†ต์„ ์žก๊ณ  ๊ณ ์ •ํ•œ ํ›„, ์—„์ง€์†๊ฐ€๋ฝ์œผ๋กœ ๋šœ๊ป‘์„ ๋“ค์–ด์˜ฌ๋ ค ์ –ํžˆ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ณ‘์ด ๊ณ ์ •๋ผ์žˆ์ง€ ์•Š์•„ ํž˜์„ ์ฃผ๋ฉด ๋ฐ€๋ ค๋‚˜๊ธฐ ๋•Œ๋ฌธ์—, ๊ฒ€์ง€, ์ค‘์ง€, ์†๋ฐ”๋‹ฅ์œผ๋กœ ๋ณ‘์„ ์œ„์—์„œ ๋ˆ„๋ฅด๋ฉฐ ๊ฝ‰ ์žก์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ์ƒํƒœ์—์„œ ์—„์ง€์˜ ๋ ์ด‰๊ฐ์„ผ์„œ๊ฐ€ ๋šœ๊ป‘ ๊ฐ€์žฅ์ž๋ฆฌ์— ๋‹ฟ์œผ๋ฉด, ์ง€๋ ›๋Œ€์ฒ˜๋Ÿผ ํž˜์„ ๊ฐ€ํ•ด ๋šœ๊ป‘์„ ์—ด๊ณ  ์™„์ „ํžˆ ๋’ค๋กœ ์ –ํ˜€์•ผ ์„ฑ๊ณต์œผ๋กœ ๊ฐ„์ฃผ๋ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ ๋šœ๊ป‘์„ ์ •ํ™•ํžˆ ๋ฌผ๊ณ  ๋“ค์–ด์˜ฌ๋ฆฌ๋Š” ์ด‰๊ฐ, ๋˜ ๋ณ‘์ด ๋ฏธ๋„๋Ÿฌ์ง€์ง€ ์•Š๊ฒŒ ๋ˆŒ๋Ÿฌ์ฃผ๋Š” ํž˜ ์กฐ์ ˆ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.

  • ์ ‘์‹œ ๋ฐ€์–ด์„œ ์ง‘์–ด ์˜ฎ๊ธฐ๊ธฐ (Plate Pick & Place): ๋‘ ๊ฐœ์˜ ์ ‘์‹œ๊ฐ€ ํฌ๊ฐœ์ ธ ํผ ๋ธ”๋ก ์œ„์— ๋†“์—ฌ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ ๋งจ ์œ„ ์ ‘์‹œ ํ•˜๋‚˜๋ฅผ ์˜†์œผ๋กœ ๋ฐ€์–ด ๋ฐ‘์˜ ์ ‘์‹œ์™€ ์–ด๊ธ‹๋‚˜๊ฒŒ ๋งŒ๋“  ํ›„, ์ง‘๊ฒŒ์ฒ˜๋Ÿผ ์žก์•„ ๋“ค์–ด ์˜ฌ๋ ค ์˜†์— ๋‚ด๋ ค๋†“์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด ์ž‘์—…์€ ํ•œ ์†์œผ๋กœ ๋‘ ์žฅ์˜ ์ ‘์‹œ๋ฅผ ๋‹ค๋ฃจ๋Š” ๊ต๋ฌ˜ํ•œ ๊ธฐ์ˆ ์„ ์š”ํ•ฉ๋‹ˆ๋‹ค. ์ฒ˜์Œ์— ์ ๋‹นํ•œ ํž˜์œผ๋กœ ์œ—์ ‘์‹œ๋ฅผ ๋ฐ€์–ด๋‚ด์•ผ ํ•˜๋Š”๋ฐ, ๋„ˆ๋ฌด ์•ฝํ•˜๋ฉด ์ ‘์‹œ๊ฐ€ ์•ˆ ์›€์ง์ด๊ณ , ๋„ˆ๋ฌด ์„ธ๋ฉด ์•„๋ž˜ ์ ‘์‹œ๊นŒ์ง€ ํ•จ๊ป˜ ๋ฏธ๋„๋Ÿฌ์ ธ๋ฒ„๋ฆฝ๋‹ˆ๋‹ค. ๋‹คํ–‰ํžˆ ์‚ด์ง ์–ด๊ธ‹๋‚˜๋ฉด ๋กœ๋ด‡์˜ ๊ฒ€์ง€์™€ ์ค‘์ง€๋กœ ์œ—์ ‘์‹œ๋ฅผ ์ง‘์„ ์ˆ˜ ์žˆ๊ฒŒ ๋˜๊ณ , ์•ˆ์ •์ ์œผ๋กœ ์ง‘์€ ์ฑ„ ๋“ค์–ด ์˜ฌ๋ ค ์˜†์— ๋‚ด๋ ค๋†“์œผ๋ฉด ์™„๋ฃŒ์ž…๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ๋Š” ๋งˆ์ฐฐ๋ ฅ์— ๊ธฐ๋ฐ˜ํ•œ ๋ฏธ๋„๋Ÿผ ์ œ์–ด, ์ถฉ๋ถ„ํ•œ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์„ ํ†ตํ•œ ํž˜ ์กฐ์ ˆ, ๊ทธ๋ฆฌ๊ณ  ์ ‘์‹œ๋ฅผ ์žก์€ ํ›„ ์•ˆ์ •์ ์ธ ํŒŒ์ง€(grasp)๊ฐ€ ๋ชจ๋‘ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

  • ์ ํ†  ์ž๋ฅด๊ธฐ (Plasticine Cutting): ์ž‘์—…๋Œ€ ์œ„ ์ž‘์€ ์ƒ์ž ์•ˆ์— ์นผ์ด ๋†“์—ฌ์žˆ๊ณ , ๊ทธ ์˜† ๋„๋งˆ ์œ„์— ์ ํ† (plasticine) ๋กค์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ ๋จผ์ € ์ƒ์ž์—์„œ ์นผ์„ ๋ฝ‘์•„ ๋“ค๊ณ , ์ด์–ด์„œ ์นผ๋กœ ์ ํ† ๋ฅผ ์ ˆ๋‹จํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์„ฑ๊ณต ์กฐ๊ฑด์€ ์ ํ† ๋ฅผ ์™„์ „ํžˆ ๋‘ ๋™๊ฐ•๋‚ด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์นผ์งˆ์„ ์„ธ๊ฒŒ ํ•˜๋ฉด ์ ํ† ๋Š” ์ž˜๋ฆด์ง€ ๋ชฐ๋ผ๋„ ๋ฐ‘์˜ ๋„๋งˆ๋‚˜ ์นผ์ง‘ ์ƒ์ž๊ฐ€ ๋ฐ€๋ ค๋‚  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(์ด๋“ค์€ ํ…Œ์ด๋ธ”์— ๊ณ ์ •๋˜์–ด ์žˆ์ง€ ์•Š์Šต๋‹ˆ๋‹ค). ๋˜, ์ ˆ๋‹จ์ด ๋ฐ˜์ฏค ๋˜๊ณ  ๋ฉˆ์ถ”๋ฉด ํ‘œ๋ฉด์ƒ ๊ฑฐ์˜ ์ž˜๋ฆฐ ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ผ ์ˆ˜๋„ ์žˆ์–ด์„œ, ์‹œ๊ฐ๋งŒ์œผ๋กœ๋Š” ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ ํŒ๋‹จํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์ด ์‹œ๋‚˜๋ฆฌ์˜ค๋Š” ๋„๊ตฌ ์‚ฌ์šฉ๊ณผ ์ •๊ตํ•œ ํž˜ ๊ฐ€ํ•˜๊ธฐ๋ฅผ ๋™์‹œ์— ์‹œํ—˜ํ•˜๋ฉฐ, ํŠนํžˆ ์ด‰๊ฐ์œผ๋กœ ์™„์ „ํžˆ ์ž˜๋ ธ๋‹ค/์•ˆ ์ž˜๋ ธ๋‹ค๋ฅผ ๋А๋ผ๋Š” ๋Šฅ๋ ฅ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

์ด ์„ธ ์ž‘์—…์„ ์œ„ํ•ด ์—ฐ๊ตฌ์ง„์€ UR5 ๋กœ๋ด‡ ํŒ” ๋์— EyeSight Hand๋ฅผ ์žฅ์ฐฉํ•œ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค. ์›๊ฒฉ ์กฐ์ž‘(teleoperation) ๋ฐฉ์‹์œผ๋กœ ์‚ฌ๋žŒ์ด ์ง์ ‘ ๋กœ๋ด‡์„ ์›€์ง์—ฌ ๊ฐ ์ž‘์—…์˜ ์‹œ๋ฒ” ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์•˜๋Š”๋ฐ, ์‚ฌ๋žŒ ์†๊ณผ ๋กœ๋ด‡ ์†์˜ ๊ตฌ์กฐ๊ฐ€ ๋‹ค๋ฅด๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ๋งž์ถฐ์ฃผ๋Š” ํŠน๋ณ„ํ•œ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์€ ์—„์ง€, ๊ฒ€์ง€, ์ค‘์ง€ ์†ํ†ฑ ๋ถ€๊ทผ๊ณผ ์†๋“ฑ์— 4๊ฐœ์˜ ์†Œํ˜• ์œ„์น˜/์ž์„ธ ํŠธ๋ž˜์ปค(trakStar ์ž๊ธฐ ์„ผ์„œ)๋ฅผ ๋ถ€์ฐฉํ•˜๊ณ , ๊ฐ€์ƒ์˜ ๋ฌผ์ฒด๋ฅผ ์กฐ์ž‘ํ•˜๋“ฏ ์†์„ ์›€์ง์˜€์Šต๋‹ˆ๋‹ค. ์ด ๋„ค ์ง€์ ์˜ 6-์ž์œ ๋„ ์œ„์น˜ ์ž์„ธ๋ฅผ ๋กœ๋ด‡ ์†์˜ ์†๊ฐ€๋ฝ ๋๊ณผ ์†๋ฐ”๋‹ฅ ์ขŒํ‘œ์— ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•˜๊ธฐ ์œ„ํ•ด, TSV(Task Space Vector) ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ„๋‹จํžˆ ๋งํ•ด, ์ธ๊ฐ„ ์†์˜ ์†๊ฐ€๋ฝ ๋๋“ค ๊ฐ„ ์ƒ๋Œ€ ๋ฒกํ„ฐ์™€ ๋กœ๋ด‡ ์†์˜ ์†๊ฐ€๋ฝ ๋๋“ค ๊ฐ„ ์ƒ๋Œ€ ๋ฒกํ„ฐ๊ฐ€ ์ตœ๋Œ€ํ•œ ์ผ์น˜ํ•˜๋„๋ก ๋ชฉํ‘œ ํ•จ์ˆ˜๋ฅผ ์„ธ์šฐ๊ณ , ์ˆœ์ฐจ์  2์ฐจ ํ”„๋กœ๊ทธ๋ž˜๋ฐ(SLSQP)์œผ๋กœ ๋งค ์‹œ๊ฐ ๋กœ๋ด‡ ๊ด€์ ˆ๊ฐ์„ ํ‘ธ๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์ด ๊ณ„์‚ฐ์€ JAX๋กœ ์ž๋™๋ฏธ๋ถ„์„ ํ™œ์šฉํ•ด 125Hz์˜ ๋น ๋ฅธ ์†๋„๋กœ ์‹คํ–‰๋˜์—ˆ๊ณ , ๊ฒฐ๊ณผ์ ์œผ๋กœ ์‚ฌ๋žŒ์ด ์†์„ ์›€์ง์ด๋Š” ๋Œ€๋กœ ๋กœ๋ด‡ ์†์ด ๊ฑฐ์˜ ๋™์‹œ์ถ”์ข…ํ•˜๋„๋ก ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์›๊ฒฉ ์กฐ์ž‘ ์‹œ์Šคํ…œ์„ ํ†ตํ•ด ๊ฐ ์ž‘์—…๋งˆ๋‹ค 100๊ฐœ์”ฉ์˜ Demonstration (๋กœ๋ด‡ ํŒ”/์†์˜ ๊ด€์ ˆ ๋ฐ์ดํ„ฐ, ์ด‰๊ฐ/์‹œ๊ฐ ์„ผ์„œ ๋ฐ์ดํ„ฐ, ๋“ฑ)์„ ์ˆ˜์ง‘ํ–ˆ์Šต๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์€ ํ›„์—๋Š” ์ด์ „ ์ ˆ์—์„œ ์„ค๋ช…ํ•œ ๋ชจ๋ฐฉ ํ•™์Šต(IL) ์ ˆ์ฐจ๋กœ ์ •์ฑ… ๋ชจ๋ธ์„ ํ•™์Šต์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ํ•™์Šต๋œ ์ •์ฑ…์€ ๊ด€์ฐฐ(์ „์—ญ์นด๋ฉ”๋ผ, ์†๋ชฉ์นด๋ฉ”๋ผ ์˜์ƒ + ์ด‰๊ฐ์˜์ƒ + ๊ด€์ ˆ๊ฐ)์„ ๋ฐ›์•„ ๋‹ค์Œ ํ–‰๋™(UR5์™€ ์†์˜ ๊ด€์ ˆ ์œ„์น˜ ๋ณ€ํ™” ๋ช…๋ น ์‹œํ€€์Šค)์„ ์ถœ๋ ฅํ•˜๊ณ , ์ด๋Š” ์ €์ˆ˜์ค€ ์ œ์–ด๊ธฐ(moteus BLDC ์ปจํŠธ๋กค๋Ÿฌ ๋“ฑ)์— ์˜ํ•ด ํ† ํฌ/์†๋„ ์ œ์–ด๋กœ ์‹คํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ตœ์ข…์ ์œผ๋กœ ๋กœ๋ด‡์€ ์‚ฌ๋žŒ ๊ฐœ์ž… ์—†์ด ์ด ์ •์ฑ…์„ ์‹คํ–‰ํ•˜์—ฌ ์ฃผ์–ด์ง„ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

flowchart TB
    subgraph collect["๋ฐ์ดํ„ฐ ์ˆ˜์ง‘"]
        user[์‚ฌ๋žŒ ์กฐ์ข…์ž] -- ์žฅ๊ฐ‘ ์„ผ์„œ --> robot[EyeSight Hand]
        robot -- ๋‹คํšŒ ์‹œ์—ฐ --> demos[๋ฐ๋ชจ ๋ฐ์ดํ„ฐ์…‹]
    end
    subgraph train["๋ชจ๋ฐฉ ํ•™์Šต"]
        demos ==> model[ACT ์ •์ฑ… ๋ชจ๋ธ]
        model --- dropout[Vision Dropout ์ ์šฉ]
    end
    subgraph deploy["ํ•™์Šต๋œ ์ •์ฑ… ์‹คํ–‰"]
        env[ํ™˜๊ฒฝ] -- ์„ผ์„œ ๊ด€์ธก --> model
        model -- ๊ด€์ ˆ ๋ช…๋ น --> hand[EyeSight Hand]
        hand -- ์ƒํ˜ธ์ž‘์šฉ --> env
    end

Diagram: ์‚ฌ๋žŒ ์กฐ์ข…์ž๊ฐ€ EyeSight Hand๋ฅผ ์›๊ฒฉ ์กฐ์ž‘ํ•ด ๋‹ค์ˆ˜์˜ ์‹œ๋ฒ” ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์œผ๊ณ , ์ด๋ฅผ ํ† ๋Œ€๋กœ Transformer ๊ธฐ๋ฐ˜ ACT ์ •์ฑ…์„ ํ›ˆ๋ จํ•œ๋‹ค. ํ•™์Šต ์‹œ Vision Dropout ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ์ •์ฑ…์ด ์ด‰๊ฐ ์ •๋ณด๋„ ํ™œ์šฉํ•˜๋„๋ก ์œ ๋„ํ•œ๋‹ค. ์ดํ›„ ํ•™์Šต๋œ ์ •์ฑ… ๋ชจ๋ธ์ด ์‹ค์‹œ๊ฐ„ ๊ด€์ธก(์‹œ๊ฐ+์ด‰๊ฐ)์„ ๋ฐ›์•„ ๋‹ค์Œ ํ–‰๋™(ํŒ”๊ณผ ์†์˜ ์›€์ง์ž„)์„ ์˜ˆ์ธกํ•˜๋ฉฐ, ๋กœ๋ด‡ ์†์ด ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•œ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ: ์ด‰๊ฐ ํ†ตํ•ฉ์˜ ์œ„๋ ฅ

ํ•™์Šต๋œ ์ •์ฑ…๋“ค์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด, ์—ฐ๊ตฌ์ง„์€ ์„ธ ๊ฐ€์ง€ ๋ณ€ํ˜•๋œ ๋ชจ๋ธ์„ ์ค€๋น„ํ•˜์—ฌ ๊ฐ๊ฐ 10ํšŒ์˜ ์‹œํ—˜์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค:

  1. Vision-Only: ์นด๋ฉ”๋ผ ์˜์ƒ(์ „์—ญ + ์†๋ชฉ) ์ž…๋ ฅ๋งŒ ๋ฐ›๊ณ  ์ด‰๊ฐ์€ ๋ฌด์‹œํ•œ ์ •์ฑ…
  2. Vision+Tactile (Vanilla): ์นด๋ฉ”๋ผ + ์ด‰๊ฐ ๋ชจ๋‘ ์ž…๋ ฅํ•˜์ง€๋งŒ ๋“œ๋กญ์•„์›ƒ์„ ์“ฐ์ง€ ์•Š๊ณ  ํ•™์Šตํ•œ ์ •์ฑ…
  3. Vision+Tactile (Dropout): ์นด๋ฉ”๋ผ + ์ด‰๊ฐ ์ž…๋ ฅ, ํ•™์Šต ์‹œ 30% ํ™•๋ฅ ๋กœ ์˜์ƒ ์ฐจ๋‹จํ•˜์—ฌ ์ด‰๊ฐ ํ™œ์šฉ์„ ๋Œ์–ด์˜ฌ๋ฆฐ ์ •์ฑ…

๊ฐ ๋ชจ๋ธ๋กœ ๋™์ผํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ด๋ณธ ๊ฒฐ๊ณผ๋Š” ์„ฑ๊ณต๋ฅ ์˜ ํ˜•ํƒœ๋กœ ์š”์•ฝ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

์ž‘์—… ์ข…๋ฅ˜ Vision-Only ์„ฑ๊ณต๋ฅ  Vision+Tactile (์ผ๋ฐ˜) Vision+Tactile (๋“œ๋กญ์•„์›ƒ)
์ ‘์‹œ ์˜ฎ๊ธฐ๊ธฐ 50% 100% 100% (๋™์ผ)
์ ํ†  ์ž๋ฅด๊ธฐ 50% 70% 90%
๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ 0% 0% 30%

์œ„ ํ‘œ์—์„œ ์•Œ ์ˆ˜ ์žˆ๋“ฏ, ์ด‰๊ฐ ์ •๋ณด๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์‹œ์ž‘ํ•˜๋ฉด์„œ ์„ฑ๋Šฅ์ด ํฐ ํญ์œผ๋กœ ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ Vision-Only ๋ชจ๋ธ์€ ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ์˜ ๊ฒฝ์šฐ ๋‹จ ํ•œ ๋ฒˆ๋„ ์„ฑ๊ณตํ•˜์ง€ ๋ชปํ–ˆ๋Š”๋ฐ, ์ด๋Š” ์นด๋ฉ”๋ผ ์˜์ƒ๋งŒ์œผ๋กœ๋Š” ๋šœ๊ป‘์ด ์ œ๋Œ€๋กœ ์žกํ˜”๋Š”์ง€, ์–ผ๋งˆ๋‚˜ ํž˜์„ ์ค˜์•ผ ํ•˜๋Š”์ง€ ๊ฐ์ด ์˜ค์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ด‰๊ฐ์ด ์—†์—ˆ๋˜ ์ด ๋ชจ๋ธ์€ ์—‰๋šฑํ•œ ํž˜ ๋ฐฉํ–ฅ์œผ๋กœ ๋ฐ€๊ฑฐ๋‚˜ ์•„์˜ˆ ์ ‘์ด‰์„ ๋†“์ณ๋ฒ„๋ ค, ์—„์ง€์†๊ฐ€๋ฝ์ด ๋šœ๊ป‘์—์„œ ๋ฏธ๋„๋Ÿฌ์ง€๋Š” ์‹คํŒจ๊ฐ€ ๋ฐ˜๋ณต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ์ด‰๊ฐ ํ†ตํ•ฉ ๋ชจ๋ธ์€ 30%์˜ ์„ฑ๊ณต๋ฅ ์ด์ง€๋งŒ ๋ช‡ ์ฐจ๋ก€๋Š” ํ™•์‹คํžˆ ๋šœ๊ป‘์„ ์—ฌ๋Š” ๋ฐ ์„ฑ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ˆˆ์œผ๋กœ๋Š” ์ž˜ ์•ˆ ๋ณด์ด๋Š” ๋šœ๊ป‘๊ณผ์˜ ์ ‘์ด‰ ๊ฐ๊ฐ์„ ์†๋ ์นด๋ฉ”๋ผ๋กœ ๋А๋ผ๋ฉฐ ์ ์ ˆํ•œ ํž˜๊ณผ ๊ฐ๋„๋กœ ๋“ค์–ด์˜ฌ๋ฆฐ ๋•๋ถ„์ž…๋‹ˆ๋‹ค.

์ ‘์‹œ ์˜ฎ๊ธฐ๊ธฐ ์ž‘์—…์˜ ๊ฒฝ์šฐ, Vision-Only ๋ชจ๋ธ๋„ 50%๋Š” ์„ฑ๊ณตํ–ˆ์œผ๋‚˜ ์ ˆ๋ฐ˜์€ ์‹คํŒจํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹คํŒจํ•œ ๊ฒฝ์šฐ๋ฅผ ๋ณด๋ฉด, ์ฒ˜์Œ์— ์ ‘์‹œ์— ์ ‘์ด‰์„ ๋ชป ํ•˜๊ฑฐ๋‚˜ ํž˜์ด ์•ฝํ•ด ๊ณ„์† ํ—›๋ฏธ๋„๋Ÿผ์งˆ๋งŒ ํ•˜๊ฑฐ๋‚˜, ์ ‘์‹œ๋Š” ๋“ค์—ˆ์ง€๋งŒ ์ถฉ๋ถ„ํžˆ ๊ฝ‰ ์ฅ์ง€ ๋ชปํ•ด ์˜ฎ๊ธฐ๋Š” ์ค‘ ๋–จ์–ด๋œจ๋ฆฌ๋Š” ์ผ์ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋Š” ์ด‰๊ฐ ์„ผ์‹ฑ์„ ์ถ”๊ฐ€ํ•˜์ž ๋ง๋”ํžˆ ํ•ด์†Œ๋˜์–ด 100% ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์ด ์ ‘์‹œ์— ๋‹ฟ์•˜๋Š”์ง€, ๋ฏธ๋„๋Ÿฌ์ง€๋Š”์ง€ ์ฆ‰๊ฐ ๋А๋ผ๊ณ  ํž˜์„ ์กฐ์ ˆํ•œ ๋•๋ถ„์ž…๋‹ˆ๋‹ค. ์• ์ดˆ์— ์ด ์ž‘์—…์€ ์‹œ๊ฐ์œผ๋กœ ์ ‘์‹œ์˜ ๋ฏธ๋„๋Ÿฌ์ง์„ ํŒ๋‹จํ•˜๊ธฐ ์–ด๋ ค์šด๋ฐ, ์ด‰๊ฐ ๋•๋ถ„์— โ€œ๋ฐ€๋ฆฌ๋Š” ์ •๋„โ€๋ฅผ ๊ฐ์ง€ํ•˜๊ณ  ํž˜ ์กฐ์ ˆ์„ ํ•  ์ˆ˜ ์žˆ์—ˆ๋˜ ๊ฒƒ์ด์ฃ . Vision+Tactile ๋ชจ๋ธ์€ ์ด๋ฏธ ์™„๋ฒฝํ–ˆ๊ธฐ์— ๋“œ๋กญ์•„์›ƒ์˜ ์œ ๋ฌด ์ฐจ์ด๋Š” ์—†์—ˆ์Šต๋‹ˆ๋‹ค (100%๋กœ ๋™์ผ).

์ ํ†  ์ž๋ฅด๊ธฐ์—์„œ๋Š” ์ฐจ์ด๊ฐ€ ๋”์šฑ ๊ทน๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค. Vision-Only๋Š” 50% ์„ฑ๊ณต์— ๊ทธ์ณค๋Š”๋ฐ, ์‹คํŒจํ•œ ์ ˆ๋ฐ˜์—์„œ๋Š” ์ ํ† ๋ฅผ ๋๊นŒ์ง€ ์ž๋ฅด์ง€ ๋ชปํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋Œ€๋ถ€๋ถ„์ด์—ˆ์Šต๋‹ˆ๋‹ค. ์ž˜๋ฆฐ ์ •๋„๊ฐ€ ์‚ด์ง ๋‚จ์•˜์–ด๋„ ๊ฒ‰๋ชจ์Šต์ƒ ๊ฑฐ์˜ ์ž˜๋ฆฐ ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ด๋‹ˆ, ์‹œ๊ฐ ์ •๋ณด๋งŒ์œผ๋กœ๋Š” ์™„๋ฃŒ ์—ฌ๋ถ€๋ฅผ ํ™•์‹ ํ•˜๊ธฐ ํž˜๋“ค์—ˆ๋˜ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ฐ„ํ˜น ์™„์ „ํžˆ ์ž๋ฅด๊ธด ํ–ˆ์œผ๋‚˜ ํž˜์„ ๋„ˆ๋ฌด ์ค˜์„œ ๋„๋งˆ์งธ ๋ฐ€๋ ค๋‚˜๋ฒ„๋ฆฌ๋Š” ๊ฒฝ์šฐ๋„ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ์ด‰๊ฐ์„ ๋„ฃ์€ ๋ชจ๋ธ์€ 70%๋กœ ์„ฑ๊ณต๋ฅ ์ด ํฌ๊ฒŒ ์˜ฌ๋ž๊ณ , Vision ๋“œ๋กญ์•„์›ƒ๊นŒ์ง€ ์ ์šฉํ•œ ๋ชจ๋ธ์€ 90%๊นŒ์ง€ ์„ฑ๊ณต๋ฅ ์ด ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด‰๊ฐ์„ ์“ด ๋ชจ๋ธ๋“ค์€ ๋ถ€๋ถ„ ์ ˆ๋‹จ vs ์™„์ „ ์ ˆ๋‹จ์˜ ๋ฏธ๋ฌ˜ํ•œ ์ฐจ์ด๋ฅผ ์†๋์œผ๋กœ ๋А๊ปด์„œ ๋๊นŒ์ง€ ํž˜์„ ๊ฐ€ํ•ด ๋งˆ๋ฌด๋ฆฌํ•  ์ˆ˜ ์žˆ์—ˆ๊ณ , ๋„ˆ๋ฌด ๊ณผ๋„ํ•œ ํž˜์œผ๋กœ ๋ˆŒ๋Ÿฌ ๋„๋งˆ๊ฐ€ ๋ฐ€๋ฆฌ๋Š” ์ผ๋„ ํฌ๊ฒŒ ์ค„์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ๋“œ๋กญ์•„์›ƒ์„ ์“ด ๋ชจ๋ธ์€ ์‹คํŒจ ์ผ€์ด์Šค๊ฐ€ ๊ฑฐ์˜ ์—†์„ ๋งŒํผ ์ด‰๊ฐ ์˜์กด์ ์œผ๋กœ ์•ˆ์ •๋œ ๋™์ž‘์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํ›ˆ๋ จ ์‹œ ์˜๋„์ ์œผ๋กœ ๋ˆˆ์„ ๊ฐ๊ธด ํšจ๊ณผ๊ฐ€ ๋‚˜ํƒ€๋‚œ ๊ฒƒ์œผ๋กœ, ๋™์ผํ•œ ์ด‰๊ฐ ์ƒํ™ฉ์—์„œ ๊ตณ์ด ์‹œ๊ฐ ์ •๋ณด๋ฅผ ์ฐพ์ง€ ์•Š๊ณ ๋„ ์ž˜ ์ˆ˜ํ–‰ํ•œ ๋•๋ถ„์ž…๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ์ ์œผ๋กœ โ€œ๋ˆˆ๊ณผ ํ”ผ๋ถ€๋ฅผ ํ•จ๊ป˜ ์“ด ๋กœ๋ด‡ ์†โ€์ด ์–ผ๋งˆ๋‚˜ ๋” ๋›ฐ์–ด๋‚œ์ง€ ์ˆ˜์น˜๋กœ ์ฆ๋ช…๋˜์—ˆ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Vision-Only์— ๋น„ํ•ด Vision+Tactile(๋“œ๋กญ์•„์›ƒ) ์ •์ฑ…์€ ์„ธ ์ž‘์—… ๋ชจ๋‘์—์„œ ์›”๋“ฑํ•œ ์•ˆ์ •์„ฑ๊ณผ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์‹คํŒจ ์‚ฌ๋ก€์˜ ์ƒ์„ธ ๋ถ„์„์„ ํ†ตํ•ด ์ด‰๊ฐ์˜ ์ด์ ๋„ ์งš์—ˆ๋Š”๋ฐ, ๊ณตํ†ต์ ์œผ๋กœ ์‹œ๊ฐ์œผ๋กœ ๊ตฌ๋ถ„ ์–ด๋ ค์šด ๋ฏธ์„ธํ•œ ์ ‘์ด‰ ์ƒํƒœ๋ฅผ ์ด‰๊ฐ์ด ํ•ด๊ฒฐํ•ด์ฃผ์—ˆ๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ–ˆ์Šต๋‹ˆ๋‹ค. ์ ‘์‹œ๋ฅผ ๋ฐ€ ๋•Œ ํž˜์ด ๋ถ€์กฑํ•œ์ง€, ์นผ์ด ์ ํ† ๋ฅผ ๋‹ค ๋ฒ ์—ˆ๋Š”์ง€, ๋šœ๊ป‘์ด ์ œ๋Œ€๋กœ ๊ฑธ๋ ธ๋Š”์ง€ ๋“ฑ์€ ๋ชจ๋‘ ์นด๋ฉ”๋ผ ์˜์ƒ๋งŒ์œผ๋กœ ์• ๋งคํ•œ ๋ฐ˜๋ฉด ์ด‰๊ฐ์„ผ์„œ๋กœ๋Š” ๋ช…ํ™•ํžˆ ๊ตฌ๋ถ„๋˜๋Š” ์ƒํ™ฉ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋“œ๋กญ์•„์›ƒ ์ „๋žต์€ ๋‹จ์ˆœํ•˜๋ฉด์„œ๋„ ํšจ๊ณผ์ ์ด์–ด์„œ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต์—์„œ ํ•œ ์ชฝ ๊ฐ๊ฐ์— ์น˜์šฐ์น˜์ง€ ์•Š๊ฒŒ ๋งŒ๋“œ๋Š” ์ข‹์€ ๋ฐฉ๋ฒ•์ž„์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ์ธ๊ฐ„ ์กฐ์ข…์— ์˜ํ•œ ์›๊ฒฉ ์กฐ์ž‘ vs ํ•™์Šต๋œ ์ •์ฑ…์˜ ์„ฑ๋Šฅ์€ ์–ด๋–ป๊ฒŒ ๋น„๊ต๋ ๊นŒ์š”? ๋…ผ๋ฌธ์—์„œ๋Š” ์ •์ฑ…์˜ ์ ˆ๋Œ€์ ์ธ ์„ฑ๊ณต๋ฅ ๋งŒ์„ ๋ณด๊ณ  ์žˆ์ง€๋งŒ, 100๊ฐœ์˜ ์‹œ๋ฒ” ๋ฐ์ดํ„ฐ๋ฅผ ๋งŒ๋“ค์—ˆ๋‹ค๋Š” ๊ฒƒ์€ ์‚ฌ๋žŒ๋„ ๋ช‡๋ช‡ ์‹คํŒจ๋ฅผ ํ–ˆ์„ ๊ฐ€๋Šฅ์„ฑ์„ ๋‚ดํฌํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ˆ˜๋ฐฑ ๋ฒˆ์˜ ์‹œ๋„ ์ค‘ ๋ช‡ ๋ฒˆ์€ ์‚ฌ๋žŒ ์‹ค์ˆ˜๋‚˜ ๋กœ๋ด‡ ์ง€์—ฐ์œผ๋กœ ์‹คํŒจ๊ฐ€ ์žˆ์—ˆ์„ ์ˆ˜ ์žˆ์ง€๋งŒ, ์ „๋ฐ˜์ ์œผ๋กœ ์ธ๊ฐ„์€ ๋†’์€ ์„ฑ๊ณต๋ฅ ๋กœ ์‹œ์—ฐ์„ ํ–ˆ๊ฒ ์ฃ . ํฅ๋ฏธ๋กœ์šด ์ ์€, ์ถฉ๋ถ„ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์œผ๊ณ  ๋‚˜๋‹ˆ AI ์ •์ฑ…์ด ์ผ๋ถ€ ์ž‘์—…์—์„œ๋Š” ์ธ๊ฐ„๋งŒํผ, ํ˜น์€ ๋” ๋‚˜์€ ์ผ๊ด€์„ฑ์„ ๋ณด์ธ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค (์˜ˆ: ์ ‘์‹œ 100%). ๋ฐ˜๋ฉด ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ์ฒ˜๋Ÿผ ๋งค์šฐ ์–ด๋ ค์šด ์ž‘์—…์€ ์•„์ง ์ธ๊ฐ„๋งŒํผ ์™„๋ฒฝํžˆ ๋ฐฐ์šฐ์ง€๋Š” ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค (30%). ์ด๋Š” ๋ฐ์ดํ„ฐ์˜ ํ•œ๊ณ„์™€ ๋ชจ๋ธ์˜ ํ•œ๊ณ„๊ฐ€ ๋ชจ๋‘ ์ž‘์šฉํ•œ ๊ฒฐ๊ณผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค. ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ๋Š” 100๊ฐœ ์‹œ์—ฐ์œผ๋กœ๋Š” ๋ถ€์กฑํ•  ์ˆ˜๋„ ์žˆ๊ณ , ๊ฐœํ์˜ ๋ฌผ๋ฆฌ์  ๋‚œ์ด๋„๊ฐ€ ๋†’์•„ ๋ฏธ์„ธํ•œ ์ „๋žต๊นŒ์ง€ ํ•™์Šต๋˜์ง„ ์•Š์€ ๋“ฏํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿผ์—๋„, ์ด ์ •๋„ ๋ณต์žกํ•œ ์‹ค์ œ ์ž‘์—…์„ ์‚ฌ๋žŒ์ด ๊ฐ€๋ฅด์นœ ๋Œ€๋กœ ํ•ด๋‚ธ ์‚ฌ๋ก€๋Š” ๋“œ๋ฌผ๊ธฐ์— ๋กœ๋ด‡๊ณตํ•™ ์ปค๋ฎค๋‹ˆํ‹ฐ์— ์‹œ์‚ฌํ•˜๋Š” ๋ฐ”๊ฐ€ ํฝ๋‹ˆ๋‹ค. ํ•™์Šต๋œ ๋กœ๋ด‡ ์†์ด ์‹œ๊ฐ+์ด‰๊ฐ์„ ํ†ตํ•ด ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ์„ฌ์„ธํ•จ์— ํ•œ ๊ฑธ์Œ ๋‹ค๊ฐ€์„ฐ์Œ์„ ๋ณด์—ฌ์ค€ ๊ฒƒ์ด์ฃ .

๋น„ํŒ์  ๊ณ ์ฐฐ: ๋ฌด์—‡์ด ๋›ฐ์–ด๋‚˜๊ณ , ๋ฌด์—‡์ด ๋‚จ์•˜๋‚˜

์ง€๊ธˆ๊นŒ์ง€ EyeSight Hand์˜ ์„ค๊ณ„์™€ ์„ฑ๋Šฅ์„ ์‚ดํŽด๋ณด์•˜์Šต๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์ด ์ ‘๊ทผ์˜ ๋งค๋ ฅ์€ ๋ฌด์—‡์ด๊ณ , ํ•œ๊ณ„๋Š” ์–ด๋–ค ๊ฒƒ์ด ์žˆ์„๊นŒ์š”? ๋˜ํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ๋“ค๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ์˜ ์œ„์น˜๋„ ์งš์–ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

1) ํ˜์‹ ๊ณผ ๊ฐ•์ : EyeSight Hand์˜ ๊ฐ€์žฅ ํฐ ๊ณตํ—Œ์€ ๋กœ๋ด‡ ์†์˜ ์„ธ ๊ฐ€์ง€ ํ•ต์‹ฌ ์š”์†Œ โ€“ ๊ตฌ์กฐ, ๊ตฌ๋™, ์„ผ์‹ฑ โ€“๋ฅผ ์ผ์ฒดํ™”ํ•˜์—ฌ ์ตœ์ ํ™”ํ•œ ์ ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์— ๋‚˜์˜จ ๋กœ๋ด‡ ์†๋“ค์€ ๊ฐ๊ธฐ ์ผ๋ถ€ ์š”์†Œ์— ์ง‘์ค‘ํ–ˆ์ง€์š”. ์˜ˆ์ปจ๋Œ€ Shadow Hand๋Š” ๋†’์€ ์ž์œ ๋„๋ฅผ ๊ตฌํ˜„ํ–ˆ์ง€๋งŒ ๋ณต์žกํ•œ ํ…๋˜๊ตฌ๋™์œผ๋กœ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ๊ฐ€ ์žˆ์—ˆ๊ณ  ๊ฐ€๊ฒฉ์ด ๋งค์šฐ ๋†’์•˜์Šต๋‹ˆ๋‹ค. Allegro Hand๋Š” ๋น„๊ต์  ์ €๋ ดํ•˜๊ณ  ์ง์ ‘ ๊ตฌ๋™ํ–ˆ์œผ๋‚˜ ์ž‘์€ ์„œ๋ณด๋ชจํ„ฐ๋“ค์˜ ํ•œ๊ณ„๋กœ ๊ฐ•ํ•œ ํž˜์„ ๋ชป ๋‚ด๊ณ  ์ž˜ ๊ณ ์žฅ๋‚ฌ์Šต๋‹ˆ๋‹ค. ์ตœ๊ทผ MIT ๋“ฑ์—์„œ ๋‚˜์˜จ ์ผ๋ถ€ ์†๋“ค์€ ๋งํฌ๊ตฌ์กฐ๋กœ ๊ฐ•๋„๋ฅผ ๋†’์˜€์ง€๋งŒ ๋™์ž‘ ์†๋„๊ฐ€ ๋А๋ ค ์‹ค์‹œ๊ฐ„ ์กฐ์ž‘์— ์–ด๋ ค์›€์ด ์žˆ์—ˆ๊ณ ์š”. ๊ทธ๋Ÿฐ ๋ฉด์—์„œ EyeSight Hand๋Š” ์ ๋‹นํ•œ ์ž์œ ๋„(7 DoF)์— ๊ฐ•์ธํ•œ ๋งํฌ+๊ธฐ์–ด ๊ตฌ๋™, ์‚ฌ๋žŒ ์ˆ˜์ค€์˜ ํž˜/์†๋„, ์† ์ „์ฒด์˜ ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ๊นŒ์ง€, ๊ท ํ˜• ์žกํžŒ ์„ค๊ณ„๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ํŠนํžˆ $2500 ์ดํ•˜์˜ ๋น„์šฉ์œผ๋กœ ๋งŒ๋“  ์ ์€ ์‹คํ—˜์‹ค์—์„œ ์ˆ˜์‹ญ, ์ˆ˜๋ฐฑ ๋ฒˆ ๋ถ€๋”ชํ˜€๋„ ๋ถ€๋‹ด ์—†์ด ์“ธ ์ˆ˜ ์žˆ๋Š” ํ”Œ๋žซํผ์ด๋ผ๋Š” ๋œป์ด๊ณ , ์ด๋Š” ๋กœ๋ด‡ ํ•™์Šต ์—ฐ๊ตฌ์˜ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฌธ์ œ๋ฅผ ํฌ๊ฒŒ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค. ์‰ฝ๊ฒŒ ๋ง๊ฐ€์ง€๋Š” ๋น„์‹ผ ์†์€ ํ•จ๋ถ€๋กœ ๋งŽ์€ ์‹œ๋„๋ฅผ ๋ชปํ•˜์ง€๋งŒ, EyeSight Hand๋Š” ํŠผํŠผํ•˜๊ณ  ์ €๋ ดํ•˜๊ธฐ์— ๋Œ€๋Ÿ‰ ์‹คํ—˜์„ ๊ฒฌ๋”œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ๋…ผ๋ฌธ์—์„œ๋„ โ€œ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์— ์ถฉ๋ถ„ํžˆ robustํ•˜๋‹คโ€๋Š” ํ‘œํ˜„์œผ๋กœ ์ด๋Ÿฌํ•œ ๊ฐ•์ ์„ ๋ฐํžˆ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋˜ ๋‹ค๋ฅธ ํ˜์‹ ์€ GelSim(ple) ์„ผ์„œ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด GelSight๋ฅ˜ ์„ผ์„œ๋Š” ์†๊ฐ€๋ฝ ๋์— ์ œํ•œ์ ์œผ๋กœ ์‚ฌ์šฉ๋˜์—ˆ๊ณ , ํ•ด์ƒ๋„๋Š” ๋†’์•„๋„ ์—ฌ๋Ÿฌ ๊ฐœ๋ฅผ ์“ฐ๊ธฐ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. EyeSight Hand๋Š” ์†๊ฐ€๋ฝ ๋‘ ๋งˆ๋””์™€ ์†๋ฐ”๋‹ฅ์„ ๋ชจ๋‘ ๊ฐ์‹ธ๋Š” 8๊ฐœ์˜ ์„ผ์„œ๋ฅผ ๋™๊ธฐํ™”ํ•จ์œผ๋กœ์จ, ์‹ค์งˆ์ ์œผ๋กœ ์† ์ „์ฒด ํ”ผ๋ถ€๋ฅผ ์‹œ๊ฐํ™”ํ•œ ์…ˆ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์ด‰๊ฐ ์—ฐ๊ตฌ์ž๋“ค์ด ์˜ค๋žซ๋™์•ˆ ๊ฟˆ๊พธ๋˜ โ€œ๋กœ๋ด‡์— ์˜จ๋ชธ์˜ ํ”ผ๋ถ€๊ฐ๊ฐ ๋ถ€์—ฌโ€๋ฅผ ๋ถ€๋ถ„์ ์œผ๋กœ๋‚˜๋งˆ ํ˜„์‹คํ™”ํ•œ ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. GelSim(ple)์€ ๋‹จ์ˆœ ์กฐ๋ช…๊ณผ ํ™•์‚ฐํŒ์„ ํ™œ์šฉํ•œ ์˜๋ฆฌํ•œ ์„ค๊ณ„๋กœ, ๊ตฝ์€ ํ‘œ๋ฉด์—๋„ ๊ท ์ผ ์กฐ๋ช…์„ ์ œ๊ณตํ•˜๊ณ , ์„ผ์„œ๋งˆ๋‹ค ๋‹ค์–‘ํ•œ ๋ชจ์–‘์œผ๋กœ ๋งŒ๋“ค์–ด๋„ ์ผ๊ด€๋œ ์ถœ๋ ฅ ํ’ˆ์งˆ์„ ๋‚ผ ์ˆ˜ ์žˆ๊ฒŒ ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ 1์ฑ„๋„ ์ถœ๋ ฅ๊ณผ ๊ฐ„์†Œํ™”๋œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ชจ๋ธ์€ ํ–ฅํ›„ ๊ฐ€์ƒ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•˜๊ฑฐ๋‚˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋กœ ๋กœ๋ด‡์„ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ์‹œ๋„๋ฅผ ์šฉ์ดํ•˜๊ฒŒ ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์ด๋ฅผ ์ง์ ‘ ์‹คํ–‰ํ•˜์ง„ ์•Š์•˜์ง€๋งŒ, ์ œ์‹œ๋œ MLP ๊ธฐ๋ฐ˜ ๋ Œ๋”๋ง ๊ธฐ๋ฒ•์€ ์ด‰๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ๋Œ€๋Ÿ‰์œผ๋กœ ๊ฐ€์ƒ ์ƒ์„ฑํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅ์„ฑ์„ ์—ด์—ˆ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต ์ธก๋ฉด์—์„œ๋„, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต๊ณผ ๋“œ๋กญ์•„์›ƒ ๊ธฐ๋ฒ•์˜ ์กฐํ•ฉ์€ ๊ฐ•๋ ฅํ•œ ๋ฉ”์‹œ์ง€๋ฅผ ์ค๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ์„ผ์„œ๊ฐ€ ์ข‹๋‹ค๊ณ  ๋กœ๋ด‡์ด ์ž˜ ์“ฐ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋‹ค๋Š” ์ ์ด์ฃ . ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ ์ ˆํžˆ ์„ค๊ณ„ํ•ด์•ผ ๋กœ๋ด‡์ด ์œ ์˜๋ฏธํ•œ ์ด‰๊ฐ ํŠน์ง•์„ ํ•™์Šตํ•˜๊ณ  ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Vision dropout์ด๋ผ๋Š” ๋น„๊ต์  ๋‹จ์ˆœํ•œ ํ…Œํฌ๋‹‰์œผ๋กœ๋„ ์ด‰๊ฐ ํ™œ์šฉ๋„๋ฅผ ํฌ๊ฒŒ ๋†’์˜€๋‹ค๋Š” ๊ฒƒ์€, ์•ž์œผ๋กœ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ ๊ฐ„ attention ์กฐ์ •์ด๋‚˜ ํ•™์Šต ์Šค์ผ€์ค„๋ง ๋“ฑ์„ ํ†ตํ•ด ๋” ์˜๋ฆฌํ•˜๊ฒŒ ์—ฌ๋Ÿฌ ๊ฐ๊ฐ์„ ํ†ตํ•ฉํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ์„ ๊ฒƒ์ž„์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ACT ๋ชจ๋ธ์„ ์ ์šฉํ•˜์—ฌ ์‹œํ€€์Šค ์˜ˆ์ธก์„ ๋„์ž…ํ•œ ๊ฒƒ์€, ์‹ค์‹œ๊ฐ„ ์ œ์–ด๋ฅผ ์ข€ ๋” ๊ณ„ํš์ ์ด๊ณ  ์•ˆ์ •๋˜๊ฒŒ ๋งŒ๋“  ์ธก๋ฉด์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ Behavior Cloning์ด ์ฆ‰๊ฐ์ ์ธ ๋‹ค์Œ ํ–‰๋™๋งŒ ๋‚ด๋‹ค๋ณด๋Š” ๊ฒƒ์— ๋น„ํ•ด, ์ผ์ • ๊ตฌ๊ฐ„ ๋ฏธ๋ž˜๋ฅผ ๋‚ด๋‹ค๋ณด๋ฉด ํ”๋“ค๋ฆผ์ด๋‚˜ ์ง€ํ„ฐ๋ฅผ ์ค„์ด๊ณ  ์˜๋ฏธ์žˆ๋Š” ํ–‰๋™์˜ ํ๋ฆ„(chunk)์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ์œผ๋‹ˆ๊นŒ์š”. ์ด๋Š” ํ–ฅํ›„ ๊ฐ•ํ™”ํ•™์Šต(RL)์ด๋‚˜ ๋‹ค๋ฅธ ์ตœ์ ํ™”์™€ ๊ฒฐํ•ฉํ•  ๋•Œ๋„ ์œ ์šฉํ•œ ๊ตฌ์กฐ์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

2) ํ•œ๊ณ„์™€ ๊ฐœ์„  ๋ฐฉํ–ฅ: ์•„๋ฌด๋ฆฌ ์ข‹์€ ์—ฐ๊ตฌ์—๋„ ์•„์‰ฌ์šด ๋ถ€๋ถ„์€ ์žˆ๊ฒŒ ๋งˆ๋ จ์ž…๋‹ˆ๋‹ค. ์šฐ์„  EyeSight Hand ์ž์ฒด์˜ ํ•˜๋“œ์›จ์–ด์  ํ•œ๊ณ„๋กœ๋Š”, ์ž์œ ๋„ ๋ถ€์กฑ๊ณผ ๊ตฌ๋™ ์—ฐ์‡„์˜ ์ œ์•ฝ์„ ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 7 DoF๋กœ ๊ฒ€์ง€, ์ค‘์ง€, ์—„์ง€๋งŒ ๊ตฌํ˜„๋œ ํ˜•ํƒœ๋ผ ๋‚˜๋จธ์ง€ ์†๊ฐ€๋ฝ(์•ฝ์ง€, ์†Œ์ง€)์ด ์—†์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํŠน์ • ํŒŒ์ง€๋‚˜ ๋„๊ตฌ ์กฐ์ž‘์— ์ œํ•œ์„ ์ค„ ์ˆ˜๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ์—์„œ๋„ ์›๋ž˜ ์‚ฌ๋žŒ์ด๋ฉด ์–‘์†์œผ๋กœ ํ•˜๊ฑฐ๋‚˜, ํ•œ ์†์œผ๋กœ๋„ ์—„์ง€-๊ฒ€์ง€-์ค‘์ง€ ์กฐํ•ฉ ์™ธ์— ์†๋ฐ”๋‹ฅ์œผ๋กœ ๋ณ‘์„ ๊ฐ์‹ธ ์ฅ๋Š”๋ฐ, ๋กœ๋ด‡์€ ๊ฒ€์ง€+์ค‘์ง€+์†๋ฐ”๋‹ฅ ๋ฉด์ ์œผ๋กœ ๋ฒ„ํ‹ฐ๋А๋ผ ๋‹ค์†Œ ๋ถˆ์•ˆ์ •ํ•ด ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์•ฝ์ง€๋‚˜ ์†Œ์ง€, ํ˜น์€ ์†๋ชฉ ํšŒ์ „ ๋“ฑ์ด ์žˆ์—ˆ๋‹ค๋ฉด ๋” ์ˆ˜์›”ํ–ˆ์„ ๊ฒ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„๋„ ๊ฒฐ๋ก ์—์„œ ํ–ฅํ›„ ์†๊ฐ€๋ฝ์„ ์ถ”๊ฐ€ํ•˜์—ฌ ์™„์ „ํ•œ ์ธ๊ฐ„ ์† ํ˜•ํƒœ๋กœ ํ™•์žฅํ•  ๋œป์„ ๋ฐํ˜”์Šต๋‹ˆ๋‹ค.

๋˜, ์—„์ง€์˜ ๊ฒฝ์šฐ MCP ๊ด€์ ˆ์ด ์—†๊ณ  ์•ˆ์žฅ๊ด€์ ˆ(TM)์˜ ๋‘ ์ถ•์„ ํ•œ ๋ชจํ„ฐ๋กœ ๊ตฌ๋™ํ•˜๋Š” ํŠน์ดํ•œ ์„ค๊ณ„์˜€๋Š”๋ฐ, ์ด๋Š” ์—„์ง€์˜ ๋…๋ฆฝ์  ์›€์ง์ž„์„ ์ œํ•œํ•ฉ๋‹ˆ๋‹ค. ์ธ๊ฐ„ ์—„์ง€๋Š” ์†๋ฐ”๋‹ฅ ์ชฝ์œผ๋กœ ๊ตฝํžˆ๋Š” ๊ฒƒ(flexion)๊ณผ ์†๋ฐ”๋‹ฅ ํ‰๋ฉด์—์„œ ๋ฒŒ์–ด์ง€๋Š” ๊ฒƒ(abduction)์„ ๋ณ„๊ฐœ๋กœ ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, EyeSight Hand ์—„์ง€๋Š” ์•„๋งˆ ๊ฒฐํ•ฉ๋œ ์›€์ง์ž„๋งŒ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์—„์ง€๊ฐ€ ํ•œ ๊ฐ€์ง€ ๊ถค์ ์„ ๋”ฐ๋ผ์„œ๋งŒ ์›€์ง์—ฌ์„œ, ์„ธ๋ฐ€ํ•œ ์กฐํ˜•(grasp shape)์˜ ๋‹ค์–‘์„ฑ์€ ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์—ญ์‹œ ์ถ”ํ›„ ๋“€์–ผ ๋ชจํ„ฐ ๊ตฌ๋™์œผ๋กœ ๊ฐœ์„ ๋  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค.

์„ผ์„œ ์ธก๋ฉด์—์„œ๋Š”, 8๊ฐœ์˜ ์นด๋ฉ”๋ผ๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋‹ค๋ฃจ๋Š” ์‹œ์Šคํ…œ ํ†ตํ•ฉ์˜ ๋ณต์žก๋„์™€ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๋น„์šฉ์ด ์ƒ๊ฐ๋ฉ๋‹ˆ๋‹ค. ๋ผ์ฆˆ๋ฒ ๋ฆฌํŒŒ์ด 2๋Œ€์™€ ZeroMQ๋กœ ์ŠคํŠธ๋ฆฌ๋ฐํ•˜๋Š” ๋“ฑ ๊ฝค ๊ณต๋“ค์—ฌ ์„ธํŒ…ํ–ˆ๋Š”๋ฐ, ์ด๋Š” ์ผ๋ฐ˜ ์—ฐ๊ตฌ์ž๊ฐ€ ๋™์ผ ํ”Œ๋žซํผ์„ ํ™œ์šฉํ•˜๋ ค๋ฉด ๋‹ค์†Œ ๋ฒˆ๊ฑฐ๋กœ์šด ๋ถ€๋ถ„์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ์ด‰๊ฐ ์˜์ƒ์„ 8๊ฐœ๋‚˜ ๋„ฃ๋‹ค๋ณด๋‹ˆ, ์ •์ฑ… ์ž…๋ ฅ ์ฐจ์›์ด ๋งค์šฐ ๋†’์•„ ํ•™์Šต ๋ถ€๋‹ด๋„ ํฝ๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” ResNet-18๋กœ ๊ฐ๊ฐ ์ธ์ฝ”๋”ฉํ•ด ๋ณ‘ํ•ฉํ–ˆ์ง€๋งŒ, ๋งŒ์•ฝ ์†๊ฐ€๋ฝ์ด ๋” ๋Š˜์–ด๋‚˜๊ฑฐ๋‚˜ ์นด๋ฉ”๋ผ ํ•ด์ƒ๋„๋ฅผ ๋†’์ด๋ฉด ํ˜„ ์ ‘๊ทผ์€ ํ•œ๊ณ„์— ๋ถ€๋”ชํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํšจ์œจ์ ์ธ ํ”ผ์ฒ˜ ์••์ถ•์ด๋‚˜ ์ค‘์š” ์„ผ์„œ ์„ ํƒ ๋“ฑ์ด ํ–ฅํ›„ ๊ณผ์ œ๋กœ ๋– ์˜ค๋ฅผ ์ˆ˜ ์žˆ์ฃ . ๋‹คํ–‰ํžˆ dropout ๊ธฐ๋ฒ• ๋“ฑ์œผ๋กœ ๋ชจ๋ธ์ด ํ•„์š”ํ•œ ์ •๋ณด๋งŒ ์ทจํ•˜๋„๋ก ์œ ๋„ํ–ˆ์ง€๋งŒ, ๋ณด๋‹ค ๊ตฌ์กฐ์ ์œผ๋กœ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ‘œํ˜„ ํ•™์Šต์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ์—ฐ๊ตฌ์˜ ์—ฌ์ง€๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฉด์—์„œ ๋ณด์ž๋ฉด, ์ด๋ฒˆ ์—ฐ๊ตฌ๋Š” ์˜คํ”„๋กœ๋ผ์ธ ๋ชจ๋ฐฉํ•™์Šต(offline IL)์œผ๋กœ ์ˆ˜ํ–‰๋˜์–ด, ์‹œ๋ฒ”์˜ ๋ถ„ํฌ ๋ฐ– ์ƒํ™ฉ์ด๋‚˜ ์‹คํŒจ ๋ณต๊ตฌ์— ์•ฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ๊ฒฐ๊ณผ์—์„œ๋„ ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ๋Š” 30% ์„ฑ๊ณต์— ๋จธ๋ฌผ๋ €๋Š”๋ฐ, ์‹คํŒจ ์‚ฌ๋ก€์—์„œ ํ•œ๋ฒˆ ๋†“์นœ ๋šœ๊ป‘์„ ๋‹ค์‹œ ์žก์œผ๋ ค ์‹œ๋„ํ•œ๋‹ค๋“ ๊ฐ€ ํ•˜๋Š” ์žฌ์‹œ๋„ ์ „๋žต์€ ์—†์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” IL์˜ ํ•œ๊ณ„๋กœ, ํ•œ๋ฒˆ ์ž˜๋ชป๋˜๋ฉด ๊ณ„์† ์˜คํ”„ ์ •์ฑ…์œผ๋กœ ๋ฐ€๊ณ  ๋‚˜๊ฐ€๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ฐ•ํ™”ํ•™์Šต(RL)์ด๋‚˜ online ๋Ÿฌ๋‹์„ ์ ‘๋ชฉํ•˜๋ฉด ์‹คํŒจ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ๊ฒ ์ง€๋งŒ, ์ด๋Š” ๋˜ ๋งŽ์€ ์‹œ๋„๊ฐ€ ํ•„์š”ํ•˜์ฃ . ๋‹คํ–‰ํžˆ EyeSight Hand๋Š” ํŠผํŠผํ•˜๋‹ˆ RL์„ ํ•ด๋ณผ ์ˆ˜๋„ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค๋งŒ, 8๊ฐœ ์ด‰๊ฐ ์„ผ์„œ์˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๊นŒ์ง€ ํฌํ•จํ•˜์—ฌ ํ•™์Šตํ•˜๋ ค๋ฉด ๊ณ„์‚ฐ๋Ÿ‰์ด ์ƒ๋‹นํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ๋ถ€๋ถ„์€ ํ˜„์‹ค๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๋ณ‘ํ–‰์ด๋‚˜, ์ธ๊ฐ„์˜ ์ถ”๊ฐ€์ ์ธ ๊ต์ • ํ”ผ๋“œ๋ฐฑ ๋“ฑ์„ ์„ž๋Š” ๋ฐฉ๋ฒ• ๋“ฑ์œผ๋กœ ๊ฐœ์„  ๊ฐ€๋Šฅํ•ด ๋ณด์ž…๋‹ˆ๋‹ค.

๊ด€๋ จ ์—ฐ๊ตฌ์™€ ๋น„๊ตํ•˜๋ฉด, EyeSight Hand๋Š” โ€œ๋งŒ๋Šฅ ํ†ตํ•ฉโ€ ์ง€ํ–ฅ์œผ๋กœ ์ฐจ๋ณ„ํ™”๋ฉ๋‹ˆ๋‹ค. ์ตœ๊ทผ All-While-Feeling ์†(Ars Electronica 2024)์ด๋ผ๋“ ๊ฐ€ Digit ๊ด€์ ˆ ์†๊ฐ€๋ฝ ๋“ฑ์˜ ์—ฐ๊ตฌ๊ฐ€ ์ด‰๊ฐ์„ ํฌ๊ฒŒ ๋ถ€๊ฐ์‹œ์ผฐ์ง€๋งŒ, ์ด๋“ค์€ ์ฃผ๋กœ 2-3 ์ž์œ ๋„ ๊ทธ๋ฆฌํผ ์ˆ˜์ค€์ด์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด EyeSight Hand๋Š” 7 DoF๋กœ ๋” ๋ณต์žกํ•œ ํ˜•์ƒ์„ ์ง€๋‹ˆ๊ณ , ์ „์ฒด ํ‘œ๋ฉด ์ด‰๊ฐ์„ ๊ฐ–์ท„๋‹ค๋Š” ์ ์—์„œ ์•ž์„œ๊ฐ‘๋‹ˆ๋‹ค. Shadow Hand ๋“ฑ์— ์™ธ๋ถ€ ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ๋ถ™์ธ ์‹œ๋„๋„ ์žˆ์—ˆ์œผ๋‚˜ ์ž์œ ๋„๊ฐ€ ๋†’์•„๋„ ์„ผ์„œ ํ•ด์ƒ๋„๊ฐ€ ๋‚ฎ์•˜๊ณ , ๋ชจ๋ฐฉํ•™์Šต๊นŒ์ง€ ์—ฐ๊ฒฐํ•œ ๊ฒฝ์šฐ๋Š” ์ฐพ์•„๋ณด๊ธฐ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ OpenAI์˜ Dactyl ๊ฐ™์€ ์œ ๋ช…ํ•œ ์‚ฌ๋ก€๋Š” ์ˆœ์ „ํžˆ ์ธ๊ณต์ง€๋Šฅ์˜ ์„ฑ๊ณผ์ง€๋งŒ, ์ดฌ์˜๋œ ์†๊ฐ€๋ฝ ์œ„์น˜๋ฅผ ๋ฏฟ๊ณ  RL์„ ํ•œ ๊ฒƒ์œผ๋กœ ์ด‰๊ฐ์ด ์—†์—ˆ๊ณ  ์‹ค์ œ๋ก  ์ˆ˜๋งŒ๋ฒˆ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•œ ๋์— ๊ฐ„์‹ ํžˆ ์‹คํ–‰ํ•œ ๊ฒƒ์ด์—ˆ์Šต๋‹ˆ๋‹ค. EyeSight Hand๋Š” ํ˜„์‹ค ์„ธ๊ณ„์—์„œ ์‚ฌ๋žŒ์ด ์‹œ์—ฐํ•œ ๊ฒƒ๋งŒ์œผ๋กœ ํ•™์Šต์„ ํ–ˆ๋‹ค๋Š” ์ ์—์„œ ๋ฐ์ดํ„ฐ ํšจ์œจ์„ฑ๊ณผ ์‹ค์šฉ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. DexMV ๊ฐ™์€ ์—ฐ๊ตฌ๊ฐ€ ๋น„๋””์˜ค์—์„œ ์ธ๊ฐ„ ์† ์›€์ง์ž„์„ ์ถ”์ •ํ•ด ๋กœ๋ด‡์— ๋ชจ๋ฐฉ์‹œํ‚ค๋Š” ๋“ฑ ํฅ๋ฏธ๋กœ์šด ๋ฐฉํ–ฅ๋„ ์žˆ์ง€๋งŒ, ๊ฒฐ๊ตญ ์ •ํ™•ํ•œ ์ž‘์—… ์ˆ˜ํ–‰์—๋Š” ์‹ค์ œ ํ™˜๊ฒฝ๊ณผ ์ด‰๊ฐ ์ •๋ณด๊ฐ€ ๊ฒฐ์ •์ ์ด๋ž€ ๊ฒƒ์„ ์ด ๋…ผ๋ฌธ์€ ๋ณด์—ฌ์ค€ ์…ˆ์ž…๋‹ˆ๋‹ค.

์ •๋ฆฌํ•˜์ž๋ฉด, EyeSight Hand๋Š” ํ˜„์žฌ ๊ฐ€์žฅ ์ข…ํ•ฉ์ ์œผ๋กœ ์ž˜ ๊ฐ–์ถฐ์ง„ ๋กœ๋ด‡ ์† ํ”Œ๋žซํผ ์ค‘ ํ•˜๋‚˜๋กœ ํ‰๊ฐ€ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค. ํœด๋จธ๋…ธ์ด๋“œ ์† ์—ฐ๊ตฌ์˜ ์ถ”์„ธ๋ฅผ ํ•œ ๋‹จ๊ณ„ ์˜ฌ๋ ธ๋‹ค๊ณ ๋„ ๋ณผ ์ˆ˜ ์žˆ์ฃ . ๋ฌผ๋ก  ์™„๋ฒฝํ•˜์ง€๋Š” ์•Š์ง€๋งŒ, ์ €๋น„์šฉ์œผ๋กœ ํŠผํŠผํ•œ ๊ตฌ์กฐ, ํ’๋ถ€ํ•œ ๊ฐ๊ฐ, ํ•™์Šต ์นœํ™”์„ฑ๊นŒ์ง€ ๊ณ ๋ คํ•œ ์ ์ด ์ธ์ƒ์ ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ†ตํ•ฉ์  ์ ‘๊ทผ์€ ์•ž์œผ๋กœ ๋กœ๋ด‡ ์† ์—ฐ๊ตฌ์—์„œ ์ค‘์š”ํ•œ ๋ฒค์น˜๋งˆํฌ๊ฐ€ ๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค.

์š”์•ฝ ๋ฐ ๊ฒฐ๋ก 

EyeSight Hand ๋…ผ๋ฌธ์€ ๋กœ๋ด‡ ์† ์—ฐ๊ตฌ์˜ ํ˜„์žฌ ์ง€ํ‰์„ ๋„“ํžŒ ์ž‘ํ’ˆ์ž…๋‹ˆ๋‹ค. ์ด๋“ค์€ ์ธ๊ฐ„ ์†์˜ ํ˜•ํƒœ์™€ ๊ธฐ๋Šฅ์„ ๋ณธ๋”ฐ๋˜ ํ˜„์‹ค์ ์ธ ์ ˆ์ถฉ์„ ํ†ตํ•ด 7์ž์œ ๋„ ์†์„ ๋งŒ๋“ค์—ˆ๊ณ , ์ค€-์ง์ ‘ ๊ตฌ๋™์ด๋ผ๋Š” ๋…์ฐฝ์  ๋ฐฉ์‹์œผ๋กœ ๊ฐ•์ธํ•จ๊ณผ ์œ ์—ฐ์„ฑ์„ ๋ชจ๋‘ ์žก์•˜์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์†๊ฐ€๋ฝ๊ณผ ์†๋ฐ”๋‹ฅ ์ „๋ฉด์— ๋ถ„ํฌํ•œ 8๊ฐœ์˜ ๋น„์ „ ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡ ์†์— ์ด‰๊ฐ์˜ ๋ˆˆ์„ ๋‹ฌ์•„์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋•๋ถ„์— EyeSight Hand๋Š” ์ถฉ๋Œ์ด๋‚˜ ๋งˆ๋ชจ ๊ฑฑ์ • ์—†์ด ์ˆ˜๋ฐฑ ๋ฒˆ์˜ ์‹คํ—˜์„ ๊ฒฌ๋””๋ฉฐ, ํ’๋ถ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์Œ“์•„ ๋ชจ๋ฐฉ ํ•™์Šต์œผ๋กœ ์ž‘์—…์„ ์ตํž ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ๋ณ‘๋šœ๊ป‘ ์—ด๊ธฐ, ์ ‘์‹œ ์˜ฎ๊ธฐ๊ธฐ, ์ ํ†  ์ž๋ฅด๊ธฐ ๋“ฑ์˜ ๊นŒ๋‹ค๋กœ์šด ์ž‘์—…์—์„œ, ํ•™์Šต๋œ ์ •์ฑ…์ด ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ํ™˜๊ฒฝ์„ ์กฐ์ž‘ํ•˜๊ณ , ํŠนํžˆ ์ด‰๊ฐ์„ ํ™œ์šฉํ•  ๋•Œ ์„ฑ๊ณต๋ฅ ์ด ๋น„์•ฝ์ ์œผ๋กœ ํ–ฅ์ƒ๋˜๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. โ€œ์†์— ๋ˆˆ์„ ๋‹ฌ์•„์ฃผ๋‹ˆ ๋น„๋กœ์†Œ ์„ฌ์„ธํ•œ ์ผ๋“ค์„ ํ•ด๋‚ด๋”๋ผโ€๋Š” ๋ฉ”์‹œ์ง€๋ฅผ ์ˆ˜์น˜๋กœ ์ฆ๋ช…ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ด ์—ฐ๊ตฌ๋Š” ๋กœ๋ด‡๊ณตํ•™์ž์—๊ฒŒ ์—ฌ๋Ÿฌ ํ†ต์ฐฐ์„ ์ค๋‹ˆ๋‹ค. ํ•˜๋“œ์›จ์–ด ์„ค๊ณ„์™€ AI ์ œ์–ด์˜ ๊ณต๋™ ์ตœ์ ํ™”๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€, ๊ทธ๋ฆฌ๊ณ  ์ธ๊ฐ„์˜ ๋Šฅ๋ ฅ์„ ๋ชจ๋ฐฉํ•˜๋ ค๋ฉด ๋‹จ์ˆœํžˆ ๊ธฐ๊ณ„ ๊ตฌ์กฐ๋ฟ ์•„๋‹ˆ๋ผ ๊ฐ๊ฐ์˜ ํ†ตํ•ฉ์ด ํ•„์ˆ˜์ž„์„ ๊นจ๋‹ซ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. EyeSight Hand์ฒ˜๋Ÿผ ์„ผ์„œ๋ฆฌ์น˜(sensor-rich)ํ•˜๊ณ  ์ปดํ”Œ๋ผ์ด์–ธํŠธํ•œ ํ”Œ๋žซํผ์ด ์•ž์œผ๋กœ ๋” ๋งŽ์ด ๋‚˜์˜ฌ์ˆ˜๋ก, ๋กœ๋ด‡์˜ ๋‹ค์žฌ๋‹ค๋Šฅํ•จ์€ ํฌ๊ฒŒ ํ–ฅ์ƒ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•œํŽธ์œผ๋กœ, ์ด๋Ÿฌํ•œ ํ”Œ๋žซํผ์„ ํšจ๊ณผ์ ์œผ๋กœ ๋‹ค๋ฃจ๋Š” ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์—ญ์‹œ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฒˆ ๋…ผ๋ฌธ์—์„œ ๋ณด์—ฌ์ค€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ณ‘ํ•ฉ ๊ธฐ๋ฒ•์ด๋‚˜ ๋“œ๋กญ์•„์›ƒ ํŠธ๋ฆญ์€ ๋น™์‚ฐ์˜ ์ผ๊ฐ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์•ž์œผ๋กœ๋Š” ์ด‰๊ฐ ์ •๋ณด๋กœ๋ถ€ํ„ฐ ํ•ต์‹ฌ ํ”ผ์ฒ˜๋ฅผ ์ถ”์ถœํ•˜๊ฑฐ๋‚˜, ์‹œ๊ฐ-์ด‰๊ฐ ๊ฐ„ ์‹ ๋ขฐ๋„๋ฅผ ์‹ค์‹œ๊ฐ„ ํ‰๊ฐ€ํ•˜์—ฌ ๊ฐ€์ค‘์น˜๋ฅผ ์กฐ์ ˆํ•˜๋Š” ๋˜‘๋˜‘ํ•œ ์ •์ฑ… ๋“ฑ์ด ์—ฐ๊ตฌ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ฐ•ํ™”ํ•™์Šต๊ณผ์˜ ๊ฒฐํ•ฉ์œผ๋กœ, ์‚ฌ๋žŒ์ด ์‹œ์—ฐํ•˜๊ธฐ ์–ด๋ ค์šด ๋” ์ฐฝ์˜์ ์ธ ์กฐ์ž‘ ๊ธฐ์ˆ ์„ ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ํ„ฐ๋“ํ•˜๋Š” ๋ฐฉํ–ฅ๋„ ๊ธฐ๋Œ€ํ•ด๋ณผ ๋งŒํ•ฉ๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ๋…ผ๋ฌธ ์ €์ž๋“ค์€ ํ–ฅํ›„ ์†๊ฐ€๋ฝ์„ ์ถ”๊ฐ€ํ•˜๊ณ  ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐœ์„ ํ•  ๊ฒƒ์„ ์–ธ๊ธ‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์™„์ „ํ•œ ์˜ค์ง€ ๋กœ๋ด‡ ์†์— ๊ฐ€๊นŒ์›Œ์งˆ์ˆ˜๋ก, ์•„๋งˆ ์ง€๊ธˆ๋ณด๋‹ค ํ›จ์”ฌ ๋” ์ธ๊ฐ„ ๊ฐ™์€ ์„ฌ์„ธํ•œ ์กฐ์ž‘์ด ๊ฐ€๋Šฅํ•ด์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์ด ๊ณต์žฅ์ด๋‚˜ ์—ฐ๊ตฌ์†Œ๋ฅผ ๋„˜์–ด, ์šฐ๋ฆฌ ์ผ์ƒ ์†์—์„œ ์†์œผ๋กœ ํ•˜๋Š” ์ผ๋“ค (๋ฌธ ์—ด๊ธฐ, ์š”๋ฆฌ ์ค€๋น„, ๊ณต๊ตฌ ์‚ฌ์šฉ ๋“ฑ)์„ ๋„์šธ ๋‚ ๋„ ์•ž๋‹น๊ฒจ์ง€๋ฆฌ๋ผ ์ƒ๊ฐ๋ฉ๋‹ˆ๋‹ค. EyeSight Hand๋Š” ๊ทธ ๋น„์ „์„ ํ–ฅํ•œ ์ค‘์š”ํ•œ ๊ฑธ์Œ์„ ๋‚ด๋””๋”˜ ์…ˆ์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡๊ณตํ•™๊ณ„์˜ ํŒŒ์ธ๋งŒ ๊ต์ˆ˜๊ฐ€ ์žˆ๋‹ค๋ฉด, ์•„๋งˆ โ€œ์ด ๋กœ๋ด‡ ์†์€ ๋ˆˆ์œผ๋กœ ๋ณด๊ณ  ๋А๋‚„ ์ค„ ์•„๋‹ˆ๊นŒ, ๋ฐฐ์šฐ๊ณ  ๋ฐœ์ „ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋ฌด๊ถ๋ฌด์ง„ํ•˜๋‹จ๋‹ค!โ€๋ผ๊ณ  ์žฌ๋ฏธ์žˆ๊ฒŒ ํ‰ํ–ˆ์„์ง€๋„ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„์˜ ์†๋ ์ง€ํ˜œ๋ฅผ ๊ธฐ๊ณ„์— ๋ถˆ์–ด๋„ฃ์œผ๋ ค๋Š” ๋„์ „์€ ๊ณ„์†๋˜๊ณ  ์žˆ์œผ๋ฉฐ, EyeSight Hand๋Š” ๊ทธ ์—ฌ์ •์—์„œ ๋นผ๋†“์„ ์ˆ˜ ์—†๋Š” ์ด์ •ํ‘œ๋กœ ๊ธฐ๋ก๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

Copyright 2026, JungYeon Lee