flowchart LR
subgraph Source["Source Sensor (labeled force data)"]
S1[GelSight raw image]
end
subgraph Target["Target Sensor (no force labels)"]
T1[uSkin / TacTip signal]
end
S1 --> SM[Marker Representation - source]
T1 --> TM[Marker Representation - target]
SM --> M2M[Marker-to-Marker Translation]
M2M --> FAKE[Synthetic target-style markers]
FAKE --> FP[Force Prediction Model]
TM -.shares same domain.-> FP
FP --> OUT[Fx, Fy, Fz]
๐Learn Force From Each Other
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
์๋ก
์ด๊ฐ ์ผ์๋ฅผ ๋ค๋ค ๋ณธ ๋ก๋ด ์ฐ๊ตฌ์๋ผ๋ฉด ๋๊ตฌ๋ ํ ๋ฒ์ฏค ๊ฒช๋ ์ข์ ์ด ์์ต๋๋ค. ์ด๋ ต๊ฒ ํ ์ผ์๋ก ํ(force) ์์ธก ๋ชจ๋ธ์ ํ์ต์์ผ ๋์๋๋ฐ, ์ผ์๊ฐ ๋จ์ข ๋๊ฑฐ๋ ์ ๋ฒ์ ์ผ๋ก ๊ต์ฒด๋๊ฑฐ๋ ํน์ ๋ค์ฏ ์๊ฐ๋ฝ์ ์๋ก ๋ค๋ฅธ ์ข ๋ฅ์ ์ผ์๋ฅผ ๋ฌ์๋๋, ๊ทธ๋์ ๋ชจ์ ๋ฐ์ดํฐ์ ๋ชจ๋ธ์ด ๊ฑฐ์ ํต์งธ๋ก ๋ฌด์ฉ์ง๋ฌผ์ด ๋๋ ์ํฉ์ ๋๋ค. ๊ฒฐ๊ตญ ์ผ์๋ง๋ค ์ฒ์๋ถํฐ ๋ค์ ํ-์ด๋ฏธ์ง ์(force-image pair) ๋ฐ์ดํฐ๋ฅผ ์์งํด์ผ ํ๋๋ฐ, ์ด ๊ณผ์ ์๋ ์ ๋ฐํ force/torque ์ผ์, ๋ก๋ด ํ, ์์(indenter)๋ฅผ ๋์ํ ์๋ง ๋ฒ์ ์ ์ด ์คํ์ด ํ์ํฉ๋๋ค. ์ผ์ ์ข ๋ฅ๊ฐ ๋์ด๋ ์๋ก ๋น์ฉ์ ๊ณฑ์ ์ผ๋ก ๋ถ์ด๋ฉ๋๋ค.
์ด ๋ ผ๋ฌธ์ ์ด ๋ฌธ์ ๋ฅผ ์ ๋ฉด์ผ๋ก ๋ค๋ฃน๋๋ค. ์ ๋ชฉ ๊ทธ๋๋ก โ์๋ก์๊ฒ์ ํ ๊ฐ์ง๋ฅผ ๋ฐฐ์ฐ๋(learn force sensing from each other)โ ์ด๊ฐ ์ผ์๋ฅผ ๋ง๋๋ ๊ฒ์ด ๋ชฉํ์ด๊ณ , ๊ทธ ํ๋ ์์ํฌ ์ด๋ฆ์ GenForce์ ๋๋ค.
์ ์ผ์๋ง๋ค ๋ค์ ํ์ตํด์ผ ํ๋๊ฐ
ํต์ฌ ์์ธ์ ๊ฐ์ ๋ณํ(deformation)์ด๋ผ๋ ์ผ์๋ง๋ค ์ ํ ๋ค๋ฅธ ์ ํธ๋ฅผ ๋ง๋ ๋ค๋ ๋ฐ ์์ต๋๋ค. ๊ฐ์ ๋ฌผ์ฒด๋ฅผ ๊ฐ์ ํ์ผ๋ก ๋๋ฌ๋,
- GelSight ๊ณ์ด(vision-based tactile sensor, VBTS)์ ์นด๋ฉ๋ผ๋ก ํ์ฑ์ฒด ํ๋ฉด์ ์ฐํ ์ (marker)๋ค์ ์์ง์์ ๋ด ๋๋ค.
- TacTip์ ๋ด๋ถ์ ํ(pin) ๊ตฌ์กฐ๊ฐ ๋ฐํ ์์ด ๋ ๊น์ ์์ (>5mm)์์ ํฐ ๋ณํ ์ ํธ๋ฅผ ๋ง๋ญ๋๋ค.
- uSkin์ ์๊ธฐ(magnetic) ๋ฐฉ์์ผ๋ก 4ร4 ํ์ (taxel) ๊ฒฉ์๊ฐ 3์ถ ๋ณํ์ ์ธก์ ํฉ๋๋ค.
์ผ์ฑ ์๋ฆฌ, ๊ตฌ์กฐ ์ค๊ณ, ์ฌ๋ฃ ๋ฌผ์ฑ์ด ๋ชจ๋ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์, ํ ์ผ์์์ ํ์ตํ โ์ด ์ ํธ ํจํด โ ์ด๋งํผ์ ํโ์ด๋ผ๋ ๋งคํ์ด ๋ค๋ฅธ ์ผ์์๋ ๊ทธ๋๋ก ํตํ์ง ์์ต๋๋ค.
๋์์ ๋น๋ ค์จ ์ง๊ด
GenForce์ ๋ฐ์์ ์ธ๊ฐ์ ์ฒด์ฑ๊ฐ๊ฐํผ์ง(somatosensory cortex)์์ ์๊ฐ์ ๋ฐ์์ต๋๋ค. ์ฐ๋ฆฌ ์๊ฐ๋ฝ ๋, ์๋ฐ๋ฅ, ์๋ฑ์ ํผ๋ถ๋ ๊ตฌ์กฐ๊ฐ ์ ๊ฐ๊ฐ์ด์ง๋ง, ๋๋ ์ด๋ค์ ํ๋์ ๊ณตํต๋ ๊ฐ๊ฐ ํํ(unified sensory encoding)์ผ๋ก ๋ณํํด ํตํฉ์ ์ผ๋ก ๋ค๋ฃน๋๋ค. ๊ทธ๋์ ์ฐ๋ฆฌ๋ ์๊ฐ๋ฝ ๋์ผ๋ก ๋ฐฐ์ด โ๋ฏธ๋๋ฌ์ง(slip)โ์ ๊ฐ๊ฐ์ ์๋ฐ๋ฅ์์๋ ์ฆ์ ํ์ฉํฉ๋๋ค.
GenForce๋ ์ด ์์ด๋์ด๋ฅผ ๊ทธ๋๋ก ๊ฐ์ ธ์ต๋๋ค. ๋ค์ํ ์ด๊ฐ ์ผ์์ ์ ํธ๋ฅผ ๊ณตํต์ ๋ง์ปค ํํ(shared marker representation)์ด๋ผ๋ ์ค๊ฐ ์ธ์ด๋ก ๋ฒ์ญํ ๋ค, ์ด ๊ณตํต ์ธ์ด ์์์ ํ์ ์์ธกํฉ๋๋ค. ๊ทธ๋ฌ๋ฉด ์ผ์ A์์ ํ์ตํ ํ ์์ธก ๋ฅ๋ ฅ์ ์ผ์ B๋ก ์ถ๊ฐ ํ ๋ฐ์ดํฐ ์์ง ์์ด ์ฎ๊ธธ ์ ์๊ฒ ๋ฉ๋๋ค.
์ ๊ทธ๋ฆผ์์ ํต์ฌ์, ํ ๋ผ๋ฒจ์ด ์๋ ์์ค ์ผ์์ ๋ฐ์ดํฐ๋ฅผ ํ๊น ์ผ์์ ์คํ์ผ๋ก ๋ฒ์ญํด ์ฃผ๋ฉด, ์์ค์ ํ ๋ผ๋ฒจ์ ๊ทธ๋๋ก ํ๊น ๋๋ฉ์ธ์ ์ฎ๊ฒจ ์ธ ์ ์๋ค๋ ์ ์ ๋๋ค. ํ๊น ์ผ์๋ก๋ ๋จ ํ ๋ฒ๋ force/torque ์ผ์๋ฅผ ๋์ํด ํ์ ์ธก์ ํ์ง ์์๋ ๋ฉ๋๋ค.
๋ฐฉ๋ฒ
GenForce๋ ํฌ๊ฒ ์ธ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. (1) ๋ง์ปค ํํ ์ถ์ถ, (2) ๋ง์ปค-ํฌ-๋ง์ปค(M2M) ๋ฒ์ญ, (3) ํ ์์ธก. ์์๋๋ก ์ดํด๋ด ๋๋ค.
1. ๋ง์ปค ํํ ์ถ์ถ (Marker Representation)
๊ฐ์ฅ ๋จผ์ , ์๋ก ๋ค๋ฅธ ์ผ์์ ์ถ๋ ฅ์ ๋ง์ปค ๊ธฐ๋ฐ ์ด์ง ์ด๋ฏธ์ง(marker-based binary image)๋ผ๋ ๊ณตํต ํ์์ผ๋ก ๋ฐ๊ฟ๋๋ค. ๋ง์ปค๋ ํ์ฑ์ฒด ํ๋ฉด์ด๋ ๋ด๋ถ์ ์ฐํ ์ /ํ์ ์์น์ด๋ฉฐ, ์ด๋ค์ด ์ ์ด์ผ๋ก ์ธํด ์์ง์ด๋ ํจํด์ด ๊ณง ๋ณํ ์ ๋ณด์ ๋๋ค. ๋ชจ๋ ์ผ์๋ฅผ โ๊ฒ์ ๋ฐฐ๊ฒฝ ์์ ํฐ ์ ๋ค์ด ๋ฐํ 256ร256 ์ด๋ฏธ์งโ๋ผ๋ ๋์ผํ ์๊ฐ ์ธ์ด๋ก ํต์ผํ๋ ๊ฒ์ด ํต์ฌ์ ๋๋ค.
- Vision-based ์ผ์(GelSight ๋ฑ): ๋ ๋จ๊ณ๋ก ๋ง์ปค๋ฅผ ๋ถ๋ฆฌํฉ๋๋ค. ๋จผ์ ๋ฐ๊ธฐ ์ ๊ทํ์ ๊ฐ๋ ์๊ณ(intensity thresholding)๋ก ๊ฑฐ์น(rough) ๋ง์ปค ์์ญ์ ๋ฝ๊ณ , ๊ทธ๋ค์ EfficientSAM(๊ฒฝ๋ Segment Anything ๊ณ์ด)์ผ๋ก ๊ฐ๋ณ ๋ง์ปค๋ฅผ ์ ๋ฐํ๊ฒ ๋ถํ (fine extraction)ํฉ๋๋ค.
- Taxel-based ์ผ์(uSkin ๋ฑ): ๋ค์ฑ๋ ์์ ํธ(raw signal)๋ฅผ ๋ง์ปค์ ๋ณ์(displacement)์ ์ง๋ฆ ๋ณํ(diameter change)๋ก ๋ณํํฉ๋๋ค. ์ด๋ ๋ง์ปค ์๊ฐํ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ดํ๋ 7๊ฐ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํด, ์๊ธฐ ์ ํธ๋ฅผ โ์์ง์ด๋ ์ โ ์ด๋ฏธ์ง๋ก ๋ ๋๋งํฉ๋๋ค.
์ด ๋จ๊ณ์ ์๋ฏธ๋ ์ง๊ด์ ์ ๋๋ค. ๋ฌผ๋ฆฌ์ ์๋ฆฌ๊ฐ ๋ค๋ฅธ ์ผ์๋ค์ โ๋ณํ์ ๊ธฐํํ(geometry of deformation)โ์ด๋ผ๋ ๊ณตํต ๋ถ๋ชจ๋ก ๋์ด๋ด๋ฆฌ๋ ๊ฒ์ ๋๋ค. ์๊น, ์กฐ๋ช , ์ฌ์ง ์ฐจ์ด ๊ฐ์ ๋๋ฉ์ธ ํน์ ์ ๊ตฐ๋๋๊ธฐ๋ฅผ ๋ฒ๊ฒจ๋ด๊ณ , ๋ณํ์ ๋ณธ์ง๋ง ๋จ๊น๋๋ค.
2. ๋ง์ปค-ํฌ-๋ง์ปค ๋ฒ์ญ (M2M Translation)
๋ง์ปค ์ด๋ฏธ์ง๋ก ํต์ผํ์ด๋, ๋ง์ปค์ ๋ฐฐ์น ํจํด(Array, Circle, Diamond ๋ฑ)๊ณผ ๋ณํ ์์์ ์ผ์๋ง๋ค ๋ค๋ฆ ๋๋ค. ๊ทธ๋์ ํ ์ผ์์ ๋ง์ปค ์ด๋ฏธ์ง๋ฅผ ๋ค๋ฅธ ์ผ์์ ๋ง์ปค ์คํ์ผ๋ก ๋ฒ์ญํ๋ ์์ฑ ๋ชจ๋ธ์ด ํ์ํฉ๋๋ค. ์ด ๋ถ๋ถ์ด GenForce์ ๊ธฐ์ ์ ์ฌ์ฅ๋ถ์ ๋๋ค.
M2M ๋ชจ๋ธ์ ๋ ์์๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- VAE ์ธ์ฝ๋-๋์ฝ๋: SD-Turbo(Stable Diffusion ๊ณ์ด์ ๋น ๋ฅธ ๋ณํ) ์ํคํ ์ฒ์ LoRA(rank-4)๋ฅผ ์ ์ฉํด, 256ร256 ๋ง์ปค ํจํด์ ์ ์ฌ ๊ณต๊ฐ์ผ๋ก ์์ถํ๊ณ ๋ณต์ํฉ๋๋ค.
- ์ด๋ฏธ์ง ์กฐ๊ฑด๋ถ ํ์ฐ ๋ชจ๋ธ(image-conditioned diffusion): ์ญ์ SD-Turbo ๊ธฐ๋ฐ UNet ๋ฐฑ๋ณธ์ LoRA(rank-8)๋ฅผ ์น์ต๋๋ค. ์์ฑ๊ธฐ G(I^S, I^T_0)๋ ์์ค ๋๋ฉ์ธ ์ด๋ฏธ์ง I^S๋ฅผ ๋ฐ์, ํ๊น ๋๋ฉ์ธ ์คํ์ผ์ ์ ํ๋ ๋ณํ ํน์ฑ(deformation)์ ๋ณด์กดํฉ๋๋ค. ์ด โ์คํ์ผ์ ๋ฐ๊พธ๋ ๋ด์ฉ(๋ณํ)์ ์ ์งโ ๊ณผ์ ์ cross-attention์ผ๋ก ๊ตฌํ๋ฉ๋๋ค.
์ฌ๊ธฐ์ ์ง๊ด์ ์ผ๋ก ์ค์ํ ์ : ์ผ๋ฐ์ ์ธ ์ด๋ฏธ์ง ๋ณํ(์: ๋งโ๏ธ์ผ๋ฃฉ๋ง)๊ณผ ๋ฌ๋ฆฌ, ์ฌ๊ธฐ์๋ ๋ณํ ์ ๋ณด๊ฐ ๊ณง ๋ผ๋ฒจ(ํ)๊ณผ ์ฐ๊ฒฐ๋ ํต์ฌ ์ ํธ์ด๋ฏ๋ก ์ ๋ ํผ์๋๋ฉด ์ ๋ฉ๋๋ค. ์คํ์ผ(์ด๋ ์ผ์์ฒ๋ผ ๋ณด์ด๋๊ฐ)๋ง ๋ฐ๊พธ๊ณ ๋ด์ฉ(์ผ๋ง๋, ์ด๋ ๋ฐฉํฅ์ผ๋ก ๋๋ ธ๋๊ฐ)์ ํฝ์ ๋จ์๋ก ์ถฉ์คํ ๋ณด์กดํด์ผ ํฉ๋๋ค.
์์ค ํจ์
ํ์ต ๋ชฉํ๋ ์ธ ๊ฐ์ง ์์ค์ ๊ฒฐํฉ์ ๋๋ค.
- ์ ๋์ ์์ค(adversarial loss) โ ๋ฒ์ญ๋ ์ด๋ฏธ์ง๊ฐ ํ๊น ์ผ์์ ์ง์ง ์ด๋ฏธ์ง์ฒ๋ผ ๋ณด์ด๋๋ก:
\mathcal{L}_{gan} = \mathbb{E}\big[\log D_T(I^T)\big] + \mathbb{E}\big[\log\big(1 - D_T(G(I^S, I^T_0))\big)\big]
์ฌ๊ธฐ์ D_T๋ ํ๊น ๋๋ฉ์ธ ํ๋ณ์(discriminator), I^T๋ ํ๊น ์ผ์์ ์ค์ ์ด๋ฏธ์ง์ ๋๋ค. ํ๋ณ์๋ โ์ง์ง ํ๊น ์ด๋ฏธ์งโ์ โ๋ฒ์ญ๋ ๊ฐ์งโ๋ฅผ ๊ตฌ๋ถํ๋ ค ํ๊ณ , ์์ฑ๊ธฐ๋ ์ด๋ฅผ ์์ด๋ ค ํ๋ฉด์ ์ ์ ์ง์ง ๊ฐ์ ํ๊น ์คํ์ผ์ ๋ง๋ค์ด๋ ๋๋ค.
- ๋ณต์ ์์ค(reconstruction loss) โ ๋ณํ ๋ด์ฉ ๋ณด์กด์ ์ํด L_2 ํฝ์ ๊ฑฐ๋ฆฌ์ LPIPS(์ง๊ฐ์ ์ ์ฌ๋)๋ฅผ ๊ฒฐํฉํฉ๋๋ค.
์ ์ฒด ์์ค์ ๊ฐ์คํฉ์ผ๋ก, ๋ณด๊ณ ๋ ๊ฐ์ค์น๋ \lambda_{gan}=0.5, \lambda_{lpips}=5.0, \lambda_{l2}=1.0 ์ ๋๋ค. LPIPS์ ๊ฐ์ฅ ํฐ ๊ฐ์ค์น๋ฅผ ๋ ์ ์์, โ์ฌ๋ ๋์ ๊ฐ์ ๋ณํ์ผ๋ก ๋ณด์ด๋์งโ๋ฅผ ๊ฐ์ฅ ์ค์ํ์์ ์ฝ์ ์ ์์ต๋๋ค.
์ต์ ํ๋ AdamW, ํ์ต๋ฅ 5\times10^{-6}, 100,000 ์คํ , ๋ฐฐ์น ํฌ๊ธฐ 16์ผ๋ก ์งํ๋ฉ๋๋ค.
2๋จ๊ณ ํ์ต: ์๋ฎฌ๋ ์ด์ ์ฌ์ ํ์ต โ ์ค๋ฐ์ดํฐ ๋ฏธ์ธ์กฐ์
๋ฐ์ดํฐ ํจ์จ์ ์ํด M2M์ ๋ ๋จ๊ณ๋ก ํ์ตํฉ๋๋ค.
- ์๋ฎฌ๋ ์ด์ ์ฌ์ ํ์ต: ๋ง์ปค ํจํด๋ณ ํฉ์ฑ ์ด๋ฏธ์ง ์ฝ 9,720์ฅ์ ์ฌ์ฉ. Array/Circle/Diamond ๊ฐ 4์ข , ์ด 12์ข ํจํด(Array1โ4 ๋ฑ)๊ณผ 132๊ฐ์ง ํจํด ์กฐํฉ์ผ๋ก ์ฌ์ ํ์ต.
- ์ค๋ฐ์ดํฐ ๋ฏธ์ธ์กฐ์ (fine-tuning): ์ค์ ์ผ์ ๋ฐ์ดํฐ๋ก ๋ง๋ฌด๋ฆฌ.
flowchart TB
SIM[Simulated marker images - 12 patterns] --> PRE[M2M Pretraining]
PRE --> FT[M2M Fine-tuning on real data]
FT --> MODEL[Trained M2M Translator]
subgraph Losses
GAN[Adversarial Loss]
L2[L2 Pixel Loss]
LP[LPIPS Perceptual Loss]
end
GAN --> MODEL
L2 --> MODEL
LP --> MODEL
3. ํ ์์ธก ๋ชจ๋ธ (Force Prediction)
๋ฒ์ญ๋ ๋ง์ปค ์ด๋ฏธ์ง ์ํ์ค๋ก๋ถํฐ 3์ถ ํ \{F_x, F_y, F_z\}๋ฅผ ํ๊ท(regression)ํ๋ ๋ชจ๋์ ๋๋ค. ์๊ฐ์ ๋ณํ(๋๋ฅด๊ณ ๋ฏธ๋๋ฌ์ง๋ ๋์ญํ)๋ฅผ ๋ด๊ธฐ ์ํด ์ํ์ค๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ผ๋ฉฐ, ์ ๋ ฅ ํ ์ ํ์์ (S \times B \times 3 \times 256 \times 256) (S=์ํ์ค ๊ธธ์ด, B=๋ฐฐ์น)์ ๋๋ค. ๊ตฌ์กฐ๋ ๋ค ๋ถ๋ถ์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค.
- RAFT ๊ธฐ๋ฐ ํน์ง ์ธ์ฝ๋: ์ฐ์ ์ด๋ฏธ์ง์์ ๊ดํ ํ๋ฆ(optical flow) ๊ณ์ด ํน์ง์ 128์ฐจ์์ผ๋ก ์ถ์ถ. ๋ง์ปค๋ค์ด โ์ด๋ป๊ฒ ์์ง์๋๊ฐโ๋ฅผ ํฌ์ฐฉํ๊ธฐ ์ข์ต๋๋ค.
- Convolutional GRU: ๊ณต๊ฐ ์ ๋ณด๋ฅผ ์ ์งํ๋ฉด์ ์๊ฐ์ ์์กด์ฑ(temporal dependency)์ ์บก์ฒ.
- ResNet ๋ชจ๋: ์ฑ๋์ 128โ256โ512๋ก ํ์ฅํ๊ณ ๊ณต๊ฐ ํด์๋๋ ์ค์ด๋ฉฐ ์ถ์์ ํน์ง์ ํ์ฑ.
- ํ๊ท ํค๋(regression head): sigmoid ํ์ฑํ๋ก 3์ถ ํ์ ์ถ๋ ฅ.
์์ค์ ํ๊ท ์ ๋ ์ค์ฐจ(MAE)์ ๋๋ค.
\mathcal{L}_{MAE} = \frac{1}{N}\sum_{i=1}^{N}\big\|\hat{F}_i - F_i\big\|_1
ํ ์์ธก ๋ชจ๋ธ ์ญ์ 2๋จ๊ณ๋ก ํ์ตํฉ๋๋ค. SGD(๋ชจ๋ฉํ 0.9, weight decay 5\times10^{-4})๋ก, ๋จผ์ ๋จ์ผ ์ผ์์์ ์ฌ์ ํ์ต(40 epoch, lr 1\times10^{-1}) ํ ์ ์ฒด ๋ฐ์ดํฐ๋ก ๋ฏธ์ธ์กฐ์ (40 epoch, lr 1\times10^{-3})ํฉ๋๋ค.
4. ์ฌ๋ฃ ๋ณด์ (Material Compensation)
๊ฐ์ ๋ง์ปค ํจํด์ด๋ผ๋ ํ์ฑ์ฒด์ ๊ฒฝ๋(softness)๊ฐ ๋ค๋ฅด๋ฉด ๊ฐ์ ํ์ ๋ํ ๋ณํ์ด ๋ฌ๋ผ์ง๋๋ค. GenForce๋ ์ฌ๋ฃ ๊ฒฝ๋ ์ฌ์ ์ง์(material softness prior)์ ๋์ ํด, ํ-๊น์ด(force-depth) ๊ด๊ณ๋ก๋ถํฐ ๋ณด์ ๊ณ์๋ฅผ ๊ณฑํฉ๋๋ค.
F^{SC} = F^{S} \times r
์ฌ๊ธฐ์ ๋ก๋ฉ(๋๋ฆ)๊ณผ ์ธ๋ก๋ฉ(๋)์ ๊ฐ๊ฐ ๋ค๋ฅธ ๊ณ์ r_l, r_u๋ฅผ ์ ์ฉํด Youngโs modulus ์ฐจ์ด๋ฅผ ๋ณด์ ํฉ๋๋ค. ์ง๊ด์ ์ผ๋ก, โ๋ ๋ฌด๋ฅธ ์ฌ๋ฃ๊ฐ ๊ฐ์ ๊น์ด๋ก ๋๋ ธ๋ค๋ฉด ์ค์ ํ์ ๋ ์๋คโ๋ ๋ฌผ๋ฆฌ๋ฅผ ๋ผ๋ฒจ์ ๋ฐ์ํ๋ ๊ฒ์ ๋๋ค.
์์ฌ์ฝ๋๋ก ๋ณด๋ ์ ์ฒด ํ์ดํ๋ผ์ธ
# Offline training
for each (source_sensor, target_sensor) pair:
source_markers = extract_markers(source_images) # SAM / taxel rendering
target_markers = extract_markers(target_images)
M2M = train_translation(source_markers, target_markers,
loss = w_gan*L_gan + w_lpips*LPIPS + w_l2*L2)
# Transfer: no force labels needed on target
synth_target = M2M.translate(source_markers) # style of target
labels = source_force_labels * material_ratio_r # compensation
ForcePredictor = train_regression(synth_target, labels, loss = MAE)
# Inference on real target sensor
real_target_markers = extract_markers(target_live_images)
F_xyz = ForcePredictor(real_target_markers)์คํ
๋ฐ์ดํฐ ์์ง ํ๊ฒฝ
๋ฐ์ดํฐ๋ UR5e ๋ก๋ด ํ + Nano17 force/torque ์ผ์ + 3D ํ๋ฆฐํ ์์(indenter) ๊ตฌ์ฑ์ผ๋ก ์์งํ์ต๋๋ค. ์ด๋ฏธ์ง๋ 40 Hz๋ก ์ํ์ค ์์งํ๊ณ , ๋ฒ์ ํ(normal force) 0โ18 N, ์ ๋จํ(shear force) ยฑ4 N ๋ฒ์๋ฅผ ๋ค๋ฃน๋๋ค. ๋ถ์์ ์ผ๋ก, ROBOTIQ 2-finger ๊ทธ๋ฆฌํผ๋ก ์์๋ฅผ ์ฅ์ด ์ค์น ๋ฐฉ์์ ์ํฅ์ ๋น๊ตํ๋ ์คํ๋ ํ์ต๋๋ค.
ํ๊ฐ 1: ๋์ข ์ผ์(Homogeneous) ์ ์ด
๊ฐ์ GelSight ๊ณ์ด์ด์ง๋ง ๋ง์ปค ํจํด์ด ๋ค๋ฅธ 5๊ฐ ๋ณํ(Array/Circle/Diamond) ์ฌ์ด์ ์ ์ด๋ฅผ ํ๊ฐํ์ต๋๋ค.
- ์ผ์๋น ์ฝ 180,000๊ฐ์ ํ-์ด๋ฏธ์ง ์, ๊ทธ๋ฆฌ๊ณ ์์น๋ฅผ ๋ง์ถ(location-paired) 17,280์ฅ.
- ์ด๋ฏธ์ง ๋ฒ์ญ ํ์ง: FID, KID๊ฐ ๋์ข ์ผ์์์ ๊ฐ๊ฐ 98%, 99% ์ด์ ๊ฐ์. ์ฆ ๋ฒ์ญ๋ ์ด๋ฏธ์ง๊ฐ ์ง์ง ํ๊น๊ณผ ๊ฑฐ์ ๊ตฌ๋ณ ๋ถ๊ฐ๋ฅํด์ง.
- ํ ์์ธก: ๋ฒ์ ํ MAE ์ต๋ 1 N ๋ฏธ๋ง(M2M ์์ ๋์ 4.8 N ๋๋น ๋ํญ ๊ฐ์ ). ์ ๋จํ F_x, F_y๋ ์ต๋ 0.24 N ๋ฏธ๋ง. ๊ฒฐ์ ๊ณ์ R^2๋ ์ธ ์ถ ํ๊ท 0.8 ์ด๊ณผ.
- ์ต์ ์กฐํฉ(Circle-II โ Diamond-I)์์๋ ์ ํ๋ 80% ๊ฐ์ .
ํ๊ฐ 2: ์ด์ข ์ผ์(Heterogeneous) ์ ์ด
์ผ์ฑ ์๋ฆฌ๊ฐ ์์ ํ ๋ค๋ฅธ GelSight โ๏ธ uSkin โ๏ธ TacTip ์ฌ์ด์ ์ ์ด์ ๋๋ค. ์ผ์๋น ์ฝ 100,000๊ฐ์ ํ-์ด๋ฏธ์ง ์์ ์ฌ์ฉํ์ต๋๋ค.
| ํญ๋ชฉ | ๊ฒฐ๊ณผ |
|---|---|
| F_z (๋ฒ์ ) MAE | 0.57 โ 1.14 N (๋ชจ๋ ์กฐํฉ) |
| F_x MAE | < 0.36 N |
| F_y MAE | < 0.27 N |
| ๋ํ ๊ฐ์ ์ฌ๋ก | uSkin โ TacTip์ F_z ์์ธก 91.4% ๊ฐ์ |
๋ฌผ๋ฆฌ ์๋ฆฌ๊ฐ ๋ค๋ฅธ ์ผ์ ๊ฐ ์ ์ด์์๋ 1 N ์ํ์ ์ค์ฐจ๋ก 3์ถ ํ์ ๋ณต์ํ๋ค๋ ์ ์ด ์ธ์์ ์ ๋๋ค. ๋ง์ปค๋ผ๋ ๊ณตํต ํํ์ด ์ค์ ๋ก โ์ผ์ ๋ ๋ฆฝ์ ๋ณํ ์ธ์ดโ ์ญํ ์ ํ์์ ์์ฌํฉ๋๋ค.
ํ๊ฐ 3: ์ฌ๋ฃ ๋ณด์
์๋ก ๋ค๋ฅธ base:activator ๋น์จ(6:1 ~ 18:1)๋ก ๋ง๋ 7์ข ํ์ฑ์ฒด, ์ฝ 30,000๊ฐ ํ-์ ์ด๋ฏธ์ง๋ก ํ๊ฐ. ๋ณด์ ์ ๋จ๋จํจโ๋ฌด๋ฆ ์ ์ด์ 90%, ๋ฌด๋ฆโ๋จ๋จํจ ์ ์ด์ 62%์์ ํจ๊ณผ์ ์ด์์ต๋๋ค. ๋ฌด๋ฅธ ์ฌ๋ฃ์์ ๋จ๋จํ ์ฌ๋ฃ๋ก ๊ฐ์๋ก ๋ณด์ ์ด ์ด๋ ค์ด๋ฐ, ์ด๋ ๋ฌด๋ฅธ ์ฌ๋ฃ์์ ์์ ํ์๋ ํฐ ๋ณํ์ด ์ผ์ด๋ ์ ๋ณด๊ฐ ํฌํ๋๊ธฐ ์ฝ๊ธฐ ๋๋ฌธ์ผ๋ก ํด์ํ ์ ์์ต๋๋ค.
์์ฉ (์ํฌ์/์ ๋ ๋ฒ์ )
์ํฌ์ ๋ฐ Nature Communications ๋ฒ์ ์์๋ GenForce๋ฅผ ์ผ์ ๋ฌผ์ฒด ์ก๊ธฐ, ๋ฏธ๋๋ฌ์ง ๊ฐ์ง ๋ฐ ๋ณด์, ๋ค์ค ์ผ์ ํ ํ์(multi-sensor force coordination) ๊ฐ์ ๋งค๋ํฐ๋ ์ด์ ๊ณผ์ ๋ก ํ์ฅํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ๋ค๋ง arXiv ๋ณธ๋ฌธ์์๋ ์ด๋ค์ด ์ฃผ๋ก ํฅํ ์์ฉ/๋ ผ์๋ก ์ธ๊ธ๋๋ฉฐ, ์ ๋์ ์ฑ๊ณต๋ฅ ๊ฐ์ ์ธ๋ถ ์์น๋ ๋ณธ๋ฌธ์์ ์ถฉ๋ถํ ํ์ธ๋์ง ์์์ต๋๋ค. (์ถ์ธก) ๋ฐ๋ชจ ์์์ด๋ ์ ๋ ๋ณด์ถฉ์๋ฃ์ ๊ตฌ์ฒด์ ์ ์ด ๋ฃจํ์ ์ฑ๊ณต๋ฅ ์ด ํฌํจ๋์ด ์์ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค.
๋นํ์ ๊ณ ์ฐฐ
๊ฐ์
- ๋ฌธ์ ์ค์ ์ ๋ณธ์ง์ฑ: โ์ผ์๋ง๋ค ํ ๋ฐ์ดํฐ๋ฅผ ๋ค์ ๋ชจ์์ผ ํ๋คโ๋ ๋น์ฉ์ ์ด๊ฐ ๋ก๋ด ๋ถ์ผ์ ์ค์ง์ ๋ณ๋ชฉ์ ๋๋ค. ์ด๋ฅผ ์ ์ด ํ์ต ๋ฌธ์ ๋ก ๋ช ํํ ์ฌ์ ์ํ ๊ฒ ์์ฒด๊ฐ ํฐ ๊ธฐ์ฌ์ ๋๋ค.
- ๋ง์ปค๋ผ๋ ๊ณตํต ํํ์ ์ฐ์ํจ: ์/์กฐ๋ช /์ฌ์ง์ ๋ฒ๋ฆฌ๊ณ ๋ณํ ๊ธฐํ๋ง ๋จ๊ธฐ๋ ํต์ผ ํํ์ ๋จ์ํ๋ฉด์ ๊ฐ๋ ฅํฉ๋๋ค. vision-based์ taxel-based๋ผ๋ ์ด์ง์ ์ผ์๋ฅผ ๊ฐ์ ์ขํ๊ณ๋ก ๋์ด๋ค์์ต๋๋ค.
- ๋ฐ์ดํฐ ํจ์จ: ์๋ฎฌ๋ ์ด์ ์ฌ์ ํ์ต์ผ๋ก ์ค๋ฐ์ดํฐ ์์กด์ ์ค์๊ณ , ํ๊น ์ผ์์์๋ ํ ๋ผ๋ฒจ์ด ์ ํ ํ์ ์๋ค๋ ์ ์ด ์ค๋ฌด์ ์ผ๋ก ๋งค๋ ฅ์ ์ ๋๋ค.
- ์ ๋์ ์ค๋๋ ฅ: M2M ์ ์ฉ ์ 4.8 N โ 1 N ๋ฏธ๋ง์ผ๋ก ๋จ์ด์ง๋ ๋ฒ์ ํ ์ค์ฐจ, 98% ์ด์์ FID/KID ๊ฐ์๋ ๋ฒ์ญ์ ํจ๊ณผ๋ฅผ ๋ถ๋ช ํ ๋ณด์ฌ์ค๋๋ค.
์ฝ์ ยทํ๊ณ
- ๋ง์ปค ์ถ์ถ ํ์ดํ๋ผ์ธ ์์กด์ฑ: taxel ์ผ์ ๋ ๋๋ง์ 7๊ฐ ํ์ดํผํ๋ผ๋ฏธํฐ, GelSight์ ์๊ณ๊ฐยทSAM ๋ฑ ์ ์ฒ๋ฆฌ๊ฐ ๋ค์ด๊ฐ๋๋ค. ์ ์ผ์๋ฅผ ์ถ๊ฐํ ๋ ์ด ์ ์ฒ๋ฆฌ ํ๋์ด ์ฌ์ค์ ๋ ๋ค๋ฅธ โ๋ฐ์ดํฐ ์์ โ์ด ๋ ์ ์์ต๋๋ค.
- ๋ง์ปค ์๋ ์ผ์๋ก์ ์ผ๋ฐํ ๋ถ๋ช ํ: GenForce๋ ๋ง์ปค๊ฐ ์กด์ฌํ๋ ์ผ์๋ฅผ ์ ์ ํฉ๋๋ค. ๋ง์ปค๊ฐ ์๋ ์์ ๊ดํ ๊น์ด ์ผ์๋ ์ ์ ์ฉ๋ ์ด๋ ์ด ๋ฑ์ผ๋ก์ ํ์ฅ์ฑ์ ๋ถ๋ถ๋ช ํฉ๋๋ค. (์ถ์ธก)
- ๋ฌด๋ฆโ๋จ๋จํจ ์ ์ด์ ํ๊ณ: ์ฌ๋ฃ ๋ณด์ ์ด ํ ๋ฐฉํฅ(62%)์์ ์ฝํ์ต๋๋ค. ๊ฒฝ๋ ์ฐจ๊ฐ ํฐ ์ค์ ์์ฉ์์๋ ์ถ๊ฐ ๋ณด์ ์ด ํ์ํ ์ ์์ต๋๋ค.
- ๋งค๋ํฐ๋ ์ด์ ๊ฒ์ฆ์ ๊น์ด: arXiv ๋ณธ๋ฌธ ๊ธฐ์ค์ผ๋ก๋ ์ค์ ํ๋ฃจํ(closed-loop) ์ ์ด์์์ ๋ฏธ๋๋ฌ์ง ๋ณด์ยท์ก๊ธฐ ์ฑ๊ณต๋ฅ ๊ฐ์ end-to-end ๊ฒ์ฆ์ด ์๋์ ์ผ๋ก ์ ํ์ ์ ๋๋ค. ํ ์์ธก ์ ํ๋๊ฐ ๊ณง ๋งค๋ํฐ๋ ์ด์ ์ฑ๋ฅ์ผ๋ก ์ด์ด์ง๋์ง๋ ๋ณ๋ ๊ฒ์ฆ์ด ํ์ํฉ๋๋ค.
- ํ์ฐ ๊ธฐ๋ฐ ๋ฒ์ญ์ ์ถ๋ก ๋น์ฉ: SD-Turbo๋ก ๋น ๋ฅธ ํธ์ด์ง๋ง, ์ค์๊ฐ ์ด๊ฐ ๋ฃจํ(์์ญ~์๋ฐฑ Hz)์ M2M ๋ฒ์ญ์ ๋งค ํ๋ ์ ๋ผ์ ๋ฃ์ ์ ์๋์ง๋ ๊ณ ๋ฏผ์ด ํ์ํฉ๋๋ค. ์ค์ ๋ก๋ ๋ฒ์ญ์ ํ์ต ์์๋ง ์ฐ๊ณ ์ถ๋ก ์์๋ ๋ง์ปค ํํ๋ง ๊ณต์ ํ๋ ๋ฐฉ์์ด ํฉ๋ฆฌ์ ์ผ๋ก ๋ณด์ ๋๋ค.
๊ด๋ จ ์ฐ๊ตฌ์์ ๋น๊ต
- ์ผ์๋ณ ๊ฐ๋ณ ์บ๋ฆฌ๋ธ๋ ์ด์ (๊ธฐ์กด GelSight ํ ์ถ์ ์ฐ๊ตฌ๋ค): ์ ํ๋๋ ๋์ง๋ง ์ผ์๋ง๋ค ์ฒ์๋ถํฐ ๋ฐ์ดํฐ๋ฅผ ๋ชจ์์ผ ํจ. GenForce๋ ์ด ๋น์ฉ์ ์ ๊ฑฐํ๋ ๋ฐฉํฅ.
- Sim-to-real ์ด๊ฐ (์: TACTO, Taxim ๊ฐ์ ์๋ฎฌ๋ ์ดํฐ): ์๋ฎฌ๋ ์ด์ ์์ ํ์ตํด ์ค์ธ๊ณ๋ก ์ฎ๊ธฐ๋ ์ ๊ทผ. GenForce๋ ์๋ฎฌ๋ ์ด์ ์ ์ฌ์ ํ์ต์๋ง ์ฐ๊ณ , ์ค๋ฐ์ดํฐ ๋๋ฉ์ธ ๊ฐ ์ ์ด์ ์์ฑ ๋ชจ๋ธ์ ์ ๊ทน ํ์ฉํ๋ค๋ ์ ์ด ๋ค๋ฆ ๋๋ค.
- CycleGAN ๋ฅ์ ์ด๊ฐ ๋๋ฉ์ธ ๋ณํ: ๊ธฐ์กด์๋ ์ด๊ฐ ์ด๋ฏธ์ง ๋๋ฉ์ธ ๋ณํ ์๋๊ฐ ์์์ผ๋, GenForce๋ (1) ๋ง์ปค ์ด์งํ๋ก ๋ณํ๋ง ์ถ์ถํ๊ณ (2) ๋ณํ ๋ณด์กด์ ๊ฐํ๊ฒ ์ ์ฝํ๋ LPIPS+L2 ์์ค์ ๋๋ค๋ ์ ์์, ํ ๋ผ๋ฒจ ์ ์ด๋ผ๋ ๋ชฉํ์ ํนํ๋์ด ์์ต๋๋ค.
์์ฝ ๋ฐ ๊ฒฐ๋ก
GenForce๋ โ์ด๊ฐ ์ผ์๋ผ๋ฆฌ ์๋ก์ ํ ๊ฐ์ง ๋ฅ๋ ฅ์ ๋น๋ ค ์ฐ๊ฒ ํ์โ๋ ๋ฌธ์ ๋ฅผ, ๋ง์ปค ๊ธฐ๋ฐ ๊ณตํต ํํ + ํ์ฐ ๊ธฐ๋ฐ ๋ง์ปค-ํฌ-๋ง์ปค ๋ฒ์ญ + ์ํ์ค ํ ํ๊ท๋ผ๋ ์ธ ์ถ์ผ๋ก ๊น๋ํ๊ฒ ํ์ด๋์ต๋๋ค. ํต์ฌ ํต์ฐฐ์ ์ธ๊ฐ ์ฒด์ฑ๊ฐ๊ฐํผ์ง์ฒ๋ผ ์ด์ง์ ์ผ์๋ค์ ํ๋์ ๊ณตํต ๊ฐ๊ฐ ์ธ์ด(๋ณํ์ ๊ธฐํ)๋ก ํต์ผํ๋ฉด, ํ ์ผ์์์ ํ์ตํ ํ ์์ธก์ ํ๊น ์ผ์์ ํ ๋ผ๋ฒจ ์์ด ์ฎ๊ธธ ์ ์๋ค๋ ๊ฒ์ ๋๋ค.
์คํ์ ์ผ๋ก๋ ๋์ข (GelSight ๋ณํ 5์ข )๊ณผ ์ด์ข (GelSight/uSkin/TacTip) ์ผ์ ๋ชจ๋์์ 1 N ์ํ์ 3์ถ ํ ์ค์ฐจ๋ฅผ ๋ฌ์ฑํ๊ณ , M2M ๋ฒ์ญ์ด FID/KID๋ฅผ 98% ์ด์ ๋ฎ์ถ๋ฉฐ ํต์ฌ ์ญํ ์ ํ์์ ๋ณด์์ต๋๋ค.
๋ก๋ด ์ค๋ฌด ๊ด์ ์์์ ๋ฉ์์ง๋ ๋ถ๋ช ํฉ๋๋ค. ์ผ์๋ฅผ ๋ฐ๊พธ๊ฑฐ๋ ์๊ฐ๋ฝ๋ง๋ค ๋ค๋ฅธ ์ผ์๋ฅผ ์์ด๋, ํ ๋ฒ ์ ๋ผ๋ฒจ๋งํ ๋ฐ์ดํฐ์ ์ ์์ฐ์ฒ๋ผ ์ฌํ์ฉํ ์ ์๋ค๋ ๊ฐ๋ฅ์ฑ์ ๋๋ค. ๋ค๋ง ๋ง์ปค ์ ์ฒ๋ฆฌ ์์กด์ฑ, ๋ฌด๋ฆโ๏ธ๋จ๋จํจ ๋น๋์นญ, ์ค์๊ฐ ๋ฒ์ญ ๋น์ฉ, ๊ทธ๋ฆฌ๊ณ ํ๋ฃจํ ๋งค๋ํฐ๋ ์ด์ ์์์ end-to-end ๊ฒ์ฆ์ ์์ผ๋ก ๋ ๋ค์ ธ์ผ ํ ์ง์ ์ ๋๋ค. ๊ทธ๋ผ์๋ ์ด๊ฐ ์ผ์์ โ๋ฐ์ดํฐ ์ฌ์ฌ์ฉ์ฑโ์ด๋ผ๋ ์ค๋ ๋์ ์ ์ค๋๋ ฅ ์๋ ํ ์๋ฅผ ๋ ์ฐ๊ตฌ๋ก ํ๊ฐํ ๋งํฉ๋๋ค.