๐DenseTact
- DenseTact๋ ์ ๋ ดํ๊ณ ํ์ฅ ๊ฐ๋ฅํ๋ฉฐ ์ปดํฉํธํ ๋น์ ๊ธฐ๋ฐ ์ด๊ฐ ์ผ์๋ก, ๋ด๋ถ ์นด๋ฉ๋ผ ์ด๋ฏธ์ง๋ก๋ถํฐ ๊ตฌํ ์๋ผ์คํ ๋จธ ํ๋ฉด์ ๊ณ ํด์๋ 3D ํ์ ์ฌ๊ตฌ์ฑ์ ๋ชฉํ๋ก ํฉ๋๋ค.
- ์ด ์ผ์๋ ๋ฅ ๋ฌ๋ ๊ธฐ๋ฐ์ ์ธ์ฝ๋-๋์ฝ๋ ๋คํธ์ํฌ๋ฅผ ํ์ฉํ์ฌ ํ๋ฉด ๋ณํ์ ์ค์๊ฐ(18ms)์ผ๋ก ์ถ์ ํ๋ฉฐ, 3D ํ๋ฆฐํ ๋ ๊ต์ ์ค๋ธ์ ํธ์ Ray Casting ์๊ณ ๋ฆฌ์ฆ์ ํตํด ์ ๋ฐํ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ถํฉ๋๋ค.
- DenseTact๋ ํ๊ท 0.28mm์ ๊น์ด ์ถ์ ์ค์ฐจ์ ์ฐ์ํ ๋ด๊ตฌ์ฑ์ ํตํด ๋ก๋ด์ ๋ฌผ์ฒด ์กฐ์ ๋ฐ ์ธํธ๋(in-hand) ์์น ์ถ์ ์ ํ์ํ ๊ณ ํด์๋ ์ด๊ฐ ์ ๋ณด๋ฅผ ํจ์จ์ ์ผ๋ก ์ ๊ณตํฉ๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
DenseTact๋ ๋ก๋ด ์กฐ์ ์์ ์์ ์ด๊ฐ ๊ฐ์ง์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด ๊ณ ํด์๋ ํ๋ฉด ์ฌ๊ตฌ์ฑ์ ์ํ ๊ดํ ์ด๊ฐ ์ผ์์ ๋๋ค. ์ด ์ผ์๋ ์ ๋ ดํ๊ณ , ํ์ฅ ๊ฐ๋ฅํ๋ฉฐ, ์ฝคํฉํธํ ๋์์ธ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๊ธฐ์กด์ ๋น์ ๊ธฐ๋ฐ ์ด๊ฐ ์ผ์๋ ๊ณ ํด์๋๋ฅผ ์ ๊ณตํ์ง๋ง, ๋ฎ์ ์ ํ๋, ๋์ ๋น์ฉ, 2D ํ์ ์ ํ ๋ฑ์ ํ๊ณ๊ฐ ์์์ต๋๋ค. DenseTact๋ ์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๋ฉฐ, ํนํ 3D ํ์ ์ผ์๋ก์ ์ ๋ฐํ ์ธํธ๋ ์กฐ์(in-hand manipulation)์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
II. ๊ด๋ จ ์ฐ๊ตฌ (Related Works)
๊ธฐ์กด ์ด๊ฐ ์ผ์๋ค์ ์์ (piezoelectric), ๊ดํ(optics), ์ ํญ(resistance), ์ฉ๋(capacity) ๋ฑ ๋ค์ํ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํด์์ต๋๋ค. ์ต๊ทผ์๋ ๊ณ ํด์๋ ํน์ฑ ๋๋ฌธ์ ๋น์ ๊ธฐ๋ฐ ์ด๊ฐ ์ผ์๊ฐ ์ธ๊ธฐ๋ฅผ ์ป๊ณ ์์ต๋๋ค. Gelsight, Gelslim, DIGIT์ ๊ฐ์ ์ผ์๋ค์ ๊ณ ํด์๋๋ฅผ ์ ๊ณตํ์ง๋ง, ํํํ ํ๋ฉด์ผ๋ก ์ธํด ์กฐ์ ์์ ์ ์ ์ฝ์ด ์์ต๋๋ค. Omnitact์ ๊ฐ์ 3D ๊ณก๋ฉด ์ผ์๋ ๋ค๋ฐฉํฅ ๊ฐ์ง๊ฐ ๊ฐ๋ฅํ์ง๋ง ๋น์ฉ์ด ๋ง์ด ๋ญ๋๋ค. DenseTact๋ ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๋น์ฉ ํจ์จ์ ์ด๊ณ 3D ํ์์ ๊ฐ์ง๋ฉฐ ๊ณ ํด์๋ ๊ฐ์ง ํผ๋๋ฐฑ์ ์ ๊ณตํฉ๋๋ค.
III. DenseTact ์ผ์ ์ค๊ณ (DenseTact Sensor Design)
DenseTact๋ ์ธํธ๋ ์ํ ๊ฐ์ฒด ์กฐ์์ ์ ์ฉํ ์์ ์ผ์ ํฌ๊ธฐ, ๋ค๋ชฉ์ ์กฐ์์ ์ํ ๋งค์ฐ ๋ถ๋๋ฌ์ด 3D ๊ณก๋ฉด, ๊ทธ๋ฆฌ๊ณ ์ ์ด ๊ฐ์ง๋ฅผ ์ํ ๊ณ ํด์๋ ํ๋ฉด ๋ณํ ๋ชจ๋ธ๋ง(ํ์ ์ฌ๊ตฌ์ฑ)์ ๋ชฉํ๋ก ์ค๊ณ๋์์ต๋๋ค.
- ์๋ผ์คํ ๋จธ ์ ์ (Elastomer Fabrication):
- ๋ฐ๊ตฌํ(hemispherical) ํฌ๋ช ์๋ผ์คํ ๋จธ(Silicone Inc. P-565 Platinum Clear Silicone, 20:1 ๋น์จ, 6.5 Shore A ๊ฒฝ๋)๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ด ๊ฒฝ๋๋ ์ฌ๋ ํผ๋ถ์ ์ ์ฌํ์ฌ ์์ ์ ๋จ๋ ฅ์๋ ํฐ ํ๋ฉด ๋ณํ์ ํ์ฉํฉ๋๋ค.
- ์๋ผ์คํ ๋จธ์ ์ ์ด ๊ฒฝ๊ณ๋ฉด์๋ ๋ฐ์ฌ ์ฝํ (reflective coating)์ด ๋์ด ์์ด, ๋จ์ผ ์นด๋ฉ๋ผ๋ก ๋ด๋ถ ๋ณํ์ ๊ด์ฐฐํ ์ ์์ต๋๋ค.
- Inhibit Xโข๋ฅผ ์ ์ฐฉ์ ๋ก ์ฌ์ฉํ์ฌ ๋ฐ์ฌ์ฑ ๊ธ์ ์ํฌ(reflective metallic ink)์ ์ค๋ฆฌ์ฝ ํผํฉ๋ฌผ(Smooth-on Psycho Paintโข)์ ์์ด๋ธ๋ฌ์ฑํ์ฌ ํ๋ฉด์ ์ฝํ ํฉ๋๋ค.
- ์นด๋ฉ๋ผ ๋ฐ ์กฐ๋ช
์์คํ
(Camera and Illumination system):
- ์๋ IMX179 ์ด๋ฏธ์ง ์ผ์(8MP, 30fps)๋ฅผ ํ์ฌํ ์ ๋น์ฉ ์นด๋ฉ๋ผ๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- 185ยฐ FoV(์์ผ๊ฐ)์ ์ด์ ๋ ์ฆ(fisheye lens)๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ๊ตฌํ ์๋ผ์คํ ๋จธ ์ ์ฒด๋ฅผ ์ปค๋ฒํฉ๋๋ค.
- ์ ์ฐํ PCB(flexible PCB)์ 24๊ฐ์ RGB LED๊ฐ ์ฅ์ฐฉ๋ LED ์คํธ๋ฆฝ์ด ์ผ์ ๋ด๋ถ์ ์ํตํ์ผ๋ก ๋ฐฐ์น๋์ด ์กฐ๋ช ์ ์ ๊ณตํฉ๋๋ค. ์ด ์กฐ๋ช ์ ๋ต์ ํ๋ฉด์ ์ค๋ชฉํ ๋ถ๋ถ์ด ์์ ํจํด์ ๋ฐฉ์ถํ๋๋ก ํ์ฌ ํ๋ฉด ํ์๊ณผ ์์ ์ฑ๋ ๋ฐ์ฌ์จ ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ๋ํ๋ ๋๋ค.
- ์ผ์ ์กฐ๋ฆฝ (Sensor Assembly):
- ์กฐ๋ฆฝ ์ ์นด๋ฉ๋ผ ๋ ์ฆ์ ์ค์ฌ์ด ๋ฐ๊ตฌํ ์๋ผ์คํ ๋จธ์ ์ค์ฌ๊ณผ ์ผ์นํ๋๋ก ์ ๋ ฌ๋ฉ๋๋ค.
- LED ์คํธ๋ฆฝ์ ์๋ผ์คํ ๋จธ ๋ฐ๋ก ์๋์ ์์นํฉ๋๋ค.
- 3D ํ๋ฆฐํ ๋ ์นด๋ฉ๋ผ ๋ง์ดํธ๊ฐ ์นด๋ฉ๋ผ์ ์๋ผ์คํ ๋จธ๋ฅผ ๊ณ ์ ํ๋ฉฐ, LED ์คํธ๋ฆฝ์ ์ด ๋ง์ดํธ ๋ด๋ถ์ ์ฅ์ฐฉ๋ฉ๋๋ค.
- ๋์ด๋ 35mm, ๋ฐ๊ตฌํ ์๋ผ์คํ ๋จธ์ ๋ฐ๊ฒฝ์ 25mm์ ๋๋ค.
- ์ ์ฒด ์ผ์ ๋น์ฉ์ 80๋ฌ๋ฌ ๋ฏธ๋ง์ผ๋ก, ์นด๋ฉ๋ผ ์์คํ (70๋ฌ๋ฌ)์ด ๋๋ถ๋ถ์ ์ฐจ์งํฉ๋๋ค.
IV. ํ์ ์ฌ๊ตฌ์ฑ (Shape Reconstruction)
DenseTact๋ ๋จ์ผ ์ด๋ฏธ์ง๋ก๋ถํฐ ์ผ์ ํ๋ฉด์ ๊ณ ํด์๋ ํํ์ ์์ฑํฉ๋๋ค. ๊ธฐ์กด GelSight์ ์ ์ฌํ ์ผ์๋ค์ ๋จ๋ฒ์์ ํ๋ฉด(Lambertian surface) ๊ฐ์ ์ ํตํด ๊ฐ ํฝ์ ์ ๊ฐ๋(intensity)๋ฅผ ํ๋ฉด ๋ฒ์ (surface normal)๊ณผ ์ฐ๊ด์์ผฐ์ต๋๋ค. ๊ทธ๋ฌ๋ DenseTact์ ๊ฐ์ด 3D ํ์์ด๋ฉฐ ๋น๋จ๋ฒ์์(non-Lambertian) ํ๋ฉด์ ๊ฐ์ง ์ผ์์๋ ์ด ๋ฐฉ๋ฒ์ด ์ ์ฉ๋์ง ์์ต๋๋ค.
์ด ๊ฒฝ์ฐ, ๊ฐ ํฝ์ (u,v)์ ๊ฐ๋ I(u,v)๋ ํ๋ฉด ๋ฒ์ \frac{\partial f}{\partial u}(u,v), \frac{\partial f}{\partial v}(u,v) ๋ฟ๋ง ์๋๋ผ ํฝ์ ์ ์์น (u,v)์๋ ์์กดํ๋ ๋น์ ํ ํจ์ R์ด ๋ฉ๋๋ค. I(u, v) = R(\frac{\partial f}{\partial u} (u, v), \frac{\partial f}{\partial v} (u, v), u, v) (1)
๋ฐ๋ผ์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ ํตํด ์ด๋ฏธ์ง ํฝ์ ์ RGB ๊ฐ I_{rgb}(u,v)๋ก๋ถํฐ ์ผ์ ํ๋ฉด์ ํด๋น ๊ตฌํ ์ขํ (R, \theta, \psi)๋ฅผ ์ถ์ ํ๋ ๋น์ ํ ํจ์ M์ ํ์ตํด์ผ ํฉ๋๋ค: (R, \theta, \psi) = M(I_{rgb}(u, v)) (2)
A. ๊น์ด ๋ฐ์ดํฐ ์์ฑ (Depth Data Generation):
๋ชจ๋ธ ํ์ต์ ์ํด ์ ํํ ๊ณ ํด์๋ Ground-Truth ํ๋ฉด ์ ๋ณด๊ฐ ํ์ํฉ๋๋ค. ์์ฉ ๊ฑฐ๋ฆฌ ์ธก์ ์ผ์(range-finding sensors)๋ ๋ฐ๋ฆฌ๋ฏธํฐ ๊ท๋ชจ์ ์ค์ฐจ๋ฅผ ๊ฐ์ง๋ฏ๋ก, 3D ํ๋ฆฐํ ๋ ์๋ ค์ง ์ปดํจํฐ ์์ฑ ํ๋ฉด ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ Ground-Truth ๋ฐ์ดํฐ๋ฅผ ์์ฑํฉ๋๋ค.
- Ground-Truth ์์ฑ ๋ฐฉ๋ฒ: Ultimaker S5 3D ํ๋ฆฐํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์ํ ํํ์ โ์ธ๋์ผ์ดํฐ(indicator)โ์ โ์ธ๋ดํฐ(indenter)โ๋ฅผ ํ๋ฆฐํ
ํฉ๋๋ค. ์ธ๋์ผ์ดํฐ๋ ๊ตฌ๋ฉ์ด ๋ซ๋ฆฐ ๋ฐ๊ตฌํ ๋ชจ์์ด๋ฉฐ, ์ธ๋ดํฐ๋ ์ด ๊ตฌ๋ฉ์ ์ฝ์
๋์ด ์ผ์๋ฅผ ๋ณํ์ํต๋๋ค.
- 37๊ฐ์ ๋ค๋ฅธ ์ธ๋์ผ์ดํฐ์ 25๊ฐ์ ๋ค๋ฅธ ์ธ๋ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์ํ ์ ์ด ๊ตฌ์ฑ์ ๋ง๋ญ๋๋ค.
- CNC ๋จธ์ ์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ์์ง ์ B์ถ(์ธ๋ก์ถ)์ผ๋ก 0.9ยฐ์ฉ ์๋ ํ์ ์ํค๊ณ , A, C์ถ(๊ฐ๋ก์ถ)์ 45ยฐ์ฉ ์๋์ผ๋ก ์กฐ์ ํ์ฌ ๋ฐ์ดํฐ ๋ค์์ฑ์ ๋์ ๋๋ค.
- CNC ๋จธ์ ์ Z-๋ฐฉํฅ์ผ๋ก ์ผ์๋ฅผ ๋๋ฅด๋๋ก ์ ๋ฐํ๊ฒ ์ ์ด๋ฉ๋๋ค.
- ๋ฐ์ดํฐ ์ ๊ทํ: STL ํ์ผ๋ก๋ถํฐ ๋ ์ด ์บ์คํ (ray casting) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๊น์ด ๊ฐ(radial value)์ ์ป์ต๋๋ค. ์ด ๊น์ด ๊ฐ์ 8๋นํธ ์ ์(0-255)๋ก ์ ๊ทํํ์ฌ ์ถ๋ ฅ ๊ฐ์ ํฌ๊ธฐ๋ฅผ ์ค์ ๋๋ค. ์ต๋ ๊น์ด ๋ณํ(9.4mm)์ ์ฌ์ฉํ์ฌ ์ ๊ทํํ๋ฉฐ, 1ํฝ์ ๊ฐ๋(intensity)๋ ์ค์ ๊น์ด ๊ฐ์์ 0.0354mm ์ฆ๊ฐ์ ํด๋นํฉ๋๋ค.
- ์ด 30,200๊ฐ์ ๋ค๋ฅธ ์ ์ด ๊ตฌ์ฑ(29,200๊ฐ ํ์ต, 1,000๊ฐ ํ ์คํธ)์ ์์ฑํ๋ฉฐ, ํ ์คํธ ์ธํธ์๋ ํ์ต ์ธํธ์ ๋ค๋ฅธ ์ธ๋์ผ์ดํฐ์ ์ธ๋ดํฐ ์กฐํฉ์ด ์ฌ์ฉ๋ฉ๋๋ค. ์ ์ฒด ๋ฐ์ดํฐ์ ํฌ๊ธฐ๋ 3.6 GB์ ๋๋ค.
B. ์นด๋ฉ๋ผ ์ด๋ฏธ์ง๋ก๋ถํฐ 3D ๋์์ ์ฐพ๊ธฐ (3D correspondence from camera image):
์ด์ ๋ ์ฆ์ ์๊ณก๊ณผ 3D ํ์ ์ผ์ ํ๋ฉด๊ณผ์ ๋์์ (correspondence)์ ์ฐพ๊ธฐ ์ํด ์๋ก์ด ์บ๋ฆฌ๋ธ๋ ์ด์ ๋ฐฉ๋ฒ์ด ๊ฐ๋ฐ๋์์ต๋๋ค.
- ๊ต์ ๊ณผ์ :
- ์๋ ค์ง ํฌ๊ธฐ์ 3D ํ๋ฆฐํ ๋ ํฑ๋ ๋ชจ์(saw-tooth shape) ์ธ๋์ผ์ดํฐ๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- ์ธ๋์ผ์ดํฐ๋ฅผ ์ผ์์ ๋ฐ์ด ๋ฃ์ ํ, Canny ์ฃ์ง ๊ฒ์ถ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ฌ ์ผ์ ์ด๋ฏธ์ง์์ ํฑ๋ ์ฃ์ง๋ฅผ ๊ฐ์งํฉ๋๋ค.
- ์ด๋ฏธ์ง์์ ๊ฐ์ง๋ ์ฃ์ง ์์น๋ฅผ ์ผ์ ํ๋ฉด์ ์ฃ์ง ์์น์ ๋งค์นญํฉ๋๋ค.
- ๊ฐ์ฐ์์ ํ๋ก์ธ์ค(Gaussian Process, GP) ํ๊ท ๋ชจ๋ธ: ์ด๋ฏธ์ง์ ์ค์ฌ์ผ๋ก๋ถํฐ์ ๋ฐ์ง๋ฆ r๊ณผ ๋ฐ๊ตฌํ ์ผ์ ํ๋ฉด์ ๋ฐ์ง๋ฆ R \sin(\theta) ๊ฐ์ ๋์ ๊ด๊ณ๋ฅผ ๋ชจ๋ธ๋งํฉ๋๋ค. R \sin(\theta) = f_{GP}(r(u, v))
- ์ด ๋์ ๊ด๊ณ๋ฅผ ํตํด ๊ฐ ์ด๋ฏธ์ง ํฝ์ (u,v)๋ ๊ตฌํ ์ขํ (\theta, \phi)๋ก ๋ณํ๋ฉ๋๋ค. ์ฌ๊ธฐ์ (u_c, v_c)๋ ์ด๋ฏธ์ง ํ๋ฉด์ ์ค์ฌ์ ๋๋ค. (\theta, \phi) = (\sin^{-1}(\frac{f_{GP}(r)}{R}), \tan^{-1}(\frac{v - v_c}{u - u_c}))
- ๋ ์ด ์บ์คํ
์๊ณ ๋ฆฌ์ฆ (Ray Casting Algorithm): ๊ฐ ํฝ์
์ ๋ํ (\theta, \phi)๊ฐ ๊ฒฐ์ ๋๋ฉด, STL ํ์ผ์ ์ผ๊ฐํ ๋ฉ์ฌ(triangular mesh)์์ ๊ฐ์ฅ ๊ฐ๊น์ด ์ ์ ๊ณ์ฐํ๊ธฐ ์ํด ๋ ์ด ์บ์คํ
์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํฉ๋๋ค. R_{ray}(u, v) = f_{raycast}(\text{Mesh}_{stl}, \theta(u, v), \psi(u, v))
- ์ด ๊ณผ์ ์ ํตํด ์ ๋ ฅ ์ด๋ฏธ์ง์ ๊ฐ ํฝ์ ๊ณผ Ground-Truth ๊น์ด ๊ฐ ๊ฐ์ 1:1 ๋์ ๊ด๊ณ๊ฐ ์ค์ ๋ฉ๋๋ค.
C. ๋ชจ๋ธ๋ง (Modeling):
์ด ๋ฌธ์ ๋ ๋จ์ผ ์ด๋ฏธ์ง ๊น์ด ์ถ์ ๋ฌธ์ ๋ก ๊ฐ์ฃผ๋ ์ ์์ต๋๋ค. ์ผ๋ฐ์ ์ธ ๊น์ด ์ถ์ ๋ฌธ์ ์ ๋ฌ๋ฆฌ, DenseTact ๋ฐ์ดํฐ์ ์ ์ ์ญ์ ์ธ ์ ๋ณด(global information)๋ณด๋ค ๊ตญ๋ถ์ ์ธ ๋ณํ ์ ๋ณด(local deformation information)์ ๋ ์ค์ ์ ๋ก๋๋ค.
- ๋คํธ์ํฌ ์ํคํ
์ฒ: ๊ฐ๋จํ ์ธ์ฝ๋-๋์ฝ๋(encoder-decoder) ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ฉฐ, ์คํต ์ปค๋ฅ์
(skip connection)์ ํฌํจํฉ๋๋ค.
- ์ธ์ฝ๋: ์ฌ์ ํ์ต๋ DenseNet-161 ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค.
- ๋์ฝ๋: ์ธ์ฝ๋์ ๋์ผํ ํฌ๊ธฐ ๋ธ๋ก๊ณผ ์ด์ ์ ์ํ๋ง๋ ๋ธ๋ก์ ์ฐ๊ฒฐํ์ฌ ๊ตญ๋ถ ์ ๋ณด๋ฅผ ํ์ตํ ์ ์๋๋ก ํฉ๋๋ค.
- ์์ค ํจ์ (Loss Function): ๋ค์ ์ธ ๊ฐ์ง ์์ค์ ์กฐํฉ์ ์ฌ์ฉํฉ๋๋ค.
- ๊น์ด ๊ฐ์ ๋ํ ์ ๋์ L_1 ์์ค (point-wise L_1 loss)
- ๊น์ด ์ด๋ฏธ์ง์ ๊ธฐ์ธ๊ธฐ(gradient)์ ๋ํ L_1 ์์ค
- ๊ตฌ์กฐ์ ์ ์ฌ์ฑ ์์ค (structural similarity loss, SSIM)
- ํ์ต: ์ด๋ฏธ์ง๋ 570x570x3์์ 640x480x3์ผ๋ก ํฌ๊ธฐ๊ฐ ์กฐ์ ๋ ํ ๋คํธ์ํฌ์ ์ ๋ฌ๋๋ฉฐ, ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ 320x240์์ 570x570์ผ๋ก ํฌ๊ธฐ๊ฐ ์กฐ์ ๋ฉ๋๋ค. ๊น์ด ๊ฐ(0-255)์ ํ์ต ํ์ง์ ๊ทน๋ํํ๊ธฐ ์ํด (10, 1000) ๋ฒ์๋ก ์ฌ์กฐ์ ๋ฉ๋๋ค. ๋คํธ์ํฌ๋ NVIDIA P100 16GB GPU์์ 16 ์ํฌํฌ(460K ์ดํฐ๋ ์ด์ ), ๋ฐฐ์น ํฌ๊ธฐ 4๋ก ํ์ต๋์์ต๋๋ค.
V. ๊ฒฐ๊ณผ ๋ฐ ํ ๋ก (Results and Discussion)
- ์ ์ฑ์ ๊ฒฐ๊ณผ (Qualitative Results): ๋ชจ๋ธ์ ๋จ์ผ ์ด๋ฏธ์ง๋ก๋ถํฐ ์ผ์ ํ์์ ์๋นํ ์ ์ฌ๊ตฌ์ฑํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค.
- ์ฑ๋ฅ: ์ผ์๋ ๋จ์ผ ์ด๋ฏธ์ง๋ก๋ถํฐ ๊น์ด ๋ทฐ๋ฅผ ์์ธกํ๋ ๋ฐ ํ๊ท 18.17ms๊ฐ ์์๋์ด, 30fps์ ์ค์๊ฐ ์กฐ์ ์์ ์ ์ํํ ์ ์์ต๋๋ค. ์์ธก๋ ๊น์ด ๊ฐ์ ์ฌ์ฉํ์ฌ 3D ํฌ์ธํธ ํด๋ผ์ฐ๋๊ฐ ์ฌ๊ตฌ์ฑ๋ฉ๋๋ค.
- ์ ๋์ ๊ฒฐ๊ณผ (Quantitative Results): ํ์ต ์ธํธ์ ํ
์คํธ ์ธํธ ๊ฐ์ ํฌ์ธํธ๋ณ L1 ์์ค ๋ฐ L2 ์์ค์ด ํ๊ฐ๋์์ต๋๋ค.
- Ground-Truth ์ค์ฐจ๋ 3D ํ๋ฆฐํฐ์ ์ ๋ฐ๋ ์ค์ฐจ๋ก ์ธํด 109.6 ๋ง์ดํฌ๋ก ์ ๋๋ค.
- ํ์ต ์ธํธ์ ํ๊ท L1 ์์ค์ 0.2381mm, ํ ์คํธ ์ธํธ์ ํ๊ท L1 ์์ค์ 0.2811mm์์ต๋๋ค.
- ํ์ต ์ธํธ์ ํ๊ท L2 ์์ค์ 0.0306mm, ํ ์คํธ ์ธํธ์ ํ๊ท L2 ์์ค์ 0.03208mm์์ต๋๋ค.
- ์ฆ, DenseTact ์ผ์๋ ํ๊ท 0.28mm์ ์ ๋ ์ค์ฐจ๋ก ํ์ ์ฌ๊ตฌ์ฑ์ ์ํํฉ๋๋ค.
- ์์ธ ์ถ์ (Pose Tracking) ํ๊ฐ: ๋ ๊ฐ์ DenseTact ์ผ์๊ฐ ์ฅ์ฐฉ๋ Allegro ํธ๋๋ก ์๋ ค์ง ๊ตฌํ ๋ฌผ์ฒด๋ฅผ ์ง๊ณ ICP(Iterative Closest Point) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ฌผ์ฒด์ ์์ธ๋ฅผ ์ถ์ ํ์ฌ ์ผ์๋ฅผ ํ๊ฐํ์ต๋๋ค. 23๋ฒ์ ํ์ง(grasping) ์๋ ํ, ํ๊ท ํผํธ๋์ค ์ ์(fitness score)๋ 0.597(\sigma = 0.238), ํ๊ท RMS ์ค์ฐจ๋ 0.037184(\sigma = 0.00276)์์ต๋๋ค. (200ํ ICP ๋ฐ๋ณต ํ ํ๊ท RMS ์ค์ฐจ๋ 0.0211).
- ๋ด๊ตฌ์ฑ: ์ผ์๋ 30,000ํ ์ด์์ ํธ์ ๋ฐ ์ธก์ ํ์๋ ๋์ ๋๋ ๋ณํ ์์ด ๋ด๊ตฌ์ฑ์ด ๋ฐ์ด๋จ์ ์ ์ฆํ์ต๋๋ค.
VI. ๊ฒฐ๋ก (Conclusion)
DenseTact๋ ์ธ์ฒด๊ณตํ์ ๋ฐ๊ตฌํ ์ผ์๋ก, ์ ์ฒด ์ผ์ ํ๋ฉด์ ์ฌ๊ตฌ์ฑํ ์ ์์ต๋๋ค. ์ด ์ผ์๋ ๋ด๊ตฌ์ฑ์ด ๋ฐ์ด๋๋ฉฐ, ๊ณ ํด์๋ ์ ์ด ์บ๋ฆฌ๋ธ๋ ์ด์ ์ ํตํด Ground-Truth์ ์๋์ ์ ํ๋์ ๋ถํ์ค์ฑ์ ๊ณ ๋ คํ์ต๋๋ค. ์ฌ์ธต ์ ๊ฒฝ๋ง(deep neural network)์ ์ ๋ ฅ ์ด๋ฏธ์ง๋ก๋ถํฐ ๊น์ด ๋งต(depth map)์ ๋ชจ๋ธ๋งํ๋ ๋ฐ ํ์ฉ๋์์ผ๋ฉฐ, ์ฌ์ ํ์ต๋ ์ธ์ฝ๋-๋์ฝ๋ ๊ธฐ๋ฐ ๋คํธ์ํฌ๊ฐ ํ์ต ๋ฐ์ดํฐ์ ์ ํตํด ์ ํํ ๊น์ด ์ฌ๊ตฌ์ฑ์ ์ํํ ์ ์์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ์ผ์๋ ํ ์คํธ ์ธํธ์์ ํ๊ท 0.28mm์ ๊น์ด ์ฐจ์ด๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. ํฅํ ์ฐ๊ตฌ์๋ ๋ค์ํ LED ๊ตฌ์ฑ ํ์ฉ์ ํตํ ์ ํ๋ ํฅ์, ํฌ๊ธฐ ํ์ฅ์ฑ ๋ฐ ๋ค์ํ ์ผ์ ํ์์ ๋ํ ์ ์์ฑ, DenseTact ์ผ์์ ํนํ๋ ๋คํธ์ํฌ ๊ตฌ์กฐ ๊ตฌํ, ๊ทธ๋ฆฌ๊ณ ์ฌ๊ตฌ์ฑ๋ ํ์๊ณผ ํจ๊ป ์๋ผ์คํ ๋จธ ๋ณํ ๊ธฐ๋ฐ์ ์ ์ด๋ ฅ ๋ถํฌ ์ถ์ถ ๋ฑ์ด ํฌํจ๋ ๊ฒ์ ๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.