๐MidasTouch ๋ฆฌ๋ทฐ
Sudharshan Suresh, Zilin Si, Stuart Anderson, Michael Kaess, Mustafa Mukadam
Conference on Robot Learning (CoRL), 2022 (Oral)
- ๐ก MidasTouch๋ ์๊ฐ ์ ๋ณด ์์ด ์ค์ง ์ด๊ฐ๋ง์ผ๋ก, ์ด๋ฏธ ์๊ณ ์๋ ๋ฌผ์ฒด ํ๋ฉด ์์์ vision-based tactile sensor(DIGIT)๊ฐ โ์ง๊ธ ์ด๋๋ฅผ ๋ง์ง๊ณ ์๋๊ฐโ๋ฅผ ์จ๋ผ์ธ์ผ๋ก ์ถ์ ํ๋ ์ ์ญ ์ด๊ฐ ์์น์ถ์ (global tactile localization) ์์คํ ์ ๋๋ค.
- โ๏ธ ํต์ฌ์ ๊ตญ์ ํ๋ฉด ๊ธฐํ๋ฅผ ์์ถ ์๋ฒ ๋ฉ์ผ๋ก ๋ฐ๊พธ๋ tactile code network์, ๋ฌผ์ฒด๋ณ๋ก ๋ฏธ๋ฆฌ ๋ง๋ค์ด ๋ tactile codebook์ ์ธก์ ๋ชจ๋ธ๋ก ํ์ฉํด SE(3) ํฌ์ฆ ๋ถํฌ๋ฅผ ๊ฐฑ์ ํ๋ Monte-Carlo ์ ์ ํํฐ(particle filter)์ ๊ฒฐํฉ์ ๋๋ค.
- ๐ฏ ์ ์๋ค์ ๋จ์ผ ์ ์ด์ ๋ณธ์ง์ ๋ชจํธ์ฑ์ ์ผ์๋ฅผ โ๋ฏธ๋๋ฌ๋จ๋ฆฌ๋ฉฐ(sliding)โ ๋์ ๊ด์ธก์ผ๋ก ํด์ํ๋ ์ ๊ทผ์ ์ ์ํ๊ณ , ์ด๋ฅผ ๊ฒ์ฆํ๊ธฐ ์ํด 10๊ฐ YCB ๋ฌผ์ฒด์ ๋ํ ์ค์ ยท์๋ฎฌ๋ ์ด์ ์ฌ๋ผ์ด๋ฉ ๋ฐ์ดํฐ๋ฅผ ๋ด์ YCB-Slide ๋ฐ์ดํฐ์ ์ ๊ณต๊ฐํ์ต๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
MidasTouch๋ vision-based tactile sensor๊ฐ ์๋ ค์ง ๋ฌผ์ฒด์ ํ๋ฉด ์๋ฅผ ๋ฏธ๋๋ฌ์ง ๋, ๊ทธ ์ผ์๊ฐ ํ๋ฉด์ ์ด๋ ์ง์ ์ ์๋์ง๋ฅผ ์จ๋ผ์ธ์ผ๋ก ์ถ์ ํ๋ ์ด๊ฐ ์์น์ถ์ ์์คํ ์ ๋๋ค. ์นด๋ฉ๋ผ๋ก ๋ฌผ์ฒด ์ ์ฒด๋ฅผ ๋ณด๋ visual localization๊ณผ ๋ฌ๋ฆฌ, ์ฌ๊ธฐ์๋ ์๊ฐ๋ฝ ๋์ ์์ ์ด๊ฐ ํจ์น ํ๋๋ง ์ฃผ์ด์ง๋๋ค. ์ฌ๋์ด ์ฃผ๋จธ๋ ์์์ ์ด์ ๋ฅผ ์ฐพ์ ๋ ๋์ ๊ฐ๊ณ ์๋์ ๊ฐ์ด๋ง์ผ๋ก ์์น๋ฅผ ๋๋ฌ์ด ๊ฐ๋ ์ํฉ๊ณผ ๋น์ทํฉ๋๋ค. ํ ๋ฒ์ ์ ์ด๋ง์ผ๋ก๋ โํ๋ฉด ์ด๋๊ฐ์ ๋น์ทํ๊ฒ ์๊ธด ์ฌ๋ฌ ํ๋ณดโ ๋๋ฌธ์ ์์น๊ฐ ํ๋๋ก ์ ํด์ง์ง ์์ต๋๋ค. MidasTouch๋ ์ด ๋ชจํธ์ฑ์ ์ผ์๋ฅผ ๋ฏธ๋๋ฌ๋จ๋ฆฌ๋ฉฐ ์๊ฐ์ ๋ฐ๋ผ ๊ด์ธก์ ๋์ ํด ์ ์ฐจ ์ขํ ๋๊ฐ๋ ๋ฐฉ์์ผ๋ก ํ์ด๋ ๋๋ค.

MidasTouch ์ ์ฒด ๊ฐ์(Fig. 1): ์๊ฐ๋ฝ-๋ฌผ์ฒด ์ ์ด์์ ์ด๊ฐ ๊น์ด/์ฝ๋๋ฅผ ์ถ์ถํ๊ณ , ๋ฌผ์ฒด๋ณ codebook๊ณผ ๋น๊ตํด ์ ์ ํํฐ๋ก ํ๋ฉด ์ SE(3) ํฌ์ฆ ๋ถํฌ๋ฅผ ์๊ฐ์ ๋ฐ๋ผ ๊ฐฑ์ ํ๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก :
MidasTouch๋ ๋ ์ถ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ํ๋๋ ์ด๊ฐ ์ด๋ฏธ์ง๋ฅผ ํ๋ฉด ๊ธฐํ ๊ธฐ๋ฐ์ ์์ถ ํํ์ผ๋ก ๋ฐ๊พธ๋ tactile code์ด๊ณ , ๋ค๋ฅธ ํ๋๋ ๊ทธ ์ฝ๋๋ฅผ ์ธก์ ๊ฐ์ผ๋ก ์ฌ์ฉํ๋ Monte-Carlo ์ ์ ํํฐ์ ๋๋ค.
์ด๊ฐ ๊น์ด ์ถ์ + tactile code network (TCN): ๋จผ์ DIGIT์ RGB ์ด๊ฐ ์ด๋ฏธ์ง๋ก๋ถํฐ ๊ตญ์ ํ๋ฉด์ heightmap๊ณผ ์ ์ด ๋ง์คํฌ๋ฅผ ์ถ์ ํด ์์ 3D ๊ธฐํ ํจ์น๋ฅผ ๋ณต์ํฉ๋๋ค. ์ด 3D ํจ์น๋ฅผ sparse 3D convolution ๊ธฐ๋ฐ ๋คํธ์ํฌ(MinkowskiNet ๊ณ์ด, feature pyramid + generalized-mean pooling)์ ํต๊ณผ์์ผ 256์ฐจ์ ์๋ฒ ๋ฉ(tactile code)์ผ๋ก ์์ถํฉ๋๋ค. LIDAR place recognition์์ ์๊ฐ์ ๋ฐ์ ๊ตฌ์กฐ๋ก, TACTO๋ก ์๋ฎฌ๋ ์ด์ ํ ๋ค์์ YCB ๋ฌผ์ฒด(ํ ์คํธ์ ๋ถ๋ฆฌ๋ ํ์ต์ฉ ์งํฉ) ์ด๊ฐ ๋ฐ์ดํฐ์ ๋ํด triplet loss๋ก ํ์ตํฉ๋๋ค. ์ฆ, ๋น์ทํ ๊ธฐํ๋ ๊ฐ๊น๊ฒ, ๋ค๋ฅธ ๊ธฐํ๋ ๋ฉ๊ฒ ์๋ฒ ๋ฉ๋๋๋ก ๋ง๋ญ๋๋ค.
Tactile codebook (๋ฌผ์ฒด๋ณ ์ฌ์ ): ์์น์ถ์ ๋์ ๋ฌผ์ฒด๋ง๋ค, ๋ฉ์ ํ๋ฉด์์ ๋ฌด์์๋ก ์ํ๋งํ ๋ค์(์๋ง ๊ฐ ๊ท๋ชจ)์ ์ผ์ ํฌ์ฆ์ ๋ํด ๋ฏธ๋ฆฌ tactile code๋ฅผ ๊ณ์ฐํด codebook์ผ๋ก ์ ์ฅํฉ๋๋ค. KD-tree๋ก ์ธ๋ฑ์ฑํด ๋๋ฉด, ๋ฐํ์์ ์์ ํ๋ฉด ํฌ์ฆ์ ํด๋นํ๋ ์ฝ๋๋ฅผ ๋น ๋ฅด๊ฒ ์กฐํํ ์ ์์ต๋๋ค.
Monte-Carlo ์ ์ ํํฐ: ํ๋ฉด ์ SE(3) ํฌ์ฆ์ ๋ํ ํ๋ฅ ๋ถํฌ๋ฅผ ๋ค์์ ์ ์(particle)๋ก ํํํฉ๋๋ค.
- ์ด๋ ๋ชจ๋ธ(motion model): ์๋์ดํํฐ ์ค๋๋ฉํธ๋ฆฌ(์๋ ์ด๋)์ ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ๋ฅผ ๋ํด ์ ์๋ฅผ ์ ์ง์ํต๋๋ค.
- ์ธก์ ๋ชจ๋ธ(measurement model): ํ์ฌ ๊ด์ธก ์ฝ๋์ codebook์์ ์กฐํํ ๊ฐ ์ ์ ์์น์ ์ฝ๋ ์ฌ์ด ์ฝ์ฌ์ธ ์ ์ฌ๋๋ฅผ softmax๋ก ๋ณํํด ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํฉ๋๋ค.
- ๋ฆฌ์ํ๋ง/ํด๋ฌ์คํฐ๋ง: low-variance ๋ฆฌ์ํ๋ง์ผ๋ก ๊ฐ์ค์น ๋์ ์ ์๋ฅผ ์ด๋ฆฌ๊ณ , ๊ณต๊ฐ์์์ ๊ตฐ์ง(์: DBSCAN)์ ๋ฌถ์ด ์ด์ฐ์ ์ธ ํฌ์ฆ ๊ฐ์ค(hypotheses)์ ๋ง๋ญ๋๋ค.

์ค์ DIGIT ์ด๊ฐ ์ด๋ฏธ์ง์์ heightmap๊ณผ ์ ์ด ๋ง์คํฌ๋ฅผ ์ถ์ ํ๊ณ (Fig. 2 ๊ณ์ด), ์ด๋ฅผ ๊ตญ์ 3D ๊ธฐํ๋ก ๋ณต์ํ๋ ๊ณผ์ . ์ด 3D ํจ์น๊ฐ tactile code ์ ๋ ฅ์ด ๋๋ค.
์ฃผ์ ๊ฒฐ๊ณผ:
- ์๋ฎฌ๋ ์ด์ ์ฌ๋ผ์ด๋ฉ ์คํ(๋ค์ trial)์์ ๋ง์นยท๋๋ฆดยท๊ฐ์์ฒ๋ผ ๊ธฐํ๊ฐ ๋๋ ทํ ๋๊ตฌ๋ฅ๋ ๋น ๋ฅด๊ฒ ์๋ ดํด ์์ ์ต์ข ํฌ์ฆ ์ค์ฐจ๋ฅผ ๋ฌ์ฑํ๊ณ , ์ปตยท์คํ์์ยท๋จธ์คํ๋๋ณ์ฒ๋ผ ๋์นญ์ ์ด๊ฑฐ๋ ๋ฐ๋ฐํ ๋ฌผ์ฒด์์๋ ์ค์ฐจ๊ฐ ๋ ์ปธ์ต๋๋ค.
- ์ค์ ํ๊ฒฝ(handheld DIGIT, ๋ฌผ์ฒด ๊ณ ์ , OptiTrack ๋ชจ์ ์บก์ฒ)์์๋ ๋ ธ์ด์ฆ๊ฐ ํฐ ์ด๊ฐ ๋ฐ์ดํฐ ํ์ ์ค์ฐจ๊ฐ ๋ ํฌ์ง๋ง, ์ฌ์ ํ ์๋ฏธ ์๋ ์๋ ด์ ๋ณด์์ต๋๋ค. ์ผ๊ตฌ๊ณต์ฒ๋ผ ํน์ง ์๋ ๊ตฌ๋ ๋ํ์ ์ธ ์คํจ ์ฌ๋ก์์ต๋๋ค.
- tactile code๋ ์ผ๋ฐ์ ์ธ ์ด๋ฏธ์ง ์๋ฒ ๋ฉ(์: ResNet ๊ธฐ๋ฐ ํน์ง)๋ณด๋ค ๋จ์ผ ์ ์ด ๋งค์นญ์์ ๋ ๋ฎ์ ์ค์ฐจ๋ฅผ ๋ณด์๊ณ , codebook ํฌ๊ธฐ๋ ํจ์ฌ ์์์ต๋๋ค.
๊ฒฐ๋ก :
MidasTouch๋ โ๋จ์ผ ์ด๊ฐ์ ๋ชจํธํ์ง๋ง, ๋ฏธ๋๋ฌ์ง๋ฉฐ ๋์ ํ๋ฉด ์ ์ญ ์์น์ถ์ ์ด ๊ฐ๋ฅํ๋คโ๋ ๊ด์ ์ ์ ์ ํํฐ์ ํ์ต๋ ์ด๊ฐ ์ฝ๋๋ก ๊ตฌํํ ์์คํ ์ ๋๋ค. ์๊ฐ ์ฌ์ ์ ๋ณด ์์ด ์ด๊ฐ๋ง์ผ๋ก ๋์ํ๋ฉฐ, ํ์ ์ฐ๊ตฌ๋ฅผ ์ํด YCB-Slide ๋ฐ์ดํฐ์ ๊ณผ ์ฝ๋๋ฅผ ๊ณต๊ฐํ์ต๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
ํ ์ค๋ก ์์ํ๋ฉด
์ด๊ฐ ์์น์ถ์ ์ ๋ณธ์ง์ ์ด๋ ค์์ โํ ๋ฒ์ ์ ์ด์ด ๊ฑฐ์ ํญ์ ๋ชจํธํ๋คโ๋ ๋ฐ ์๋ค. MidasTouch๋ ์ด ๋ชจํธ์ฑ์ ์์ ๋ ค ์ ์ฐ๋ ๋์ , ์ ๋ฉด์ผ๋ก ๋ฐ์๋ค์ธ๋ค. ํ ์ ์ ๊ด์ธก์ ๋ถํ์คํ๋ ๋ถํฌ๋ก ๋ค๋ฃจ๊ณ , ์ผ์๋ฅผ ํ๋ฉด ์๋ก ๋ฏธ๋๋ฌ๋จ๋ฆฌ๋ฉฐ ์๊ฐ์ ๋ฐ๋ผ ๊ด์ธก์ ์์ ๋ถํฌ๋ฅผ ์ขํ๋ค. ๊ทธ ๋ถํฌ ์ถ๋ก ์ ์์ง์ด Monte-Carlo ์ ์ ํํฐ์ด๊ณ , ๊ฐ ๊ด์ธก์ โํ๋ฉด ์ด๋ ์ง์ ๊ณผ ๋ฎ์๋๊ฐโ๋ก ํ์ํด ์ฃผ๋ ๋๊ตฌ๊ฐ ํ์ต๋ tactile code๋ค.
์๋ก ๊ณผ ๋ฐฐ๊ฒฝ: ์ด๊ฐ ์์น์ถ์ ์ ์ ์ด๋ ค์ด๊ฐ
๋จผ์ ๋ฌธ์ ์ค์ ์ ๋ถ๋ช ํ ํ์. ๋ฌผ์ฒด์ 3D ๋ฉ์๋ ์ด๋ฏธ ์๋ค. ๊ทธ ํ๋ฉด ์๋ฅผ DIGIT ๊ฐ์ vision-based tactile sensor๊ฐ ๋๋ฅด๋ฉฐ ๋ฏธ๋๋ฌ์ง๋ค. ๋ชฉํ๋ ๋งค ์๊ฐ ์ผ์๊ฐ ํ๋ฉด์ ์ด๋ SE(3) ํฌ์ฆ์ ์๋์ง๋ฅผ ์ถ์ ํ๋ ๊ฒ์ด๋ค. ์๊ฐ์ ์ฐ์ง ์๋๋ค.
์ฌ๊ธฐ์ ๋ ๊ฐ์ง๊ฐ ๋์์ ์ด๋ ต๋ค.
์ฒซ์งธ, ๊ด์ธก ์์ญ์ด ๊ทนํ ์๋ค. DIGIT์ ์ ค์ด ๋ฟ๋ ์์ญ์ ๋ช mmยฒ ์์ค์ด๋ค. ๊ทธ ์์ ํจ์น์ ๋ด๊ธด ๊ตญ์ ๊ธฐํ(๊ณก๋ฅ , ๋ชจ์๋ฆฌ, ํ๋ฉด ์ฌ๋ถ)๋ง์ผ๋ก ์ ์ฒด ํ๋ฉด์์ ์์น๋ฅผ ์ฐพ์์ผ ํ๋ค. ๋ฌผ์ฒด ์ ์ฒด๋ฅผ ๋ณด๋ ์นด๋ฉ๋ผ์๋ ์ ๋ณด๋์ ์ฐจ์์ด ๋ค๋ฅด๋ค.
๋์งธ, ์ ์ญ ๋ชจํธ์ฑ(global ambiguity)์ด ๊ตฌ์กฐ์ ์ด๋ค. ๋งค๋ํ ํ๋ฉด, ๋จ์ํ ๊ณก๋ฉด, ๋์นญ์ถ์ ๊ฐ์ง ๋ฌผ์ฒด์์๋ ์๋ก ๋ค๋ฅธ ์ฌ๋ฌ ์์น๊ฐ ๊ฑฐ์ ๋๊ฐ์ ์ด๊ฐ์ ๋ง๋ ๋ค. ์ปต์ ์๋ฉด ํ ์ ์ ๋ง์ง๋ฉด ์๋ฉด ์ ์ฒด๊ฐ ํ๋ณด๊ฐ ๋๋ค. ์ฆ ๋จ์ผ ๊ด์ธก์ posterior๋ ๋ณธ์ง์ ์ผ๋ก ๋ค๋ด(multimodal)์ด๋ค. ๋จ์ผ ์ถ์ ์น(์ ์ถ์ )๋ก ๋ตํ๋ ค ํ๋ฉด ๋ฐ๋์ ๊นจ์ง๋ค.
MidasTouch์ ํต์ฌ ํต์ฐฐ์ ์ด ๋ ๋์ ์ ๋ํ ๋ต์ด ๊ฐ๋ค๋ ๊ฒ์ด๋ค. ๋ถํฌ๋ก ์ถ๋ก ํ๊ณ , ๋ฏธ๋๋ฌ์ง๋ฉฐ ๋์ ํ๋ผ. ํ๋ฉด ์๋ฅผ ๋ฏธ๋๋ฌ์ง๋ค ๋ชจ์๋ฆฌ๋ ๋ฅ์ ๊ฐ์ salient geometry๋ฅผ ๋ง๋๋ ์๊ฐ ํ๋ณด๊ฐ ๊ธ๊ฒฉํ ์ค์ด๋ ๋ค. ์ฌ๋์ด ์ปต์ ๋๋ฌ๋ค ์์ก์ด์ ๋ฟ์ผ๋ฉด ๋จ์จ์ ๋ฐฉํฅ์ ์ก๋ ๊ฒ๊ณผ ๊ฐ๋ค.
๋ฐฉ๋ฒ ์์ธ 1: ์ด๊ฐ์ ๊ธฐํ๋ก, ๊ธฐํ๋ฅผ ์ฝ๋๋ก
MidasTouch์ ํ์ดํ๋ผ์ธ์ ๊ด์ธก์ ๋ ๋จ๊ณ๋ก ์ถ์ํํ๋ค.
์ด๊ฐ ์ด๋ฏธ์ง โ ๊ตญ์ 3D ๊ธฐํ. DIGIT์ RGB ์ถ๋ ฅ์ ์ ค์ด ๋ณํ๋๋ฉฐ ๋ง๋ค์ด์ง ์ผ์ข ์ ์์ ์ด๋ฏธ์ง๋ค. ๋จผ์ ์ด๋ก๋ถํฐ ํ๋ฉด heightmap๊ณผ ์ ์ด ๋ง์คํฌ๋ฅผ ์ถ์ ํด, ๋ฟ์ ์์ญ์ ์์ 3D ๊ธฐํ ํจ์น๋ฅผ ๋ณต์ํ๋ค. ์ด๋ ๊ฒ RGB์์ ๊ธฐํ๋ก ํ ๋ฒ ํ์ํด ๋๋ฉด ์ผ์ ์๊ฐยท์กฐ๋ช ๊ฐ์ ์ธ๊ด ์ฐจ์ด์ ๋ ๋ฏผ๊ฐํด์ง๋ค.
๊ตญ์ 3D ๊ธฐํ โ tactile code. ๋ณต์ํ 3D ํจ์น๋ฅผ sparse 3D convolution ๋คํธ์ํฌ์ ๋ฃ์ด 256์ฐจ์ ์๋ฒ ๋ฉ์ผ๋ก ์์ถํ๋ค. ์ด ๋ถ๋ถ์ด ๋ ผ๋ฌธ์ ์๋ฆฌํ ์ง์ ์ด๋ค. ์ ์๋ค์ LIDAR place recognition(์์จ์ฃผํ์์ LIDAR ์ค์บ๋ง์ผ๋ก โ์ฌ๊ธฐ๊ฐ ์ด๋์ธ์งโ ์ธ์ํ๋ ๋ฌธ์ )์์ ์ฐ๋ ๊ตฌ์กฐ๋ฅผ ๊ฑฐ์ ๊ทธ๋๋ก ๊ฐ์ ธ์จ๋ค. point cloud๋ฅผ voxel๋ก ์์ํํ๊ณ , feature pyramid๋ก voxel๋ณ ํน์ง์ ๋ฝ์ ๋ค, generalized-mean pooling์ผ๋ก ํ๋์ ์ ์ญ ๋์คํฌ๋ฆฝํฐ๋ก ๋ชจ์๋ค. ๋ฐฑ๋ณธ์ LIDAR ๋ฐ์ดํฐ๋ก ์ฌ์ ํ์ตํ ๋ค, TACTO ์๋ฎฌ๋ ์ดํฐ๋ก ์์ฑํ ์ด๊ฐ ๋ฐ์ดํฐ์ triplet loss๋ก fine-tuneํ๋ค. ํ์ต ๋ฌผ์ฒด์ ํ ์คํธ ๋ฌผ์ฒด๋ ๋ถ๋ฆฌํด, ์ ๋ฌผ์ฒด์๋ ์ผ๋ฐํ๋๋ โ๊ธฐํ ๋ฌ์ฌ ๋ฅ๋ ฅโ์ ํ์ตํ๊ฒ ํ๋ค.

๋ฌผ์ฒด ํ๋ฉด์ tactile code ๊ณต๊ฐ ์์ ์ ์ฌ๋๋ก ์์น ํ ์๊ฐํ(Fig. 3 ๊ณ์ด). ๊ฐ์ ์(=๋น์ทํ ์ฝ๋)์ด ํ๋ฉด ์ฌ๋ฌ ๊ณณ์ ํฉ์ด์ ธ ์๋ค๋ ์ ์ด ๋จ์ผ ์ ์ด ๋ชจํธ์ฑ์ ์๊ฐ์ ๊ทผ๊ฑฐ์ด๋ฉฐ, ๋ชจ์๋ฆฌยท์์ก์ด ๊ฐ์ salient ์์ญ์ด ๊ตฌ๋ถ๋ ฅ์ ๋ง๋ ๋ค.
์ฌ๊ธฐ์ ์ โ์ด๋ฏธ์ง ์๋ฒ ๋ฉโ์ด ์๋๋ผ โ๊ธฐํ ์ฝ๋โ์ธ์ง๊ฐ ์ค์ํ๋ค. RGB ์ด๊ฐ ์ด๋ฏธ์ง๋ฅผ ๊ทธ๋๋ก ResNet์ ๋ฃ์ด๋ ์๋ฒ ๋ฉ์ ์ป์ง๋ง, ๊ทธ ์๋ฒ ๋ฉ์ ์ผ์ยท์กฐ๋ช ๋๋ฉ์ธ์ ๋ฌถ์ธ๋ค. ๊ธฐํ๋ก ํ์ํ ์ฝ๋๋ ๊ทธ ๋๋ฉ์ธ ๊ฒฉ์ฐจ๋ฅผ ํ ๋ฒ ๊ฑท์ด๋ธ ํํ์ด๋ผ, sim์์ ํ์ตํด real์ ์ฎ๊ธธ ๋ ์ ๋ฆฌํ๋ค. ๋ ผ๋ฌธ๋ ๋จ์ผ ์ ์ด ๋งค์นญ์์ tactile code๊ฐ ์ด๋ฏธ์ง ๊ธฐ๋ฐ ํน์ง๋ณด๋ค ๋ฎ์ ์ค์ฐจ์ ํจ์ฌ ์์ codebook ํฌ๊ธฐ๋ฅผ ๋ณด์ธ๋ค๊ณ ๋ณด๊ณ ํ๋ค.
๋ฐฉ๋ฒ ์์ธ 2: codebook๊ณผ ์ ์ ํํฐ ๋ฃจํ
Codebook(๋ฌผ์ฒด๋ณ ์ฌ์ ). ์์น์ถ์ ๋์ ๋ฌผ์ฒด๋ง๋ค, ๋ฉ์ ํ๋ฉด์์ ์ ์ด์ ยท๋ฒ์ ยท๋ฐฉํฅยท์์ (indentation)์ ๋ฌด์์๋ก ๋ฐ๊ฟ๊ฐ๋ฉฐ ์๋ง ๊ฐ ๊ท๋ชจ์ ๊ฐ์ ์ ์ด ํฌ์ฆ๋ฅผ ๋ง๋ค๊ณ , ๊ฐ๊ฐ์ tactile code๋ฅผ ๋ฏธ๋ฆฌ ๊ณ์ฐํด ์ ์ฅํ๋ค. ์ด๋ ๊ฒ ๋ง๋ codebook์ KD-tree๋ก ์ธ๋ฑ์ฑํ๋ฉด, ๋ฐํ์์ โํ๋ฉด ์ ์์ ํฌ์ฆ โ ํด๋น ์ฝ๋โ๋ฅผ ๋น ๋ฅด๊ฒ ์กฐํํ ์ ์๋ค. ํต์ฌ์ ๋ฌด๊ฑฐ์ด ์ฝ๋ ๊ณ์ฐ์ ์ ๋ถ ์คํ๋ผ์ธ์ผ๋ก ๋ฐ์ด๋๊ณ , ์จ๋ผ์ธ์์๋ ๊ฐ๋ฒผ์ด ๋น๊ต๋ง ํ๋ค๋ ์ ์ด๋ค.
ํํฐ๋ง ๋ฃจํ. ๋งค ํ์์คํ ๋ง๋ค ๋ค์์ด ๋ฐ๋ณต๋๋ค.
- ์์ธก(์ด๋ ๋ชจ๋ธ): ์๋์ดํํฐ ์ค๋๋ฉํธ๋ฆฌ(์ผ์๊ฐ ์ผ๋ง๋ ์์ง์๋์ง)์ ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ๋ฅผ ๋ํด ๋ชจ๋ ์ ์๋ฅผ ํ๋ฉด์ ๋ฐ๋ผ ์ ์ง์ํจ๋ค. ๋ถํ์คํ ์ด๋์ด๋ฏ๋ก ์ ์๊ฐ ์ฝ๊ฐ์ฉ ํผ์ง๋ค.
- ๊ฐฑ์ (์ธก์ ๋ชจ๋ธ): ํ์ฌ ๊ด์ธก ์ฝ๋๋ฅผ, codebook์์ ์กฐํํ ๊ฐ ์ ์ ์์น์ ์ฝ๋์ ์ฝ์ฌ์ธ ์ ์ฌ๋๋ก ๋น๊ตํ๋ค. ์ ์ฌ๋๋ฅผ softmax๋ก ์ ๊ทํํด ์ ์ ๊ฐ์ค์น๋ฅผ ๋งค๊ธด๋ค. ๊ด์ธก๊ณผ ๋ฎ์ ์์น์ ์ ์๊ฐ ๋์ ๊ฐ์ค์น๋ฅผ ๋ฐ๋๋ค.
- ๋ฆฌ์ํ๋ง: low-variance ๋ฆฌ์ํ๋ง์ผ๋ก ๊ฐ์ค์น ๋์ ์ ์๋ฅผ ๋ณต์ ํ๊ณ ๋ฎ์ ์ ์๋ฅผ ๋ฒ๋ฆฐ๋ค.
- ๊ฐ์ค ์ถ์ถ: ์ด์๋จ์ ์ ์๋ฅผ ๊ณต๊ฐ์์์ DBSCAN ๋ฑ์ผ๋ก ๊ตฐ์งํํด, โ์ ๋ ฅ ํ๋ณด ์์น๋คโ์ ์ด์ฐ์ ์ธ ๊ฐ์ค๋ก ์ ์ํ๋ค.
์ด ๋ฃจํ์ ์๋ฆ๋ค์์ ๋ค๋ด์ฑ์ ์์ฐ์ค๋ฝ๊ฒ ํํํ๋ค๋ ๋ฐ ์๋ค. ์ด๊ธฐ์๋ ์ ์๊ฐ ํ๋ฉด ์ ์ฒด์ ํฉ๋ฟ๋ ค์ง ๋ค๋ด ๋ถํฌ๋ค. ํ๋ฉด์ ๋ฏธ๋๋ฌ์ง๋ ๋์์๋ ์ฌ๋ฌ ๋ด์ฐ๋ฆฌ๊ฐ ๊ณต์กดํ๋ค. ๊ทธ๋ฌ๋ค ๋ชจ์๋ฆฌ ๊ฐ์ ํน์ง์ ์ง๋๋ฉด ํ๋ ๋ด์ฐ๋ฆฌ๋ง ์ด์๋จ์ผ๋ฉฐ ๋ถํฌ๊ฐ ์๋ ดํ๋ค. ์นผ๋ง ํํฐ ๋ฅ์ ๋จ๋ด ๊ฐ์ ์ผ๋ก๋ ์ก์ ์ ์๋ ๊ฑฐ๋์ด๋ค.
YCB-Slide ๋ฐ์ดํฐ์
๋ฐฉ๋ฒ๋งํผ์ด๋ ์ด ๋ ผ๋ฌธ์ ์ค์ง์ ๊ธฐ์ฌ๋ ๋ฐ์ดํฐ์ ์ด๋ค. ์ด๊ฐ ์ฌ๋ผ์ด๋ฉ ์์น์ถ์ ์ ์ฐ๊ตฌํ๋ ค๋ฉด โ์ผ์๊ฐ ๋ฌผ์ฒด ์๋ฅผ ๋ฏธ๋๋ฌ์ง๋ ๊ถค์ + ์ ํํ ground-truth ํฌ์ฆโ๊ฐ ํ์ํ๋ฐ, ๊ทธ๋ฐ ๋ฐ์ดํฐ๊ฐ ์์๋ค.
- ์ค์ ๋ฐ์ดํฐ: 10๊ฐ์ YCB ๋ฌผ์ฒด์ ๋ํด, ๋ฌผ์ฒด๋ฅผ ๋ฐ์ด์ค๋ก ๊ณ ์ ํ๊ณ ์ฌ๋์ด DIGIT์ ์์ ๋ค๊ณ ํ๋ฉด์ ๋๋ฅด๋ฉฐ ๋ฏธ๋๋ฌ๋จ๋ฆฌ๋ ๊ถค์ ์ ์์งํ๋ค. OptiTrack ๋ฉํฐ์นด๋ฉ๋ผ ๋ชจ์ ์บก์ฒ๋ก ground-truth ํฌ์ฆ๋ฅผ ๊ธฐ๋กํ๋ค. ๊ฐ ๋ฌผ์ฒด๋น ๋ค์์ ๊ถค์ ์ด ์๊ณ , ์ด๊ฐ ์ด๋ฏธ์งยท์ผ์ ํฌ์ฆยท๋ฌผ์ฒด ๋ฉ์ยท์ ์ด ๋ง์คํฌ๊ฐ ํจ๊ป ์ ๊ณต๋๋ค.
- ์๋ฎฌ๋ ์ด์ ๋ฐ์ดํฐ: ๊ฐ์ ๋ฌผ์ฒด๋ค์ ๋ํด TACTO๋ก ํ๋ฉด์ ๋ฐ๋ผ๊ฐ๋ geodesic ์ฌ๋ผ์ด๋ฉ ๊ถค์ ์ ์์ฑํ๋ค. ์ด๊ฐ ์ด๋ฏธ์ง๋ฟ ์๋๋ผ ground-truth heightmap, ํฌ์ฆ๋ฅผ ๋ชจ๋ ์ ๊ณตํ๊ณ , ํ์ค์ฑ์ ์ํด ํฌ์ฆ์ ์๋์ ๋ ธ์ด์ฆ(์์ญ ๋ถ์ 1 mmยท1ยฐ ์์ค)๋ฅผ ์ฃผ์ ํ๋ค.
์คํ์์ยท๋๋ผ์ด๋ฒยท๋๋ฆดยท๋จธ๊ทธยท๊ฐ์ยท๋ง์นยท์ผ๊ตฌ๊ณต ๋ฑ ํ๋ฉดยท๊ณก๋ฉดยท๋๊ตฌยท๊ตฌ๊ฐ ๊ณจ๊ณ ๋ฃจ ์์ฌ, ๊ธฐํ ๊ตฌ๋ถ๋ ฅ์ด ์์น์ถ์ ๋์ด๋์ ์ด๋ป๊ฒ ์์ฉํ๋์ง ์ฒด๊ณ์ ์ผ๋ก ๋ณผ ์ ์๊ฒ ์ค๊ณ๋์ด ์๋ค.

์ค์ ์คํ ์ ์ (Fig. 5 ๊ณ์ด): ์คํ์์ยท์ ๋๋๋ฆด์ ๋ฐ์ด์ค๋ก ๊ณ ์ ํ๊ณ , OptiTrack ๋ง์ปค๊ฐ ๋ถ์ฐฉ๋ DIGIT์ ์์ผ๋ก ๋ฏธ๋๋ฌ๋จ๋ฆฐ๋ค. ์ข์๋จ์ ๊ทธ ์๊ฐ์ ์ค์ ์ด๊ฐ ์ด๋ฏธ์ง.
์คํ: ์ ํ๋์ ์๋ ด
ํ๊ฐ๋ ๋ ๊ฐ๋๋ก ์งํ๋๋ค. ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ๋ชจ๋์์ ๋ค์์ trial๋ก ์ฌ๋ผ์ด๋ฉ ๊ถค์ ์ ๋๋ฆฌ๊ณ , ์๊ฐ์ ๋ฐ๋ฅธ ํฌ์ฆ RMSE ์๋ ด๊ณผ ์ต์ข ํฌ์ฆ ์ค์ฐจ(translation, rotation)๋ฅผ ๋ณธ๋ค.

๋ํ ๋ฌผ์ฒด๋ค์ ์ฌ๋ผ์ด๋ฉ ์งํ์ ๋ฐ๋ฅธ ์๋ ด(Fig. 7 ๊ณ์ด): ์ด๊ฐ ์ด๋ฏธ์งยท๋ณต์ ๊ธฐํยทํ๋ฉด likelihood ํํธ๋งต๊ณผ ํจ๊ป, ์ฌ๋ผ์ด๋ฉ์ด ์งํ๋ ์๋ก ํฌ์ฆ RMSE๊ฐ ๋ด๋ ค๊ฐ๋ฉฐ ๋ถํฌ๊ฐ ๋ชจ์ด๋ ๊ณผ์ ์ ๋ณด์ฌ์ค๋ค.
๊ด์ฐฐ๋๋ ํจํด์ ์ง๊ด๊ณผ ์ ๋ง๋๋ค.
- ๊ธฐํ๊ฐ ๋๋ ทํ ๋ฌผ์ฒด์ผ์๋ก ๋น ๋ฅด๊ณ ์ ํํ๊ฒ ์๋ ดํ๋ค. ๋ง์นยท๋๋ฆดยท๊ฐ์์ฒ๋ผ ๋ชจ์๋ฆฌยท๋์ถ๋ถ๊ฐ ํ๋ถํ ๋ฌผ์ฒด๋ ์ฌ๋ผ์ด๋ฉ ์ค salient feature๋ฅผ ์์ฃผ ๋ง๋ ํ๋ณด๊ฐ ๋น ๋ฅด๊ฒ ์ ๋ฆฌ๋๋ค.
- ๋์นญยท๋ฐ๋ฐํ ๋ฌผ์ฒด๋ ์ด๋ ต๋ค. ์คํ์์(์ง์ก๋ฉด์ฒด), ๋จธ๊ทธ(ํ์ ๋์นญ์ ๊ฐ๊น์ด ๊ณก๋ฉด), ๋จธ์คํ๋๋ณ์ฒ๋ผ ํ๋ฉด ๋ค์๊ฐ ๋น์ทํ ์ฝ๋๋ฅผ ๊ฐ๋ ๋ฌผ์ฒด๋ ๋ชจํธ์ฑ์ด ์ค๋ ๋จ์ ์ต์ข ์ค์ฐจ๊ฐ ํฌ๋ค.
- ํน์ง ์๋ ๊ตฌ๋ ํ๊ณ ์ฌ๋ก๋ค. ์ผ๊ตฌ๊ณต์ ํ๋ฉด ์ด๋๋ ๋๊ฐ์ด ๋ฅ๊ธ์ด ์ฌ๋ผ์ด๋ฉ์ผ๋ก๋ ๊ตฌ๋ถ์ ์ด ์๊ธฐ์ง ์๋๋ค. ์ค์ ํ๊ฒฝ์์ ๋ํ์ ์คํจ๋ก ๋ณด๊ณ ๋๋ค.
์ค์ ํ๊ฒฝ์ ์ค์ฐจ๋ ์๋ฎฌ๋ ์ด์ ๋ณด๋ค ํฌ๋ค. ์ค์ ์ด๊ฐ ์ด๋ฏธ์ง์ ๋ ธ์ด์ฆ, heightmap ์ถ์ ์ค์ฐจ, sim-to-real ๋๋ฉ์ธ ๊ฒฉ์ฐจ๊ฐ ๋์ ๋๊ธฐ ๋๋ฌธ์ด๋ค. ๊ทธ๋ผ์๋ ๋๊ตฌ๋ฅ์์๋ ๋ถํฌ๊ฐ ์ค์ ๋ก ๋ชจ์ธ๋ค๋ ์ ์ด ํต์ฌ ๋ฉ์์ง๋ค. ์ฒ๋ฆฌ ์๋๋ ์จ๋ผ์ธ ์ด์ฉ์ด ๊ฐ๋ฅํ ์์ค(๋๋ต ์ค์๊ฐ์ ๊ทผ์ )์ผ๋ก ๋ณด๊ณ ๋๋ค.

์ค์ ํ๊ฒฝ 500 trial์ ๋ํ ์ต์ข ์ค์ฐจ ๋ถํฌ(Fig. 9 ๊ณ์ด): ๋ฌผ์ฒด๋ณ๋ก ์ด๊ธฐ ์ค์ฐจ(initial) ๋๋น ์ต์ข ์ค์ฐจ(final)๊ฐ ์ผ๋ง๋ ์ค์๋์ง๋ฅผ boxplot์ผ๋ก ๋น๊ตํ๋ค. ๋๊ตฌ๋ฅ์์ ๊ฐ์ ํญ์ด ํฌ๊ณ , ๋์นญยท๊ตฌํ ๋ฌผ์ฒด์์ ์๋ค.
ablation์์๋ ์ด๊ธฐ prior์ ๋ถํ์ค์ฑ์ ์กฐ์ด๋ฉด(๋ ์ข์ prior) outlier๊ฐ ์ค๊ณ ์๋ ด์ด ๊ฐ์ ๋๋ ๊ฒฝํฅ์ด ํ์ธ๋๋ค. ์ฆ ์ฝ๊ฐ์ ์ฌ์ ์ ๋ณด(๋๋ต์ ์ธ ์์ ์์น)๋ ํฐ ๋์์ด ๋์ง๋ง, ์ ์ญ ๋ชจ๋์์๋ ์์คํ ์ ๋์ํ๋ค.
๋นํ์ ๊ณ ์ฐฐ: ๊ฐ์ ๊ณผ ์ฝ์
๊ฐ์ .
- ๋ฌธ์ ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ํ๋ ์ด๋ฐํ๋ค. ๋จ์ผ ์ถ์ ๋์ ๋ถํฌ ์ถ๋ก ์ ํํ ๊ฒ์ ์ด๊ฐ ์์น์ถ์ ์ ๋ณธ์ง(๋ค๋ด์ฑ)๊ณผ ์ ํํ ๋ง๋ฌผ๋ฆฐ๋ค. ์ ์ ํํฐ๋ ์ด ๋ค๋ด์ฑ์ ํํํ๊ธฐ์ ๊ฐ์ฅ ์์ฐ์ค๋ฌ์ด ๋๊ตฌ๋ค.
- ๋๋ฉ์ธ ๊ฒฉ์ฐจ๋ฅผ ํ ๋จ๊ณ ๊ฑท์ด๋ด๋ ํํ. RGB๋ฅผ ๋ฐ๋ก ์๋ฒ ๋ฉํ์ง ์๊ณ ๊ธฐํ๋ก ํ์ํ ๋ค ์ฝ๋๋ฅผ ๋ฝ๋ ์ค๊ณ๋ sim์์ ํ์ตํด real๋ก ์ฎ๊ธธ ๋์ ๊ฒฉ์ฐจ๋ฅผ ์ค์ธ๋ค. LIDAR place recognition์ ์ด๊ฐ์ผ๋ก ์ฎ๊ธด ๋ฐ์๋ ์ ์ ํ๋ค.
- ๊ณ์ฐ์ ์คํ๋ผ์ธ์ผ๋ก ๋ฐ์ด๋ธ codebook. ๋ฌด๊ฑฐ์ด ์ฝ๋ ๊ณ์ฐ์ ์ฌ์ ์ ๋๋ด๊ณ ์จ๋ผ์ธ์ KD-tree ์กฐํ + ์ฝ์ฌ์ธ ์ ์ฌ๋๋ก ๊ฐ๋ณ๊ฒ ์ ์งํด, ์ ์ ์๋ง ๊ฐ๋ฅผ ์ค์๊ฐ ๊ทผ์ฒ์์ ๊ตด๋ฆฐ๋ค.
- ๋ฐ์ดํฐ์ ๊ณต๊ฐ. YCB-Slide๋ ์ด ํ์ ๋ถ์ผ์ ๊ณตํต ๋ฒค์น๋งํฌ๋ก ์ฐ์ผ ํ ๋๋ฅผ ๋ง๋ค์๋ค.
์ฝ์ ๊ณผ ํ๊ณ.
- ๋ฌผ์ฒด ๋ฉ์๋ฅผ ์๋ค๋ ๊ฐํ ๊ฐ์ . codebook์ ์ ํํ 3D ๋ฉ์๊ฐ ์์ด์ผ ๋ง๋ค์ด์ง๋ค. ๋ฏธ์ง์ ๋ฌผ์ฒด์๋ ๊ทธ๋๋ก ์ธ ์ ์๊ณ , ํ์ ์ถ์ ๊ณผ์ ๊ฒฐํฉ(SLAM๋ฅ)์ด ๋ณ๋ ๊ณผ์ ๋ก ๋จ๋๋ค.
- ๋ฐ๋ฐยท๋์นญยท๊ตฌํ ๋ฌผ์ฒด์ ํ๊ณ. ์ผ๊ตฌ๊ณต์ฒ๋ผ ํ๋ฉด ๊ตฌ๋ถ๋ ฅ์ด ์์ผ๋ฉด ์ฌ๋ผ์ด๋ฉ์ผ๋ก๋ ํ๋ฆฌ์ง ์๋๋ค. ์ด๋ ๋ฐฉ๋ฒ์ ๊ฒฐํจ์ด๋ผ๊ธฐ๋ณด๋ค ์ด๊ฐ ๋จ๋ ์ ์ ๋ณด ํ๊ณ์ด์ง๋ง, ์ค์ฉ์์๋ ๊ฒฐ์ ์ ์ ์ฝ์ด๋ค.
- ์ด๋ ๋ชจ๋ธ์ ๊ฐ์ . ์๋์ดํํฐ ์ค๋๋ฉํธ๋ฆฌ๊ฐ ๋น๊ต์ ์ ํํ๋ค๊ณ ๊ฐ์ ํ๋ค. ๋ฏธ๋๋ฌ์ง(slip)์ด๋ ์ค๋๋ฉํธ๋ฆฌ ๋๋ฆฌํํธ๊ฐ ํฌ๋ฉด ์ด๋ ๋ชจ๋ธ์ด ํ๋ค๋ฆฐ๋ค.
- heightmap ์ถ์ ์ ๋ํ ์์กด. ์ ์ฒด ํ์ดํ๋ผ์ธ์ด ์ด๊ฐโ๊ธฐํ ๋ณต์์ ํ์ง์ ๋ฌถ์ฌ ์๋ค. ์ด ๋จ๊ณ๊ฐ ๋ฌด๋์ง๋ฉด ์ฝ๋๋ ๋ฌด๋์ง๋ค. ์ค์ ํ๊ฒฝ ์ค์ฐจ์ ์๋น ๋ถ๋ถ์ด ์ฌ๊ธฐ์ ์จ๋ค.
- ๋จ์ผ ๋ฌผ์ฒดยท๋จ์ผ ์ผ์ ์ค์ . ์๊ฐ๋ฝ ํ๋๊ฐ ํ ๋ฌผ์ฒด๋ฅผ ๋ฏธ๋๋ฌ์ง๋ ์๋๋ฆฌ์ค๋ค. ๋ค์๊ฐ๋ฝ ๋์ ์ ์ด, ๋ฌผ์ฒด๊ฐ ์์ง์ด๋ in-hand manipulation์ผ๋ก์ ํ์ฅ์ ํ์ ๊ณผ์ ๋ค.
๊ด๋ จ ์ฐ๊ตฌ ์ ์๋ฆฌ๋งค๊น
MidasTouch๋ ์ด๊ฐ SLAM/localization ๊ณ์ด(์: ๋์ผ ์ ์๊ตฐ์ tactile SLAM ์ฐ๊ตฌ)๊ณผ, ํ์ต๋ ๋์คํฌ๋ฆฝํฐ ๊ธฐ๋ฐ place recognition ๊ณ์ด์ ๊ต์ฐจ์ ์ ์๋ค. visual localization, LIDAR place recognition์์ ๊ฒ์ฆ๋ โ์์ถ ๋์คํฌ๋ฆฝํฐ + ๊ฒ์โ ํจ๋ฌ๋ค์์ ์ด๊ฐ์ผ๋ก ๊ฐ์ ธ์จ ์ ์ด ํน์ง์ด๋ค. ๋ํ ์ด๊ฐ ์๋ฎฌ๋ ์ดํฐ TACTO ์์์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ค๋ ์ ์์ sim ๊ธฐ๋ฐ ์ด๊ฐ ํ์ต ํ๋ฆ๊ณผ ์ง์ ์ฐ๊ฒฐ๋๋ค. tactile code๊ฐ ObjectFolder๋ฅ ์ด๋ฏธ์ง ์๋ฒ ๋ฉ๋ณด๋ค ์์น์ถ์ ์ ์ ๋ฆฌํ๋ค๋ ๋น๊ต๋, โ์ด๊ฐ์์ ๋ฌด์์ ํํ์ผ๋ก ์ผ์์ผ ํ๋๊ฐ(์ธ๊ด vs ๊ธฐํ)โ์ ๋ํ ์๋ฏธ ์๋ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ์ ๊ณตํ๋ค.
์์ฝ
MidasTouch์ ๊ธฐ์ฌ๋ ํ ๋ฌธ์ฅ์ผ๋ก ๋ชจ์ธ๋ค. ์ด๊ฐ ์์น์ถ์ ์ ์ ์ถ์ ๋ฌธ์ ๊ฐ ์๋๋ผ ๋ถํฌ ์ถ๋ก ๋ฌธ์ ์ด๋ฉฐ, ๋จ์ผ ์ ์ด์ ๋ชจํธ์ฑ์ ๋ฏธ๋๋ฌ์ง๋ฉฐ ๋์ ํ๋ฉด ํ๋ฆฐ๋ค. ์ด๋ฅผ ์ํด ์ด๊ฐ์ ๊ตญ์ ๊ธฐํ๋ก, ๊ธฐํ๋ฅผ ์์ถ ์ฝ๋๋ก ํ์ํ๊ณ , ๋ฌผ์ฒด๋ณ codebook์ ์ธก์ ๋ชจ๋ธ๋ก ์ผ๋ Monte-Carlo ์ ์ ํํฐ๋ฅผ ๋๋ฆฐ๋ค. ๊ธฐํ๊ฐ ๋๋ ทํ ๋ฌผ์ฒด์์๋ ํ์คํ ์๋ ดํ๊ณ , ๋ฐ๋ฐยท๋์นญยท๊ตฌํ ๋ฌผ์ฒด์์๋ ์ด๊ฐ ๋จ๋ ์ ์ ๋ณด ํ๊ณ์ ๋ถ๋ชํ๋ค. ์ ํํ ๋ฉ์๋ฅผ ์๋ค๋ ๊ฐ์ ๊ณผ heightmap ์ถ์ ํ์ง ์์กด์ด๋ผ๋ ์ ์ฝ์ด ๋จ์ง๋ง, ๊ณต๊ฐ๋ YCB-Slide ๋ฐ์ดํฐ์ ๊ณผ ํจ๊ป ์ด๊ฐ ์์น์ถ์ ์ ๋ณธ๊ฒฉ์ ์ธ ํ์ตยท์ถ๋ก ๋ฌธ์ ๋ก ๋์ด์ฌ๋ฆฐ ์์ ์ด๋ค.