๐Manipulation by Feel ๋ฆฌ๋ทฐ
- ๐ค ๋ณธ ๋ ผ๋ฌธ์ ๊ณ ํด์๋ GelSight ์ด๊ฐ ์ผ์์ ๋ฅ ์์ธก ๋ชจ๋ธ์ ๊ฒฐํฉํ์ฌ ์๊ฐ์ด ๊ฐ๋ ค์ง ์ํฉ์์๋ ๋ก๋ด์ ์ฐ์์ ์ธ non-prehensile ์กฐ์์ ๊ฐ๋ฅํ๊ฒ ํ๋ deep tactile MPC ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
- ๐ง ์ด ๋ฐฉ๋ฒ์ ๋ก๋ด์ด ๋น์ง๋ ์์จ ์ํธ์์ฉ์ ํตํด ์์ ์ด๊ฐ ์ผ์ ์ ๋ ฅ์์ ๋ฅ ์์ธก ๋ชจ๋ธ์ ํ์ตํ๊ณ , ์ด๋ฅผ Model Predictive Control (MPC)์ ํ์ฉํ์ฌ ์ฌ์ฉ์๊ฐ ์ง์ ํ ์ด๊ฐ ๋ชฉํ๋ฅผ ์ง์ ๋ฌ์ฑํฉ๋๋ค.
- โจ ์ ์๋ deep tactile MPC๋ ๊ณต ์ฌ๋ฐฐ์น, ์๋ ๋ก๊ทธ ์คํฑ ์กฐ์, 20๋ฉด์ฒด ์ฃผ์ฌ์ ๊ตด๋ฆฌ๊ธฐ์ ๊ฐ์ ์ค์ ์กฐ์ ์์ ์์ ๊ธฐ์กด์ ์๋ ์ค๊ณ baseline๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ, ์ด๊ฐ ๊ธฐ๋ฐ ๋ก๋ด ์ ์ด์ ๋์ ์ ์ฌ๋ ฅ์ ์ ์ฆํฉ๋๋ค.

๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
โManipulation by Feel: Touch-Based Control with Deep Predictive Modelsโ ๋ ผ๋ฌธ์ ๊ณ ํด์๋ ์ด๊ฐ ์ผ์(GelSight)์ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ์์ธก ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋ก๋ด์ด ์ด๊ฐ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ฌผ์ฒด๋ฅผ ์กฐ์ํ๋ ๋ฌธ์ ๋ฅผ ๋ค๋ฃน๋๋ค. ํนํ ์ฐ์์ ์ด๊ณ ๋นํ์ (non-prehensile)์ ์ธ ์กฐ์์์ ์ด๊ฐ ์ผ์ฑ์ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ ์ด๋ ค์์ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค.
์ด ์ฐ๊ตฌ๋ ์ธ๊ฐ์ด ์กฐ์ ์ ์ด๊ฐ์ ํฌ๊ฒ ์์กดํ๋ค๋ ์ (์: ์์ด ๋ง๋น๋๋ฉด ์ฑ๋ฅ์ ์ผ๊ธฐ ์ด๋ ค์ด ์คํ)์ ๊ฐ์กฐํ๋ฉฐ, ๋ก๋ด ์กฐ์์์ ์๊ฐ ์ผ์ฑ์ด ๊ฐ๋ ค์ง๋ ์ ์ด ์ง์ ์์ ์ด๊ฐ์ ์ค์์ฑ์ ์ญ์คํฉ๋๋ค. ๊ธฐ์กด ๋ก๋ด ์ด๊ฐ ์ผ์ฑ์ ํ๊ณ์ (๋ฎ์ ํด์๋, ๋ฌผ๋ฆฌ ๋ชจ๋ธ์ ์ด๋ ค์, ์ด๊ฐ ๋ชฉํ ์ค์ ์ ๋ชจํธํจ)์ ์ง์ ํ๋ฉฐ, GelSight์ ๊ฐ์ ์ต์ ์ด๊ฐ ์ผ์ฑ ๊ธฐ์ ๊ณผ ๋ฅ๋ฌ๋์ ๋ฐ์ ์ด ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์์ ์ ์ํฉ๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก ์ โDeep Tactile MPCโ (Model Predictive Control) ํ๋ ์์ํฌ์ ๋๋ค. ์ด ํ๋ ์์ํฌ๋ ๋ก๋ด์ ์์จ์ ์ธ ์ํธ์์ฉ์ ํตํด ์์ง๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ด๊ฐ ์์ธก ๋ชจ๋ธ์ ํ์ตํฉ๋๋ค.
- ๋ฐ์ดํฐ ์์ง (Autonomous Data Collection): ๋ก๋ด์ ball, analog stick, 20-sided die์ ๊ฐ์ ๋ฌผ์ฒด์ ๋ฌด์์ ์์ง์์ ํตํด ์์จ์ ์ผ๋ก ์ํธ์์ฉํ๋ฉฐ ๋๋์ ์ด๊ฐ ์ด๋ฏธ์ง ์ํ์ค์ ํด๋น ์ก์ ๋ฐ์ดํฐ๋ฅผ ์์งํฉ๋๋ค. ์๋ฅผ ๋ค์ด ball repositioning task์์๋ 7400๊ฐ์ ๊ถค์ , analog stick task์์๋ 3000๊ฐ, die rolling task์์๋ 4500๊ฐ์ ๊ถค์ ์ด ์์ง๋์์ต๋๋ค. ๊ฐ ๊ถค์ ์ 15~18 ํ์์คํ ์ผ๋ก ๊ตฌ์ฑ๋๋ฉฐ, ์ผ์์ x, y, z ๋ฐฉํฅ์ผ๋ก ยฑ6.0 mm์ ๋ฌด์์ ์์ง์์ด ์ ์ฉ๋ฉ๋๋ค. ์ก์ ์ 3 ํ์์คํ ๋์ ๋ฐ๋ณต๋์ง๋ง, ์ด๋ฏธ์ง๋ ๋งค ํ์์คํ ๋ง๋ค ๊ธฐ๋ก๋์ด ๋ถ์ฐ์์ ์ธ ๋์ญํ ํ๊ฒฝ์์ ๋ชจ๋ธ ์์ธก ์ ํ๋๋ฅผ ๋์ ๋๋ค.
- ๋ฅ ์์ธก ๋ชจ๋ธ ํ์ต (Deep Predictive Model Learning): ์์ง๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฅ ์ํ ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(deep recurrent convolutional network)์ด ํ์ต๋ฉ๋๋ค. ์ด ๋ชจ๋ธ์ ํ์ฌ GelSight ์ผ์ ์ด๋ฏธ์ง(I_0)์ ๋ฏธ๋ ์ก์ ์ํ์ค(a_{1:T})๋ฅผ ์ ๋ ฅ๋ฐ์ ๋ฏธ๋์ GelSight ์ผ์ ๊ด์ธก์น ์ํ์ค(\hat{I}_{1:T})๋ฅผ ์์ธกํฉ๋๋ค. ๋ชจ๋ธ์ ๊ตฌ์กฐ๋ ๊ธฐ์กด์ ๋น๋์ค ์์ธก ๋ชจ๋ธ(์: [12], [13]์์ ์ ์๋ ์ํคํ ์ฒ)์ ๋ฐ๋ฅด๋ฉฐ, ์ด๋ ์ด๊ฐ ๋๋ฉ์ธ์์์ ๋์ญํ \hat{I}_{1:T} = g(a_{1:T}, I_0)์ ํ์ตํฉ๋๋ค. ์ด ๋ชจ๋ธ์ raw tactile observation์ผ๋ก๋ถํฐ ๋ฌผ์ฒด์ ์ ์ด ํจํด ๋ณํ๋ฅผ ์ ํํ๊ฒ ์์ธกํฉ๋๋ค.
- ์ด๊ฐ MPC ์ ์ด (Tactile MPC Control): ํ์ต๋ ์์ธก ๋ชจ๋ธ์ MPC ํ๋ ์์ํฌ ๋ด์์ ์ ์ด์ ํ์ฉ๋ฉ๋๋ค. ์ฌ์ฉ์๋ ์ํ๋ ์ด๊ฐ ์ํ๋ฅผ ๋ํ๋ด๋ ๋ชฉํ ์ด๊ฐ ์ด๋ฏธ์ง(I_g)๋ฅผ ์ง์ ์ ๊ณตํ์ฌ ๋ชฉํ๋ฅผ ์ง์ ํฉ๋๋ค.
- ๊ณํ (Planning): ๊ฐ ์ ์ด ์คํ ์์, ์ต์ ์ ๋ฏธ๋ ์ก์ ์ํ์ค(a_{1:T})๋ฅผ ์ฐพ๊ธฐ ์ํด ์ต์ ํ ๋ฌธ์ ๊ฐ ํด๊ฒฐ๋ฉ๋๋ค. ์ด ๋ฌธ์ ์ ๋ชฉ์ ์ ์์ธก๋ ์ด๊ฐ ์ด๋ฏธ์ง(\hat{I}_t)์ ๋ชฉํ ์ด๋ฏธ์ง(I_g) ์ฌ์ด์ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ ๋น์ฉ ํจ์(c_t(I_g, \hat{I}_t))๋ฅผ ์ค์ด๋ ๊ฒ์ ๋๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ ์ด ๋น์ฉ ํจ์๋ก ํฝ์ ๊ณต๊ฐ์์์ ํ๊ท ์ ๊ณฑ ์ค์ฐจ(Mean Squared Error, MSE)๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ต์ ํ ๊ณต์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: a_{1:T} = \arg \min_{a_{1:T}} \sum_{t=1,...,T} c_t(I_g, \hat{I}_t)
- ์ต์ ํ ๊ธฐ๋ฒ (Optimization Method): ์ํ๋ง ๊ธฐ๋ฐ์ ์ต์ ํ ๊ธฐ๋ฒ์ธ Cross-Entropy Method (CEM) [29]์ด ์ฌ์ฉ๋ฉ๋๋ค. CEM์ ๋ฐ๋ณต์ ์ผ๋ก ์ก์ ์ํ์ค๋ฅผ ์ํ๋งํ๊ณ , ์์ธก ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๋น์ฉ์ ํ๊ฐํ๋ฉฐ, ๋ ๋์ ์ํ์ค๋ฅผ ์ฐพ๊ธฐ ์ํด ํ์ ๋ถํฌ๋ฅผ ์ ์ ํฉ๋๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ CEM์ 3ํ ๋ฐ๋ณตํ๊ณ ๊ฐ ๋ฐ๋ณต์์ 100๊ฐ์ ์ํ์ ์ฌ์ฉํฉ๋๋ค. ์์ธก horizon์ 15~18 ํ์์คํ ์ ๋๋ค.
- ์คํ (Execution): CEM์ผ๋ก ์ฐพ์ ์ต์ ์ ์ก์ ์ํ์ค ์ค ์ฒซ ๋ฒ์งธ ์ก์ ๋ง ๋ก๋ด์ ์ ์ฉ๋ฉ๋๋ค.
- ์ฌ๊ณ์ฐ (Receding Horizon Control): ๋ชจ๋ธ์ ๋ถ์ ํ์ฑ๊ณผ ํ๊ฒฝ ๋ณํ์ ๋์ํ๊ธฐ ์ํด, ์ด ๊ณํ ๊ณผ์ ์ ๋งค ํ์์คํ ๋ง๋ค ๋ฐ๋ณต๋์ด (receding horizon control) ์ ์ด์ ๊ฐ๊ฑด์ฑ์ ๋์ ๋๋ค.
์คํ์ ball repositioning, analog stick deflection, die rolling ์ธ ๊ฐ์ง ์ค์ ์ด๊ฐ ์กฐ์ ํ์คํฌ์์ ์ํ๋์์ต๋๋ค. ํ๊ฐ ์งํ๋ก๋ ์ต์ข ์ด๊ฐ ์ด๋ฏธ์ง์ ๋ชฉํ ์ด๋ฏธ์ง ๊ฐ์ MSE, ๊ทธ๋ฆฌ๊ณ ์๋์ผ๋ก ์ฃผ์ ์ฒ๋ฆฌ๋ ๋ฌผ์ฒด(pressure centroid)์ ํฝ์ ๊ณต๊ฐ ๊ฑฐ๋ฆฌ(๋ฌผ๋ฆฌ์ ์์น๋ฅผ ๋ฐ์)๊ฐ ์ฌ์ฉ๋์์ต๋๋ค. Die rolling ํ์คํฌ์ ๊ฒฝ์ฐ ์ํ๋ ๋ฉด์ด ์๋ก ํฅํ๋ ์ฑ๊ณต๋ฅ ๋ ์ธก์ ๋์์ต๋๋ค.
์ด ๋ฐฉ๋ฒ์ ์๋์ผ๋ก ์ค๊ณ๋ ๋ฒ ์ด์ค๋ผ์ธ(์๋ ฅ ์ค์ฌ์ ๊ฐ์งํ๊ณ ๋ชฉํ๋ฅผ ํฅํด ์ง์ ์ผ๋ก ์ด๋ํ๋ ๋ฐฉ์)๊ณผ ๋น๊ต๋์์ ๋ ๋ชจ๋ ํ์คํฌ์์ ์๋นํ ์ฑ๋ฅ ํฅ์์ ๋ณด์์ต๋๋ค. Ball repositioning ํ์คํฌ์์ ์ด๊ฐ MPC๋ 2.10mm์ ์ค์๊ฐ L2 ๊ฑฐ๋ฆฌ(centroid)๋ฅผ ๋ฌ์ฑํ ๋ฐ๋ฉด ๋ฒ ์ด์ค๋ผ์ธ์ 2.97mm๋ฅผ ๊ธฐ๋กํ์ต๋๋ค. Analog stick ํ์คํฌ์์๋ ๊ฐ๊ฐ 5.31mm ๋ 8.86mm๋ฅผ ๋ณด์์ต๋๋ค. Die rolling ํ์คํฌ์์๋ ์ด๊ฐ MPC๊ฐ 86.6%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์ด๋ฉฐ ๋ฒ ์ด์ค๋ผ์ธ์ 46.6%๋ฅผ ํฌ๊ฒ ์์ฐ์ต๋๋ค. ์ด๋ die rolling๊ณผ ๊ฐ์ด ๋ณต์กํ ๋์ญํ(๋ฏธ๋๋ฌ์ง, ๊ตฌ๋ฆ ๋ฑ)์ ํฌํจํ๋ ํ์คํฌ์์ ์ฌ์ธต ๋์ญํ ๋ชจ๋ธ์ ๊ฐ์ ์ ์ ์ฆํฉ๋๋ค.
๋ ผ๋ฌธ์ ์ด ๋ฐฉ๋ฒ์ด ์ด๊ฐ๋ง์ผ๋ก ๋ค์ํ ์กฐ์ ํ์คํฌ๋ฅผ ์ํํ ์ ์์์ ๋ณด์ฌ์ฃผ์ง๋ง, ๋จ๊ธฐ horizon ์ ์ด์ ํ์ ๋๋ค๋ ์ ๊ณผ ๋จ์ผ ์๊ฐ๋ฝ ์กฐ์์ ํ๊ณ๋ฅผ ์ธ๊ธํฉ๋๋ค. ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ผ๋ก๋ ๋น๋์ค ์์ธก ๋ชจ๋ธ์ ๋ฐ์ ๊ณผ ํจ๊ป ๋ค์ง(multi-fingered) ๋ก๋ด ํธ๋์ ์ด๊ฐ ์ผ์๋ฅผ ํตํฉํ์ฌ ๋ ๋ณต์กํ ์ธ-ํธ๋(in-hand) ์กฐ์ ๋ฐ ์กฐ๋ฆฝ ๊ธฐ์ ์ ๊ตฌํํ๋ ๊ฒ์ ์ ์ํฉ๋๋ค.

