๐Contact Trust Region ๋ฆฌ๋ทฐ
- โจ ์ ์ด์ด ํ๋ถํ ๋ก๋ด ์กฐ์์๋ ์ ๋ขฐํ ์ ์๋ ๊ตญ์ ์ ์ด ๋์ญํ ๋ฌ์ฌ๊ฐ ์ค์ํ๋ฉฐ, ๋ณธ ๋ ผ๋ฌธ์ ์ ์ด์ ๋จ์ธก์ฑ์ ํฌ์ฐฉํ๋ ์ปจํํธ ํธ๋ฌ์คํธ ๋ฆฌ์ (CTR)์ ์ ์ํฉ๋๋ค.
- ๐ค CTR์ ํ์ฉํ์ฌ ๊ตญ์ ์ ์ด ์กฐ์ ๊ณํ ๋ฐ ์์ ํ์ ํจ์จ์ ์ธ ๋ชจ๋ธ ์์ธก ์ ์ด(MPC) ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๊ณ , ์๋ฎฌ๋ ์ด์ ๋ฐ ํ๋์จ์ด ์คํ์ผ๋ก ์ฑ๋ฅ์ ์ ์ฆํ์ต๋๋ค.
- ๐บ๏ธ MPC ๊ธฐ๋ฐ์ ๊ตญ์ ๊ณํ์ ์ฐ๊ฒฐํ๋ ๋ก๋๋งต ๋ฐฉ์์ ํตํด ์ฅ๊ฑฐ๋ฆฌ ๋ฑ์คํฐ๋ฌ์ค ์กฐ์์ ์ํ ์ ์ญ ๊ณํ์ด ๊ฐ๋ฅํ๋ฉฐ, ๊ธฐ์กด ๋ฐฉ๋ฒ๋ณด๋ค ๊ณ์ฐ ์๊ฐ์ ํฌ๊ฒ ๋จ์ถํ์ต๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
๋ณธ ๋ ผ๋ฌธ โDexterous Contact-Rich Manipulation via the Contact Trust Regionโ์ ๋ก๋ด์ ๋ฅ์ํ๊ณ ์ ์ด์ด ๋ง์ ์กฐ์(dexterous contact-rich manipulation)์ ์ํ ํจ์จ์ ์ธ ์ง์ญ์ ๋์ญํ ๋ชจ๋ธ๊ณผ ๊ทธ ์ ๋ขฐ ์์ญ(trust region)์ ์ ์ํ๋ ๋ฌธ์ ๋ฅผ ๋ค๋ฃฌ๋ค. ๊ธฐ์กด์ ๋ง์ ์ ๊ทผ ๋ฐฉ์์ ๋์ญํ์ Taylor ๊ทผ์ฌ์ ํ์ํ trust region์ ์์กดํ์ง๋ง, ๋ณธ ๋ ผ๋ฌธ์ ์ด๋ฌํ ๋ฐฉ์์ด ์ ์ด์ ๋น๋์นญ์ฑ(unilateral nature)๊ณผ ๊ทผ๋ณธ์ ์ผ๋ก ์ผ๊ด๋์ง ์๋ค๊ณ ์ฃผ์ฅํ๋ค.
์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด, ๋ณธ ๋ ผ๋ฌธ์ ์ ์ด์ ๋น๋์นญ์ฑ์ ํฌ์ฐฉํ๋ฉด์๋ ๊ณ์ฐ ํจ์จ์ฑ์ ์ ์งํ๋ Contact Trust Region(CTR)์ ์ ์ํ๋ค. CTR์ ๊ธฐ๋ฐ์ผ๋ก, ๋จผ์ ์ง์ญ์ ์ธ ์ ์ด์ด ๋ง์ ๊ณํ์ ํฉ์ฑํ ์ ์๋ Model-Predictive Control(MPC) ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๋ค. ๊ทธ ํ, ์ด ๊ธฐ๋ฅ์ ํ์ฅํ์ฌ ์ง์ญ MPC ๊ณํ๋ค์ ์ฐ๊ฒฐํจ์ผ๋ก์จ ์ ์ญ์ ์ผ๋ก ๊ณํํ๊ณ ํจ์จ์ ์ด๋ฉฐ ๋ฅ์ํ ์ ์ด์ด ๋ง์ ์กฐ์์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
๋ณธ ๋ ผ๋ฌธ์ ์ฃผ์ ๊ธฐ์ฌ๋ ์ธ ๊ฐ์ง์ด๋ค. ์ฒซ์งธ, ์ ์ด ์ญํ์ ํจ์จ์ ์ผ๋ก ๊ทผ์ฌํ๋ Contact Trust Region(CTR)์ด๋ค. ๋์งธ, ์ง์ญ์ ์ธ ์ ์ด์ด ๋ง์ ์กฐ์์ ํนํ๋ ๋งค์ฐ ํจ์จ์ ์ธ ๊ธฐ์ธ๊ธฐ ๊ธฐ๋ฐ MPC ์ปจํธ๋กค๋ฌ์ด๋ค. ์ ์งธ, ์ง์ญ ๊ถค์ ๋ค์ ์ฐ๊ฒฐํ๋ ์ ์ญ ํ๋๋์ด๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก : Contact Trust Region (CTR)
๋ณธ ๋ ผ๋ฌธ์ ์ ์ด ๋์ญํ์ Convex Quasidynamic Differentiable Contact(CQDC) ๋ชจ๋ธ๋ก ํํํ๋ค. ์ด๋ ์ ์ด ์๋ฎฌ๋ ์ด์ ์ ๋ค์ ํํ์ Second-Order Cone Program(SOCP)์ผ๋ก ์ ์ํํ๋ค: \begin{aligned} \min_{q_+} & \quad \frac{1}{2} q_+^\top P(q)q_+ + b(q, u)^\top q_+, \\ \text{subject to} & \quad J_i(q)q_+ + c_i(q) \in K_i, \quad \forall i \in I_c. \end{aligned} ์ฌ๊ธฐ์ q๋ ์์คํ ์ค์ (configuration), u๋ ๋ก๋ด์ ์ ์ด ์ ๋ ฅ(actuated configuration command), P, b, J_i, c_i๋ q, u์ ์์กดํ๋ ํ๋ ฌ/๋ฒกํฐ, I_c๋ ์ ์ด ์ ์ธ๋ฑ์ค ์งํฉ, K_i๋ ๊ฐ๋ฅํ ์๋(velocity)์ feasible cone์ด๋ค. ์ด SOCP์ KKT ์กฐ๊ฑด์ ์ค๋์ (quasi-dynamic) ์ด๋ ๋ฐฉ์ ์, ๋น๊ดํต(non-penetration), ๋ง์ฐฐ ์๋ฟ(friction cone), ์๋ณด์ฑ(complementarity) ์ ์ฝ์ ๋ง์กฑํ๋ค.
์ด ๋ชจ๋ธ์ ์ง์ ์ ์ธ ๋ฏธ๋ถ์ ์ ์ด ๋ชจ๋ ์ ํ์ผ๋ก ์ธํด ๊ธฐ์ธ๊ธฐ๊ฐ ๋ถ์ฐ์์ ์ด๋ค. ์ด๋ฅผ ์ํํ๊ธฐ ์ํด ๋ณธ ๋ ผ๋ฌธ์ ๋ก๊ทธ ๋ฐฐ๋ฆฌ์ด(log-barrier) ์ค๋ฌด๋ฉ์ ์ ์ฉํ ์ํ๋ ๋์ญํ f_\kappa(q,u)๋ฅผ ์ฌ์ฉํ๋ค. ์ด ์ํ๋ ๋์ญํ์ ์ค๋ฌด๋ฉ ํ๋ผ๋ฏธํฐ \kappa์ ์์กดํ๋ฉฐ, ์ ์ด์ด ์๋ ๊ฐ์ฒด ์ฌ์ด์๋ ํ์ ๋ฐ์์ํจ๋ค. ์ค๋ฌด๋ฉ๋ ๋์ญํ์ ๊ธฐ์ธ๊ธฐ๋ ๋ฏผ๊ฐ๋ ๋ถ์(sensitivity analysis)์ ํตํด ์ป์ ์ ์๋ค.
๋ณธ ๋ ผ๋ฌธ์ smoothed dynamics์ Taylor ๊ทผ์ฌ๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์ ์ํ \hat{q}_+์ ์ ์ด๋ ฅ \hat{\lambda}_{+,i}์ ๋ํ ์ ํ ๋ชจ๋ธ์ ๊ตฌ์ถํ๋ค: \begin{aligned} \hat{q}_+ &= A_\kappa \delta q + B_\kappa \delta u + f_\kappa(\bar{q}, \bar{u}), \\ \hat{\lambda}_{+,i} &= C_{\kappa,i} \delta q + D_{\kappa,i} \delta u + \lambda_{\kappa,i}(\bar{q}, \bar{u}). \end{aligned} ์ฌ๊ธฐ์ (\bar{q}, \bar{u})๋ ํ์ฌ nominal point์ด๊ณ (\delta q, \delta u)๋ perturbation์ด๋ค.
Ellipsoidal Trust Region (ETR)์ (\delta q, \delta u)์ ๋ํด \delta z^\top \Sigma \delta z \leq 1 ํํ์ ์ ์ฝ์ ๊ฐํ๋ค. ๊ทธ๋ฌ๋ ์ด๋ ์ ์ด์ ๋น๋์นญ์ฑ์ ํฌ์ฐฉํ์ง ๋ชปํ๋ค.
Contact Trust Region (CTR)์ ETR ์ ์ฝ์ ๋ํ์ฌ, ์ ์ ํ ๋ชจ๋ธ๋ก ์์ธก๋ ๋ค์ ์ํ \hat{q}_+์ ์ ์ด๋ ฅ \hat{\lambda}_{+,i}๊ฐ ์๋ ๋น์ํ๋ SOCP ๋์ญํ์ primal ๋ฐ dual feasibility constraint๋ฅผ ๋ง์กฑํด์ผ ํ๋ค๋ ์ ์ฝ์ ์ถ๊ฐํ๋ค: \begin{aligned} J_i \hat{q}_+ + c_i &\in K_i, \\ \hat{\lambda}_{+,i} &\in K_i^*. \end{aligned} ์ด๋ฌํ ์ ์ฝ์ ์ ํํ๋ ๋ณ์์ ๋ํด ๋ถ๊ณผ๋๋ฏ๋ก, CTR์ ์ฌ์ ํ ๋ณผ๋ก ์งํฉ(convex set)์ด๋ค (๊ตฌ์ฒด์ ์ผ๋ก, ์ฌ๋ฌ ๊ฐ์ second-order cone constraints์ ๊ต์งํฉ). Example 1๊ณผ 2๋ฅผ ํตํด, primal feasibility ์ ์ฝ(J_i \hat{q}_+ + c_i \in K_i)์ด ๋๋๋ก ์ค์ ๋๋ฌ ๊ฐ๋ฅํ ์์ญ๋ณด๋ค trust region์ ์ง๋์น๊ฒ ๋ณด์์ ์ผ๋ก ์ ํํจ์ ๋ณด์ฌ์ค๋ค.
๋ฐ๋ผ์ ๋ณธ ๋ ผ๋ฌธ์ primal feasibility ์ ์ฝ์ ์ํํ Relaxed Contact Trust Region (R-CTR)์ ์ ์ํ๋ค. R-CTR์ ETR ์ ์ฝ๊ณผ dual feasibility ์ ์ฝ(\hat{\lambda}_{+,i} \in K_i^*)๋ง์ ํฌํจํ๋ค. Example 3์ R-CTR์ ์ฌ์ฉํ Motion Set(์ ํํ๋ primal solution map์ ์ํ RA-CTR์ ์ด๋ฏธ์ง)์ด ๊ฐ์ฒด ์์ง์์ ์ง์ญ์ ๋๋ฌ ๊ฐ๋ฅ์ฑ์ ๋ ์ ํฌ์ฐฉํจ์ ๋ณด์ฌ์ค๋ค. ๋ํ, RA-CTR๊ณผ ๊ทธ์ ๋ฐ๋ฅธ Wrench Set, Motion Set ๊ฐ๋ ์ ๊ณ ์ ์ ์ธ ์ ์ด ์ญํ ๊ฐ๋ ๊ณผ ์ฐ๊ฒฐ๋ ์ ์์์ ์ด๋ก ์ ์ผ๋ก ๋ณด์ธ๋ค (Lemma 2).
์ง์ญ ๊ณํ ๋ฐ ์ ์ด (Local Planning and Control)
์ ์๋ R-CTR์ ์ง์ญ ๊ถค์ ์ต์ ํ(trajectory optimization) ๋ฐ MPC์ ํ์ฉ๋๋ค. Algorithm 1์ R-CTR ์ ์ฝ์ ํฌํจํ๋ SOCP subproblem์ ๋ฐ๋ณต์ ์ผ๋ก ํด๊ฒฐํ์ฌ nominal trajectory๋ฅผ ๊ฐ์ ํ๋ ๋ฐฉ์์ด๋ค. ์ด ๋ฐฉ๋ฒ์ smoothed dynamics์ ์ ํ ๊ทผ์ฌ๋ฅผ ์ฌ์ฉํ์ง๋ง, R-CTR์ ํตํด ์ง์ญ์ ์ผ๋ก ์ ํจํ ์์ญ ๋ด์์ ๊ณํ์ด ์ด๋ฃจ์ด์ง๋๋ก ํ๋ค. ํนํ, ์ ์ด์ด ์๋ ์ด๊ธฐ ์ํ์์ ์์ํ ๊ฒฝ์ฐ, ๋ก๋ด์ด ๊ฐ์ฒด์ ์ ์ดํ๋๋ก ์ ๋ํ๋ ์ด๊ธฐ ์ถ์ธก ํด๋ฆฌ์คํฑ์ ์ ์ฉํ์ฌ ๊ณํ์ ํจ์จ์ฑ์ ๋์ธ๋ค. Example 4์ 5๋ ์ด ๋ฐฉ๋ฒ์ด ์ ์ด ๋ชจ๋ ์ ํ์ ํ์ํ๊ณ ๊ณํ์ ์ ๋ฆฌํ ๋ฐฉํฅ์ผ๋ก ๋์๊ฐ๋ ๊ณผ์ ์ ๋ณด์ฌ์ค๋ค.
Algorithm 2๋ Algorithm 1์ MPC ํ๋ ์์ํฌ์ ์ ์ฉํ ๊ฒ์ด๋ค. ํ์ฌ ์ํ์์ ๋ฏธ๋ ์ํ๊น์ง์ ๊ถค์ ์ ๊ณํํ๊ณ , ๊ณํ๋ ์ฒซ ๋ฒ์งธ ์ ์ด ์ ๋ ฅ์ ์ค์ ์์คํ ์ ์ ์ฉํ ํ, ๋ค์ ์ํ๋ฅผ ๊ด์ฐฐํ์ฌ ๋ค์ ๊ณํ์ ์ํํ๋ค (re-planning).
์คํ ๊ฒฐ๊ณผ (Experiments)
๋ณธ ๋ ผ๋ฌธ์ IiwaBimanual (planar, 29 collision geometries) ๋ฐ AllegroHand (3D in-hand, 39 collision geometries) ๋ ๊ฐ์ง ์ ์ด์ด ๋ง์ ๋ก๋ด ์์คํ ์์ ์ ์๋ ๋ฐฉ๋ฒ๋ก ์ ํฌ๊ด์ ์ผ๋ก ํ๊ฐํ๋ค.
- CQDC ๋์ญํ์์์ ์ง์ญ MPC ์ฑ๋ฅ (Section 5):
- R-CTR, CTR, ETR์ ์ฌ์ฉํ๋ MPC์ ๋ชฉํ ๋๋ฌ ์ฑ๋ฅ(์ต์ข ๊ฐ์ฒด ์์น/ํ์ ์ค๋ฅ) ๋น๊ต.
- ์์ฑ๋ ๋ชฉํ๋ ์ง์ญ์ ์ผ๋ก ๋๋ฌ ๊ฐ๋ฅํ๋ MPC์ ๋์ ์ ์ธ ๋ชฉํ๋ค์ด๋ค (Figure 9).
- ๊ฒฐ๊ณผ(Figure 9, Table 2): R-CTR์ด ๋ ์์คํ ๋ชจ๋์์ ํ๊ท ์ค๋ฅ ๋ฐ ๋ถ์ฐ ์ธก๋ฉด์์ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค. ํนํ IiwaBimanual์์ CTR ๋ฐ ETR๋ณด๋ค ์ ์๋ฏธํ๊ฒ ์ฐ์ํ๋ค. AllegroHand์์๋ ์ฐจ์ด๊ฐ ๋น๊ต์ ์์๋๋ฐ, ์ด๋ ์์คํ ํน์ฑ์ bilateral contact regime์ด ๋ ์์ฃผ ํ์ฑํ๋ ์ ์๊ธฐ ๋๋ฌธ์ผ๋ก ์ถ์ธก๋๋ค.
- Trust region radius(r)์ MPC rollout horizon(H)์ ๋ํ ์คํ(Figure 10): ์ ์ ํ r๊ณผ H์์ ์ฑ๋ฅ์ด ์ต์ ํ๋๋ฉฐ, ๋๋ฌด ์์ r์ ๋๋ฌ ๊ฐ๋ฅ์ฑ์ ์ ํํ๊ณ ๋๋ฌด ํฐ r์ ์ ํ ๊ทผ์ฌ์ ๋ถ์ ํ์ฑ์ผ๋ก ์ธํด ์ฑ๋ฅ ์ ํ๋ฅผ ์ผ๊ธฐํ๋ค.
- 2์ฐจ ๋์ญํ ํ์์์ ์์ ํ ์ฑ๋ฅ (Section 6):
- CQDC ๋์ญํ ๋ชจ๋ธ๊ณผ ์ค์ ๋ฌผ๋ฆฌ(Drake ์๋ฎฌ๋ ์ด์ ๋ฐ ํ๋์จ์ด) ๊ฐ์ ์ฐจ์ด(ํนํ hydroplaning)๋ฅผ ๊ณ ๋ คํ ์์ ํ ์ฑ๋ฅ ํ๊ฐ.
- Algorithm 3์ ์ ์: MPC ๊ณํ์ ์ฌ๋ฌ ๋ฌผ๋ฆฌ ์คํ ์ ๊ฑธ์ณ ์คํํ๊ณ , ์ฌ๊ณํ ์ ํ์ฌ ๋ก๋ด ์ํ์ ๋ํด ์ด๊ธฐ ์ถ์ธก ํด๋ฆฌ์คํฑ์ ๋ค์ ์ ์ฉํ์ฌ ์ ์ด ์ ์ง๋ฅผ ๊ฐํ (MPCProj).
- Open-loop, No Heuristics, Closed-loop ์ธ ๊ฐ์ง ์๊ณ ๋ฆฌ์ฆ ๋ณํ ํ๊ฐ.
- ๊ฒฐ๊ณผ(Figure 11, Table 4):
- Closed-loop MPC๋ Open-loop๋ณด๋ค ํจ์ฌ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ, ์ ์ด ๋์ญํ ๋ชจ๋ธ์ ๋ถ์ ํ์ฑ์๋ ๋ถ๊ตฌํ๊ณ ํผ๋๋ฐฑ์ด ์ค์ํจ์ ์์ฌํ๋ค.
- ์ด๊ธฐ ์ถ์ธก ํด๋ฆฌ์คํฑ ์ ์ฉ(Closed-loop vs. No Heuristics): ํ๊ท ์ค๋ฅ ๊ฐ์ ํจ๊ณผ๋ ์์ง๋ง, ์ ์ด ์์ค๋ก ์ธํ ํฐ ์ค๋ฅ ๋ฐ์ ๋น๋๋ฅผ ์ ์๋ฏธํ๊ฒ ์ค์๋ค (Figure 11 histogram). ํด๋ฆฌ์คํฑ ์ ์ฉ์ ๋ก๋ด ๊ฒฝ๋ก ๊ธธ์ด๋ฅผ ๋จ์ถ์ํค๋ ํจ๊ณผ๋ ์์๋ค (Figure 12).
- IiwaBimanual๊ณผ AllegroHand ๋น๊ต: AllegroHand ํ์คํฌ(in-hand manipulation)์ ๋ณธ์ง์ ์ธ ์ด๋ ค์(๋ฏธ๋๋ฌ์ง)์ผ๋ก ์ธํด IiwaBimanual๋ณด๋ค ํ๊ท ์ค๋ฅ๊ฐ ์ปธ๋ค.
- ํ๋์จ์ด ์คํ: ์๋ฎฌ๋ ์ด์ ๊ฒฐ๊ณผ์ ์ ์ฌํ ์ฑ๋ฅ์ ๋ณด์๋ค (Table 4).
์ ์ญ ๊ณํ (Global Planning)
์ง์ญ MPC๋ ๋นํ์์ ์์ง์์ด ํ์ํ ์ ์ญ ๋ชฉํ ๋ฌ์ฑ์ ํ๊ณ๊ฐ ์๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ณธ ๋ ผ๋ฌธ์ ์ง์ญ MPC์ ์ฅ์ ์ ํ์ฉํ๋ ๋ก๋๋งต(Roadmap) ๊ธฐ๋ฐ ์ ์ญ ๊ณํ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
- ๋ชฉํ ์ํ ๊ธฐ๋ฐ ์ ์ด ์ค์ ์์ฑ (Section 7):
- ์ฃผ์ด์ง ๊ฐ์ฒด ์ํ(q_o)์ ๋ชฉํ(q_{og})์ ๋ํด, ์ง์ญ MPC๊ฐ ํจ์จ์ ์ผ๋ก ๋ชฉํ์ ๋๋ฌํ๋๋ก ์ ๋ฆฌํ ๋ก๋ด ์ค์ (q_a)์ ์ฐพ๋ ๋ฌธ์ ์ ์.
- ์ต์ ํ ๋ฌธ์ ์ ๋น์ฉ ํจ์๋ ์ง์ญ MPC์ ์ ํ ์๊ฐ ๊ฐ์น ํจ์(V)์ ๊ฐ๊ฑด์ฑ(robustness) regularizer(r)๋ฅผ ์กฐํฉํ๋ค. r์ RA-CTR ๊ธฐ๋ฐ wrench set์ ์ต๋ ๋ด์ ๊ตฌ ๋ฐ๊ฒฝ์ผ๋ก ์ ์๋๋ฉฐ, ์ด ์ค์ ์์ ๋ก๋ด์ด ๊ฐ์ฒด์ ์ผ๋ง๋ ํฐ ์ธ๋์ ๊ฒฌ๋ ์ ์๋์ง๋ฅผ ๋ํ๋ธ๋ค. ๋น์ฉ ํจ์๋ C(q_a; q_o, q_{og}) = V(q_a; q_o, q_{og}) - \alpha r(q_a; q_o)^2 ํํ์ด๋ค.
- ์ด ๋ฌธ์ ๋ ๋น๋ณผ๋กํ๋ฉฐ ๊ธฐ์ธ๊ธฐ ๊ณ์ฐ์ด ์ด๋ ต๊ธฐ ๋๋ฌธ์ ์ํ๋ง ๊ธฐ๋ฐ ์ต์ ํ ํด๋ฆฌ์คํฑ์ผ๋ก ํด๊ฒฐํ๋ค. AllegroHand์ ๊ฐ์ ๊ณ ์ฐจ์ ๋ก๋ด์ ๊ฒฝ์ฐ, reduced-order model (4๊ฐ์ sphere)์ ์ฌ์ฉํ๊ณ ๊ทธ ํด๋ฅผ ์ญ๊ธฐ๊ตฌํ(IK)์ผ๋ก ๋ก๋ด ์ค์ ์ ๋งคํํ๋ ํด๋ฆฌ์คํฑ์ ๋์ ํ๋ค.
- ๊ฒฐ๊ณผ(Figure 18, Table 6): AllegroHand์์ ์ง๊ด์ ์ด๊ณ ๋ชฉํ ๋ฌ์ฑ์ ํจ๊ณผ์ ์ธ ์ด๊ธฐ ๋ก๋ด ์ค์ ๋ค์ ์ฐพ์์ผ๋ฉฐ, MPC ๋กค์์ ๊ฒฐ๊ณผ 10mm ์ด๋ด์ ์์น ์ค๋ฅ์ 30mrad ์ด๋ด์ ํ์ ์ค๋ฅ๋ฅผ ๋ฌ์ฑํ๋ค.
- ๋ก๋๋งต ๊ธฐ๋ฐ ์ ์ญ ๊ณํ (Section 8):
- ์คํ๋ผ์ธ ๋จ๊ณ(Algorithm 4): ์์ ๊ณต๊ฐ์ ์ถฉ๋ถํ ์ปค๋ฒํ๋ ์์ ์ ์ธ ๊ฐ์ฒด ์ค์ ๋ค์ ํด๋นํ๋ ์ ์ด ์ค์ ๋ค์ ๋ก๋๋งต์ ์ ์ (vertices)์ผ๋ก ์์ฑํ๋ค. ๊ฐ ์ ์ ์์ ๋ํด ์ง์ญ MPC(๊ฐ์ฒด ๋ชฉํ ๋๋ฌ)์ ์ถฉ๋ ํํผ ๊ณํ(๋ก๋ด ์ฌ๋ฐฐ์น)์ ์์ฐจ์ ์ผ๋ก ์ ์ฉํ์ฌ ์ ์ด๊ฐ ์ฑ๊ณตํ๋ฉด ์์ง(edge)๋ฅผ ์ถ๊ฐํ๋ค (Figure 19). AllegroHand์ ๊ฒฝ์ฐ ๊ฐ์ฒด์ ๋์นญ์ฑ์ ํ์ฉํ์ฌ ๋ก๋๋งต ๊ตฌ์ถ์ ํจ์จํํ์ผ๋ฉฐ, ํ์ค ๋ ธํธ๋ถ CPU๋ง์ผ๋ก 10๋ถ ์ด๋ด์ ๋ก๋๋งต ๊ตฌ์ถ์ด ๊ฐ๋ฅํ๋ค. ํ๋์จ์ด์์ 150ํ ์ฐ์ ์์ง ์ ์ด์ ์ฑ๊ณตํ๋ฉฐ ๋ก๋๋งต์ ๊ฐ๊ฑด์ฑ์ ํ์ธํ๋ค.
- ์จ๋ผ์ธ ๋จ๊ณ: ์์์ ์์ ์ค์ ์์ ์์์ ๋ชฉํ ๊ฐ์ฒด ์ค์ ๊น์ง์ ๊ณํ์, ์์/๋ชฉํ๋ฅผ ๋ก๋๋งต์ ๊ฐ์ฅ ๊ฐ๊น์ด ์ ์ ์ ์ฐ๊ฒฐํ ํ ๊ทธ๋ํ ์์์ ์ต๋จ ๊ฒฝ๋ก๋ฅผ ํ์ํ๋ ๋ฐฉ์์ผ๋ก ์ํ๋๋ค (Figure 20).
๊ฒฐ๋ก (Conclusion)
๋ณธ ๋ ผ๋ฌธ์ Contact Trust Region(CTR) ๊ฐ๋ ์ ํตํด ์ ์ด์ ๋น๋์นญ์ฑ์ ๊ณ ๋ คํ ์ง์ญ์ ๋์ญํ ๊ทผ์ฌ๋ฅผ ์ ๊ณตํ๊ณ , ์ด๋ฅผ ํ์ฉํ์ฌ ํจ์จ์ ์ธ MPC ๊ธฐ๋ฐ ์ง์ญ ๊ณํ ๋ฐ ์ ์ด ๋ฐฉ๋ฒ์ ๊ฐ๋ฐํ๋ค. ๋ํ, ์ ์ด ์ค์ ์์ฑ ๋ฐ ๋ก๋๋งต ๊ธฐ๋ฒ์ ํตํด ์ ์ญ์ ์ธ ์ ์ด์ด ๋ง์ ์กฐ์ ๊ณํ ๋ฅ๋ ฅ์ ๊ตฌํํ๋ค. ์ ์๋ ๋ฐฉ๋ฒ์ ์๋ฎฌ๋ ์ด์ ๋ฐ ์ค์ ํ๋์จ์ด ์คํ์ ํตํด ๊ทธ ์ฑ๋ฅ๊ณผ ๊ณ์ฐ ํจ์จ์ฑ์ ์ ์ฆํ๋ค. ํนํ ์ฌ์ธต ๊ฐํ ํ์ต(deep RL) ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ ๋นํด ํ์ ํ ๋ฎ์ ๊ณ์ฐ ์๊ฐ์ผ๋ก ๋ชฉํ ๋ฌ์ฑ์ด ๊ฐ๋ฅํจ์ ๋ณด์ฌ์ค๋ค.
ํ์ง๋ง ์ฌ์ ํ ํด๊ฒฐํด์ผ ํ ๊ณผ์ ๋ค์ด ๋จ์์๋ค. ํน์ ๊ณํ ์คํจ์ ์์ธ, IiwaBimanual๊ณผ AllegroHand ๊ฐ feasibility constraint์ ์ญํ ์ฐจ์ด์ ๋ํ ๊น์ ์ดํด, ๊ทธ๋ฆฌ๊ณ CQDC์ hydroplaning๊ณผ ๊ฐ์ ๋ชจ๋ธ-ํ์ค ๋ฌผ๋ฆฌ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ๊ณ ์ ์ด์ ๊ฐ๊ฑดํ๊ฒ ์ ์งํ๋ ๋ฌธ์ ๋ฑ์ ํฅํ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ ๋ณธ ๋ ผ๋ฌธ์์ ์ ์๋ CTR, MPC, ์ ์ด ์ค์ ์์ฑ, ๋ก๋๋งต ๊ธฐ๋ฒ์ ์ ์ด์ด ๋ง์ ๋ก๋ด ์กฐ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๋ก์ด ๊ฐ๋ ฅํ ๋๊ตฌ๋ค์ ์ ๊ณตํ๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.