flowchart TD
A["High-Frequency Teleop Input<br/>(human hand keypoints v_i^t)"] --> C
B["Robot Joint State Feedback<br/>(q_{t-1})"] --> C
C["Unified Constraint Linearization<br/>in joint differential space"]
C --> D1["Teleop mapping:<br/>1st-order FK Taylor expansion<br/>f_i(q) approx f_i + J_i dq"]
C --> D2["Kinematic limits:<br/>q_l - q_{t-1} le dq le q_u - q_{t-1}"]
C --> D3["Safety (CBF):<br/>J_dist dq ge -gamma_tilde h(q)"]
D1 --> E["Convex QP<br/>min 0.5 dq^T H dq + g^T dq<br/>s.t. A dq le b"]
D2 --> E
D3 --> E
E --> F["Optimal joint update dq*<br/>q_t = q_{t-1} + dq*"]
F --> G["Robot Motion Output<br/>(fixed-rate closed loop)"]
G -.-> B
๐Kilohertz-Safe
- ๐ค ์ด ๋ ผ๋ฌธ์ ๊ณ ์ฐจ์ ๋ก๋ด ์์ ํ ๋ ์คํผ๋ ์ด์ ์์ ๋์ ์ฃผํ์์ ์์ ์ฑ์ ๋์์ ๋ณด์ฅํ๊ธฐ ์ํด ๋น์ ํ ๋ฆฌํ๊ฒํ ๋ฌธ์ ๋ฅผ joint differential space์์์ convex QP๋ก ์ฌ๊ตฌ์ฑํ๋ Kilohertz-Safe ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
- ๐ ๏ธ ์ด ํ๋ ์์ํฌ๋ Control Barrier Functions (CBFs)๋ฅผ ํตํฉํ์ฌ ์ด์ข ์ ์ฝ ์กฐ๊ฑด(kinematic limits, collision avoidance)์ ์ฒด๊ณ์ ์ผ๋ก ์ ํํํ๊ณ ์ถฉ๋ ๋ฐฉ์ง์ ๋ํ formal safety guarantees๋ฅผ ์ ๊ณตํฉ๋๋ค.
- ๐ Wuji Hand ํ๋ซํผ์์์ ์๋ฎฌ๋ ์ด์ ๋ฐ ํ๋์จ์ด ์คํ์ ํตํด ์ ์๋ ํ๋ ์์ํฌ๋ ํ๊ท 9.05ms์ ๋ฎ์ ์ง์ฐ ์๊ฐ๊ณผ 95% ์ด์์ ์์ ๊ธฐ์ค ์ถฉ์กฑ๋ฅ ๋ก state-of-the-art ๋ฐฉ๋ฒ๋ก ๋ค์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
Kilohertz-Safe๋ ๊ณ ์ฐจ์ ๋ก๋ด ์์ ํ ๋ ์คํผ๋ ์ด์ ์ ์ํ ํ์ฅ ๊ฐ๋ฅํ ๋ฆฌํ๊ฒํ ํ๋ ์์ํฌ๋ก, ์ค์๊ฐ ๊ณ ์ฃผํ ์ ์ด์ ์ด๊ธฐ์ข ์ ์ฝ ์กฐ๊ฑด(heterogeneous constraints) ๋ง์กฑ์ ๋์์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. ๊ธฐ์กด ๋น์ ํ ์ต์ ํ(nonlinear optimization) ๊ธฐ๋ฐ ๋ฐฉ์์ ๊ณ์ฐ ๋น์ฉ์ด ๋์ ํฌ๋กํค๋ฅด์ธ (kilohertz) ์์ค ์ ์ด์ ๋ถ์ ํฉํ๋ฉฐ, ํ์ต ๊ธฐ๋ฐ ๋ฐฉ์์ ๊ณต์์ ์ธ ์์ ๋ณด์ฅ(formal safety guarantees)์ด ๋ถ์กฑํ๋ค๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก (Core Methodology)
Kilohertz-Safe๋ ๋ฑ์คํฐ๋ฌ์ค ํธ๋ ๋ฆฌํ๊ฒํ (dexterous hand retargeting) ๋ฌธ์ ๋ฅผ ์กฐ์ธํธ ์ฐจ๋ถ ๊ณต๊ฐ(joint differential space)์์์ ๋ณผ๋ก ์ด์ฐจ ๊ณํ๋ฒ(convex Quadratic Program, QP)์ผ๋ก ์ฌ๊ตฌ์ฑํฉ๋๋ค. ์ด๋ ์ ์ฝ ์กฐ๊ฑด๋ค์ ํ์ฌ ๋์์ (operating point) ์ฃผ๋ณ์์ ์ ํํํจ์ผ๋ก์จ ๋ฌ์ฑ๋ฉ๋๋ค.
๊ณ ์ฃผํ ํ ๋ ์คํผ๋ ์ด์ ์ ๋ ฅ (High-Frequency Teleoperation Input): ์ธ๊ฐ ์ ๋์๊ณผ ๋ก๋ด ์กฐ์ธํธ ์ํ ํผ๋๋ฐฑ์ ๋๊ธฐํํ์ฌ ๊ณ ์ฃผํ๋ก ์ ๋ ฅ๋ฐ์ต๋๋ค. ์ธ๊ฐ์ ์ ๋์์ ํคํฌ์ธํธ(keypoints)๋ก ํํ๋๋ฉฐ, ๋ก๋ด์ ์ด์ ์๊ฐ ๋จ๊ณ์ ์กฐ์ธํธ ์ค์ (q_{t-1})์ ๊ฐ์ง๋๋ค.
ํตํฉ ์ ์ฝ ์กฐ๊ฑด ์ ํํ (Unified Constraint Linearization): ๋ค์ํ ๋น์ ํ ์ ์ฝ ์กฐ๊ฑด๋ค์ ์กฐ์ธํธ ์๋ ๊ณต๊ฐ(joint-velocity space)์์ ์ ํํ๋ ํํ๋ก ๋ณํํฉ๋๋ค. ์ด๋ QP์ ์ ํ ๋ถ๋ฑ์ ์ ์ฝ ์กฐ๊ฑด์ผ๋ก ํฌํจ๋ฉ๋๋ค.
ํ ๋ ์คํผ๋ ์ด์ ๋งคํ ์ ์ฝ (Teleoperation Mapping Constraint): ์ธ๊ฐ ์ ํคํฌ์ธํธ(v_i^t)์ ๋ก๋ด ํคํฌ์ธํธ(f_i(q^t)) ๊ฐ์ ๋ถ์ผ์น๋ฅผ ์ต์ํํ๋ ๊ฒ์ด ๋ชฉํ์ ๋๋ค. ๊ธฐ์กด์ ๋น์ ํ ์ต์ ํ ๋ฌธ์ : \min_{q^t} \sum_{i=1}^{N}\alpha \left\|v_i^t - f_i(q^t)\right\|^2 + \beta \left\|q^t - q^{t-1}\right\|^2 \text{s.t.} \quad q^l \le q^t \le q^u ์ด๋ฅผ ์กฐ์ธํธ ์ฐจ๋ถ \Delta q_t = q_t - q_{t-1}์ ๋ํ QP๋ก ๋ณํํฉ๋๋ค. f_i(q_t)๋ฅผ q_{t-1}์์ 1์ฐจ ํ ์ผ๋ฌ ์ ๊ฐ(first-order Taylor expansion)ํ์ฌ ๊ทผ์ฌํฉ๋๋ค: f_i(q_t) \approx f_i(q_{t-1}) + J_i(q_{t-1})\Delta q_t ์ฌ๊ธฐ์ J_i๋ i-๋ฒ์งธ ํคํฌ์ธํธ์ ๋ํ ์ผ์ฝ๋น์(Jacobian)์ ๋๋ค. ์ด๋ฅผ ๋์ ํ์ฌ ์ด์ฐจ ๋ชฉ์ ํจ์๋ฅผ ์ป์ต๋๋ค: \min_{\Delta q_t} \left\|J\Delta q_t - \Delta v\right\|^2_2 + \beta\|\Delta q_t\|^2_2 ์ฌ๊ธฐ์ J = \begin{bmatrix} J_1 \\ \vdots \\ J_N \end{bmatrix}, \Delta v = \begin{bmatrix} \Delta v_1^t \\ \vdots \\ \Delta v_N^t \end{bmatrix}, \Delta v_i^t = v_i^t - f_i(q_{t-1})์ ๋๋ค. ์กฐ์ธํธ ์์น ํ๊ณ(q^l \le q^t \le q^u)๋ \Delta q_t์ ๋ํ ์ ํ ๋ถ๋ฑ์ ์ ์ฝ ์กฐ๊ฑด์ผ๋ก ๋ณํ๋ฉ๋๋ค: q^l - q_{t-1} \le \Delta q_t \le q^u - q_{t-1}.
์ ์ด ์ฅ๋ฒฝ ํจ์ ๊ธฐ๋ฐ ์์ ๋ณด์ฅ (Control Barrier Function-Based Safety Guarantee): CBF๋ฅผ ํตํด ์ถฉ๋ ํํผ(collision avoidance)์ ๋ํ ๊ณต์์ ์ธ ์์ ๋ณด์ฅ์ ์ ๊ณตํฉ๋๋ค. ๋ก๋ด ๋งํฌ์ ํ๊ฒฝ ์ฅ์ ๋ฌผ์ ๊ธฐํํ์ ์์ ์์(geometric primitives)์ ์งํฉ์ธ ์บก์(capsule)๋ก ๋ชจ๋ธ๋งํฉ๋๋ค. ์ ์ฌ์ ์ผ๋ก ์ถฉ๋ํ ์ ์๋ ๋ ๋ฌผ์ฒด A์ B์ ๋ํด, ๊ฐ์ฅ ๊ฐ๊น์ด ์ (witness points) p_A(q)์ p_B(q)๋ฅผ ์ ์ํ๊ณ ์์ ํจ์(safety function)๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํฉ๋๋ค: h(q) = \|p_A(q) - p_B(q)\|^2 - (r_A + r_B) ์ฌ๊ธฐ์ r_A, r_B๋ ์บก์์ ๋ฐ์ง๋ฆ์ ๋๋ค. ์ถฉ๋์ h(q) < 0์ผ ๋ ๋ฐ์ํฉ๋๋ค. ์์ ์งํฉ S = \{q \in \mathbb{R}^n | h(q) \ge 0\}์ ์ ๋ฐฉ ๋ถ๋ณ์ฑ(forward invariance)์ ๋ณด์ฅํ๊ธฐ ์ํด CBF ์กฐ๊ฑด \dot{h}(q) \ge -\gamma h(q)๋ฅผ ์ ์ฉํฉ๋๋ค. ์ฌ๊ธฐ์ \gamma > 0๋ ์์คํ ์ด ์์ ๊ฒฝ๊ณ๋ก๋ถํฐ ๋ฉ์ด์ง๋ ์๋๋ฅผ ์ ์ดํ๋ ์ฌ์ฉ์ ์ ์ ์์์ ๋๋ค. \dot{h}(q)๋ \dot{h}(q) = \hat{n}^T(\dot{p}_A - \dot{p}_B) = J_{\text{dist}}(q)\dot{q}๋ก ๊ณ์ฐ๋ฉ๋๋ค. ์ฌ๊ธฐ์ \hat{n}์ ๋ ์ ์ ์๋ ๋จ์ ๋ฒ์ ๋ฒกํฐ(unit normal vector)์ด๋ฉฐ, J_{\text{dist}}(q)๋ ๊ฑฐ๋ฆฌ ์ผ์ฝ๋น์์ ๋๋ค. ๊ณ ์ฃผํ ํ ๋ ์คํผ๋ ์ด์ ์์ \dot{q} \approx \Delta q_t / \Delta t๋ก 1์ฐจ ์ด์ฐํ(first-order discretization)ํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ ํ ๋ถ๋ฑ์์ ์ป์ต๋๋ค: J_{\text{dist}}(q_{t-1})\Delta q_t \ge -\tilde{\gamma} h(q_{t-1}) ์ฌ๊ธฐ์ \tilde{\gamma} = \gamma\Delta t์ ๋๋ค. ์ด ์ ์ฝ ์กฐ๊ฑด์ ์์ฌ ๊ฒฐ์ ๋ณ์(decision variable) \Delta q_t์ ๋ํด ์ํ(affine)์ด๋ฉฐ, ๋ค๋ฅธ ์กฐ์ธํธ ํ๊ณ ์ ์ฝ ์กฐ๊ฑด๊ณผ ํจ๊ป QP์ ์ง์ ํตํฉ๋ฉ๋๋ค.
๊ตฌ์กฐํ๋ ๋ณผ๋ก ์ต์ ํ (Structured Convex Optimization): ๋ชจ๋ ์ ํํ๋ ์ ์ฝ ์กฐ๊ฑด๋ค์ ํ๋์ ํ์ค ๋ณผ๋ก QP ํํ๋ก ํตํฉํฉ๋๋ค: \min_{\Delta q_t} \frac{1}{2} \Delta q_t^\top H \Delta q_t + g^\top \Delta q_t \text{s.t.} \quad A \Delta q_t \le b ์ฌ๊ธฐ์ H = 2(\alpha J^\top J + \beta I), g = -2\alpha J^\top \Delta v ์ด๊ณ , A = \begin{bmatrix} I \\ -I \\ -J_{\text{dist}} \end{bmatrix}, b = \begin{bmatrix} q^u - q_{t-1} \\ q_{t-1} - q^l \\ \tilde{\gamma} h(q_{t-1}) \end{bmatrix}์ ๋๋ค. ์ด QP๋ ์์ ๋ฐ์ ์น(positive semi-definite) ํค์ธ ํ๋ ฌ(Hessian)์ ๊ฐ์ง๋ฏ๋ก ๋ณผ๋ก์ฑ์ ๋ณด์ฅํ์ฌ ์ ๋ขฐํ ์ ์๋ ์ค์๊ฐ ํด๋ฒ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
๋ก๋ด ๋์ ์ถ๋ ฅ (Robot Motion Output): QP์ ์ต์ ํด \Delta q_t^*๋ฅผ ๊ณ์ฐํ์ฌ ๋ก๋ด์ ๋ค์ ์กฐ์ธํธ ์ค์ q_t = q_{t-1} + \Delta q_t^*๋ฅผ ์ป์ต๋๋ค. ์ด๋ ๊ณ ์ ๋ ์๋๋ก ํ๋ฃจํ ์คํ(fixed-rate closed-loop execution)๋์ด ๋ก๋ด ํธ๋์ ๋ถ๋๋ฌ์ด ์์ง์์ ์์ฑํฉ๋๋ค.
์คํ ๊ฒฐ๊ณผ (Experimental Results)
Wuji ํธ๋ ํ๋ซํผ ์๋ฎฌ๋ ์ด์ ๋ฐ ํ๋์จ์ด ์คํ์ ํตํด Kilohertz-Safe์ ์ฑ๋ฅ์ ๊ฒ์ฆํ์ต๋๋ค.
- ๊ณ์ฐ ์ง์ฐ ์๊ฐ (Computation Latency): ์ ์๋ ๋ฐฉ์์ ํ๊ท 9.05ms์ ์ง์ฐ ์๊ฐ์ ๋ฌ์ฑํ์ฌ Dex-Retargeting(15.59ms) ๋ฐ GeoRT(34.49ms)๋ณด๋ค ํ์ ํ ๋ฎ๊ณ ์์ ์ ์ธ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. 100Hz ์ ์ด ์ฃผํ์(10ms) ๋ด์ 85.82%์ ์ ์ด ๋จ๊ณ๊ฐ ์๋ฃ๋์ด ์ค์๊ฐ ์คํ ๊ฐ๋ฅ์ฑ์ ์ ์ฆํ์ต๋๋ค.
- ๋์ ๋ณด์กด (Motion Preservation): ์ ์๋ ๋ฐฉ์์ ์ธ๊ฐ ์ ๋์๊ณผ์ ์ ๋ ฌ(alignment)์ ๋ ์ ์ ์งํ์ฌ, Dex-Retargeting๊ณผ ๋น๊ตํ์ ๋ ๋์ ์ค์ฐจ(cumulative error)๊ฐ ์ ๊ณ ๋ ๋์ ๋์ ์ถฉ์ค๋(motion fidelity)๋ฅผ ๋ณด์์ต๋๋ค.
- ์ถฉ๋ ์์ ์ ์ (Collision Safety Score): CBF์ ํตํฉ์ ํตํด Kilohertz-Safe๋ ์๊ฐ๋ฝ ๋ด ์ํธ์์ฉ(inter-finger interactions) ์ค ์ผ๊ด๋๊ฒ ๋์ ์์ ์ ์(95% ์ด์์ ํ๋ ์์ด 0.8 ์ด์)๋ฅผ ์ ์งํ์ฌ, ๋ค๋ฅธ ๋ฐฉ์์์ ๋ํ๋๋ ์ถฉ๋ ์ํ์ ํจ๊ณผ์ ์ผ๋ก ์ํํ์ต๋๋ค. ์์ ์ ์ฝ ์กฐ๊ฑด ์ ๊ฑฐ ์ ์ถฉ๋ ์ํ์ด ํฌ๊ฒ ์ฆ๊ฐํ๋ ๊ฒ์ด ํ์ธ๋์์ต๋๋ค. ํ์ฑํ ๊ฑฐ๋ฆฌ(activation distance) ์ค์ ์ ์ถฉ๋ ๋ฐฉ์ง์ ํจ๊ณผ์ ์ด์์ต๋๋ค.
- ์ค์ ํ๊ฒฝ ํ๊ฐ (Real-World Evaluation): ์ค์ Wuji ํธ๋์์ ์ ์๋ ํ๋ ์์ํฌ๋ ์ ์ด ์ค๋จ์ด๋ ์ง์ฐ ์์ด ์ฐ์์ ์ธ ๋์ ์ํ์ค์์ ์์ ์ ์ด๊ณ ์ ๋ขฐํ ์ ์๋ ์ค์๊ฐ ์๋์ ์ ์ฆํ์ต๋๋ค. ํนํ ์๊ฐ๋ฝ ๊ต์ฐจ(finger crossing)์ ๊ฐ์ ๋์ ์ ์ธ ๋์์์๋ ์์ ํ ์ ์ค์ ์ ์ ์งํ๋ฉฐ ์๊ฐ ์ถฉ๋(self-collision)์ด ๊ด์ฐฐ๋์ง ์์์ต๋๋ค.
๊ฒฐ๋ก (Conclusion)
Kilohertz-Safe๋ ๋ณผ๋ก ์ด์ฐจ ๊ณํ๋ฒ์ ๊ธฐ๋ฐ์ผ๋ก ์ด๊ธฐ์ข ์ ์ฝ ์กฐ๊ฑด์ ํจ์จ์ ์ธ ํตํฉ์ ๊ฐ๋ฅํ๊ฒ ํ๊ณ ๊ณ์ฐ ํจ์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํต๋๋ค. ์ ์ด ์ฅ๋ฒฝ ํจ์๋ฅผ ๋์ ํ์ฌ ์ด๋ก ์ ์ธ ์์ ๋ณด์ฅ์ ์ ๊ณตํ๋ฉฐ, ๋์ ์ ์ฌ์ฑ์ ์ ์งํ๋ฉด์ ์๊ฐ ์ถฉ๋ ์ํ์ ํจ๊ณผ์ ์ผ๋ก ์ ๊ฑฐํฉ๋๋ค. ํฅํ ์ฐ๊ตฌ๋ ๊ฐ์ฒด ์ํธ ์์ฉ ์ ํ ํฌ ๋ถ๋ฐฐ(torque distribution)๋ฅผ ์ต์ ํํ๊ณ ๋ชจํฐ ํ ํฌ ํฌํ(motor torque saturation) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ด๊ฐ ์ํผ๋์ค ์ ์ด(tactile impedance control) ์ ์ฝ ์กฐ๊ฑด์ ํตํฉํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
์๋ก
์๊ฐ๋ฝ์ด ์ฌ๋ฌ ๊ฐ ๋ฌ๋ฆฐ dexterous hand(๋ค๊ด์ ๋ก๋ด ์)๋ฅผ ์ฌ๋์ ์๋์์ผ๋ก ์ง์ ์กฐ์ข (teleoperation)ํ๋ ์ฅ๋ฉด์ ๋ ์ฌ๋ ค ๋ณด์. ์ฌ๋์ด ์นด๋ฉ๋ผ ์์์ ์์ ์์ง์ด๋ฉด, ๊ทธ ์์ง์์ด ๊ณง๋ฐ๋ก ๋ก๋ด ์์ ๊ด์ ๊ฐ๋๋ก ๋ณํ๋์ด์ผ ํ๋ค. ์ด โ์ฌ๋ ์ โ ๋ก๋ด ์โ ๋ณํ ๊ณผ์ ์ retargeting(๋ฆฌํ๊ฒํ )์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค.
์ด ์์ ์ ์๊ฐ๋ณด๋ค ํจ์ฌ ๊น๋ค๋กญ๋ค. ๋ ๊ฐ์ง ์๊ตฌ์ฌํญ์ด ๋์์ ์ถฉ๋ํ๊ธฐ ๋๋ฌธ์ด๋ค.
- ์๋(real-time): ์กฐ์ข ์ด ์์ฐ์ค๋ฝ๊ฒ ๋๊ปด์ง๋ ค๋ฉด ๋ช ๋ น์ด ๋ฐ๋ฆฌ์ด ๋จ์๋ก ์์ฑ๋์ด์ผ ํ๋ค. ์ ์ด ๋ฃจํ๊ฐ 100Hz(10ms ์ฃผ๊ธฐ)๋ ๊ทธ ์ด์, ์ฌ์ง์ด kilohertz(1kHz) ์์ค์ผ๋ก ๋์์ผ ํ๋ฃจํ(closed-loop)๊ฐ ์์ ์ ์ผ๋ก ์ ์ง๋๋ค.
- ์์ (safety): ๋ก๋ด ์์ ๊ธฐ๊ณ์ ์ผ๋ก ๋งค์ฐ ๋นฝ๋นฝํ๋ค. ์๊ฐ๋ฝ๊ณผ ๋งํฌ ์ฌ์ด ๊ฐ๊ฒฉ์ด ๋ฐ๋ฆฌ๋ฏธํฐ ๋จ์๋ผ์, ์์ ์์น ์ค์ฐจ๋ ์ ์ด ์ง์ฐ๋ง์ผ๋ก๋ self-collision(์๊ฐ ์ถฉ๋)์ด๋ penetration(๋ถํ๋ผ๋ฆฌ ํ๊ณ ๋ฆ)์ด ์ผ์ด๋ ํ๋์จ์ด๊ฐ ์์๋ ์ ์๋ค.
๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ์ด ๋ ๋ง๋ฆฌ ํ ๋ผ๋ฅผ ๋์์ ์ก์ง ๋ชปํ๋ค. ๋ ผ๋ฌธ์ ์ด๋ฅผ ๋ ์ง์์ผ๋ก ์ ๋ฆฌํ๋ค.
- ์ต์ ํ ๊ธฐ๋ฐ(optimization-based): DexPilot, AnyTeleop ๊ฐ์ ๋ฐฉ๋ฒ์ ๋ฆฌํ๊ฒํ ์ ์ ์ฝ ์ต์ ํ ๋ฌธ์ ๋ก ํ์ด ๊ด์ ํ๊ณยท์ด๋ ์ผ๊ด์ฑยท๋ถ๋๋ฌ์์ ๋ช ์์ ์ผ๋ก ์ธ์ฝ๋ฉํ๋ค. ํด์ ๊ฐ๋ฅํ๊ณ ์ฌ๋ฌ ๋ก๋ด ์์ ์ ์ฉํ๊ธฐ ์ฝ์ง๋ง, ๋น์ ํ ์๋ฒ(nonlinear solver)๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ๋๋ ค์ผ ํด์ ์์ ๋(DoF)๊ฐ ๋์ด๋๋ฉด ๊ณ์ฐ ๋น์ฉ์ด ๊ธ๊ฒฉํ ์ปค์ง๋ค. kilohertz ์ ์ด๋ ์ฌ์ค์ ๋ถ๊ฐ๋ฅํ๋ค.
- ํ์ต ๊ธฐ๋ฐ(learning-based): GeoRT ๊ฐ์ ๋ฐฉ๋ฒ์ ๋ณต์กํ ๊ณ์ฐ์ ์คํ๋ผ์ธ ํ์ต์ผ๋ก ๋ฏธ๋ค 1kHz ์ถ๋ก ์ ๋ฌ์ฑํ๋ค. ํ์ง๋ง ํน์ ๋ก๋ด ๋ชธ์ฒดยท๋ฐ์ดํฐ์ ์ ๊ฐํ๊ฒ ์ข ์๋๊ณ , ์์ ์ ์ฝ์ ์์ค ํจ์๋ ํด๋ฆฌ์คํฑ์ผ๋ก ์๋ฌต์ ์ผ๋ก๋ง ๋ค๋ค ํ์์ ๋ณด์ฅ(formal guarantee)์ด ์๋ค. ๋ถํฌ ๋ฐ(out-of-distribution) ์ํฉ์ด๋ ์ ์ด์ด ๋ง์ ์ฅ๋ฉด์์ ์ฑ๋ฅ์ด ๋ฌด๋์ง ์ ์๋ค.
์ ์๋ค์ด ์ ์ํ๋ Kilohertz-Safe๋ ์ด ๋๋ ๋ง๋ฅผ โ์์คํ ์ํคํ ์ฒ ๊ด์ โ์์ ๋ค์ ์ค๊ณํ๋ค. ํต์ฌ ์์ด๋์ด๋ฅผ ํ ๋ฌธ์ฅ์ผ๋ก ์์ฝํ๋ฉด ์ด๋ ๋ค.
๋น์ ํ ๋ฆฌํ๊ฒํ ๋ฌธ์ ๋ฅผ joint differential space(๊ด์ ์ฆ๋ถ ๊ณต๊ฐ)์์์ convex QP(๋ณผ๋ก ์ด์ฐจ๊ณํ๋ฒ)๋ก ๋ค์ ์ฐ๊ณ , ์์ ์ ์ฝ์ Control Barrier Function(CBF)์ผ๋ก ์ ํ ๋ถ๋ฑ์ํํ์ฌ ๊ฐ์ QP ์์ 1๊ธ ์๋ฏผ์ผ๋ก ๋ผ์ ๋ฃ๋๋ค.
๋น์ ํ์๋ฉด, ๊ธฐ์กด ๋น์ ํ ์ต์ ํ๊ฐ โ๋งค ํ๋ ์๋ง๋ค ์ฐ ์ ์ฒด๋ฅผ ๋ค์ ํํํ๋โ ๋ฐฉ์์ด๋ผ๋ฉด, ์ด ๋ ผ๋ฌธ์ โ์ง๊ธ ์ ์๋ ์๋ฆฌ ์ฃผ๋ณ๋ง ํํํ ์ง๋๋ก ๊ทผ์ฌํด์, ๊ทธ ์์์ ๊ฐ์ฅ ๋น ๋ฅธ ํ ๊ฑธ์์ ๋ซํ ํํ๋ก ๊ณ์ฐํ๋โ ๋ฐฉ์์ด๋ค. ๊ณ ์ฃผํ ์ ์ด์์๋ ํ ์คํ ์ฌ์ด ๋ณํ๊ฐ ์์ผ๋ฏ๋ก ์ด ๊ทผ์ฌ๊ฐ ์ ๋นํ๋๋ค.
์ฃผ์ ๊ธฐ์ฌ๋ ์ธ ๊ฐ์ง๋ค.
- ๊ณ ์ฃผํ ์ค์๊ฐ ์คํ๊ณผ ์ด์ง์ (heterogeneous) ์ ์ฝ ๋ง์กฑ์ ๋์์ ๋ฌ์ฑํ๋ ํ์ฅ ๊ฐ๋ฅํ ๋ฆฌํ๊ฒํ ํ๋ ์์ํฌ.
- joint differential-space ํตํฉ ์ธํฐํ์ด์ค ์์์ ์์ ์ ๋ช ์์ ์ ์ฝ์ผ๋ก ํํํ์ฌ ์ถฉ๋ ํํผ์ ํ์์ ๋ณด์ฅ ์ ๊ณต.
- Wuji Hand ์ค๋ฌผ ํ๋ซํผ์์์ ๊ฒ์ฆ.
๋ฐฉ๋ฒ
1. ์ถ๋ฐ์ : ๋น์ ํ ๋ฆฌํ๊ฒํ
๋จผ์ ๊ธฐ์กด ๋ฆฌํ๊ฒํ ์ ํ์ค ํํ๋ฅผ ๋ณด์. ์ฌ๋ ์์ keypoint(์ง๋ฌธ์ /๊ด์ ์ ) 3D ์์น๋ฅผ v_i^t \in \mathbb{R}^3, ๋ก๋ด ๊ด์ ๊ตฌ์ฑ์ q_t \in \mathbb{R}^{n_q}, ๋ก๋ด keypoint์ forward kinematics๋ฅผ f_i(\cdot)๋ผ ํ๋ฉด AnyTeleop ๋ฑ์ด ์ฐ๋ ํํ๋ ๋ค์๊ณผ ๊ฐ๋ค.
\min_{q_t} \sum_{i=1}^{N} \alpha \,\lVert v_i^t - f_i(q_t)\rVert^2 + \beta\, \lVert q_t - q_{t-1}\rVert^2 \quad \text{s.t.}\quad q_l \le q_t \le q_u
์ง๊ด์ ์ผ๋ก ์ฒซ ํญ(\alpha)์ โ์ฌ๋ ์๊ณผ ๋ก๋ด ์์ keypoint๋ฅผ ์ต๋ํ ์ผ์น์์ผ๋ผ(tracking)โ, ๋์งธ ํญ(\beta)์ โ์ง์ ์์ธ์ ๋๋ฌด ๋ค๋ฅด๊ฒ ์์ง์ด์ง ๋ง๋ผ(smoothness)โ, ์ ์ฝ์ โ๊ด์ ํ๊ณ๋ฅผ ์ง์ผ๋ผโ์ด๋ค. ๋ฌธ์ ๋ f_i๊ฐ ๋น์ ํ์ด๋ผ ์ด ์ต์ ํ๊ฐ ๋น์ ํ์ด๊ณ , ๋ฐ๋ณต ์๋ฒ๊ฐ ํ์ํ๋ค๋ ์ ์ด๋ค.
2. ํต์ฌ ํธ๋ฆญ: 1์ฐจ ํ ์ผ๋ฌ ์ ๊ฐ๋ก QPํ
์ฌ๊ธฐ์ ๋ ผ๋ฌธ์ ์ฒซ ๋ฒ์งธ ๋ฌ์๊ฐ ๋ฑ์ฅํ๋ค. ๊ด์ ์ฆ๋ถ \Delta q_t = q_t - q_{t-1}์ ๊ฒฐ์ ๋ณ์๋ก ์ผ๊ณ , forward kinematics๋ฅผ ์ง์ ๊ตฌ์ฑ q_{t-1} ์ฃผ๋ณ์์ 1์ฐจ ํ ์ผ๋ฌ ์ ๊ฐํ๋ค.
f_i(q_t) \approx f_i(q_{t-1}) + J_i(q_{t-1})\,\Delta q_t
์ฌ๊ธฐ์ J_i๋ i๋ฒ์งธ keypoint์ Jacobian(์์ฝ๋น์)์ด๋ค. ์ด๊ฒ์ ์๋ ๋ชฉ์ ํจ์์ ๋์ ํ๋ฉด, ๋น์ ํ์ด๋ ํญ์ด \Delta q_t์ ๋ํ ์ด์ฐจ์์ผ๋ก ๋ฐ๋๋ค.
\min_{\Delta q_t} \lVert J\Delta q_t - \Delta v\rVert_2^2 + \beta\lVert \Delta q_t\rVert_2^2
์ฌ๊ธฐ์ \Delta v_i^t = v_i^t - f_i(q_{t-1})๋ โํ์ฌ ๋ก๋ด keypoint๊ฐ ๋ชฉํ๋ณด๋ค ์ผ๋ง๋ ๋จ์ด์ ธ ์๋๊ฐ(์์ฐจ)โ์ด๋ค. ๊ด์ ํ๊ณ๋ ์ฆ๋ถ์ ๋ํ ์ ํ ๋ถ๋ฑ์ q_l - q_{t-1} \le \Delta q_t \le q_u - q_{t-1}๋ก ์์ฐ์ค๋ฝ๊ฒ ๋ณํ๋๋ค. ์ต์ข ์ ์ผ๋ก ํ์ค QP ํํ๊ฐ ๋๋ค.
\min_{\Delta q_t} \tfrac{1}{2}\Delta q_t^\top H \Delta q_t + g^\top \Delta q_t \quad \text{s.t.}\quad A\Delta q_t \le b
H = 2(\alpha J^\top J + \beta I), \qquad g = -2\alpha J^\top \Delta v, \qquad A = \begin{bmatrix} I \\ -I \end{bmatrix}, \qquad b = \begin{bmatrix} q_u - q_{t-1} \\ q_{t-1} - q_l \end{bmatrix}
ํต์ฌ์ H = 2(\alpha J^\top J + \beta I)๊ฐ positive semi-definite(์์ ์ค์ ๋ถํธ)๋ผ๋ ์ ์ด๋ค. ์ฆ ์ด ๋ฌธ์ ๋ ๋ณผ๋ก(convex)์ด๊ณ , ์ง์ญ ์ต์์ ๋น ์ง์ง ์์ผ๋ฉฐ ๋ซํ ํํ์ ๊ฐ๊น๊ฒ ๋น ๋ฅด๊ณ ์์ ์ ์ผ๋ก ํ๋ฆฐ๋ค. ์ด๊ฒ์ด โkilohertzโ๋ฅผ ๊ฐ๋ฅ์ผ ํ๋ ๊ณ์ฐ์ ํ ๋๋ค.
์ฌ๊ธฐ์ ๊น๋ฆฌ๋ ์ ์ (Remark 1)๋ ํฉ๋ฆฌ์ ์ด๋ค. VR ์ธํฐํ์ด์คยท๋น์ ์ถ์ ยท๋ฐ์ดํฐ ๊ธ๋ฌ๋ธ ๋๋ถ์ ์ฌ๋ ์ ๋์์ ๊ณ ์ฃผํ๋ก ์ป์ ์ ์๊ณ , ๋ฐ๋ผ์ ์ฐ์ํ ๋ ์คํ ์ฌ์ด์ ๊ด์ ๋ณํ๊ฐ ๋ณธ์ง์ ์ผ๋ก ์์ 1์ฐจ ์ ํํ๊ฐ ํ๋นํ๋ค๋ ๊ฒ์ด๋ค.
3. ์์ ์ 1๊ธ ์ ์ฝ์ผ๋ก: Control Barrier Function
QPํ๋ง์ผ๋ก๋ ์ถฉ๋์ด ์ ์ผ์ด๋๋ค๋ ๋ณด์ฅ์ด ์๋ค. ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ๋ชฉ์ ํจ์์ ์ถฉ๋ ํ๋ํฐ๋ฅผ ๋ํ๋ ์์ผ๋ก ์์ ์ ๋ค๋ค์ง๋ง, ์ด๋ ๊ฐ์ค์น ํ๋์ ์์กดํ๋ soft constraint(์ฐ์ฑ ์ ์ฝ)์ด๋ผ ํ๋ฅ ์ ยท๊ฒฝํ์ ์ํ์ ๊ทธ์น๋ค. ๋ ผ๋ฌธ์ ์์ ์ hard constraint๋ก ๊ฒฉ์ํ๋ค.
CBF์ ๊ธฐ๋ณธ ์์ด๋์ด๋ ์ด๋ ๋ค. ์์ ์งํฉ์ \mathcal{C} = \{x \mid h(x) \ge 0\}๋ก ์ ์ํ๋ฉด, h๊ฐ ์์๋ก ๋ด๋ ค๊ฐ์ง ์๋๋ก(์ฆ ์งํฉ ๋ฐ์ผ๋ก ๋ชป ๋๊ฐ๋๋ก) ๋ค์ ์กฐ๊ฑด์ ๊ฐ์ ํ๋ค.
\dot{h}(x) + \alpha h(x) \ge 0
์ง๊ด์ ์ผ๋ก, h(์์ ์ฌ์ )๊ฐ 0์ ๊ฐ๊น์์ง์๋ก ๋ ๊ฐํ๊ฒ โ๋ฐ์ด๋ด๋โ ํ์ด ์๋ํด ๊ฒฝ๊ณ๋ฅผ ๋์ง ๋ชปํ๊ฒ ํ๋ค. ์ด๋ฅผ forward invariance(์ ๋ฐฉ ๋ถ๋ณ์ฑ)๋ผ ๋ถ๋ฅธ๋ค โ ํ ๋ฒ ์์ ์์ญ ์์ ์์ผ๋ฉด ๊ณ์ ์์ ์์ญ์ ๋จธ๋ฌธ๋ค.
์ด๋ฅผ ๋ก๋ด ์์ ์ ์ฉํ๊ธฐ ์ํด ์ ์๋ค์ capsule(์บก์) ์ถฉ๋ ๋ชจ๋ธ์ ์ด๋ค. ๊ฐ ๋งํฌ๋ฅผ ๋ฐ์ง๋ฆ r์ง๋ฆฌ ์บก์๋ก ๊ทผ์ฌํ๊ณ , ์ถฉ๋ ๊ฐ๋ฅํ ๋ ๋ฌผ์ฒด A, B์ ๊ฐ์ฅ ๊ฐ๊น์ด ์ (witness point) p_A(q), p_B(q) ์ฌ์ด ๊ฑฐ๋ฆฌ๋ก ์์ ํจ์๋ฅผ ์ ์ํ๋ค.
h(q) = \lVert p_A(q) - p_B(q)\rVert_2 - (r_A + r_B)
h < 0์ด๋ฉด ์บก์์ด ๊ฒน์น ๊ฒ, ์ฆ ์ถฉ๋์ด๋ค. ์ด์ \dot h๋ฅผ ๊ตฌํด์ผ ํ๋๋ฐ, ๋ ๋ฌผ์ฒด๋ฅผ ์๋ ๋จ์ ๋ฒ์ \hat n = (p_A - p_B)/\lVert p_A - p_B\rVert_2์ witness point๋ค์ point Jacobian J_{v,A}, J_{v,B}๋ฅผ ์จ์ distance Jacobian์ ์ป๋๋ค (Danskin ์ ๋ฆฌ๋ก ๋ฏธ๋ถ ์ฒ๋ฆฌ).
\dot h(q) = J_{\text{dist}}(q)\,\dot q, \qquad J_{\text{dist}}(q) \triangleq \hat n^\top\big(J_{v,A}(q;p_A) - J_{v,B}(q;p_B)\big)
์ฆ ๊ฑฐ๋ฆฌ์ ๋ณํ์จ์ด ๊ด์ ์๋์ ์ ํ์ผ๋ก ์ฐ๊ฒฐ๋๋ค. ๊ณ ์ฃผํ ๊ฐ์ ์์ \dot q \approx \Delta q_t / \Delta t๋ก ์ด์ฐํํ๋ฉด, CBF ์กฐ๊ฑด์ด ๊น๋ํ ์ ํ ๋ถ๋ฑ์์ด ๋๋ค.
J_{\text{dist}}(q_{t-1})\,\Delta q_t \ge -\tilde\gamma\, h(q_{t-1}), \qquad \tilde\gamma = \gamma\Delta t
์ด ๋ถ๋ฑ์์ ๊ฒฐ์ ๋ณ์ \Delta q_t์ ๋ํด affine(์ํ)ํ๋ฏ๋ก, ๊ด์ ํ๊ณ ์ ์ฝ๊ณผ ๋๋ํ ๊ฐ์ QP์ ๊ทธ๋ฅ ์์ ๋ฃ์ผ๋ฉด ๋๋ค.
A = [\,A_{jl}\,;\, -J_{\text{dist}}\,], \qquad b = [\,b_{jl}\,;\, \tilde\gamma\, h(q_{t-1})\,]
๋ชฉ์ ํจ์๋ ์ ์ฝ๋ ๋ชจ๋ ๋ณผ๋ก์ด๋ฏ๋ก ์ ์ฒด๋ ์ฌ์ ํ ํ์ค convex QP๋ค. ์ ์๋ค์ด ๊ฐ์กฐํ๋ ๋๋น์ ์ ๋ช ํํ๋ค โ CBF๋ฅผ ๋น์ ํ ๋ฆฌํ๊ฒํ ์ ์ง์ ๋ฃ์ผ๋ฉด ๊ณ ์ฐจ์ ๋น์ ํ ๋ถ๋ฑ์์ด ์๊ฒจ ๊ณ ์ฃผํ ์คํ์ด ๋ถ๊ฐ๋ฅํด์ง์ง๋ง, ์ ํํ๋ QP ์์์๋ ํ์์ ์์ ๋ณด์ฅ์ ์ ์งํ๋ฉด์๋ ์ค์๊ฐ์ฑ์ด ๋ณด์กด๋๋ค.
์ ์ฒด ํ์ดํ๋ผ์ธ
์์ฌ์ฝ๋๋ก ํํํ๋ฉด ํ ์ ์ด ์คํ ์ ๋ค์๊ณผ ๊ฐ๋ค.
function RETARGET_STEP(q_prev, human_keypoints v):
# 1. linearize forward kinematics at q_prev
for i in 1..N:
J_i = jacobian(q_prev, keypoint_i)
dv_i = v_i - FK_i(q_prev)
J = stack(J_i); dv = stack(dv_i)
# 2. build QP objective (convex, PSD Hessian)
H = 2 * (alpha * J^T J + beta * I)
g = -2 * alpha * J^T dv
# 3. kinematic-limit rows
A = [ I ; -I ]
b = [ q_u - q_prev ; q_prev - q_l ]
# 4. CBF safety rows for each colliding capsule pair (A,B)
for (A,B) in collision_pairs:
p_A, p_B = closest_points(q_prev, A, B)
h = norm(p_A - p_B) - (r_A + r_B)
n_hat = (p_A - p_B) / norm(p_A - p_B)
J_dist = n_hat^T (Jv_A - Jv_B)
A = vstack(A, -J_dist)
b = vstack(b, gamma_tilde * h)
# 5. solve convex QP
dq = solve_QP(H, g, A, b)
return q_prev + dq์คํ
์ ์
ํ๊ฐ๋ ์๋ฎฌ๋ ์ด์ (SAPIEN ํ๊ฒฝ, Wuji hand ๊ณต์ URDF)๊ณผ ์ค๋ฌผ ํ๋์จ์ด(๊ณ ์ ํ๋ซํผ์ Wuji dexterous hand) ์์ชฝ์์ ์ด๋ค์ก๋ค. ์ฌ๋ ์ keypoint๋ ์๋ฎฌ์์๋ ๋ ธํธ๋ถ ๋จ์ ์นด๋ฉ๋ผ, ํ๋์จ์ด์์๋ Intel RealSense + MediaPipe๋ก ์ค์๊ฐ ์ถ์ ํ๋ค. ๋น๊ต ๋์์ ๋ ๋ํ ๋ฐฉ๋ฒ, Dex-Retargeting(AnyTeleop ๊ณ์ด, ์ต์ ํ ๊ธฐ๋ฐ)๊ณผ GeoRT(ํ์ต ๊ธฐ๋ฐ)์ด๋ค.
ํ๊ฐ ์งํ๋ ์ธ ๊ฐ์ง๋ค.
- Computation Latency: ํ ํ๋ ์์ ๋ก๋ด ๊ด์ ๋ชฉํ๋ก ๋ณํํ๋ ๋ฐ ๊ฑธ๋ฆฌ๋ wall-clock ์๊ฐ(๋ ๋๋งยทํต์ ์ ์ธ). ํ๊ท /ํ์คํธ์ฐจ/99ํผ์ผํ์ผ๊ณผ, 10ms ์ฃผ๊ธฐ๋ฅผ ๋ง์กฑํ๋ ์คํ ๋น์จ(RT@100Hz)์ ๋ณด๊ณ .
- Motion Preservation(MP): ์ฌ๋๊ณผ ๋ก๋ด ์์ ๋ฐฉํฅ ์ผ์น๋. ํ๋ฉด ์ต์ปค์ ์์ ๋ฐฉํฅ ๋น์ ์ฌ๋ \epsilon_i = 1 - (d_i^H)^\top d_i^R ([0,2] ๋ฒ์, 0์ด ์๋ฒฝ ์ผ์น)๋ฅผ ๊ฐ์ค ํ๊ท . ์์์๋ก ์ข๋ค.
- Collision Safety Score: ๋น์ธ์ ์๊ฐ๋ฝ ๋งํฌ ๊ฐ ์ต์ ๊ฑฐ๋ฆฌ D_\text{self}๋ฅผ ์๊ณ๊ฐ D_\text{safe}๋ก ์ ๊ทํํ ์ ์ S_\text{safe} = \text{clip}(D_\text{self}/D_\text{safe}, 0, 1).
์ง์ฐ(Latency) ๊ฒฐ๊ณผ
ํต์ฌ ์ ๋ ๊ฒฐ๊ณผ๋ Table I์ด๋ค.
| Method | Mean (ms) โ | Std (ms) โ | 99%ile (ms) โ | RT@100Hz (%) โ |
|---|---|---|---|---|
| Ours | 9.05 | 2.29 | 13.42 | 85.82 |
| Dex-Retargeting | 15.59 | 12.50 | 32.82 | 34.41 |
| GeoRT | 34.49 | 4.28 | 49.90 | 0.19 |
ํด์ํ๋ฉด ์ด๋ ๋ค. ์ ์ ๋ฐฉ๋ฒ์ ํ๊ท 9.05ms๋ก ๊ฐ์ฅ ๋น ๋ฅผ ๋ฟ ์๋๋ผ, ํ์คํธ์ฐจ 2.29ms๋ก ๊ฐ์ฅ ์ผ๊ด์ ์ด๋ค โ ์ฆ โ๊ฐ๋ ๋๋ ค์ง๋โ ์ผ์ด ๊ฑฐ์ ์๋ค. 10ms ์ฃผ๊ธฐ๋ฅผ ์งํค๋ ๋น์จ์ด 85.82%๋ก, Dex-Retargeting(34.41%)๊ณผ GeoRT(0.19%)๋ฅผ ์๋ํ๋ค. ํฅ๋ฏธ๋กญ๊ฒ๋ ํ์ต ๊ธฐ๋ฐ์ธ GeoRT๊ฐ ๊ฐ์ฅ ๋๋ฆฐ๋ฐ, ์ด๋ ๊ธฐํ ๋งคํ ์ฐ์ฐ๊ณผ ํ๋ ์๋ณ ํด๋ฆฌ์คํฑ ๋ณด์ ๋๋ฌธ์ด๋ค. Dex-Retargeting์ ํ๊ท ์ ๊ทธ๋ญ์ ๋ญ์ด๋ ์ ๋ ฅ์ ๋ฐ๋ผ ๊ณ์ฐ๋์ด ์ถ๋ ์ฌ(Std 12.50ms) ์ค์๊ฐ ์ผ๊ด์ฑ์ด ๋จ์ด์ง๋ค.
(์ฐธ๊ณ ) GeoRT๊ฐ ๋ค๋ฅธ ๋ฌธํ์์๋ 1kHz๋ฅผ ์ฃผ์ฅํ์์ ๊ณ ๋ คํ๋ฉด, ์ฌ๊ธฐ์์ 34.49ms๋ ์ด ๋ ผ๋ฌธ์ ํน์ ๊ตฌํยทํ์ดํ๋ผ์ธ(MediaPipe ์ ์ฒ๋ฆฌ ํฌํจ ์ฌ๋ถ ๋ฑ) ์กฐ๊ฑด์์ ์ธก์ ๋ ๊ฐ์ผ๋ก ๋ณด์ธ๋ค. (์ถ์ธก) ๋น๊ต ์กฐ๊ฑด์ ์ธ๋ถ๊ฐ ๊ฒฐ๊ณผ ํด์์ ์ํฅ์ ์ค ์ ์๋ค.
Motion Preservation ๊ฒฐ๊ณผ
์ ์ ๋ฐฉ๋ฒ์ ์ํธ์์ฉ ์ํ์ค ์ ๋ฐ์์ ์ฌ๋ ์๊ณผ ๋ ๊ฐ๊น์ด ๋ฐฉํฅ ์ผ์น๋ฅผ ์ ์งํ๋ค(Fig. 2a). Dex-Retargeting์ ํน์ ๊ตฌ๊ฐ์์ ๋์ ๋๋ ํธ์ฐจ๋ฅผ ๋ณด์๊ณ , GeoRT๋ ๊ธฐํ ๊ทผ์ฌ์ ๋ถ์ฐ์์ ํ๋ ์๋ณ ๋ณด์ ์ผ๋ก ์ถฉ์ค๋๊ฐ ๋จ์ด์ก๋ค. ์ ์๋ค์ ๋์ MP ์ด๋(cumulative gain)๋ ์ ์ํด ๋น๊ตํ๋ค.
G_\text{rel}(T) = \frac{E_c^{(\text{baseline})}(T) - E_c^{(\text{ours})}(T)}{E_c^{(\text{baseline})}(T)}
์ด ๊ฐ์ด ์๊ฐ์ด ์ง๋ ์๋ก ๊พธ์คํ ์ฆ๊ฐํ๋๋ฐ(Fig. 2b), ์ด๋ ๊ธด ์๊ฐ ๋์ ๋์ ํธ์ฐจ๊ฐ ๋ ์ ๊ฒ ์์ธ๋ค๋ ๋ป์ด๋ค. ํนํ ์๊ฐ๋ฝ์ด ๊ต์ฐจํ๋ Phase I๊ณผ ์๊ฐ๋ฝ์ ๋ชจ์ grasp๋ฅผ ํ์ฑํ๋ Phase II์์ ์ฐจ์ด๊ฐ ๋๋๋ฌ์ก๋ค. ๋ํ ํจ์จ-์ถฉ์ค๋ ํธ๋ ์ด๋์คํ(Fig. 2e)์์ ์ ์ ๋ฐฉ๋ฒ์ ๊ฐ์ฅ ๋ฎ์ MP ๊ฐ๊ณผ ๊ฐ์ฅ ์งง์ ๊ณ์ฐ ์๊ฐ์ ๋์์ ๋ฌ์ฑํ๋ค.
์์ (Safety) ๊ฒฐ๊ณผ
์์ ์ ์ ์๊ณ์ด(Fig. 4)์์ ์ ์ ๋ฐฉ๋ฒ์ ์ผ๊ด๋๊ฒ ๋์ ์ ์๋ฅผ ์ ์งํ ๋ฐ๋ฉด, Dex-Retargeting๊ณผ GeoRT๋ ์๊ฐ๋ฝ ๋ด์ (finger adduction)์ด๋ ์ํธ ์นจํฌ๊ฐ ์ ์ผ์ด๋๋ ๊ตฌ๊ฐ์์ ๊ธ๊ฒฉํ ํ๋ฝํ๋ค โ ๋ช ์์ ์ถฉ๋ ์ ์ฝ์ด ์๊ธฐ ๋๋ฌธ์ด๋ค. ์ ๋์ ์ผ๋ก ์ ์ด ์คํ ์ 95% ์ด์์ด ์์ ์ ์ 0.8 ์ด์์ ๋ฌ์ฑํ๋ค. ์์ ์ ์ ๋ถํฌ(0.8~1.0 ๊ตฌ๊ฐ ํ๋ ์ ์)์์ Ours๋ 240, Dex-Retargeting์ 168, GeoRT๋ 29 ์์ค์ผ๋ก, ๊ฒฉ์ฐจ๊ฐ ๋๋ ทํ๋ค.
Ablation(์ ์ ์ฐ๊ตฌ)์์๋ ๋ค๋ฅธ ์์๋ฅผ ๊ณ ์ ํ ์ฑ ์์ ํญ๋ง ์ ๊ฑฐํ๋ค. CBF ์์ด๋ ์์ ์ ์๊ฐ ์๊ณ๊ฐ ์๋๋ก ์์ฃผ ๋จ์ด์ง ๋ฐ๋ฉด, CBF๋ฅผ ์ผ๋ฉด ์ํ์ค ์ ๋ฐ์์ ์ ์๊ฐ ์ผ๊ด๋๊ฒ ๋์๋ค(Fig. 5a). ํ๋ ์๋ณ ์ต์ ์๊ฐ๋ฝ ๊ฐ ๊ฑฐ๋ฆฌ(Fig. 5b)๋ฅผ ๋ณด๋ฉด, ์์ ์ ์ฝ์ด ์ผ์ก์ ๋ ๊ฑฐ๋ฆฌ๊ฐ ์๊ณ๊ฐ์ ๊ฐ๊น์์ง์๋ก ๊ฐ์๊ฐ ๋ฅ๋์ ์ผ๋ก ์ต์ ๋์ด ์ถฉ๋ ์ง์ ์ํฉ์ ๋ง์๋ค.
๊ตฌ์ฒด์ ํ๋ผ๋ฏธํฐ๋ก, ์ต์ ์์ ๊ฑฐ๋ฆฌ ์๊ณ๊ฐ์ 0.01m(Wuji hand์ ์๊ฐ๋ฝ ๋๊ปยท๊ด์ ๊ฐ๊ฒฉ ๊ธฐ์ค)๋ก ๊ณ ์ ํ๊ณ , ์์คํ ์ง์ฐ์ ๊ณ ๋ คํด ์ฝ๊ฐ ํฐ activation distance 0.011m์์ ์ ์ฝ์ด ๋ฏธ๋ฆฌ ๋ฐ๋๋๋๋ก ํ๋ค. ์ด ์์ฃผ ์์ ์์ธก ๋ง์ง๋ง์ผ๋ก๋ ์ง์ฐ ํ์์ ๊ฑฐ๋ฆฌ ๊ฐ์๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ต์ ํ๋ค. ๋ค๋ง ์ด์ฐ ์๊ฐ ์ ์ด์ ์ง์ฐ ๋๋ฌธ์ ์ผ๋ถ ํ๋ ์์์ ๋ฐ๋ฆฌ๋ฏธํฐ ์์ค์ ๋ฏธ์ธํ ์๊ณ๊ฐ ์๋ฐ์ ๊ด์ฐฐ๋์๋ค.
์ค๋ฌผ ๊ฒ์ฆ
ํ๋์จ์ด ์คํ์ ์ ์ฑ ํ๊ฐ ์ค์ฌ์ผ๋ก, grasping๊ณผ finger-crossing ๊ฐ์ ์ผ์์ ์ด๋ฉด์๋ ์๋ต์ฑยท์ถฉ๋ ํํผ์ ๊น๋ค๋ก์ด ๋์์ ๋ค๋ค๋ค. ํ๋ ์์ํฌ๋ fixed-rate ํ๋ฃจํ ์คํ์ ์ ์งํ๊ณ , ๋ก๋ด ์์ด ๊ธด ์ฐ์ ์ํ์ค ๋์ ์ ์ด ์ค๋จ์ด๋ ์ง์ฐ ๋์ ์์ด ์ฌ๋ ๋์์ ๋ถ๋๋ฝ๊ฒ ๋ฐ๋ผ๊ฐ๋ค(200ms ๊ฐ๊ฒฉ ์ค๋ ์ท, Fig. 7). Dex-Retargeting ๋ฐ โ์์ ์ ์ฝ ์๋ ๋ณํโ๊ณผ์ ๋น๊ต(Fig. 8)์์, ์๊ฐ๋ฝ ๊ต์ฐจ ๊ฐ์ ๊น๋ค๋ก์ด ๋์ ์ค baseline์ ์๊ฐ๋ฝ ๊ฐ ๊ฐ๊ฒฉ์ด ์ค๊ฑฐ๋ ๋ถ์์ ํด์ง ๋ฐ๋ฉด ์ ์ ๋ฐฉ๋ฒ์ ์๊ฐ ์ถฉ๋ ์์ด ์์ ํ ๊ตฌ์ฑ์ ์ ์งํ๋ค.
๋นํ์ ๊ณ ์ฐฐ
๊ฐ์
- ๊ฐ๋ ์ ๋ช ๋ฃํจ๊ณผ ํตํฉ์ฑ: ๊ฐ์ฅ ํฐ ๋ฏธ๋์ teleoperation ๋งคํ, ์ด๋ํ ํ๊ณ, ์ถฉ๋ ํํผ๋ผ๋ ์ด์ง์ ์ ์ฝ์ ๋ชจ๋ ํ๋์ joint differential-space QP ์์์ ์ ํ ์ ์ฝ์ผ๋ก ํต์ผํ๋ค๋ ์ ์ด๋ค. ์์ง๋์ด๋ง ๊ด์ ์์ ๋งค์ฐ ๊น๋ํ๊ณ ํ์ฅํ๊ธฐ ์ฝ๋ค.
- ์๋์ ์ผ๊ด์ฑ์ ๋์ ๋ฌ์ฑ: 9.05ms ํ๊ท ์ 2.29ms๋ผ๋ ๋ฎ์ ๋ถ์ฐ์ ์ค์๊ฐ ์ ์ด์์ ํ๊ท ๊ฐ๋ณด๋ค ์ค์ํ ์ ์๋ค. ํ๋ฃจํ ์์ ์ฑ์ โ์ต์ ์ ๊ฒฝ์ฐ ์ง์ฐโ์ ์ข์ฐ๋๊ธฐ ๋๋ฌธ์ด๋ค.
- ์์ ์ ํ์์ ๋ณด์ฅ: ์ถฉ๋ ํํผ๋ฅผ ํ๋ํฐ๊ฐ ์๋ hard constraint(CBF)๋ก ๋ค๋ค, ํด๋ฆฌ์คํฑ ๊ฐ์ค์น ํ๋ ์์กด์ ์ ๊ฑฐํ๊ณ forward invariance๋ผ๋ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ํ๋ณดํ๋ค.
์ฝ์ ยทํ๊ณ
- ์ ํํ์ ํ๋น ๋ฒ์: ์ ์ฒด ๋ฐฉ๋ฒ์ โ์ฐ์ ์คํ ๊ฐ ๋ณํ๊ฐ ์๋คโ๋ ๊ฐ์ ์ ์์กดํ๋ค. ์ ๋ ฅ์ด ๋๊ธฐ๊ฑฐ๋(์ผ์ ๋๋กญ์์), ๋น ๋ฅธ ๋์์์ ํฐ ์ ํ๊ฐ ์๊ธฐ๊ฑฐ๋, ์ ์ด์จ์ด ๋ฎ์์ง๋ฉด 1์ฐจ ํ ์ผ๋ฌ ๊ทผ์ฌ์ \dot q \approx \Delta q/\Delta t ์ด์ฐํ๊ฐ ๋ฌด๋์ง ์ ์๋ค. ๋ ผ๋ฌธ์ ์ด ๊ฒฝ๊ณ์์์ ๊ฑฐ๋์ ์ ๋์ ์ผ๋ก ํ๊ตฌํ์ง ์๋๋ค. (์ถ์ธก) ๋งค์ฐ ๋น ๋ฅธ ์๋์์์์ robustness๋ ์ถ๊ฐ ๊ฒ์ฆ์ด ํ์ํด ๋ณด์ธ๋ค.
- ๊ตญ์ ์ต์ ์ฑ(myopia): ๋งค ์คํ ํ ๊ฑธ์๋ง ๋ณด๋ 1์ฐจ QP๋ ๋ณธ์ง์ ์ผ๋ก greedyํ๋ค. ๋ฉ๋ฆฌ ๋ด๋ค๋ณด๋ ๊ณํ(์: ๊ณง ๋ฅ์น ์ถฉ๋์ ํํผํ๋ ค ๋ฏธ๋ฆฌ ์ฐํ)์ activation distance๋ผ๋ ์์ ๋ง์ง์๋ง ์์กดํ๋ค. ๋ณต์กํ ๋ค๋ฌผ์ฒด ์ ์ด์์ QP๊ฐ infeasible(ํด ์์)ํด์ง๋ ๊ฒฝ์ฐ์ ์ฒ๋ฆฌ(์ฌ๋ ๋ณ์, ์ฐ์ ์์ ๋ฑ)์ ๋ํ ๋ ผ์๊ฐ ๋ถ์กฑํ๋ค.
- ๋จ์ผ ์๋ฒ ๋๋จผํธยท์ ์ฑ ์์ฃผ์ ์ค๋ฌผ ํ๊ฐ: ๊ฒ์ฆ์ด Wuji hand ํ ์ข ๋ฅ์ ์ง์ค๋์ด ์๊ณ , ํ๋์จ์ด ์คํ์ ์ ์ฑ ํ๊ฐ ์ค์ฌ์ด๋ค. โ์ฌ๋ฌ ๋ก๋ด ์์ ํ์ฅ ๊ฐ๋ฅโ์ด๋ผ๋ ์ฃผ์ฅ์ ๋นํด ๋ค์ํ ์ ํํ์์์ ์ ๋ ๊ฒฐ๊ณผ๋ ์ ํ์ ์ด๋ค.
- ๋น๊ต ๊ณต์ ์ฑ: ์์ ์ง์๋ฏ GeoRT์ 34.49ms๋ ์ ๋ ผ๋ฌธ์ 1kHz ์ฃผ์ฅ๊ณผ ํฐ ์ฐจ์ด๊ฐ ์์ด, ๋น๊ต ํ์ดํ๋ผ์ธ ๊ตฌ์ฑ(์ ์ฒ๋ฆฌ ํฌํจ ์ฌ๋ถ ๋ฑ)์ด ๊ฒฐ๊ณผ์ ์ํฅ์ ์คฌ์ ๊ฐ๋ฅ์ฑ์ด ์๋ค.
- ๊ฑฐ๋ฆฌ ์๊ณ๊ฐ์ ๊ณ ์ ์ฑ: 0.01m ์๊ณ๊ฐ๊ณผ 0.011m activation์ ๋ชจ๋ ์คํ์ ๊ณ ์ ํ๋ค. ๋น ๋ฅธ grasp์์๋ ๋ฐ๋ฆฌ๋ฏธํฐ ์๋ฐ์ด ์ค์ ๋ก ๊ด์ฐฐ๋์์ผ๋ฏ๋ก, ์๋ ์ ์ํ ๋ง์ง์ด ๋ ์์ ํ ์ ์๋ค.
์์ฝ ๋ฐ ๊ฒฐ๋ก
Kilohertz-Safe๋ dexterous hand teleoperation์ ์ค๋๋ ๋๋ ๋ง โ ์๋ ๋ ์์ โ ๋ฅผ ์๋ฆฌํ ์ฌ์ ์ํ๋ก ๋์์ ๊ณต๋ตํ๋ค. ๋น์ ํ ๋ฆฌํ๊ฒํ ์ forward kinematics์ 1์ฐจ ํ ์ผ๋ฌ ์ ๊ฐ๋ฅผ ํตํด joint differential-space์ convex QP๋ก ๋ฐ๊พธ๊ณ (PSD Hessian์ผ๋ก ๋ณผ๋ก์ฑ ๋ณด์ฅ), capsule ๊ธฐ๋ฐ ๊ฑฐ๋ฆฌ ํจ์์ CBF ์กฐ๊ฑด์ affine ๋ถ๋ฑ์์ผ๋ก ๋ง๋ค์ด ๊ฐ์ QP์ hard constraint๋ก ํตํฉํ๋ค.
ํต์ฌ ์์น๋ก ์ ๋ฆฌํ๋ฉด, ์๋ฎฌ๋ ์ด์ ์์ ํ๊ท ์ง์ฐ 9.05ms(std 2.29ms, 99%ile 13.42ms)๋ก Dex-Retargeting(15.59ms)ยทGeoRT(34.49ms)๋ฅผ ์์ฐ๊ณ , 100Hz ์ค์๊ฐ ์ถฉ์กฑ๋ฅ 85.82%, ๊ทธ๋ฆฌ๊ณ ์ ์ด ์คํ ์ 95% ์ด์์ด ์์ ์ ์ 0.8 ์ด์์ ๋ฌ์ฑํ๋ค. Ablation์ CBF๊ฐ ์๊ฐ๋ฝ ๊ฐ ๊ฑฐ๋ฆฌ ๊ฐ์๋ฅผ ๋ฅ๋์ ์ผ๋ก ์ต์ ํจ์ ๋ณด์๊ณ , Wuji hand ์ค๋ฌผ์์ fixed-rate ํ๋ฃจํ ์คํ๊ณผ ๋งค๋๋ฌ์ด ์ถ์ข ์ ํ์ธํ๋ค.
์ค๊ณ ์ฒ ํ ๋ฉด์์ ์ด ๋ ผ๋ฌธ์ด ์ฃผ๋ ๊ตํ์ ๋ถ๋ช ํ๋ค โ โ์์ ์ ๋ชฉ์ ํจ์์ ํญ์ด ์๋๋ผ ์ ์ฝ์ผ๋ก, ๊ทธ๊ฒ๋ ๋ซํ ๋ณผ๋ก ๋ฌธ์ ์์ ๋ฃ์ด๋ผโ๋ ๊ฒ์ด๋ค. CBF๋ฅผ ๋น์ ํ ๋ฌธ์ ์ ์ง์ ๋ฃ์ผ๋ฉด ์ค์๊ฐ์ฑ์ด ์ฃฝ์ง๋ง, ๊ณ ์ฃผํ ๊ฐ์ ๋์ ์ ๋นํ๋๋ ์ ํํ๋ฅผ ๊ฑฐ์น๋ฉด ํ์์ ๋ณด์ฅ๊ณผ kilohertz ์๋๋ฅผ ํจ๊ป ๊ฐ์ง ์ ์๋ค. ์ ์๋ค์ ํฅํ tactile impedance control ์ ์ฝ์ ํตํฉํด ๋ฌผ์ฒด ์ํธ์์ฉ ์ ํ ํฌ ๋ถ๋ฐฐ๋ฅผ ์ต์ ํํ๊ณ ๋ชจํฐ ํ ํฌ ํฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๊ฒ ๋ค๊ณ ๋ฐํ๋ค. ์ ํํ์ robustness, infeasibility ์ฒ๋ฆฌ, ๋ค์ํ ์ ํํ๋ก์ ์ ๋์ ํ์ฅ์ด ํ์ ๊ณผ์ ๋ก ๋จ๋๋ค.