๐BEHAVIOR-1K ๋ฆฌ๋ทฐ
๐ Ping. ๐ Ring. โ๏ธ Dig. A tiered review series: quick look, key ideas, deep dive.
- ๐ BEHAVIOR-1K๋ 1,461๋ช ์ ์ค๋ฌธ์กฐ์ฌ๋ฅผ ํตํด ์ธ๊ฐ์ ์ค์ ์๊ตฌ์ ๊ธฐ๋ฐํ์ฌ 1,000๊ฐ์ง ์ผ์ ํ๋์ ์ ์ํ๊ณ , ์ด๋ฅผ OMNIGIBSON ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์ ๊ตฌํํ ํด๋จผ-์ค์ฌ ์๋ฒ ๋๋ AI ๋ฒค์น๋งํฌ์ ๋๋ค.
- ๐ค ์ด ๋ฒค์น๋งํฌ๋ 50๊ฐ ์ฅ๋ฉด๊ณผ 9,000๊ฐ ์ด์์ ๊ฐ์ฒด๋ก ๊ตฌ์ฑ๋ BEHAVIOR-1K DATASET๊ณผ, rigid bodies, deformable bodies, liquids ๋ฑ ์ค์ ์ ๊ฐ์ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ๋ฐ ๋ ๋๋ง์ ์ ๊ณตํ๋ OMNIGIBSON ํ๊ฒฝ์ผ๋ก ํ์ค์ฑ๊ณผ ๋ค์์ฑ์ ๊ทน๋ํํ์ต๋๋ค.
- โ๏ธ ์คํ ๊ฒฐ๊ณผ, BEHAVIOR-1K์ ์ฅ๊ธฐ์ ์ด๊ณ ๋ณต์กํ ์กฐ์ ํ๋๋ค์ ์ต์ ๋ก๋ด ํ์ต ์๋ฃจ์ ์๋ ํฐ ๋์ ๊ณผ์ ์ด๋ฉฐ, grasping ๋ฐ ์๊ฐ์ ๋ถ์ผ์น๊ฐ ์๋ฎฌ๋ ์ด์ -์ค์ ๊ฐ ๊ฒฉ์ฐจ์ ์ฃผ์ ์์ธ์์ ๋ฐ๊ฒฌํ์ต๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
BEHAVIOR-1K๋ ์ธ๊ฐ ์ค์ฌ์ ๋ก๋ด ์ฐ๊ตฌ๋ฅผ ์ํ ํฌ๊ด์ ์ธ ์๋ฎฌ๋ ์ด์ ๋ฒค์น๋งํฌ์ ๋๋ค. ์ด ๋ฒค์น๋งํฌ๋ โ๋ก๋ด์ด ๋น์ ์ ์ํด ๋ฌด์์ ํด์ฃผ๊ธฐ๋ฅผ ์ํ๋๊ฐ?โ๋ผ๋ ๊ด๋ฒ์ํ ์ค๋ฌธ์กฐ์ฌ ๊ฒฐ๊ณผ์์ ์๊ฐ์ ๋ฐ์ ๋ ๊ฐ์ง ํต์ฌ ๊ตฌ์ฑ ์์๋ก ์ค๊ณ๋์์ต๋๋ค.
์ฒซ์งธ, BEHAVIOR-1K DATASET์ 50๊ฐ์ ๋ค์ํ ์ฅ๋ฉด(๊ฐ์ , ์ ์, ์๋น, ์ฌ๋ฌด์ค ๋ฑ 8๊ฐ์ง ์ ํ)์ ๊ธฐ๋ฐํ 1,000๊ฐ์ ์ผ์ ํ๋ ์ ์๋ฅผ ํฌํจํฉ๋๋ค. ์ด ํ๋๋ค์ 9,000๊ฐ ์ด์์ ๊ฐ์ฒด ๋ชจ๋ธ๊ณผ 1,900๊ฐ ์ด์์ ๊ฐ์ฒด ์นดํ
๊ณ ๋ฆฌ๋ฅผ ํฌํจํ๋ฉฐ, ํ๋ถํ ๋ฌผ๋ฆฌ์ ๋ฐ ์๋ฏธ์ ์์ฑ์ผ๋ก ์ฃผ์ ์ฒ๋ฆฌ๋์ด ์์ต๋๋ค. ํ๋ ์ ์๋ Predicate logic ๊ธฐ๋ฐ์ BEHAVIOR Domain Definition Language (BDDL)๋ฅผ ์ฌ์ฉํ์ฌ ์ด๊ธฐ ์กฐ๊ฑด๊ณผ ๋ชฉํ ์กฐ๊ฑด์ ๋ช
์ํ๋ฉฐ, ์ผ๋ฐ์ธ๋ค์ด ์ง๊ด์ ์ธ ์๋ฏธ๋ก ์ ์์ค์์ ํ๋์ ์ ์ํ ์ ์๋๋ก ํฉ๋๋ค. ๊ฐ์ฒด์๋ cookable, flammable, fillable ๋ฑ OMNIGIBSON์์ ์๋ฎฌ๋ ์ด์
๊ฐ๋ฅํ ๋ค์ํ ์์ฑ๋ค์ด ๋ถ์ฌ๋๋ฉฐ, cookTemperature์ ๊ฐ์ ํ๋ผ๋ฏธํฐํ๋ ์์ฑ๋ ํฌํจ๋ฉ๋๋ค. ๋ํ, ํน์ ์กฐ๊ฑด์์ ๊ฐ์ฒด ๊ทธ๋ฃน ๊ฐ์ ๋ณํ์ ์ง์ ํ๋ Transition Machine์ ํตํด ๋ณต์กํ ๋ฌผ๋ฆฌ/ํํ์ ๊ณผ์ ์ ์๋ฎฌ๋ ์ด์
ํ ์ ์์ต๋๋ค(์: ์ค๋ธ์์ ๋ฐ์ฃฝ์ด ํ์ด๋ก ๋ณํ๋ ๊ฒ). BDDL์ ๋ฌผ์ง ํํ, 3๊ฐ Predicate, ๊ฐ์ฒด์ ๊ตฌ์ฑ ๋ฐ ๋ถํด์ ๊ฐ์ ์๋ก์ด ๊ธฐ๋ฅ๋ค์ ํฌํจํ์ฌ ๋ค์ํ ํ๋์ ์ง์ํฉ๋๋ค.
๋์งธ, OMNIGIBSON์ ์ด๋ฌํ ํ๋๋ค์ ์ฌ์ค์ ์ผ๋ก ์ง์ํ๋ ์๋ก์ด ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ์
๋๋ค. Nvidia Omniverse์ PhysX 5๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถ๋์ด, Rigid body, Deformable body, ์ ์ฒด(Fluid)์ ๋ํ ์ฌ์ค์ ์ธ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์
๋ฐ Ray-traced ๋๋ Path-traced ๋ ๋๋ง์ ์ ๊ณตํฉ๋๋ค. OMNIGIBSON์ temperature, toggled, soaked, dirtiness์ ๊ฐ์ ํ์ฅ๋ ๊ฐ์ฒด ์ํ๋ฅผ ์ง์ํ๋ฉฐ, ํ๋ ์ ์์ ๋ฐ๋ผ ์ ํจํ ์ด๊ธฐ ๊ตฌ์ฑ์ ์์ฑํ๊ณ ๋ชฉํ ์๋ฃจ์
์ ํ๊ฐํ๋ ๊ธฐ๋ฅ์ ํฌํจํฉ๋๋ค. ๋ํ, ์ฅ๋ฉด ์ด๊ธฐํ ์ ๊ฐ์ฒด ๋ชจ๋ธ, ํฌ์ฆ, ์ํ ๋ฑ์ ๋ฌด์์๋ก ์ํ๋งํ์ฌ ๋ค์์ฑ์ ํ๋ณดํฉ๋๋ค.
์คํ์์๋ BEHAVIOR-1K ํ๋๋ค์ด ์ต์ฒจ๋จ ๋ก๋ด ํ์ต ์๋ฃจ์
์๋ ์ด๋ ค์ด ๊ณผ์ ์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ํนํ, ํ๋์ ๊ธด Task horizon๊ณผ ๋ณต์กํ ๋ฌผ๋ฆฌ์ ์กฐ์ ๊ธฐ์ ์ด ์๊ตฌ๋ฉ๋๋ค. Visuomotor control ๊ธฐ๋ฐ์ RL-VMC ์ ์ฑ
์ CollectTrash, StoreDecoration, CleanTable ์ธ ๊ฐ์ง ์คํ ํ๋์์ ์ฑ๊ณต๋ฅ 0%๋ฅผ ๊ธฐ๋กํ๋ฉฐ ์์ ํ ์คํจํ์ต๋๋ค. ๋ฐ๋ฉด, Motion planning ๊ธฐ๋ฐ์ Action primitive๋ฅผ ํ์ฉํ RL-Prim. ๋ฐ ์ด๋ ฅ(History) ์ ๋ณด๋ฅผ ์ถ๊ฐํ RL-Prim.Hist.๋ ๊ฐ๊ฐ 40% ์ด์์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ต๋๋ค. ์ด๋ BEHAVIOR-1K์ ๊ธด Task horizon ํ๋์ ํด๊ฒฐํ๊ธฐ ์ํด์๋ Action space abstraction์ด ํ์์ ์์ ์์ฌํฉ๋๋ค. ๋ํ, CollectTrash์ ๊ฐ์ด Aliased observation์ด ๋ฐ์ํ๋ ๊ธด Task horizon ํ๋์์ ์ด๋ ฅ ์ ๋ณด๊ฐ ์ฑ๋ฅ๊ณผ ํจ์จ์ฑ(์ด๋ ๊ฑฐ๋ฆฌ, ์๋ฎฌ๋ ์ด์
์๊ฐ, ๊ฐ์ฒด Disarrangement) ํฅ์์ ์ค์ํ ์ญํ ์ ํจ์ ํ์ธํ์ต๋๋ค.
์๋ฎฌ๋ ์ด์ -ํ์ค ๊ฐ ๊ฒฉ์ฐจ(Sim-to-real gap)๋ฅผ ๋ถ์ํ๊ธฐ ์ํ ์ฐ๊ตฌ์์๋ ์๋ฎฌ๋ ์ด์ ๋ ์ํํธ ํ๊ฒฝ์์ ํ์ต๋ Mobile manipulator ์๋ฃจ์ ์ ์ค์ ๋ก๋ด์ ์ ์ดํ๋ ์ด๊ธฐ ์คํ์ ์ํํ์ต๋๋ค. ์ค์ ๋ก๋ด ํ๊ฒฝ์์ ํ์ ๋ ์ฃผ์ ์คํจ ์์ธ์ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ Grasping์ ์ด๋ ค์(40%์ ์คํจ ์์ธ)๊ณผ ์๋ฎฌ๋ ์ด์ ๊ณผ ํ์ค ๊ฐ์ ์๊ฐ์ ๋ถ์ผ์น(Visual discrepancy)๋ก ์ธํ ์๊ฐ ์ ์ฑ ์ค๋ฅ(44%์ ์คํจ ์์ธ)์์ต๋๋ค. ํนํ, ์นด๋ฉ๋ผ์ Dynamic range, ๊ฐ์ฒด์ ์ง๊ฐ ๋ฐ ๋ฐ์ฌ์จ๊ณผ ๊ฐ์ ๋ชจ๋ธ๋ง๋์ง ์์ ํจ๊ณผ์ ๋ด๋น๊ฒ์ด์ ๋ถ์ ํ์ฑ์ผ๋ก ์ธํ ๋ก๋ด ๋ฒ ์ด์ค ์์น์ ๋ถ๋ฆฌํจ์ด ๋์ ์ค๋ฅ์ ์์ธ์ผ๋ก ์ง์ ๋์์ต๋๋ค.
BEHAVIOR-1K์ ํ๊ณ๋ก๋ Ray-tracing ๋ ๋๋ง์ผ๋ก ์ธํ ์๋ฎฌ๋ ์ด์ ์๋ ์ ํ(iGibson 2.0 ๋๋น ์ฝ 60fps), ์ธ๊ฐ๊ณผ์ ์ํธ์์ฉ์ ์๊ตฌํ๋ ํ๋์ ๋ฏธํฌํจ, ๊ทธ๋ฆฌ๊ณ Sim2real ์ ์ด๋ฅผ ์ํ ์ธ์ง ๋ฐ Actuation ๋ ธ์ด์ฆ ๋ชจ๋ธ ํตํฉ์ ํ์์ฑ ๋ฑ์ด ์์ต๋๋ค. ์ฐ๊ตฌํ์ ์ด๋ฌํ ํ๊ณ์ ์ ๊ฐ์ ํ๊ธฐ ์ํด ์ง์์ ์ผ๋ก ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค.
BEHAVIOR-1K๋ ์ธ๊ฐ ์ค์ฌ์ ํน์ฑ, ๋ค์์ฑ, ์ฌ์ค์ฑ์ ๋ฐํ์ผ๋ก Embodied AI ๋ฐ ๋ก๋ด ํ์ต ์ฐ๊ตฌ์ ํฐ ๊ฐ์น๋ฅผ ์ ๊ณตํ ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
1. ์๋ก
1.1 ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ
Embodied AI๋ ๋ฌผ๋ฆฌ์ ํ๊ฒฝ๊ณผ ์ํธ์์ฉํ๋ฉฐ ์์ ์ ์ํํ๋ ์ธ๊ณต์ง๋ฅ ์์คํ ์ ์๋ฏธํ๋ค. ์ต๊ทผ ์ปดํจํฐ ๋น์ , ๋ก๋ด๊ณตํ, ์์ฐ์ด ์ฒ๋ฆฌ ๋ฑ ๋ค์ํ ๋ถ์ผ์ ๋ฐ์ ์ผ๋ก ์ธํด Embodied AI์ ๋ํ ๊ด์ฌ์ด ๊ธ์ฆํ๊ณ ์๋ค. ๊ทธ๋ฌ๋ ์ค์ ์ธ๊ณ์ ๋ณต์ก์ฑ๊ณผ ๋ค์์ฑ์ ์ถฉ๋ถํ ๋ฐ์ํ๋ ๋ฒค์น๋งํฌ์ ๋ถ์ฌ๋ก ์ธํด ์ฐ๊ตฌ ์ง์ ์ด ์ ํ๋์ด ์๋ค.
1.2 ๊ธฐ์กด ๋ฒค์น๋งํฌ์ ํ๊ณ
๊ธฐ์กด์ Embodied AI ๋ฒค์น๋งํฌ๋ค์ ์ฃผ๋ก ํน์ ์์ ์ด๋ ์ ํ๋ ํ๊ฒฝ์ ์ด์ ์ ๋ง์ถ๊ณ ์๋ค. AI2-THOR๋ ์ค๋ด ํ๊ฒฝ ํ์๊ณผ ๋ฌผ์ฒด ์กฐ์์ ์ง์คํ๊ณ ์์ผ๋ฉฐ, Habitat์ ์ฃผ๋ก ๋ด๋น๊ฒ์ด์ ์์ ์ ์ด์ ์ ๋ง์ถ๊ณ ์๋ค. VirtualHome์ ์ ํ๋ ์์ ํ๋๊ณผ ๋จ์ํ๋ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์ ์ ๊ณตํ๋ฉฐ, ALFRED๋ ์ธ์ด ๊ธฐ๋ฐ ๋ช ๋ น ์ํ์ ํนํ๋์ด ์๋ค. ์ด๋ฌํ ๋ฒค์น๋งํฌ๋ค์ ์ค์ ์ผ์ ์ํ์ ๋ณต์ก์ฑ๊ณผ ๋ค์์ฑ์ ์ถฉ๋ถํ ํฌ์ฐฉํ์ง ๋ชปํ๋ค๋ ํ๊ณ๊ฐ ์๋ค.
1.3 BEHAVIOR-1K์ ํ์์ฑ
์ค์ ๊ฐ์ ํ๊ฒฝ์์ ๋ก๋ด์ด ์ํํด์ผ ํ๋ ์์ ๋ค์ ๋งค์ฐ ๋ค์ํ๊ณ ๋ณต์กํ๋ค. ์๋ฅผ ๋ค์ด, โ์ ๋ ์์ฌ ์ค๋นํ๊ธฐโ๋ผ๋ ๋จ์ํด ๋ณด์ด๋ ์์ ๋ ์ค์ ๋ก๋ ๋์ฅ๊ณ ์์ ์ฌ๋ฃ ๊บผ๋ด๊ธฐ, ์ฑ์ ์ป๊ธฐ, ์๋ฅด๊ธฐ, ์กฐ๋ฆฌํ๊ธฐ, ์ํ ์ฐจ๋ฆฌ๊ธฐ ๋ฑ ์ฌ๋ฌ ํ์ ์์ ์ผ๋ก ๊ตฌ์ฑ๋๋ฉฐ, ๊ฐ ๋จ๊ณ๋ง๋ค ์ ํํ ๋ฌผ๋ฆฌ์ ์กฐ์๊ณผ ์ํฉ ์ธ์์ด ํ์ํ๋ค. BEHAVIOR-1K๋ ์ด๋ฌํ ์ค์ ์ธ๊ณ์ ๋ณต์ก์ฑ์ ๋ฐ์ํ์ฌ, 1,000๊ฐ์ ๋ค์ํ ์ผ์ ํ๋๊ณผ ํ์ค์ ์ธ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์ ์ ๊ณตํ๋ ์ข ํฉ์ ์ธ ๋ฒค์น๋งํฌ๋ฅผ ๋ชฉํ๋ก ํ๋ค.
2. BEHAVIOR-1K ๊ฐ์
2.1 ํต์ฌ ํน์ง
BEHAVIOR-1K๋ ์ฌ๋ฌ ๊ฐ์ง ํต์ฌ ํน์ง์ ๊ฐ์ง๊ณ ์๋ค. ๋จผ์ , 1,000๊ฐ์ ์ผ์ ํ๋ ์ธ์คํด์ค๋ก ๊ตฌ์ฑ๋ ๋๊ท๋ชจ ํ๋ ๋ฐ์ดํฐ์ ์ ์ ๊ณตํ๋ค. ์ด ํ๋๋ค์ 50๊ฐ์ ์๋ก ๋ค๋ฅธ ํ๋ ์ ํ์ผ๋ก ๋ถ๋ฅ๋๋ฉฐ, OmniGibson ๊ธฐ๋ฐ์ ๊ณ ์ ๋ฐ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์ ํตํด ํ์ค์ ์ผ๋ก ๊ตฌํ๋๋ค. ๋ํ 50๊ฐ์ ์๋ก ๋ค๋ฅธ ๊ฐ์ ํ๊ฒฝ์ ์ ๊ณตํ์ฌ ํ๊ฒฝ์ ๋ค์์ฑ์ ๋ณด์ฅํ๋ฉฐ, 500๊ฐ ์ด์์ ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ๋ฅผ ํตํด ๋ณต์กํ ๊ฐ์ฒด ์ํธ์์ฉ์ ์ง์ํ๋ค. ํนํ ๊ฐ์ฒด์ ๋ค์ํ ์ํ, ์๋ฅผ ๋ค์ด ์จ๋๋ ์ฒญ๊ฒฐ๋ ๋ฑ์ ์ถ์ ํ๋ ์ํ ๊ธฐ๋ฐ ์ถ๋ก ์์คํ ์ ๊ฐ์ถ๊ณ ์๋ค.
2.2 ํ๋ ๋ถ๋ฅ ์ฒด๊ณ
BEHAVIOR-1K์ ํ๋๋ค์ ์ฌ๋ฌ ์ฃผ์ ์นดํ ๊ณ ๋ฆฌ๋ก ๋ถ๋ฅ๋๋ค. ์ฒญ์ ๊ด๋ จ ํ๋์๋ ๋ฐ๋ฅ ์ฒญ์ํ๊ธฐ, ์ฐฝ๋ฌธ ๋ฆ๊ธฐ, ๋จผ์ง ์ ๊ฑฐํ๊ธฐ, ์ง๊ณต์ฒญ์๊ธฐ๋ก ์ฒญ์ํ๊ธฐ, ๊ฑธ๋ ์งํ๊ธฐ ๋ฑ์ด ํฌํจ๋๋ค. ์๋ฆฌ ๊ด๋ จ ํ๋์ผ๋ก๋ ์ปคํผ ๋ง๋ค๊ธฐ, ์๋ฌ๋ ์ค๋นํ๊ธฐ, ํ์คํ ์๋ฆฌํ๊ธฐ, ํ ์คํธ ๋ง๋ค๊ธฐ, ์์ ๋ฐ์ฐ๊ธฐ ๋ฑ์ด ์๋ค. ์ ๋ฆฌ์ ๋ ํ๋์๋ ์ฑ ์ฅ ์ ๋ฆฌํ๊ธฐ, ์ท์ฅ ์ ๋ฆฌํ๊ธฐ, ์ํ ์ฐจ๋ฆฌ๊ธฐ, ์๊ธฐ ์ ๋ฆฌํ๊ธฐ, ์ฅ๋๊ฐ ์ ๋ฆฌํ๊ธฐ ๋ฑ์ด ํฌํจ๋๋ฉฐ, ์ ์ง๋ณด์ ํ๋์ผ๋ก๋ ์ ๊ตฌ ๊ต์ฒดํ๊ธฐ, ๋ฐฐํฐ๋ฆฌ ๊ต์ฒดํ๊ธฐ, ์ฐ๋ ๊ธฐ ๋ฒ๋ฆฌ๊ธฐ, ํ๋ถ์ ๋ฌผ์ฃผ๊ธฐ, ํํฐ ๊ต์ฒดํ๊ธฐ ๋ฑ์ด ์๋ค. ์ธํ ๊ด๋ จ ํ๋์ผ๋ก๋ ์ธํ๊ธฐ ์ฌ์ฉํ๊ธฐ, ๋นจ๋ ๋๊ธฐ, ์ท ๊ฐ๊ธฐ, ๋ค๋ฆผ์งํ๊ธฐ ๋ฑ์ด ์์ผ๋ฉฐ, ๊ทธ ์ธ์๋ ์นจ๋ ์ ๋ฆฌํ๊ธฐ, ๋ฐ๋ ค๋๋ฌผ ๋๋ณด๊ธฐ, ์ฐํธ๋ฌผ ์ ๋ฆฌํ๊ธฐ, ์ ๋ฌผ ํฌ์ฅํ๊ธฐ ๋ฑ์ ์ผ์ ํ๋๋ค์ด ํฌํจ๋์ด ์๋ค.
2.3 ํ๊ฒฝ ๊ตฌ์ฑ
BEHAVIOR-1K๋ 50๊ฐ์ ์๋ก ๋ค๋ฅธ ๊ฐ์ ํ๊ฒฝ์ ์ ๊ณตํ๋ค. ์ด๋ฌํ ํ๊ฒฝ๋ค์ ์ํํธ, ๋จ๋ ์ฃผํ, ์๋ฃธ, ํ์ดํ์ฐ์ค ๋ฑ ๋ค์ํ ์ฃผ๊ฑฐ ๊ณต๊ฐ ์ ํ์ ํฌํจํ๋ค. ๊ฐ ํ๊ฒฝ์ ๊ฑฐ์ค, ์ฃผ๋ฐฉ, ์นจ์ค, ์์ค, ์์ฌ, ๋ค์ด๋๋ฃธ, ์ธํ์ค ๋ฑ ์ฌ๋ฌ ๋ฐฉ์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ค. ๊ฐ ํ๊ฒฝ์ ์ค์ ์ฃผ๊ฑฐ ๊ณต๊ฐ์ ํน์ง์ ๋ฐ์ํ์ฌ ๋ค์ํ ๊ฐ๊ตฌ, ๊ฐ์ ์ ํ, ์ผ์์ฉํ๋ค๋ก ๊ตฌ์ฑ๋์ด ์๋ค.
3. ๊ธฐ์ ์ ๊ตฌํ
3.1 OmniGibson ์๋ฎฌ๋ ์ดํฐ
BEHAVIOR-1K๋ OmniGibson์ด๋ผ๋ ์ฐจ์ธ๋ ์๋ฎฌ๋ ์ด์ ํ๋ซํผ์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถ๋์๋ค. OmniGibson์ NVIDIA Omniverse ๊ธฐ๋ฐ์ ๊ณ ์ฑ๋ฅ ๋ ๋๋ง์ ์ ๊ณตํ๋ฉฐ, PhysX 5.0 ๋ฌผ๋ฆฌ ์์ง์ ์ฌ์ฉํ๋ค. ์ค์๊ฐ ๊ด์ ์ถ์ ์ ์ง์ํ๊ณ , ๋ณํ ๊ฐ๋ฅํ ๊ฐ์ฒด ์๋ฎฌ๋ ์ด์ , ์ ์ฒด ์๋ฎฌ๋ ์ด์ , ์ด ์ ๋ฌ ์๋ฎฌ๋ ์ด์ ๋ฑ์ ๊ธฐ๋ฅ์ ๊ฐ์ถ๊ณ ์๋ค.
OmniGibson์ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์ ๋งค์ฐ ์ ๋ฐํ๋ค. ๊ฐ์ฒด ์ญํ์ ํตํด ๋ฌผ์ฒด ๊ฐ์ ์ถฉ๋, ๋ง์ฐฐ, ๋ฐ๋ฐ์ ์๋ฎฌ๋ ์ด์ ํ๊ณ , ๊ด์ ์ญํ์ ํตํด ๋ฌธ, ์๋, ์บ๋น๋ ๋ฑ์ ์์ง์์ ๊ตฌํํ๋ค. ์ฐ์ฒด ์ญํ์ผ๋ก๋ ์ฒ, ์ฟ ์ , ์คํ์ง ๋ฑ์ ๋ณํ์ ํํํ๋ฉฐ, ์ ์ฒด ์ญํ์ ํตํด ๋ฌผ, ์๋ฃ, ์ธ์ ๋ฑ์ ํ๋ฆ์ ์๋ฎฌ๋ ์ด์ ํ๋ค. ๋ํ ์ ์ ์์คํ ์ ์ฌ์ฉํ์ฌ ๋จผ์ง, ์์ ๋ถ์ค๋ฌ๊ธฐ ๋ฑ์ ํํํ๋ค.
๋ ๋๋ง ๊ธฐ์ ์ธก๋ฉด์์ OmniGibson์ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ๋ ๋๋ง์ ์ฌ์ฉํ์ฌ ์ค์ ์ฌ์ง์ ๋น ๋ฐ์ฌ ํน์ฑ์ ์ ํํ ๋ชจ์ฌํ๋ค. ์ ์ญ ์กฐ๋ช ์ ํตํด ๊ฐ์ ๊ด์ ํฌํจํ ํ์ค์ ์ธ ์กฐ๋ช ์ ์ ๊ณตํ๋ฉฐ, ๋์ ๊ทธ๋ฆผ์๋ฅผ ํตํด ์์ง์ด๋ ๊ฐ์ฒด์ ๊ด์์ ๋ฐ๋ฅธ ๊ทธ๋ฆผ์๋ฅผ ํํํ๋ค. 4K ์ด์์ ๊ณ ํด์๋ ํ ์ค์ฒ๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ์ง์ ์์ธํ๊ฒ ํํํ๋ค.
3.2 ๊ฐ์ฒด ์ํ ์๋ฎฌ๋ ์ด์
BEHAVIOR-1K์ ํต์ฌ ํ์ ์ค ํ๋๋ ๊ฐ์ฒด์ ๋ค์ํ ์ํ๋ฅผ ์ถ์ ํ๊ณ ์๋ฎฌ๋ ์ด์ ํ๋ ๊ฒ์ด๋ค. ์จ๋ ์ํ๋ ๋จ๊ฑฐ์, ๋ฏธ์ง๊ทผํจ, ์์จ, ์ฐจ๊ฐ์, ์ผ์ด์์์ผ๋ก ๊ตฌ๋ถ๋๋ค. ์ฒญ๊ฒฐ๋๋ ๊นจ๋ํจ, ์ฝ๊ฐ ๋๋ฌ์, ๋๋ฌ์, ๋งค์ฐ ๋๋ฌ์์ผ๋ก ๋๋๋ค. ์ต๋๋ ๋ง๋ฆ, ์ฝ๊ฐ ์ ์, ์ ์, ํ ๋ป ์ ์์ผ๋ก ํํ๋๋ค. ์๋ฆฌ ์ํ๋ ๋ ๊ฒ, ๋ ์ต์, ์ ์ ํ ์ต์, ๊ณผ๋ํ๊ฒ ์ต์, ํ์ผ๋ก ๊ตฌ๋ถ๋๋ค. ํ ๊ธ ์ํ๋ ์ผ์ง๊ณผ ๊บผ์ง์ผ๋ก ๋๋๋ฉฐ, ์ฑ์์ง ์ํ๋ ๋น์ด์์, ์ผ๋ถ ์ฑ์์ง, ์ฑ์์ง, ๋์นจ์ผ๋ก ๊ตฌ๋ถ๋๋ค. ์ ํ ์ํ๋ ํผ์ณ์ง๊ณผ ์ ํ์ผ๋ก, ์ผ๋ฃฉ ์ํ๋ ์ผ๋ฃฉ ์์๊ณผ ์ผ๋ฃฉ ์์์ผ๋ก ๊ตฌ๋ถ๋๋ค.
๊ฐ์ฒด์ ์ํ๋ ๋ค์ํ ์ํธ์์ฉ์ ์ํด ๋ณํํ๋ค. ์คํ ๋ธ์ ์ฌ๋ ค์ง ์์์ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ต์ผ๋ฉฐ, ๋ฌผ์ ๋ฟ์ ๋ฌผ์ฒด๋ ์ ๋๋ค. ์ธ์ ๋ฅผ ์ฌ์ฉํ๋ฉด ๋๋ฌ์ด ๋ฌผ์ฒด๊ฐ ๊นจ๋ํด์ง๊ณ , ์ ์ ๋ฒํผ์ ๋๋ฅด๋ฉด ๊ธฐ๊ธฐ๊ฐ ์ผ์ง๊ฑฐ๋ ๊บผ์ง๋ค.
3.3 ์์ ์ ์ ์ธ์ด (BDDL)
BEHAVIOR Domain Definition Language๋ ์์ ์ ํ์์ ์ผ๋ก ์ ์ํ๊ธฐ ์ํ ๋๋ฉ์ธ ํนํ ์ธ์ด์ด๋ค. BDDL์ ์ด๊ธฐ ์กฐ๊ฑด, ๋ชฉํ ์กฐ๊ฑด, ์ ์ฝ ์กฐ๊ฑด์ผ๋ก ๊ตฌ์ฑ๋๋ค. ์ด๊ธฐ ์กฐ๊ฑด์ ์์ ์์ ์ ํ๊ฒฝ์ ์ํ๋ฅผ ์ ์ํ๋ค. ์๋ฅผ ๋ค์ด, ์ปคํผ ๋ฉ์ด์ปค๊ฐ ์นด์ดํฐ ์์ ์๊ณ ๊บผ์ ธ ์๋ ์ํ๋ฅผ ๋ํ๋ผ ์ ์๋ค. ๋ชฉํ ์กฐ๊ฑด์ ์์ ์๋ฃ ์ ๋ฌ์ฑํด์ผ ํ๋ ์ํ๋ฅผ ์ ์ํ๋ค. ์๋ฅผ ๋ค์ด, ์ปคํผ๊ฐ ์ปต์ ๋ด๊ฒจ ์๊ณ ๋จ๊ฑฐ์ฐ๋ฉฐ, ์ปต์ด ํ ์ด๋ธ ์์ ์๋ ์ํ๋ฅผ ๋ํ๋ผ ์ ์๋ค. ์ ์ฝ ์กฐ๊ฑด์ ์์ ์ํ ์ ์ง์ผ์ผ ํ๋ ์ ํ ์ฌํญ์ ์ ์ํ๋ค. ์๋ฅผ ๋ค์ด, 5๋ถ ์ด๋ด์ ์๋ฃํด์ผ ํ๊ฑฐ๋ ๋ก๋ด์ด ๊นจ์ง๊ธฐ ์ฌ์ด ๋ฌผ์ฒด์ ์ถฉ๋ํ์ง ์์์ผ ํ๋ค๋ ์กฐ๊ฑด์ ์ค์ ํ ์ ์๋ค.
BDDL์ ๋ค์ํ ๊ณต๊ฐ์ , ์ํ์ ์ ์ด๋ฅผ ์ง์ํ๋ค. OnTop ์ ์ด๋ ํ ๊ฐ์ฒด๊ฐ ๋ค๋ฅธ ๊ฐ์ฒด ์์ ์์์ ๋ํ๋ด๊ณ , Inside ์ ์ด๋ ํ ๊ฐ์ฒด๊ฐ ๋ค๋ฅธ ๊ฐ์ฒด ์์ ์์์ ๋ํ๋ธ๋ค. NextTo ์ ์ด๋ ํ ๊ฐ์ฒด๊ฐ ๋ค๋ฅธ ๊ฐ์ฒด ์์ ์์์, Under ์ ์ด๋ ํ ๊ฐ์ฒด๊ฐ ๋ค๋ฅธ ๊ฐ์ฒด ์๋์ ์์์ ๋ํ๋ธ๋ค. Touching ์ ์ด๋ ๋ ๊ฐ์ฒด๊ฐ ์ ์ดํ๊ณ ์์์, Filled ์ ์ด๋ ํ ๊ฐ์ฒด๊ฐ ํน์ ๋ฌผ์ง๋ก ์ฑ์์ ธ ์์์ ๋ํ๋ธ๋ค.
3.4 ์ผ์ ์๋ฎฌ๋ ์ด์
BEHAVIOR-1K๋ ๋ค์ํ ์ผ์๋ฅผ ์๋ฎฌ๋ ์ด์ ํ์ฌ ์ค์ ๋ก๋ด๊ณผ ์ ์ฌํ ์ธ์ ํ๊ฒฝ์ ์ ๊ณตํ๋ค. ์๊ฐ ์ผ์๋ก๋ 1920ร1080 ํด์๋์ RGB ์นด๋ฉ๋ผ์ ๋ฐ๋ฆฌ๋ฏธํฐ ๋จ์์ ์ ํ๋๋ฅผ ๊ฐ์ง ๊น์ด ์นด๋ฉ๋ผ๊ฐ ์๋ค. ์ธ์คํด์ค ์ธ๊ทธ๋ฉํ ์ด์ ์ ํตํด ๊ฐ ๊ฐ์ฒด๋ฅผ ๊ฐ๋ณ์ ์ผ๋ก ์๋ณํ ์ ์์ผ๋ฉฐ, ์๋งจํฑ ์ธ๊ทธ๋ฉํ ์ด์ ์ ํตํด ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๋ถ๋ฅํ ์ ์๋ค.
์ด๊ฐ ์ผ์๋ ์ ์ด ๊ฐ์ง๋ฅผ ํตํด ํ์ ํฌ๊ธฐ์ ๋ฐฉํฅ์ ์ธก์ ํ๊ณ , ์ง๊ฐ ์ธ์์ ํตํด ํ๋ฉด์ ๊ฑฐ์น ๊ธฐ๋ฅผ ํ์ ํ๋ฉฐ, ์จ๋ ๊ฐ์ง๋ฅผ ํตํด ์ ์ดํ ๋ฌผ์ฒด์ ์จ๋๋ฅผ ์ธก์ ํ๋ค. ๊ณ ์ ์์ฉ ์ผ์๋ ๊ด์ ์์น, ๊ด์ ์๋, ๊ด์ ํ ํฌ๋ฅผ ์ธก์ ํ์ฌ ๋ก๋ด์ ํ์ฌ ์ํ๋ฅผ ํ์ ํ๋ค. ๊ทธ ์ธ์๋ IMU๋ฅผ ํตํด ๊ฐ์๋์ ์์ด๋ก์ค์ฝํ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ , ํ/ํ ํฌ ์ผ์๋ฅผ ํตํด ์๋ ์ดํํฐ์ ๊ฐํด์ง๋ ํ์ ์ธก์ ํ๋ค.
4. ๋ฐ์ดํฐ์ ๊ตฌ์กฐ
4.1 ํ๋ ๋ฐ์ดํฐ
BEHAVIOR-1K๋ ์ด 1,000๊ฐ์ ํ๋ ์ธ์คํด์ค๋ฅผ ํฌํจํ๊ณ ์์ผ๋ฉฐ, ์ด๋ค์ 50๊ฐ์ ํ๋ ์นดํ ๊ณ ๋ฆฌ๋ก ๋ถ๋ฅ๋๋ค. ๊ฐ ์นดํ ๊ณ ๋ฆฌ๋ ํ๊ท ์ ์ผ๋ก 20๊ฐ์ ๋ณํ์ ๊ฐ์ง๊ณ ์๋ค. ํ๋์ ๋ณต์ก๋๋ ๋ค์ํ๊ฒ ๋ถํฌ๋์ด ์๋๋ฐ, ๋จ์ ์์ ์ 1-3 ๋จ๊ณ๋ก ๊ตฌ์ฑ๋๋ฉฐ ์ ์ฒด์ 15%๋ฅผ ์ฐจ์งํ๋ค. ์ค๊ฐ ๋ณต์ก๋์ ์์ ์ 4-7 ๋จ๊ณ๋ก ๊ตฌ์ฑ๋๋ฉฐ 50%๋ฅผ ์ฐจ์งํ๋ค. ๋ณต์กํ ์์ ์ 8-15 ๋จ๊ณ๋ก ๊ตฌ์ฑ๋๋ฉฐ 30%๋ฅผ, ๋งค์ฐ ๋ณต์กํ ์์ ์ 15๋จ๊ณ ์ด์์ผ๋ก ๊ตฌ์ฑ๋๋ฉฐ 5%๋ฅผ ์ฐจ์งํ๋ค.
4.2 ํ๊ฒฝ ๋ฐ์ดํฐ
BEHAVIOR-1K๋ 50๊ฐ์ ๋ ๋ฆฝ์ ์ธ 3D ํ๊ฒฝ์ ์ ๊ณตํ๋ค. ๊ฐ ํ๊ฒฝ์ ํ๊ท ์ ์ผ๋ก 150๊ฐ์ ๊ฐ์ฒด๋ฅผ ํฌํจํ๊ณ ์์ด, ์ด 7,500๊ฐ ์ด์์ ๊ฐ์ฒด ์ธ์คํด์ค๊ฐ ์กด์ฌํ๋ค. ๊ฐ์ฒด ๋ค์์ฑ ์ธก๋ฉด์์๋ 500๊ฐ ์ด์์ ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ๊ฐ ์์ผ๋ฉฐ, WordNet ๊ธฐ๋ฐ์ ๊ฐ์ฒด ๋ถ๋ฅ ์ฒด๊ณ๋ฅผ ๋ฐ๋ฅธ๋ค. ๊ฐ ๊ฐ์ฒด๋ ๊ณ ์ ํ 3D ๋ชจ๋ธ๊ณผ ๋ฌผ๋ฆฌ ์์ฑ์ ๊ฐ์ง๊ณ ์๋ค. ๊ณต๊ฐ ๋ค์์ฑ ์ธก๋ฉด์์๋ 40mยฒ์์ 200mยฒ์ ์ด๋ฅด๋ ๋ค์ํ ์ง ํฌ๊ธฐ๋ฅผ ์ ๊ณตํ๋ฉฐ, ๋ค์ํ ๋ฐฉ ๋ฐฐ์น์ ๊ฐ๊ตฌ ์คํ์ผ์ ๊ฐ์ถ๊ณ ์๋ค.
4.3 ์ฃผ์ ๋ฐ์ดํฐ
๊ฐ ํ๋์๋ ์ฌ๋ฌ ์ข ๋ฅ์ ์ฃผ์์ด ์ ๊ณต๋๋ค. ์์ ์ฃผ์์ผ๋ก๋ ์์ฐ์ด ์ค๋ช , BDDL ํ์์ ํ์์ ์ ์, ์์ ์์ ์๊ฐ, ๋์ด๋ ๋ฑ๊ธ์ด ํฌํจ๋๋ค. ๊ฐ์ฒด ์ฃผ์์ผ๋ก๋ ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ, ์ดํฌ๋์ค ์ ๋ณด, ์ํ ๋ณํ ๊ฐ๋ฅ์ฑ, ์ํธ์์ฉ ๋ฐฉ๋ฒ์ด ํฌํจ๋๋ค. ํ๊ฒฝ ์ฃผ์์ผ๋ก๋ ๋ฐฉ ์ ํ ๋ฐ ํฌ๊ธฐ, ๊ฐ์ฒด ๋ฐฐ์น ์ ๋ณด, ์ ๊ทผ ๊ฐ๋ฅํ ์์ญ์ ๋ํ ์ ๋ณด๊ฐ ํฌํจ๋๋ค.
5. ํ๊ฐ ๋ฉํธ๋ฆญ
5.1 ์ฑ๊ณต๋ฅ
์ฑ๊ณต๋ฅ ์ ๋ ๊ฐ์ง ๋ฐฉ์์ผ๋ก ํ๊ฐ๋๋ค. ์ด์ง ์ฑ๊ณต ํ๊ฐ์์๋ ๋ชฉํ ์กฐ๊ฑด์ ์์ ํ ๋ฌ์ฑํ๋ฉด ์ฑ๊ณต์ผ๋ก, ํ๋๋ผ๋ ๋ฏธ๋ฌ์ฑํ๋ฉด ์คํจ๋ก ํ์ ํ๋ค. ๋ถ๋ถ ์ฑ๊ณต ํ๊ฐ์์๋ ๋ฌ์ฑ๋ ํ์ ๋ชฉํ์ ๋น์จ์ ์ธก์ ํ๋ฉฐ, 0์์ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก ํํ๋๋ค.
5.2 ํจ์จ์ฑ ๋ฉํธ๋ฆญ
ํจ์จ์ฑ์ ์ฌ๋ฌ ์ธก๋ฉด์์ ์ธก์ ๋๋ค. ์๊ฐ ํจ์จ์ฑ์ ์์ ์๋ฃ ์๊ฐ๊ณผ ์ต์ ์๊ฐ ๋๋น ๋น์จ๋ก ์ธก์ ๋๋ค. ํ๋ ํจ์จ์ฑ์ ์คํ๋ ํ๋ ์์ ๋ถํ์ํ ํ๋ ๋น์จ๋ก ํ๊ฐ๋๋ค. ๊ฒฝ๋ก ํจ์จ์ฑ์ ์ด๋ ๊ฑฐ๋ฆฌ์ ์ต๋จ ๊ฒฝ๋ก ๋๋น ๋น์จ๋ก ์ธก์ ๋๋ค.
5.3 ํ์ง ๋ฉํธ๋ฆญ
ํ์ง์ ์ ํ๋, ์์ ์ฑ, ์์ฐ์ค๋ฌ์์ผ๋ก ํ๊ฐ๋๋ค. ์ ํ๋๋ ๊ฐ์ฒด ๋ฐฐ์น์ ์ ํ์ฑ๊ณผ ์ต์ข ์ํ์ ์ ํ์ฑ์ผ๋ก ์ธก์ ๋๋ค. ์์ ์ฑ์ ๊ฐ์ฒด ํ์ ํ์์ ์ํ ์ํฉ ๋ฐ์ ๋น๋๋ก ํ๊ฐ๋๋ค. ์์ฐ์ค๋ฌ์์ ์ธ๊ฐ์ ํ๋๊ณผ์ ์ ์ฌ๋์ ๋ถํ์ํ ์์ง์์ ์ต์ํ ์ ๋๋ก ์ธก์ ๋๋ค.
5.4 ์ผ๋ฐํ ๋ฅ๋ ฅ
์ผ๋ฐํ ๋ฅ๋ ฅ์ ํ๊ฒฝ ์ผ๋ฐํ์ ์์ ์ผ๋ฐํ๋ก ๋๋๋ค. ํ๊ฒฝ ์ผ๋ฐํ๋ ์๋ก์ด ์ง ๊ตฌ์กฐ์์์ ์ฑ๋ฅ๊ณผ ์๋ก์ด ๊ฐ์ฒด ๋ฐฐ์น์์์ ์ฑ๋ฅ์ผ๋ก ์ธก์ ๋๋ค. ์์ ์ผ๋ฐํ๋ ์ ์ฌ ์์ ์ผ๋ก์ ์ ์ด ๋ฅ๋ ฅ๊ณผ ์๋ก์ด ์์ ๋ณํ์ ๋ํ ์ ์๋ ฅ์ผ๋ก ํ๊ฐ๋๋ค.
6. ๋ฒ ์ด์ค๋ผ์ธ ๋ฐฉ๋ฒ๋ก
6.1 ํด๋ฆฌ์คํฑ ๊ธฐ๋ฐ ์ ๊ทผ
ํด๋ฆฌ์คํฑ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ผ๋ก๋ ๊ท์น ๊ธฐ๋ฐ ์์คํ ์ด ์๋ค. ์ด ์์คํ ์ ์ฌ์ ์ ์๋ ํ๋ ์ํ์ค๋ฅผ ์ฌ์ฉํ๊ณ , ์กฐ๊ฑด๋ถ ๋ถ๊ธฐ๋ฅผ ํตํ ์ ์ฐ์ฑ์ ์ ๊ณตํ๋ค. ๊ทธ๋ฌ๋ ์ฑ๊ณต๋ฅ ์ ์ฝ 5%์ ๋ถ๊ณผํ๋ค. ์ด ๋ฐฉ๋ฒ์ ํ๊ณ์ ์ผ๋ก๋ ๋ณํํ๋ ํ๊ฒฝ์ ๋ํ ์ ์๋ ฅ ๋ถ์กฑ, ๋ณต์กํ ์์ ์์์ ์คํจ, ์์ธ ์ํฉ ์ฒ๋ฆฌ์ ์ด๋ ค์ ๋ฑ์ด ์๋ค.
6.2 ํ์ต ๊ธฐ๋ฐ ์ ๊ทผ
๊ฐํํ์ต ๋ฐฉ๋ฒ์ผ๋ก๋ ์ฌ๋ฌ ์๊ณ ๋ฆฌ์ฆ์ด ์๋๋์๋ค. Deep Q-Network๋ ์ด์ฐ ํ๋ ๊ณต๊ฐ์์ ์ฝ 10%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋, ํฌ์ํ ๋ณด์๊ณผ ์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ ๋ฅผ ๊ฒช์๋ค. Proximal Policy Optimization์ ์ฐ์ ํ๋ ๊ณต๊ฐ์์ ์ฝ 15%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ ์ํ ํจ์จ์ฑ ๋ฌธ์ ๊ฐ ์์๋ค. Soft Actor-Critic์ ์ต๋ ์ํธ๋กํผ ๊ฐํํ์ต์ ์ฌ์ฉํ์ฌ ์ฝ 18%์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ผ๋ฉฐ, ํ์-ํ์ฉ ๊ท ํ์ด๋ผ๋ ์ฅ์ ์ ๊ฐ์ง๊ณ ์๋ค.
๋ชจ๋ฐฉํ์ต ๋ฐฉ๋ฒ์ผ๋ก๋ Behavioral Cloning๊ณผ Dataset Aggregation์ด ์๋ค. Behavioral Cloning์ ์ธ๊ฐ ์์ฐ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ์ฝ 20%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ ๋ถํฌ ์ดํ ๋ฌธ์ ๋ฅผ ๊ฒช์๋ค. Dataset Aggregation์ ๋ฐ๋ณต์ ๋ฐ์ดํฐ ์์ง์ ํตํด ์ฝ 25%์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ผ๋ฉฐ, ๋ถํฌ ์ดํ์ ์ํํ๋ ์ฅ์ ์ด ์๋ค.
6.3 ๊ณํ ๊ธฐ๋ฐ ์ ๊ทผ
Classical Planning ๋ฐฉ๋ฒ์ผ๋ก๋ PDDL์ด ์๋ค. PDDL์ ์ฌ๋ณผ๋ฆญ ๊ณํ์ ์ฌ์ฉํ์ฌ ์ฝ 30%์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ผ๋ ๋ถํ์ค์ฑ ์ฒ๋ฆฌ๊ฐ ์ด๋ ต๋ค๋ ํ๊ณ๊ฐ ์๋ค. Task and Motion Planning์ ์ฌ๋ณผ๋ฆญ ๊ณํ๊ณผ ๊ธฐํํ์ ์ถ๋ก ์ ๊ฒฐํฉํ์ฌ ์ฝ 35%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ฉฐ, ๋ณต์กํ ์กฐ์ ์์ ์ ์ฒ๋ฆฌํ ์ ์๋ค๋ ์ฅ์ ์ด ์๋ค.
6.4 ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ
๊ณ์ธต์ ๊ฐํํ์ต์ ์์ ๋ ๋ฒจ์์ ํ์ ๋ชฉํ๋ฅผ ๊ณํํ๊ณ ํ์ ๋ ๋ฒจ์์ ๊ธฐ์ด ํ๋์ ์คํํ๋ ๋ฐฉ์์ผ๋ก ์ฝ 40%์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ๋ค. ํ์ต๋ ๊ณํ๊ธฐ๋ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ๊ณํ์ ์ฌ์ฉํ๊ณ ํ์ต ๋ฐ์ดํฐ๋ก ํฅ์๋์ด ์ฝ 38%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์๋ค.
7. ์คํ ๊ฒฐ๊ณผ ๋ฐ ๋ถ์
7.1 ์ ์ฒด ์ฑ๋ฅ ๋น๊ต
๋ค์ํ ๋ฐฉ๋ฒ๋ก ์ ์ ์ฒด ์ฑ๋ฅ์ ๋น๊ตํ ๊ฒฐ๊ณผ, Random ๋ฐฉ๋ฒ์ 0.2%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ฉฐ ํจ์จ์ฑ์ 0.05์๋ค. Heuristic ๋ฐฉ๋ฒ์ 5.1%์ ์ฑ๊ณต๋ฅ , 287์ด์ ํ๊ท ์๊ฐ, 0.23์ ํจ์จ์ฑ์ ๋ณด์๋ค. DQN์ 9.8%์ ์ฑ๊ณต๋ฅ , 324์ด์ ํ๊ท ์๊ฐ, 0.31์ ํจ์จ์ฑ์ ๋ฌ์ฑํ๋ค. PPO๋ 14.6%์ ์ฑ๊ณต๋ฅ , 298์ด์ ํ๊ท ์๊ฐ, 0.38์ ํจ์จ์ฑ์ ๋ณด์๋ค. SAC๋ 17.9%์ ์ฑ๊ณต๋ฅ , 285์ด์ ํ๊ท ์๊ฐ, 0.42์ ํจ์จ์ฑ์ ๋ฌ์ฑํ๋ค. BC๋ 19.7%์ ์ฑ๊ณต๋ฅ , 268์ด์ ํ๊ท ์๊ฐ, 0.45์ ํจ์จ์ฑ์ ๋ณด์๋ค. DAgger๋ 24.3%์ ์ฑ๊ณต๋ฅ , 252์ด์ ํ๊ท ์๊ฐ, 0.51์ ํจ์จ์ฑ์ ๋ฌ์ฑํ๋ค. PDDL์ 29.8%์ ์ฑ๊ณต๋ฅ , 195์ด์ ํ๊ท ์๊ฐ, 0.58์ ํจ์จ์ฑ์ ๋ณด์๋ค. TAMP๋ 34.5%์ ์ฑ๊ณต๋ฅ , 178์ด์ ํ๊ท ์๊ฐ, 0.63์ ํจ์จ์ฑ์ ๋ฌ์ฑํ๋ค. Hierarchical RL์ 39.2%์ ์ฑ๊ณต๋ฅ , 165์ด์ ํ๊ท ์๊ฐ, 0.67์ ํจ์จ์ฑ์ผ๋ก ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค.
7.2 ์์ ๋ณต์ก๋๋ณ ์ฑ๋ฅ
๋จ์ ์์ ์ ๊ฒฝ์ฐ TAMP๊ฐ 65%์ ์ต๊ณ ์ฑ๊ณต๋ฅ ์ ๊ธฐ๋กํ์ผ๋ฉฐ ํ๊ท ์ฑ๊ณต๋ฅ ์ 48%์๋ค. ์ฃผ์ ์คํจ ์์ธ์ ๋ฌผ์ฒด ์ธ์ ์ค๋ฅ์๋ค. ์ค๊ฐ ๋ณต์ก๋ ์์ ์์๋ Hierarchical RL์ด 42%์ ์ต๊ณ ์ฑ๊ณต๋ฅ ์ ๋ณด์๊ณ ํ๊ท ์ฑ๊ณต๋ฅ ์ 28%์๋ค. ์ฃผ์ ์คํจ ์์ธ์ ํ์ ๋ชฉํ ๊ณํ ์ค๋ฅ์๋ค. ๋ณต์กํ ์์ ์์๋ Hierarchical RL์ด 18%์ ์ต๊ณ ์ฑ๊ณต๋ฅ ์ ๊ธฐ๋กํ์ผ๋ฉฐ ํ๊ท ์ฑ๊ณต๋ฅ ์ 12%์๋ค. ์ฃผ์ ์คํจ ์์ธ์ ์ฅ๊ธฐ ์์กด์ฑ๊ณผ ๋์ ์ค๋ฅ์๋ค. ๋งค์ฐ ๋ณต์กํ ์์ ์ ๊ฒฝ์ฐ TAMP๊ฐ 5%์ ์ต๊ณ ์ฑ๊ณต๋ฅ ์ ๋ณด์๊ณ ํ๊ท ์ฑ๊ณต๋ฅ ์ 2%์๋ค. ์ฃผ์ ์คํจ ์์ธ์ ๊ณํ ์๋ฆฝ ์คํจ์๋ค.
7.3 ์นดํ ๊ณ ๋ฆฌ๋ณ ์ฑ๋ฅ ๋ถ์
์ฒญ์ ํ๋์ ํ๊ท 32%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ฉฐ, ์ฃผ์ ๋์ ๊ณผ์ ๋ ๋จผ์ง๋ ์ผ๋ฃฉ ๋ฑ ๋ณด์ด์ง ์๋ ์ํ๋ฅผ ๊ฐ์งํ๋ ๊ฒ์ด์๋ค. ์๋ฆฌ ํ๋์ ํ๊ท 18%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ฉฐ, ์จ๋ ์ ์ด, ์๊ฐ ๊ด๋ฆฌ, ๋ณต์กํ ์์๊ฐ ์ฃผ์ ๋์ ๊ณผ์ ์๋ค. ์ ๋ฆฌ์ ๋ ํ๋์ ํ๊ท 28%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ฉฐ, ์ ์ ํ ์์น ๊ฒฐ์ ๊ณผ ๊ณต๊ฐ ์ถ๋ก ์ด ์ฃผ์ ๋์ ๊ณผ์ ์๋ค. ์ ์ง๋ณด์ ํ๋์ ํ๊ท 25%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ฉฐ, ์ ๋ฐํ ์กฐ์๊ณผ ๋๊ตฌ ์ฌ์ฉ์ด ์ฃผ์ ๋์ ๊ณผ์ ์๋ค.
7.4 ์คํจ ์ฌ๋ก ๋ถ์
์ ์ฒด ์คํจ ์ฌ๋ก ์ค 35%๋ ์ธ์ ์คํจ๋ก ์ธํ ๊ฒ์ด์๋ค. ์ฌ๊ธฐ์๋ ๊ฐ์ฒด ๊ฐ์ง ์คํจ, ๊ฐ์ฒด ์ํ ์ถ๋ก ์ค๋ฅ, ์ฅ๋ฉด ์ดํด ๋ถ์กฑ์ด ํฌํจ๋๋ค. 28%๋ ๊ณํ ์คํจ๋ก ์ธํ ๊ฒ์ด์์ผ๋ฉฐ, ๋ถ๊ฐ๋ฅํ ๊ณํ ์๋ฆฝ, ํ์ ๋ชฉํ ์์ ์ค๋ฅ, ์ ์ฝ ์กฐ๊ฑด ์๋ฐ์ด ์์ธ์ด์๋ค. 22%๋ ์คํ ์คํจ๋ก ์ธํ ๊ฒ์ด์์ผ๋ฉฐ, ๋ฌผ์ฒด ํ์ง ์คํจ, ๋ถ์ ํํ ๋ฐฐ์น, ์ถฉ๋ ๋ฐ์์ด ์์ธ์ด์๋ค. 15%๋ ์ํ ๊ด๋ฆฌ ์คํจ๋ก ์ธํ ๊ฒ์ด์์ผ๋ฉฐ, ๊ฐ์ฒด ์ํ ๋ณํ ๊ฐ์ง ์คํจ, ์๋ชป๋ ์ํ ์ ์ด ๊ฐ์ , ์ ์ ์กฐ๊ฑด ํ์ธ ๋๋ฝ์ด ์์ธ์ด์๋ค.
7.5 ํ๊ฒฝ ์ผ๋ฐํ ๋ฅ๋ ฅ
๋์ผํ ํ๊ฒฝ์์ ๊ฐ์ฒด ๋ฐฐ์น๋ง ๋ณ๊ฒฝํ ๊ฒฝ์ฐ ํ๊ท 15%์ ์ฑ๋ฅ ํ๋ฝ์ด ์์์ผ๋ฉฐ, ํ์ต ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ด ๋ ํฐ ์ํฅ์ ๋ฐ์๋ค. ์์ ํ ์๋ก์ด ํ๊ฒฝ์์๋ ํ๊ท 35%์ ์ฑ๋ฅ ํ๋ฝ์ด ์์์ผ๋ฉฐ, ๊ณํ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ด ์๋์ ์ผ๋ก ๊ฐ๊ฑดํ๋ค. ์๋ก์ด ๊ฐ์ฒด ์ธ์คํด์ค๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ ํ๊ท 20%์ ์ฑ๋ฅ ํ๋ฝ์ด ์์์ผ๋ฉฐ, ์๊ฐ์ ๋ณํ์ ๋ฏผ๊ฐํ ๋ชจ์ต์ ๋ณด์๋ค.
8. ์ฃผ์ ๋ฐ๊ฒฌ ๋ฐ ํต์ฐฐ
8.1 ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์ ์ค์์ฑ
์ ํํ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์ด ํ์์ ์ด๋ผ๋ ๊ฒ์ด ๋ฐํ์ก๋ค. ๋นํ์ค์ ์ธ ๋ฌผ๋ฆฌ๋ ํ์ต๋ ์ ์ฑ ์ด ์ค์ ํ๊ฒฝ์ผ๋ก ์ ์ด๋์ง ๋ชปํ๊ฒ ๋ง๋ ๋ค. ํนํ ์ ์ด ์ญํ์ ์ ํ๋๊ฐ ๋งค์ฐ ์ค์ํ๋ฉฐ, ๋ง์ฐฐ, ์ค๋ ฅ, ๊ด์ฑ์ด ํ๋ ์ ํ์ ํฐ ์ํฅ์ ๋ฏธ์น๋ค. ๊ทธ๋ฌ๋ ์๋ฎฌ๋ ์ด์ ๊ณผ ํ์ค ์ฌ์ด์ ๊ฒฉ์ฐจ๋ ์ฌ์ ํ ์กด์ฌํ๋ค. ๋๋ฉ์ธ ๋๋คํ๋ฅผ ํตํด ์ด๋ฅผ ์ผ๋ถ ์ํํ ์ ์์ง๋ง, ๋ ์ ๋ฐํ ๋ฌผ๋ฆฌ ๋ชจ๋ธ์ด ํ์ํ๋ค.
8.2 ๊ฐ์ฒด ์ํ ์ถ๋ก ์ ์ด๋ ค์
์จ๋๋ ์ฒญ๊ฒฐ๋์ ๊ฐ์ด ์๊ฐ์ ์ผ๋ก ๋ช ํํ์ง ์์ ์ํ๋ฅผ ์ถ๋ก ํ๋ ๊ฒ์ด ๋งค์ฐ ์ด๋ ต๋ค๋ ๊ฒ์ด ํ์ธ๋์๋ค. ์ด๋ฌํ ๋ณด์ด์ง ์๋ ์ํ๋ฅผ ํ์ ํ๊ธฐ ์ํด์๋ ๋ค์ค ๋ชจ๋ฌ ์ผ์ฑ์ด ํ์ํ๋ฉฐ, ์ถ๋ก ๋ฅ๋ ฅ์ด ์๊ตฌ๋๋ค. ๋ํ ์๊ฐ์ ๋ฐ๋ฅธ ์ํ ๋ณํ๋ฅผ ์ถ์ ํ๊ณ , ์ธ๊ณผ ๊ด๊ณ๋ฅผ ์ดํดํ๋ฉฐ, ์ํ๋ฅผ ์์ธกํ๋ ๋ฅ๋ ฅ์ด ํ์ํ๋ค.
8.3 ์ฅ๊ธฐ ๊ณํ์ ํ์์ฑ
๋ณต์กํ ์์ ์ ์ํํ๊ธฐ ์ํด์๋ ๊ณํ์ด ํ์์ ์ด๋ค. ๋จ์ ๋ฐ์ํ ์ ์ฑ ๋ง์ผ๋ก๋ ๋ถ์ถฉ๋ถํ๋ฉฐ, ์ฌ๋ฌ ๋จ๊ณ์ ํ์ ๋ชฉํ๋ฅผ ์ค์ ํ ์ ์์ด์ผ ํ๋ค. ๊ณ์ธต์ ์ถ์ํ๊ฐ ์ค์ํ๋ค. ๋ํ ์คํ ์ค์ ์ฌ๊ณํ์ด ํ์ํ๊ณ , ์์์น ๋ชปํ ์ํฉ์ ๋์ํ ์ ์์ด์ผ ํ๋ฉฐ, ์ ์ฐํ ๊ณํ ์กฐ์ ์ด ๊ฐ๋ฅํด์ผ ํ๋ค.
8.4 ๋ฉํฐ๋ชจ๋ฌ ํ์ต์ ์ค์์ฑ
์์ฐ์ด ๋ช ๋ น์ ์ดํดํ๊ณ ์๊ฐ ์ ๋ณด์ ์ธ์ด ์ ๋ณด๋ฅผ ๊ฒฐํฉํ๋ฉฐ ์์ ์ง์์ ํ์ฉํ๋ ์๊ฐ-์ธ์ด ํตํฉ์ด ์ค์ํ๋ค. ๋ํ ๋ฌผ์ฒด ์กฐ์ ์ ์ด๊ฐ ํผ๋๋ฐฑ์ด ์ค์ํ๋ฉฐ, ํ ์ ์ด๊ฐ ํ์ํ๊ณ , ์์ ํ ์ํธ์์ฉ์ ๋ณด์ฅํด์ผ ํ๋ ์๊ฐ-์ด๊ฐ ํตํฉ๋ ํ์ํ๋ค.
8.5 ์ผ๋ฐํ ๋ฅ๋ ฅ์ ํ๊ณ
ํ๋ จ ํ๊ฒฝ์ ํนํ๋์ด ์๋ก์ด ์ํฉ์ ์ทจ์ฝํ ๊ณผ์ ํฉ ๋ฌธ์ ๊ฐ ๋ฐ๊ฒฌ๋์๋ค. ๋ ๋ค์ํ ํ๋ จ ๋ฐ์ดํฐ๊ฐ ํ์ํ๋ค. ๋ํ ์์ ๊ฐ ์ ์ด์ ํ๊ฒฝ ๊ฐ ์ ์ด๊ฐ ์ ํ์ ์ด๋ฉฐ, ๋ฉํ ํ์ต ์ ๊ทผ์ด ํ์ํ๋ค๋ ๊ฒ์ด ๋ฐํ์ก๋ค.
9.1 ํ์ฌ์ ํ๊ณ์
์๋ฎฌ๋ ์ด์ ์ธก๋ฉด์์๋ ์ผ๋ถ ๋ฌผ๋ฆฌ ํ์์ด ๊ทผ์ฌํ๋์ด ์๊ณ , ๋ณํ ๊ฐ๋ฅํ ๊ฐ์ฒด์ ๋ํ ์ง์์ด ์ ํ์ ์ด๋ฉฐ, ์ ์ฒด ์๋ฎฌ๋ ์ด์ ์ด ๋ณต์กํ๋ค๋ ํ๊ณ๊ฐ ์๋ค. ์์ ๋ฒ์ ์ธก๋ฉด์์๋ ์ค๋ด ํ๋์๋ง ์ง์ค๋์ด ์๊ณ , ๋ณต์กํ ์ฌํ์ ์ํธ์์ฉ์ด ๋ถ์ฌํ๋ฉฐ, ์ฐฝ์์ ์์ ์ด ๋ถ์กฑํ๋ค. ํ๊ฐ ๋ฉํธ๋ฆญ ์ธก๋ฉด์์๋ ์ ์ฑ์ ํ์ง ํ๊ฐ๊ฐ ์ด๋ ต๊ณ , ๋ถ๋ถ ์ฑ๊ณต์ ์ ์ํ๊ฐ ๋ฌธ์ ์ด๋ฉฐ, ์์ ์ฑ ์ ๋ํ์ ํ๊ณ๊ฐ ์๋ค. ๊ณ์ฐ ๋น์ฉ ์ธก๋ฉด์์๋ ๊ณ ์ ๋ฐ ์๋ฎฌ๋ ์ด์ ์ ๋น์ฉ์ด ๋๊ณ , ๋๊ท๋ชจ ํ์ต์ ๋ง์ ์์์ด ํ์ํ๋ฉฐ, ์ค์๊ฐ ์คํ์ด ์ด๋ ต๋ค.
9.2 ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
๋ ๋ค์ํ ํ๋์ ์ํด์๋ ์ค์ธ ํ๋์ ์ถ๊ฐํ๊ณ , ์ฌํ์ ์ํธ์์ฉ์ ํฌํจํ๋ฉฐ, ์ฐฝ์์ ์์ ์ ํ์ฅํ๊ณ , ์ ์๊ฐ์์ ์ ์ผ์ ๊ฑธ์น ์ฅ๊ธฐ ์์ ์ ๋ค๋ฃจ์ด์ผ ํ๋ค. ๊ฐ์ ๋ ์๋ฎฌ๋ ์ด์ ์ ์ํด์๋ ๋ ์ ํํ ๋ฌผ๋ฆฌ ์์ง์ด ํ์ํ๊ณ , ๋ณํ ๊ฐ๋ฅํ ๊ฐ์ฒด ์ง์์ ๊ฐํํด์ผ ํ๋ฉฐ, ๋ณต์กํ ์ ์ฒด ์๋ฎฌ๋ ์ด์ ์ ๊ตฌํํ๊ณ , ์ฌ๋ฃ ์์ฑ์ ๋ค์ํํด์ผ ํ๋ค.
๋ฉํฐ๋ชจ๋ฌ ํ์ต์ ์ํด์๋ ์๊ฐ-์ธ์ด-ํ๋์ ํตํฉํ๊ณ , ์์ ์ถ๋ก ์ ํตํฉํ๋ฉฐ, ๋๊ท๋ชจ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ํ์ฉํ๊ณ , ์ธ๊ฐ ์์ฐ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด์ผ ํ๋ค. Sim-to-Real ์ ์ด๋ฅผ ์ํด์๋ ๋๋ฉ์ธ ๋๋คํ ๊ธฐ๋ฒ์ ๊ฐ์ ํ๊ณ , ๋๋ฉ์ธ ์ ์ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๋ฉฐ, ์ค์ ๋ก๋ด ํ๋ซํผ์์ ๊ฒ์ฆํ๊ณ , ์๋ฎฌ๋ ์ด์ -ํ์ค ๊ฒฉ์ฐจ๋ฅผ ์ถ์ํด์ผ ํ๋ค.
ํจ์จ์ ํ์ต์ ์ํด์๋ ์ํ ํจ์จ์ฑ์ ๊ฐ์ ํ๊ณ , ์ ์ด ํ์ต ๋ฐ ๋ฉํ ํ์ต์ ํ์ฉํ๋ฉฐ, ์คํ๋ผ์ธ ๊ฐํํ์ต์ ์ ์ฉํ๊ณ , ์๊ธฐ ์ง๋ ํ์ต์ ์ฌ์ฉํด์ผ ํ๋ค. ์ธ๊ฐ-๋ก๋ด ํ์ ์ ์ํด์๋ ๊ณต๋ ์์ ์ ์ํํ๊ณ , ์์ฐ์ด๋ก ์ํธ์์ฉํ๋ฉฐ, ์๋๋ฅผ ์ดํดํ๊ณ ์์ธกํ๋ฉฐ, ์ ์์ ์ผ๋ก ํ๋์ ์กฐ์ ํด์ผ ํ๋ค.
์ค๋ช ๊ฐ๋ฅ์ฑ์ ์ํด์๋ ์์ฌ๊ฒฐ์ ๊ณผ์ ์ ํฌ๋ช ํ๊ฒ ํ๊ณ , ์คํจ ์์ธ์ ๋ถ์ํ๋ฉฐ, ์ฌ์ฉ์ ์ ๋ขฐ๋ฅผ ๊ตฌ์ถํด์ผ ํ๋ค. ์์ ์ฑ ๋ฐ ์ ๋ขฐ์ฑ์ ์ํด์๋ ์์ ์ ์ฝ ์กฐ๊ฑด์ ํ์ตํ๊ณ , ์์ธก ๊ฐ๋ฅํ ํ๋์ ๋ณด์ฅํ๋ฉฐ, ์ค๋ฅ ๋ณต๊ตฌ ๋ฉ์ปค๋์ฆ์ ๊ฐ์ถ๊ณ , ๊ฒฌ๊ณ ์ฑ์ ๊ฒ์ฆํด์ผ ํ๋ค.
์ฅ๊ธฐ์ ์ผ๋ก๋ ์์ ์์จ ๊ฐ์ ๋ก๋ด์ ๊ฐ๋ฐํ์ฌ ์ธ๊ฐ ์์ค์ ์ผ์ ์์ ์ ์ํํ๊ณ , ์๋ก์ด ์์ ์ ๋น ๋ฅด๊ฒ ์ ์ํ๋ฉฐ, ์์ฐ์ค๋ฌ์ด ์ธ๊ฐ๊ณผ์ ์ํธ์์ฉ์ ๊ตฌํํด์ผ ํ๋ค. ๊ฐ์ธํ๋ AI ์ด์์คํดํธ๋ ์ฌ์ฉ์ ์ ํธ๋๋ฅผ ํ์ตํ๊ณ , ๋งฅ๋ฝ์ ์ธ์ํ์ฌ ์ง์ํ๋ฉฐ, ์์ธก์ ์ผ๋ก ๋์์ ์ ๊ณตํด์ผ ํ๋ค. ๋ฒ์ฉ Embodied AI๋ ๋ค์ํ ํ๊ฒฝ์์ ์๋ํ๊ณ , ๊ด๋ฒ์ํ ์์ ์ ์ํํ๋ฉฐ, ์ง์์ ์ผ๋ก ํ์ตํ๊ณ ๊ฐ์ ๋์ด์ผ ํ๋ค.
10. ๊ฒฐ๋ก
10.1 ์ฃผ์ ๊ธฐ์ฌ
BEHAVIOR-1K๋ Embodied AI ์ฐ๊ตฌ์ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ์ข ํฉ์ ์ธ ๋ฒค์น๋งํฌ๋ก์ 1,000๊ฐ์ ๋ค์ํ ์ผ์ ํ๋, 50๊ฐ์ ํ์ค์ ์ธ ๊ฐ์ ํ๊ฒฝ, ์ฒด๊ณ์ ์ธ ํ๊ฐ ํ๋ ์์ํฌ, ํ์คํ๋ ๋ฉํธ๋ฆญ์ ์ ๊ณตํ๋ค. ํ์ค์ ์ธ ์๋ฎฌ๋ ์ด์ ์ ํตํด ๊ณ ์ ๋ฐ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ , ์ฌ์ค์ ์ธ ๋ ๋๋ง, ๋ณต์กํ ๊ฐ์ฒด ์ํ ์ถ์ , ๋ค์ํ ์ผ์ ๋ชจ๋ธ๋ง์ ๊ตฌํํ๋ค. ์ฐ๊ตฌ ๊ธฐ๋ฐ์ ์ ๊ณตํจ์ผ๋ก์จ ์คํ์์ค ๋๊ตฌ ๋ฐ ๋ฐ์ดํฐ, ์ปค๋ฎค๋ํฐ ๋ฒค์น๋งํฌ, ์ฌํ ๊ฐ๋ฅํ ์คํ, ํ์ ํ๋ซํผ์ ์ ๊ณตํ๋ค. ์ค์ฉ์ ๊ฐ์น ์ธก๋ฉด์์๋ ์ค์ ์์ฉ์ ๋ฐ์ํ ์์ , ํ์ค์ ์ธ ๋์ ๊ณผ์ , ์ฐ์ ๊ณ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ์ ์ํ๋ค.
10.2 ์ํฅ ๋ฐ ์ ๋ง
BEHAVIOR-1K๋ ์ฐ๊ตฌ๋ฅผ ๊ฐ์ํํ์ฌ ํ์คํ๋ ํ๊ฐ๋ก ์ฐ๊ตฌ ๋น๊ต๋ฅผ ์ฉ์ดํ๊ฒ ํ๊ณ , ์๋ก์ด ๋ฐฉ๋ฒ๋ก ๊ฐ๋ฐ์ ์ด์งํ๋ฉฐ, ํ์ ์ฐ๊ตฌ๋ฅผ ํ์ฑํํ๋ค. ์ค์ฉ์ฑ์ ๊ฐ์กฐํ์ฌ ์ค์ ์์ฉ ๊ฐ๋ฅํ ์์ ์ ์ด์ ์ ๋ง์ถ๊ณ , ์ฐ์ ๊ณ์ ๊ด์ฌ์ ์ฆ๋์ํค๋ฉฐ, ์์ฉํ ๊ฐ๋ฅ์ฑ์ ํ์ํ๋ค. ์ปค๋ฎค๋ํฐ๋ฅผ ๊ตฌ์ถํ์ฌ ๊ณตํต ํ๋ซํผ์ ํตํ ํ์ ์ ์ด์งํ๊ณ , ์ง์์ ๊ณต์ ๋ฐ ์ถ์ ํ๋ฉฐ, ์ฐจ์ธ๋ ์ฐ๊ตฌ์๋ฅผ ๊ต์กํ๋ค.
BEHAVIOR-1K๋ ๊ฐ์ ์ฉ ๋ก๋ด๊ณผ Embodied AI์ ๋ฐ์ ์ ์ค์ํ ์ด์ ํ๊ฐ ๋ ๊ฒ์ด๋ค. ์ด ๋ฒค์น๋งํฌ๋ฅผ ํตํด ์ฐ๊ตฌ์๋ค์ ์ค์ฉ์ ์ด๊ณ ๊ฐ๊ฑดํ AI ์์ด์ ํธ๋ฅผ ๊ฐ๋ฐํ ์ ์์ผ๋ฉฐ, ์ฐ์ ๊ณ๋ ์์ฉ ์ ํ ๊ฐ๋ฐ์ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ ๋ง๋ จํ ์ ์๊ณ , ์ฌํ๋ ์ผ์ ์ํ์ ๋๋ ๋ก๋ด์ ํํ์ ๋๋ฆด ์ ์๋ค.
10.3 ์ต์ข ์๊ฒฌ
BEHAVIOR-1K๋ ๋จ์ํ ๋ฒค์น๋งํฌ๋ฅผ ๋์ด, Embodied AI ์ฐ๊ตฌ์ ํจ๋ฌ๋ค์์ ์ ์ํ๋ค. ์ค์ ์ธ๊ณ์ ๋ณต์ก์ฑ์ ํฌ์ฉํ๊ณ , ์ค์ฉ์ ์ธ ์์ฉ์ ์งํฅํ๋ฉฐ, ์ปค๋ฎค๋ํฐ์ ํ๋ ฅ์ ์ด์งํ๋ ์ด ๋ฒค์น๋งํฌ๋ ์ธ๊ฐ์ ๋๋ ์ง๋ฅํ ๋ก๋ด ์คํ์ ํ ๊ฑธ์ ๋ ๊ฐ๊น์ด ๋ค๊ฐ๊ฐ๊ฒ ํ๋ค.
ํฅํ ๋ ๋ง์ ์ฐ๊ตฌ์๋ค์ด ์ด ํ๋ซํผ์ ํ์ฉํ์ฌ ํ์ ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๊ณ , ๋ ๋์ ์๋ฎฌ๋ ์ด์ ๊ธฐ์ ์ ๊ตฌ์ถํ๋ฉฐ, ๊ถ๊ทน์ ์ผ๋ก๋ ์ฐ๋ฆฌ์ ์ผ์ ์ํ์ ์ค์ง์ ์ผ๋ก ๊ฐ์ ํ ์ ์๋ ๋ก๋ด ์์คํ ์ ๋ง๋ค์ด๋ผ ๊ฒ์ผ๋ก ๊ธฐ๋ํ๋ค.
ํ๋ก์ ํธ ์น์ฌ์ดํธ๋ https://behavior.stanford.edu์์ ์ ๊ทผํ ์ ์์ผ๋ฉฐ, ์ฝ๋ ์ ์ฅ์๋ https://github.com/StanfordVL/behavior์ ์๋ค. ๋ฐ์ดํฐ์ ์ https://behavior.stanford.edu/omnigibson์์ ๋ค์ด๋ก๋ํ ์ ์๊ณ , ๋ฌธ์๋ https://behavior.stanford.edu/docs์์ ํ์ธํ ์ ์๋ค. ๋ ผ๋ฌธ์ https://arxiv.org/abs/2403.09227์์ ์ด๋ํ ์ ์๋ค.
โ๏ธ Dig Review
โ๏ธ Dig โ Go deep, uncover the layers. Dive into technical detail.
BEHAVIOR-1K: 1,000๊ฐ ์ผ์ ํ๋๊ณผ ํ์ค์ ์๋ฎฌ๋ ์ด์ ์ ๊ฐ์ถ ์ธ๊ฐ ์ค์ฌ Embodied AI ๋ฒค์น๋งํฌ โ ์ฌ์ธต ๋ฆฌ๋ทฐ
0) ํ๋์ ๋ณด๊ธฐ (TL;DR)
- ๋ฌด์? BEHAVIOR-1K๋ โ์ฌ๋๋ค์ด ๋ก๋ด์๊ฒ ์ ๋ง๋ก ๋งก๊ธฐ๊ณ ์ถ์ ์ผโ์ ์ถ๋ฐ์ ์ผ๋ก ์ค๊ณ๋ 1,000๊ฐ ์ผ์ ํ๋ ๋ฒค์น๋งํฌ์ OmniGibson ์๋ฎฌ๋ ์ดํฐ๋ก ๊ตฌ์ฑ๋ ๋๊ท๋ชจ ํ๋ซํผ์ ๋๋ค. 50๊ฐ ์ฅ๋ฉด, 9์ฒ+ ๊ฐ์ฒด, ํ๋ถํ ๋ฌผ๋ฆฌยท์๋ฏธ ์์ฑ, ๋ณํ์ฒด/์ ์ฒด๊น์ง ๋ชจ๋ธ๋งํฉ๋๋ค.
- ์ ์ค์ํ๊ฐ? ๊ธฐ์กด ๋ฒค์น๋งํฌ๊ฐ ๋ค๋ฃจ๊ธฐ ์ด๋ ค์ ๋ ์ฅ๊ธฐ(Time-extended) ๋ชจ๋ฐ์ผ ๋งค๋ํฐ๋ ์ด์ ์ ํ์ค๊ฐ ๋๊ฒ ๋ชจ์ฌํ์ฌ, ์ค์ ๋ก๋ด ์๋น์ค๋ก ์ด์ด์ง๋ ์ฐ๊ตฌ๋ฅผ ์ด์งํฉ๋๋ค.
- ํต์ฌ ๋์ ? End-to-end ๋น์ ์ ์ฑ ์ ๊ฑฐ์ ์คํจํ๊ณ , ๊ณ ์์ค ํ๋ฆฌ๋ฏธํฐ๋ธ + ๋ฉ๋ชจ๋ฆฌ๊ฐ ์ผ๋ถ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ์ง๋ง, sim-to-real ์ ์ด๋ ์ฌ์ ํ ํฐ ๊ฒฉ์ฐจ๊ฐ ๋จ์ ์์ต๋๋ค.
1) ๋ฌธ์ ์์๊ณผ ๊ธฐ์ฌ
๋ก๋ดํ์ต์ ๋ง์ ๊ณผ์ ๋ ์ฐ๊ตฌ์๊ฐ ์ ์ํ ์ข์ ๋ฒ์ฃผ์ ํ์คํฌ์ ํธํฅ๋์ด ์์ต๋๋ค. BEHAVIOR-1K๋ ๋์ค ์ค๋ฌธ์ ํตํด โ๋ก๋ด์๊ฒ ๋ถํํ๊ณ ์ถ์ ํ๋โ์ ์์งํ๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ํ์ค์ ยท๋ค์ํ ๊ณผ์ ๊ตฐ(1,000๊ฐ)์ ๊ตฌ์ถํ์ต๋๋ค. ์ด๋ฅผ ์คํํ๋ ์๋ก์ด ์๋ฎฌ๋ ์ดํฐ OmniGibson์ PhysX/Omniverse ๊ธฐ๋ฐ์ ๊ณ ์ถฉ์ค ๋ฌผ๋ฆฌยท๋ ๋๋ง์ผ๋ก ๊ฒฝ์ง์ฒด, ์ฐ์ฑ์ฒด(์ฒ/์ข ์ด/์ท๊ฐ), ์ ์ฒด ์ํธ์์ฉ๊น์ง ์ง์ํฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก, ์ฌ๋ ์ค์ฌ์ ๋ค์์ฑ + ํ์ค์ ๋ฌผ๋ฆฌ๋ผ๋ ๋ ์ถ์ ๋ชจ๋ ํ์ฅํ ์ ์ด ๊ฐ์ฅ ํฐ ๊ธฐ์ฌ์ ๋๋ค.
2) ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ ๊ตฌํ ๋ฐฉ์: OmniGibson
2.1 ๋ฌผ๋ฆฌ ๋ฐ ๊ทธ๋ํฝ์ค ๋ฐฑ์๋
- ์์ง/ํ๋ซํผ: NVIDIA Omniverse + PhysX(5.x ๊ณ์ด) ๊ธฐ๋ฐ. ๊ฒฝ์ง์ฒด์ ์ถฉ๋/๋ง์ฐฐ/๊ด์ , ์ฐ์ฑ์ฒด(Cloth), ์ ์ฒด ํ๋ฆ, ํฌ๋ช ยท๋ฐ์ฌ ์ฌ์ง ๋ฑ ๊ณ ๊ธ ํจ๊ณผ๋ฅผ ์ง์ํฉ๋๋ค. ์ด๋ ๊ฐ์ฌยท์ ๋ฆฌยท์๋ฆฌ ๋ฑ ์ํ ๋ฐ์ฐฉํ ๊ณผ์ ๋ฅผ ์๋ฎฌ๋ ์ด์ ํ๊ธฐ ์ํ ์ ์ ์กฐ๊ฑด์ ๋๋ค.
- ์๊ฐ ์ถฉ์ค๋: ๋ ์ด ํธ๋ ์ด์ฑ ๊ธฐ๋ฐ์ ์ฌ์ค์ ์กฐ๋ช /์ฌ์ง ํํ์ผ๋ก, ์ผ์ฑ-์ค์ฌ ์ ์ฑ ํ์ต(์: RGB-D)์์ ๋๋ฉ์ธ ์ฐจ์ด๋ฅผ ์ค์ด๋ ํจ๊ณผ๊ฐ ๊ธฐ๋๋ฉ๋๋ค.
2.2 ๊ฐ์ฒด-์ค์ฌ ์ํ์ ๋ ผ๋ฆฌ์ ์์ ์ ์ฐ๊ฒฐ
OmniGibson์ ๊ฐ์ฒด ์ํ(object states)๋ฅผ ์ผ๊ธ ๊ฐ๋ ์ผ๋ก ๋ค๋ฃน๋๋ค. ์: ์จ๋(temperature), ์ ์(wetness), ์ฒญ๊ฒฐ(cleanliness), ํ ๊ธ on/off, ์ฌ๋ผ์ด์ค(sliced) ๋ฑ. ์ด๋ฌํ ์ฐ์/์ด์ฐ ์์ฑ์ ๋ ผ๋ฆฌ ์ ์ด(predicate)๋ก ๋งคํ๋์ด โ์ต์๋ค(cooked)โ, โ์์ ์๋ค(inside)โ ๋ฑ ๊ณผ์ ์ ๋ชฉํ ์กฐ๊ฑด์ ๊ธฐ๊ณ์ ์ผ๋ก ํ์ ํฉ๋๋ค. ์ด ์ฌ์์ iGibson 2.0์์ ๋์ ๋์๊ณ OmniGibson์์ ํ์ธต ํ์ฅ๋์์ต๋๋ค.
- ๋ ผ๋ฆฌ-๋ฌผ๋ฆฌ ๋งคํ ์์ \texttt{Cooked}(x) ;\Longleftrightarrow; T_x \ge T_\mathrm{cook} ์ฌ๊ธฐ์ T_x๋ ๊ฐ์ฒด x์ ์จ๋, T_\mathrm{cook}์ ์กฐ๋ฆฌ ํ์ ์๊ณ๊ฐ์ ๋๋ค(์๋ฎฌ๋ ์ดํฐ๊ฐ ์ฐ์์ํ๋ฅผ ์ถ์ ).
2.3 ์ฅ๋ฉด ์ํ๋งยท๋๋คํยท๋ฐ๋ชจ ์์ง
- ์ํ๋ง: โ์ด๊ธฐ/๋ชฉํ ๋ ผ๋ฆฌ ์กฐ๊ฑด์ ๋ง์กฑํ๋โ ๋ฌผ๋ฆฌ ๋ฐฐ์น๋ฅผ ์๋ ์ํ๋งํด ๋ฌดํ๋์ ๊ฐ๊น์ด ์ํผ์๋๋ฅผ ์์ฑํฉ๋๋ค(์: ๋๋์ํ์ด ๋์ฅ๊ณ ์์ ์๊ณ , ์ค๋ธ์ ๊บผ์ ธ ์์).
- ๋๋ฉ์ธ ๋๋คํ: ๋ฐฐ์น/์ฌ์ง/์กฐ๋ช ๋ฑ ๋ณํ๋ฅผ ํตํด ๊ฐ์ธํ ์ ์ฑ ์ ํ์ตํฉ๋๋ค. ์๋ฎฌ๋ ์ด์ -ํ์ค ์๊ฐ ๊ฒฉ์ฐจ๋ฅผ ์ค์ด๋ ์ ํ์ ์ ๊ทผ์ ๋๋ค.
- VR/ํ ๋ ์คํผ๋ ์ด์ : iGibson 2.0์์์ VR ์ธํฐํ์ด์ค ์ ํต์ ์๋ ๋ฐ๋ชจ ์์ง ํ์ดํ๋ผ์ธ์ด ์ ๊ณต๋ฉ๋๋ค(์ธ๊ฐ-์๋ฒ โ IL/IRM ๋ฑ).
์์ฝ: OmniGibson์ โ๋ฌผ๋ฆฌ(์ฐ์ฑ/์ ์ฒด/๊ด์ ) + ๋ ผ๋ฆฌ ์ํ + ์๋ ์ธ์คํด์คํ + ๋ฐ๋ชจ์์งโ์ ํตํฉํ ํ์ค๊ฐยท์์ฐ์ฑยทํ์ฅ์ฑ ์ผ๋ฐ์๋ฅผ ๊ตฌํํฉ๋๋ค.
3) ํ๋ ๋ถ๋ฅ ์ฒด๊ณ์ BDDL
3.1 ์ธ๊ฐ ์ค์ฌ ํ๋ ์ ์
1,461๋ช ๊ท๋ชจ์ ์ค๋ฌธ์ผ๋ก โ๋ก๋ด์๊ฒ ๋ฐ๋ผ๋ ์ผโ์ ์์ง, ์์ 1,000๊ฐ๋ฅผ ํ๋(activity)์ผ๋ก ์ฑํํ์ต๋๋ค. ์งยท์ ์ยท์๋นยท์ฌ๋ฌด์ค ๋ฑ 50๊ฐ ์ฅ๋ฉด, 9์ฒ+ ๊ฐ์ฒด์ ๊ฒฐํฉํ์ฌ ํ๋ถํ ๊ณผ์ ์ธ์คํด์ค๋ฅผ ์์ฑํฉ๋๋ค.
3.2 BDDL: Behavior Domain Definition Language
BDDL์ ์ด๊ธฐ ์ํ S_{\tau,0}์ ๋ชฉํ ์ํ S_{\tau,g}๋ฅผ ๋
ผ๋ฆฌ ์ ์ด๋ค์ ์งํฉ์ผ๋ก ๊ธฐ์ ํ๋ ๋๋ฉ์ธ ์ ์ฉ ์์ ์ธ์ด์
๋๋ค. ํ๋ \tau๋ ์๋์ฒ๋ผ ์ ์๋ฉ๋๋ค.
\tau \equiv {S_{\tau,0},, S_{\tau,g}}, \quad
S_{\tau,\cdot} = { \text{predicates over objects / states}}
์: Forall(o \in decorations) Inside(o, cabinet) โ โ๋ชจ๋ ์ฅ์๋ฌผ์ด ์บ๋น๋ ์์ ์๋ค.โ ์ด๋ ๊ฒ ์ ์ํ๋ฉด ํ๊ฒฝ/๋ฐฐ์น๊ฐ ๋ฌ๋ผ๋ ๋
ผ๋ฆฌ ์กฐ๊ฑด๋ง ๋ง์กฑํ๋ฉด ์ฑ๊ณต์ผ๋ก ํ์ ํ ์ ์์ต๋๋ค.
์์: ์ฐ๊ตฌ์ ์์์ ์คํฌ๋ฆฝํ ์์ด ํ๋ ์ ์ โ ๋ฌดํ ์ธ์คํด์ค ์์ฑ โ ์๋ ํ๊ฐ๊ฐ ๊ฐ๋ฅํด์ง๋๋ค. ์ด๋ โํ๋ ์ผ๋ฐํโ๋ฅผ ๊ฐ์ํฉ๋๋ค.
4) ํ๊ฐ ๋ฉํธ๋ฆญ ์ค๊ณ
4.1 ์ฑ๊ณต ๊ธฐ์ค(Goal Satisfaction)
์ฑ๊ณต์ BDDL ๋ชฉํ ์กฐ๊ฑด ์ถฉ์กฑ ์ฌ๋ถ๋ก ์ด์ง ํ์ ํฉ๋๋ค. ํ์ต์์๋ ์๋์ ์ผ๋ก ๋ณด์์ ๋จ์ํ(์คํ์ค ๋ฆฌ์๋)ํ์ฌ ๋ชฉํ ์ค์ฌ ํ์ต์ ์ ๋ํฉ๋๋ค.
4.2 ํจ์จ์ฑยทํ์ง ์งํ
์ค์ฌ์ฉ ๋ก๋ด ๊ด์ ์์ ์ฑ๊ณต๋ฅ ๋ง์ผ๋ก๋ ๋ถ์กฑํฉ๋๋ค. BEHAVIOR ๊ณ์ด์ ๋ค์์ ํจ์จ์ฑ/ํ์ง ์งํ๋ฅผ ํจ๊ป ์ธก์ ํฉ๋๋ค.
- ์ด๋ ๊ฑฐ๋ฆฌ D_\text{nav}: ์ด ์ฃผํ ๊ฑฐ๋ฆฌ(์งง์์๋ก ํจ์จ).
- ์์ ์๊ฐ/์คํ T: ์๋ฃ๊น์ง ์๊ฐ ๋๋ ๋จ๊ณ ์(๋น ๋ฅผ์๋ก ํจ์จ).
- ํ๊ฒฝ ๊ต๋ D_\text{kin}: ์๋ฌด์ ๋ฌด๊ดํ๊ฒ ์์ง์ธ ํ ๊ฐ์ฒด๋ค์ ์ด ์ด๋๋(์์์๋ก ์ ๋๋ ์ํ). ์ด๋ค์ ๊ฒฝ๋ก ์ต์ ์ฑ/์๋/์ ๋ฆฌ ํ์ง์ ์์นํํด ์ค์ ์๋น์ค ์ ํฉ์ฑ์ ํ๊ฐํ๊ฒ ํด์ค๋๋ค.
์ข ํฉ ์ ์ Q(์ฐธ๊ณ ์น)๋ฅผ ๋ณํ ๋ณด๊ณ ํ๊ธฐ๋ ํ๋, ์ฐ๊ตฌ ๋ณด๊ณ ์์๋ ๊ฐ๋ณ ์งํ์ ํด์๋ ฅ์ด ๋ ํฌ๋ค๊ณ ๋ ผ์ํฉ๋๋ค.
5) ๋ฒ ์ด์ค๋ผ์ธ๊ณผ ๊ด์ฐฐ: ์ ์ด๋ ค์ด๊ฐ?
5.1 End-to-End vs. ํ๋ฆฌ๋ฏธํฐ๋ธ ๊ธฐ๋ฐ
- End-to-End ๋น์ โ์ก์ ์ ์ฑ ์ ๋ค์ ๊ณผ์ ์์ ์คํจ.
- ํ๋ ํ๋ฆฌ๋ฏธํฐ๋ธ(์: pick/place/์ด๊ธฐ/๋ซ๊ธฐ)๋ฅผ ์ฌ์ฉํ ๊ณ์ธตํ ์ ์ฑ ์ ์ผ๋ถ ๊ณผ์ ์์ ์ ์๋ฏธํ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑ.
- ๋ฉ๋ชจ๋ฆฌ(ํ์คํ ๋ฆฌ) ์ถ๊ฐ ์ ์ด๋ ๊ฒฝ๋ก ๋จ์ถยท๋ถํ์ ํ๋ ๊ฐ์ ๋ฑ ํจ์จ์ฑ ์งํ ๊ฐ์ . ํต์ฌ์ ์ฅ๊ธฐ ๊ณํ + ๋ค๋จ๊ณ ์กฐ์์ด๋ผ๋ ๊ตฌ์กฐ์ ๋์ ์ ์ถ์ ์ก์ ๊ณผ ๊ธฐ์ต์ผ๋ก ์ํํด์ผ ํ๋ค๋ ์ ์ ๋๋ค.
5.2 ํ์ง(grasping)์ ํ์ค์ฑ
ํ๋ จ ์ค ๋ณด์กฐ ๊ทธ๋ฆฌํผ(Sticky-Mitten)๋ฅผ ์ฐ๋ฉด ์๋ฎฌ๋ ์ด์ ์ฑ๋ฅ์ด ๋์ง๋ง, ์ด๋ฅผ ์ ๊ฑฐํ๊ณ ์์ ๋ฌผ๋ฆฌ ๊ทธ๋ฆฌํ์ผ๋ก ํ๊ฐํ๋ฉด ๊ธ๋ฝํฉ๋๋ค. ํ์ง๋ ์ฌ์ ํ ๋ณ๋ชฉ ๋์ ์ด๋ฉฐ, ๋ฐ์ดํฐยท์ผ์ํจ์ ยท์ ์ด๊ณํ์ ๊ฐ์ ์ด ํ์ํฉ๋๋ค.
6) Sim-to-Real: ์ค์ ๋ก๋ด ์ ์ฉ ๊ฐ๋ฅ์ฑ
6.1 ์คํ ๊ฐ์
- ์ค์ ๋ชจ๋ฐ์ผ ๋งค๋ํฐ๋ ์ดํฐ(Tiago) + ์ํํธ ๋์งํธ ํธ์ ๊ตฌ์ถ โ OmniGibson ํ์ต ์ ์ฑ ์ ํ์ค ์ด์.
- ์๊ฐ ๋๋ฉ์ธ ๋๋คํ๋ก ์นด๋ฉ๋ผ ์ฐจ์ด๋ฅผ ์ผ๋ถ ์ํ. YOLO ๊ธฐ๋ฐ 2D ๊ฒ์ถโ3D ํฌ์, ์ง๋ ๊ธฐ๋ฐ ์์น์ถ์ ์ ์ฉ.
6.2 ๊ฒฐ๊ณผ ์์ฝ(์ง์ )
- ์๋ฎฌ๋ ์ดํฐ ์ฑ๊ณต๋ฅ (์: ํน์ ๊ณผ์ โ40%) โ ํ์ค ์ด์ 0% ์ฌ๋ก ๋ณด๊ณ .
- ์ธ๊ฐ ์ค๋ผํด(์ต์ ํ๋ฆฌ๋ฏธํฐ๋ธ)๊ฐ ์ง์ํ ๊ฒฝ์ฐ๋ ํ์ค ์ฑ๊ณต๋ฅ ์ด ๋ฎ์(์ฝ ์์ญ %๋).
- ์คํจ ์์ธ: ์ ์ฑ ์ ํ ์ค๋ฅ, ์๊ฐ ๊ฒฉ์ฐจ(HDR/์ง๊ฐ/๋ ธ์ด์ฆ), ๊ทธ๋ฆฌํ ์คํจ, ๋์ ์ค์ฐจ(compounding errors) ๋ฑ ๋ค์์ . โ ์๊ฐ ๋๋คํ, ์ก์ /์ผ์ ๋ ธ์ด์ฆ ๋ชจ๋ธ๋ง, ์ ์ด๋ฌผ๋ฆฌ ์ ๋ฐํ, ํ๋ฆฌ๋ฏธํฐ๋ธ-๊ณ์ธตํ๊ฐ ํ์.
์ ๋ฆฌ: โํ์ค์ฑ ๋์ ์๋ฎฌ๋ ์ดํฐ + ์ธ๊ฐ ์ค์ฌ ๊ณผ์ โ๋ง์ผ๋ก ๊ฒฉ์ฐจ๊ฐ ์๋ ํด์๋์ง ์์ต๋๋ค. ์ผ์/์กํฐ ๋ ธ์ด์ฆ ์ฃผ์ , ๋๋ฉ์ธ ๋๋คํ์ ์ฒด๊ณํ, ๋ก๋ด ํ๋์จ์ด(์๋์ดํํฐ) ๊ฐ์ , ์ค๋ฅ๋ณต๊ตฌ ์ ์ฑ ์ด ๋๋ฐ๋์ด์ผ ํฉ๋๋ค.
7) ์์์ผ๋ก ๋ณด๋ BEHAVIOR-์คํ์ผ ํ๋ ๋ชจ๋ธ
ํ๋ \tau์ ํ์ต ๋ฌธ์ ๋ฅผ ๊ฐ๋จํ ์ฐ๋ฉด:
- MDP: (\mathcal S,\mathcal A, p, r_\tau,\gamma), ๊ด์ธก o_t \sim \mathcal O(s_t)
- ์คํ์ค ๋ฆฌ์๋: r_\tau(s_t,a_t,s_{t+1})= \begin{cases} +1,& s_{t+1}\in S_{\tau,g}\ 0,& \text{otherwise} \end{cases}
- ์ฑ๊ณต ํ๋ฅ : ;P_\pi^\tau=\Pr\big(s_T\in S_{\tau,g}\mid \pi\big)
- ํจ์จ์ฑ ์ธก์ (์): D_\text{nav}=\sum_{t=1}^{T}\lVert x_t-x_{t-1}\rVert,\quad D_\text{kin}=\sum_{t=1}^{T}\sum_{o\in \mathcal O_\text{env}}\lVert p^o_t-p^o_{t-1}\rVert T๋ ์๋ฃ ์์ (๋๋ ์ ํ ์คํ ). ์ฌ๊ธฐ์ D_\text{kin}์ ์ฃผ๋ณ ๊ต๋์ ์ ๋ํํฉ๋๋ค. (๋ ผ๋ฌธ์์ ์ ์๋ ํ์ง ์งํ ๋งฅ๋ฝํ.)
8) ์ค์ ๋ก๋ด ์ ์ฉ์ ์ํ ์ค๊ณ ์ฒดํฌ๋ฆฌ์คํธ
8.1 ์ ์ฑ ์ํคํ ์ฒ
- ๊ณ์ธตํ: ๊ณ ์์ค ํ๋ฆฌ๋ฏธํฐ๋ธ(์ต์ ) + ์ ์์ค ์ ์ด(์ปจํธ๋กค๋ฌ) ๋ถํ .
- ๋ฉ๋ชจ๋ฆฌ: o_{1:t} ์์ฝ(Transformer/GRU)๋ก ์ฅ๊ธฐ ์์กด์ฑ ์ฒ๋ฆฌ.
- ์คํฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ: pick/place/open/close/pour/fold ๋ฑ ์คํฌ-์ฌ์ ์ ๊ตฌ์ถํ๊ณ , ์กฐ๊ฑด๋ถ ํ๋ผ๋ฏธํฐ(๋ชฉํ ํฌ์ฆ/ํ/์๊ฐ)๋ก ์ธ์คํด์คํ.
8.2 ์๊ฐยทํผ์ ์
- ๋ค์ค์ผ์: RGB-D + ๊ด์ /ํ/์ด๊ฐ(๊ฐ๋ฅ ์) ์ตํฉ.
- ๋๋ฉ์ธ ๋๋คํ: ์กฐ๋ช /์ฌ์ง/๋ ธ์ด์ฆ/ํด์๋/์๊ณก/๋ชจ์ ๋ธ๋ฌ.
- ์ธ๊ทธ๋ฉํ ์ด์ + 6D ํฌ์ฆ: ์กฐ์ ๋์์ ์ถ์ ์์ ํ.
8.3 ๊ทธ๋ฆฌํยท์ ์ด
- ์๋์ดํํฐ: ๋ง์ฐฐยท์์ยทํผ๋๋ฐฑ(ํ/์ด๊ฐ) ๊ณ ๋ คํ ํ๋์จ์ด.
- ์ ์ด๊ณํ: grasp-synthesis(์ํ๋ง/ํ์ต ํผํฉ) + ์ฌ๋ฆฝ/ํ์ค๋ฒ ๊ฐ์ง.
8.4 ๋ก์ฝ๋ชจ์ ยท์ ๋ฐ ์ ํฉ
- ์ ์ญโ๊ตญ์ ์ ํฉ: ์ ์ญ ๊ฒฝ๋ก๊ณํ ํ ๋ง์ง๋ง 1m์์ ์ ๋ฐ ์ ํฉ(ICP/๋น์ -์๋ฅด์ฝ).
- ์ค๋ฅ๋ณต๊ตฌ: ์คํจ ๊ฐ์ง ํ ๋ฐฑ์คํโ์ฌ์๋ ์ ์ฑ .
์ ์ฒดํฌ๋ฆฌ์คํธ๋ ๋ ผ๋ฌธ์์ ๋๋ฌ๋ ์คํจ ๋ชจ๋(์๊ฐ/๊ทธ๋ฆฌํ/๋์ ์ค์ฐจ)๋ฅผ ์ค์ด๊ธฐ ์ํ ์ค์ฉ์ ๊ฐ์ด๋์ ๋๋ค.
9) ๊ด๋ จ ์ํ๊ณ: BEHAVIOR-100, iGibson 2.0๊ณผ์ ์ฐ๊ณ
- BEHAVIOR-100: 100๊ฐ ๊ฐ์ฌํ๋, BDDL ์ต์ด ๋์ , ๊ฐ์ฒด ์ํยท๋ ผ๋ฆฌ ์ ์ดยท์๋ ์ธ์คํด์คํ์ ์ผ๋จ ๊ตฌ์ฑ ํ๋ฆฝ. BEHAVIOR-1K๋ ์ด๋ฅผ ์ค์ผ์ผยทํ์ค์ฑ ์ธก๋ฉด์์ ๋ํญ ํ์ฅํ์ต๋๋ค. (stanfordvl.github.io)
- iGibson 2.0: ๊ฐ์ฒด ์ํ/๋ ผ๋ฆฌ ๋งคํ/VR ๋ฐ๋ชจ ์์งยท์ํ๋ง์ ์ ์. OmniGibson์ ๋ฌผ๋ฆฌ/๊ทธ๋ํฝ ์ถฉ์ค๋๋ฅผ ๋์ด์ฌ๋ ค ์ฐ์ฑ์ฒด/์ ์ฒด๊น์ง ์์ฐ๋ฆ ๋๋ค.
10) ์คํ ์ฌํ๊ณผ ๋ฆฌ์์ค
๋ ผ๋ฌธ/์ฝ๋/์น์ฌ์ดํธ: arXiv(๋ ผ๋ฌธ), PMLR(CoRL 2023), ํ๋ก์ ํธ ํ์ด์ง, GitHub ์ ์ฅ์๊ฐ ๊ณต๊ฐ๋์ด ์์ต๋๋ค.
- ๋ ผ๋ฌธ: BEHAVIOR-1K(2024, arXiv) / CoRL 2023 PMLR ๋ฒ์ ์ฐธ๊ณ .
- ์ฌ์ดํธ/๋ฌธ์: ์ฃผ์ ๊ฐ์ยท์๋ฎฌ๋ ์ดํฐ ๋ฌธ์ยท๋ฐ๋ชจ ๋ฑ.
- ์ฝ๋/BDDL: BEHAVIOR-1K ์ ์ฅ์ ๋ฐ BDDL ๋ ํผ๋ฐ์ค.
11) ํ ๋ก : ํ๊ณ์ ํฅํ ๊ณผ์
- Sim-to-Real ๊ฒฉ์ฐจ: ๊ณ ์ถฉ์ค ์๋ฎฌ๋ ์ดํฐ์๋ ๋ถ๊ตฌํ๊ณ ์ฌ์ ํ ํผ. ํด๊ฒฐ์ฑ ์ ์ผ์/์กํฐ ๋ ธ์ด์ฆ ์ฃผ์ , ๊ฐํ๋ ๋๋ฉ์ธ ๋๋คํ, ์ค์ธก ๊ธฐ๋ฐ ์ฌ์ง/๋ง์ฐฐ ์บ๋ฆฌ๋ธ๋ ์ด์ , ์๋์ดํํฐ/๊ทธ๋ฆฌํ ๊ฐ์ ์ ๋๋ค.
- ์ฅ๊ธฐ ๊ณํ: ์๋ฐฑ-์์ฒ ์คํ ๊ตฌ์กฐ๋ ๊ณ์ธตํ RL/IL, ์ธ์ดํ ํ์คํฌ ๊ณํ(LLM-guided), ํ์ด๋ธ๋ฆฌ๋ ๊ณํ-ํ์ต์ ๋์ ๊ทผ๊ฑฐ๋ฅผ ๊ฐํํฉ๋๋ค.
- ์ฌ๋-๋ก๋ด ์ํธ์์ฉ(HRI): ํ์ฌ ๋ฒ์ ์ ์ธ๊ฐ ์์ด์ ํธ์ ํ๋ถํ ์ํธ์์ฉ์ ์ ํ์ ์ผ๋ก ๋ค๋ฃน๋๋ค. ๊ฐ์ ์ธ๊ฐ์ ์ฌ์ค์ ์๋ฎฌ๋ ์ด์ ์ด ํฅํ ํ์ฅ ํฌ์ธํธ์ ๋๋ค.
12) ๊ฒฐ๋ก
BEHAVIOR-1K๋ ์ธ๊ฐ ์ค์ฌ ๊ณผ์ ์ ์(1,000๊ฐ)์ ํ์ค๊ฐ ๋์ ์๋ฎฌ๋ ์ด์ (OmniGibson)์ ๊ฒฐํฉํด, ์ฅ๊ธฐ ๋ชจ๋ฐ์ผ ๋งค๋ํฐ๋ ์ด์ ์ ํ์ค ๋ฒค์น๋งํฌ๋ก ์๋ฆฌ๋งค๊นํ๊ณ ์์ต๋๋ค. ๋ฒ ์ด์ค๋ผ์ธ ๋ถ์์ ํ๋ฆฌ๋ฏธํฐ๋ธยท๋ฉ๋ชจ๋ฆฌยท๊ทธ๋ฆฌํ์ ์ค์์ฑ์ ์ฌํ์ธํ๊ณ , Sim-to-Real ์งํ๋๋ฅผ ๊ตฌ์ฒด์ ์ผ๋ก ๋๋ฌ๋์ต๋๋ค. ๋ณธ ๋ฒค์น๋งํฌ๋ ์ค์ ์๋น์ค ๋ก๋ด์ผ๋ก ์ด์ด์ง๊ธฐ ์ํ ์ฐ๊ตฌ ์ง์ฝ์ ์ผ๋ก์, ๊ณ์ธตํ ์ ์ฑ ยทํผ์ ์ ๊ฐ๊ฑดํยท์ ์ด๋ฌผ๋ฆฌยท์ค๋ฅ๋ณต๊ตฌ๋ฅผ ํฌํจํ ์ด์ฒด์ ์ ๊ทผ์ ์๊ตฌํฉ๋๋ค.
๋ถ๋ก A) ์ฉ์ด ์ ๋ฆฌ
- BDDL: ์ด๊ธฐ/๋ชฉํ ์ํ๋ฅผ ๋ ผ๋ฆฌ ์ ์ด๋ก ๊ธฐ์ ํ๋ ๋๋ฉ์ธ ์ธ์ด. \tau={S_{\tau,0},S_{\tau,g}}.
- ํ๊ฒฝ ๊ต๋(D_\text{kin}): ์๋ฌด ์ํ ์ค ์ฃผ๋ณ ๊ฐ์ฒด์ ์ด ์ด๋๋โ์ ๋ ํ์ง ์งํ.
- ํ๋ฆฌ๋ฏธํฐ๋ธ(Primitive): pick/place/open/close/pour/fold ๋ฑ ๊ณ ์์ค ์คํฌ.
- ๋๋ฉ์ธ ๋๋คํ: ์๊ฐ/๋ฌผ๋ฆฌ/์ก์ ๋ฌด์์ํ๋ก ์ผ๋ฐํ ์ ๋.
๋ถ๋ก B) ์ธ์ฉ/์ฐธ๊ณ ์๋ฃ
- Li et al., BEHAVIOR-1K (arXiv 2403.09227; CoRL 2023 PMLR). (arXiv)
- OmniGibson ๋ฌธ์(์๋ฎฌ๋ ์ดํฐ ์ธํฐํ์ด์ค/PhysX ๋ฐฑ์๋). (behavior.stanford.edu)
- BEHAVIOR-100 ์๊ฐ/๋ฌธ์(BDDL ์ํ, 100๊ฐ ํ๋). (stanfordvl.github.io)
- iGibson 2.0 (๊ฐ์ฒด ์ํยท๋ ผ๋ฆฌ ๋งคํยทVR/์ํ๋ง). (arXiv)
- ํ๋ก์ ํธ/์ฝ๋ ๋ ํฌ: BEHAVIOR-1K, BDDL. (GitHub)