요즘 AI가 영상을 만드는 건 더 이상 놀라운 일이 아니지만, 구글 딥마인드가 내놓은 genie3는 차원이 다르다고 봅니다.
제가 보기엔 이제 AI가 단순히 영화를 찍어 보여주는 단계를 지나, 우리가 직접 들어가 뛰어놀 수 있는 디지털 우주를 실시간으로 창조하기 시작했습니다.
텍스트 한 줄만 쓰면 내가 주인공이 되어 조작할 수 있는 게임이 즉석에서 만들어지는 셈인데, 저는 이 기술이 콘텐츠 산업의 판도를 완전히 뒤집어놓을 것이라고 확신합니다.
저는 genie3의 가장 소름 돋는 점이 바로 실시간성이라고 생각하며, 이는 기존 AI 영상과는 근본부터 다른 지점입니다.
기존 AI 영상이 정해진 시나리오대로 흘러가는 영화였다면, genie3는 유저의 움직임에 따라 매 순간 장면이 그려지는 720p 해상도의 게임과 같습니다.
초당 24프레임(24fps)의 속도로 환경을 렌더링하는데, 이게 얼마나 대단한 거냐면 우리가 조이스틱을 움직이는 즉시 AI가 그다음 장면을 실시간으로 추론해서 그려낸다는 뜻입니다.
사막에서 갑자기 도시로 가고 싶다고 하면, AI는 단 41밀리초(ms)의 지연 시간 안에 새로운 환경을 즉흥적으로 만들어내며 우리를 놀라게 합니다.
제가 분석해보면서 가장 어이가 없었던 점은, genie3는 물리 법칙을 교과서로 배운 게 아니라, 수백만 개의 유튜브 영상을 보며 독학했다는 사실입니다.
영상을 시청하면서 공이 튀어 오르는 모습이나 파도가 치는 방식 등을 스스로 관찰하고 물리적 인과관계를 깨우친 것이죠.
저는 이 기술의 핵심인 잠재 액션 모델(LAM)이 마치 AI계의 역설계 전문가 같다는 생각이 들며, 요즘 발전속도를 보면 따라가기도 힘들다는 생각이 들 정도로 정교함에 감탄하곤 합니다.
영상 속 장면 변화를 보고 저렇게 되려면 어떤 힘과 행동이 필요했을까를 스스로 추론해 내기 때문에, 개발자가 복잡한 물리 코드를 짤 필요가 전혀 없습니다.
우리가 오픈월드 게임을 할 때 가장 중요한 요소 중 하나는 제가 한 행동이 가상 세계에 그대로 유지되는 것입니다. 원하는 게임의 스타일에 따라서 장소, 2D/3D/4D, 전략시뮬레이션, 전쟁, 키우기등 다양하게 다 할수있는 것이죠. 자유도가 넓은 게임은 점점더 세상에 근접해오고 있습니다.
genie3는 월드 메모리라는 기능을 통해 자신이 만든 세계를 단기적으로 기억하며, 이는 몰입감을 높이는 결정적인 역할을 합니다. 제가 벽에 그림을 그리거나 나무를 쓰러뜨리고 다른 곳에 갔다 와도, 일정 시간 동안은 그 변화를 고스란히 유지하는 놀라운 능력을 보여줍니다.
단순히 스쳐 지나가는 영상이 아니라 실제로 존재하는 공간이라는 느낌을 주기 때문에, 저는 genie3가 진정한 의미의 가상 세계 창조주가 된 것 같은 기분이 듭니다. 내가 끄적끄적 생각만 했던 세상을 프롬포트에 집어넣으면 모델을 구현해준다는게 참..
genie3는 단순한 놀잇감을 넘어 인류가 꿈꾸는 인공 일반 지능, 즉 AGI로 가는 결정적인 징검다리라고 저는 생각합니다.
특히 로봇 공학 분야에서 그 가치는 상상을 초월하며, 비싼 돈 들여 현실에서 로봇을 고장 내며 훈련시키는 시대는 곧 끝날 것입니다. 그냥 가상세계를 무한대로 펼쳐놓고 한대씩 들어가서 교육하고 그 결과를 클라우드로 공유하면 되거든요.
genie3가 만든 무한한 가상 세계에서 로봇은 파손 걱정 없이 수백만 번의 시행착오를 겪으며 물리적 감각을 익힐 수 있기 때문입니다. 물리학을 배울수 있으면 그랩(집는 행동), 옮기는 행동 등등을 수행하기에 좋죠.
비디오 데이터를 통해 물리적 인과관계를 이해하게 된 AI는 이제 인간처럼 복잡한 문제를 해결하고 추론하는 AGI 단계에 한 발짝 더 다가섰습니다.
물론 지금의 genie3가 완벽한 것은 아니며, 아직은 지속 시간이 짧거나 가끔 그래픽 오류가 발생하는 등의 과제가 남아 있습니다.
하지만 저는 이 한계들이 오히려 엄청난 기회라고 생각하며, 불과 몇 년 전의 조악한 결과물과 비교하면 지금의 성장은 기적에 가깝습니다.
4K화질은 아니어도 720p HD 화질로 실시간 상호작용을 하고 있다는 사실만으로도 이미 기술적 임계점을 넘었으며, 앞으로의 발전 속도는 더 빨라질 것입니다.
현재는 일부 연구자와 제작자들에게만 열려 있지만, 이 기술이 대중화되는 순간 우리가 세상을 경험하는 방식은 혁명적으로 바뀔 것이라고 저는 확신합니다. 이미 대중화되어있는데 사람들이 모르는 것일수도..
부업을 해보자..!!