마침내 베일을 벗은 차세대 콘솔기기

차세대 게임기 전쟁(비디오 게임기)이 본격적으로 시작됐다. 전쟁의 시작을 끊은 마이크로소프트(이하 MS)는 올해 중 '엑스박스360(Xenon : 제논)'을 시장에 발매할 계획이다. 이에 맞서 소니컴퓨터엔터테인먼트(이하 SCE)는 '플레이스테이션 3(이하 PS3)'를 내년 봄에 출시할 계획이며, 닌텐도 또한 내년 내에 차세대 기기인 '레볼루션(가칭)'을 선보일 예정이다.

21세기를 상징하는 차세대 게임기의 전쟁, 일반 PC의 성능을 가볍게 뛰어넘는 기능을 가진 기기들이 게이머들을 매료시킬 시대가 곧 다가오려 한다.

3사의 차별적인 전략과 방향성

차세대 게임기를 발매할 3대 회사의 전략은 서로 커다란 차이를 보인다. 먼저 SCE는 PS3를 궁극의 엔터테인먼트 컴퓨터화 하고자 한다. SCE는 컴퓨터로써 혁신적인 성능을 가진 기기를 만들어낸다면 이자연적으로 획기적인 게임이 쏟아져 나올 것이라고 전망하고 있으며, 이런 SCE의 의도처럼 PS3는 범용적인 컴퓨터로서의 충실한 인터페이스를 가지고 있다. '컴퓨팅이란 말 자체를 바꾸겠다'고 SCE의 쿠다라기 켄 취재역 대표 사장 겸 CEO가 공언한 만큼 SCE는 PS3를 게임기 이외의 응용 측면을 강화해 넓은 범용성을 살려 시장을 공략해 나갈 예정이다.

이에 비해 MS가 엑스박스360를 통해 이루고자 하는 바는 플랫폼을 통한 충실한 게임기로서의 역할이다. 물론 하드웨어의 사양에도 충실하면서 개발환경과 네트워크 경유 서비스도 중점사항으로 제시하고 있으며, 개발자에게 용이한 개발환경을, 게이머에게는 편리한 네트워크와 그래픽 사용자 인터페이스(GUI)를 제공함으로 총체적으로 풍부한 환경을 제공해 활용도를 높일 방침을 가지고 있다.

닌텐도는 이 두 회사의 전략과는 전혀 다른 양상을 보인다. 닌텐도는 이번에 발매할 레볼루션을 통해 과거의 자산을 최대한 활용하는 전략을 가지고 있다. 레볼루션을 통해 닌텐도 과거 명작을 즐길 수 있게 한다는 새로운 전략을 세웠으며, 과거의 게임들은 네트워크를 통해 제공하면서 레볼루션만의 새로운 비즈니스 모델을 찾을 계획이다.


레볼루션


최고급 PC를 가뿐히 뛰어넘는 차세대 게임기

하드웨어적으로 봤을 때, 이번 발매될 게임기 전쟁의 포인트는 3사 전부 비슷한 시기에 발표했다는 사실에 주목해야 한다. 3개 회사 중 하드웨어의 개요를 확실하게 밝힌 것은 SCE와 MS. 두 회사가 공개한 하드웨어의 사양을 보면 거의 비슷하다고 할 수 있으며 양사가 자랑하고 있는 게임기 성능면에서 많은 경쟁이 있을 것으로 전망된다.

SCE의 PS3는 IBM, 도시바 등 컴퓨터 제조사와 공동 개발한 혁신적인 CPU인 셀 프로세서 3.2GHz를 채용했고, 그래픽 엔진(GPU)은 그래픽 칩셋 제조사 엔비디아와 공동개발한 리얼리티 신디사이저(RSX)를 장착했다. 그 외에 사운드 성능 구현에 높은 성능을 보인다는 사우스 브릿지 칩을 기기에 넣었다.

여기에 메인 메모리에는 XDR DRAM256을, 비디오 메모리로는 GDDR256을 탑재 시켰으며 차세대 미디어 규격인 블루 레이디스크 드라이브, 기가비트 무선 인터넷 랜 컨트롤러를 표준 사양으로 기기에 장착했다.

이에 맞서는 MS의 엑스박스360은 IBM의 파워피시를 베이스로 한 커스텀 트리플코어 3.2 GHz을 CPU로 택했고, 그래픽엔진에는 그래픽 칩셋 제조사 ATI가 개발한 커스텀 GPU를 사용했으며 사운드 칩으로 실리콘 인터그레이티드 시스템즈(SiS)의 사우스 브릿지 칩을 넣었다.

메인 메모리로는 GDDR3 512MB를 사용하며, 그 외에 DRAM(eDRAM)칩 10MB를 GPU와 동패키지에 넣었다. 또, DVD±R/RW와 20기가 하드디스크가 표준 장비 되어 있으며 100BASE-TX와 무선랜 기능을 자랑한다.

이렇게 하드웨어만 놓고 봤을 때, 두 기종은 모두 최고급 성능의 PC급, 아니 그 이상의 사양을 자랑한다. 특히 CPU에 있어 두 회사 모두 펜티엄 D나 애슬론 64 X2의 성능을 가볍게 뛰어넘는 부동소수점 연산기능을 가지고 있다. PS3의 CPU인 셀의 부동소수점 연산기능의 최고 한계는 217.6GFLOPS로 이전 세대의 슈퍼컴퓨터 클래스라고 할 만큼 높은 수치를 보였으며 엑스박스360의 CPU도 115.2GFLOPS를 기록하는 모습을 보였다.

(여기서 잠깐: 3D 그래픽 물리 표현시 정수가 아닌 부동소수를 연산해 반복 계산하는 방식을 채택하므로 부동소수점 연산기능이 빠르면 빠를수록 아름다운 그래픽을 표현할 수 있습니다.)

GPU 부분에 있어서도 두 회사는 PC 그래픽스와 테크놀로지 분야에서 비슷한 수준에 이르렀다. 결국 PC 세계의 주류였던 쉐이더 베이스의 그래픽스 방식이 그대로 차세대 게임기에 응용되는 셈이다. PS3의 RSX는 엔비디아의 최신 GPU인 지포스 7800 GTX(G70)와 동일한 성능을 가지고 있으며, 엑스박스360은 ATI의 차세대 그래픽스 R520과 똑같은 성능으로 무장하고 있다.

HDTV 대응부분서도 차세대 게임기를 빼놓을 수 없다. PS3는 HDMI 인터페이스 화면출력방식을 채택하고 있으며 최대 해상도 1080p (1920×1080) 프로그레시브를 두 화면 동시에 출력할 수 있을 정도의 성능을 자랑한다. 엑스박스360의 경우 720P (1280×720) 해상도를 지원하며 1080i를 지원한다. 단, 듀얼 스크린에 대한 SCE의 언급은 없었다.


PS3


차세대기의 OS 기능


예전 비디오 게임기에 탑재된 메모리의 양은 일반 PC와 비교했을 때 매우 적은 용량이었다. 그것이 프로그래밍의 제약으로 작용해, 개발하는데 있어 많은 어려움으로 작용한 것도 사실이다. 그러나 차세대기는 이제 일반 PC만큼의 메모리량을 확보했고, 거대한 메모리로 인해 OS도 그 진가를 발휘하기 시작했다. MS는 게임 중에도 여러 설정을 불러낼 수 있는 표준 GUI를 탑재시켰다. 이런 GUI를 통해 게임 중 네트워크 설정 변경이나 사운드 설정 변경 등이 가능하며 여러 가지 세밀한 부분을 조정할 수 있다.

PS3는 셀의 가상머신 지원기능을 이용해 멀티 OS기능을 동시에 이용할 수 있도록 지원 해준다. 즉, PS3는 하드 탑재 버전에 리눅스 같은 운영체제를 사용할 수 있도록 할 전망이다.

MS와 SCE는 각각 표준 라이브러리를 강화했는데, 마이크로소프트의 경우 다이렉트X를 베이스로 API군을 확장시켜 프로그래밍 프레임워크에 XNA을 준비해두었고, SCE는 그래픽스에 오픈GL ES2.0을 채택할 계획이다.

다소 어려울지 모르지만, 위에 언급한 내용은 이번 차세대 게임기들이 전부 하위호환성능을 가지고 가는 셈이 된다는 것이다. 이때까지 SCE를 제외하고는 가정용의 경우 하위 호환기능을 가진 게임기는 전무했다.

그러나 하위호환기능이 게이머들이 원하는 중요 기능인 것이 사실인 만큼, MS와 SCE 양 진영 모두 기존 기기에서 구동된 게임을 이끌고 가는 하위호환이 채택될 확률이 매우 높다.


엑스박스360


8개의 CPU 코어를 탑재한 PS3의 셀 프로세서


PS3의 심장인 셀은 하나의 칩에 9개의 CPU 코어를 탑재시킨 멀티 CPU 다. 가장 큰 특징이라면 2종류의 다른 CPU 코어를 가지고 있다는 점. 컨트롤러계 처리에 특화된 CPU코어 '파워 프로세서 엘레먼트 (PPE)'을 1개, 데이터 처리에 능숙한 CPU코어 '시너지스틱 프로세서 엘레먼트(SPE)'를 8개 가지고 있다. 여러 가지 특화된 CPU코어를 가지고 있기 때문에, PS3는 같은 종류의 CPU코어를 복수 탑재한 PC의 듀얼 코어 CPU와는 완전히 다르다고 할 만큼 커다란 차이를 보인다.

PPE는 IBM의 64비트 파워아키텍쳐 명령셋트가 호환되며, 주 OS의 컨트롤 계열업무를 활성화시키는 설정 역할을 담당한다. 즉, 파워피시의 호환성을 살리기 위해 OS와 소프트웨어의 이식이 쉽게 이루어지는 이점을 가지고 있다. CPU내부의 구조 자체는 파워피시 G5 (970)와 비교했을 때 상당히 간단명료하며, 펜티엄 세대와 비슷하다. 그러나 PPE는 하이퍼스레드 같은 멀티 스레딩 기능을 가지고 있으며 2개의 스레드를 동시에 처리할 수 있는 특기를 가지고 있다.

SPE는 싱글 인트로덕션, 멀티플 데이터(SIMD) 형의 구성으로 주로 멀티미디어 계열의 처리를 담당한다. PPE이상의 단순한 CPU 코어를 가지고 있지만 메인 연산 유닛은 4way SIMD 유닛을 하나 기용한다.(SPE1개로 32비트단 정도의 부동소수점 데이터 4개를 동시에 처리할 수 있는 성능을 가지고 있다) 256KB란 비교적 대용량에 속하는 로컬 메모리, '로컬 스토어 (LS)'를 가지고 있는데 이 메모리 안에서 프로그램을 실행시킨다.

셀은 이런 CPU코어를 작고 단순하게 만들어서 9개의 CPU코어를 펜티엄 D와 같은 수준의 다이사이즈(반도체 본체의 면적)를 확보하는데 성공했다.


PS3 셀칩 아키텍쳐


지포스7800 GTX(G70)과 비슷한 RSX의 구성


현시점에서 SCE의 GPU인 RSX에 대해 상세한 사항은 공개된 바 없다. 하지만 RSX의 내부 구성에 대해서는 예측이 가능하다. 그건 RSX가 엔비디아의 최신 GPU인 지포스 7800 GTX(G70)와 같은 구성으로 이뤄져 있기 때문이다.

RSX와 G70은 지포스 6800 (NV40) 구성을 기본 바탕으로 픽셀 쉐이더 기능을 특별히 강화시켰으며 정점처리를 담당하는 버텍스 쉐이더와 컬러 & 텍스쳐를 연산하는 픽셀 쉐이더의 2종류 프로그래메이블 쉐이더를 장착함으로 이전의 구성을 답습했다.

G70의 버텍스 쉐이더 8유닛, 픽셀 쉐이더의 24유닛의 구성으로 RSX도 같은 구성을 하고 있지 않을까 추측해본다.

위 두 GPU도 1사이클에 허용하는 실제 쉐이더 명령수는 136과 동등하기 때문이다. 픽셀 쉐이더의 수가 부자연스럽게 많은 이유는 어플리케이션의 진화로 인해 픽셀 쉐이더 부분의 담당 분야가 급증했기 때문이다.

RSX/G70 계열의 구조가 가지는 최대 특징은 NV40보다 픽셀 쉐이더가 대폭 늘어났고 그 성능이 강화되었으며 1개의 쉐이더 속에 많은 양의 정보 처리를 담아낼 수 있단 점이다. 1개의 쉐이더 속에 2개 분의 쉐이더를 연산하는 유닛이 들어있다고 생각하면 이해가 빠를 것이다.

정확히, 1개의 유닛이 텍스쳐 프로세서와 리소스를 공유하기 때문에 텍스처 처리에는 배타적으로 이용된다.

또, 양쪽 SIMD 유닛에는 각각의 미니 -ALU라고 불리는 스칼라 연산유닛이 들어있다. 유닛 1에는 FP16 정규화(노멀라이즈)전용 유닛이 붙어있고, 7연산까지 정규화 처리와 배열이 가능하다. 그래서 픽셀 쉐이더 내부에서 피크로 27FLOPS(부동 소수점 연산 오퍼레이션)를 1사이클에 실행시킨다.

이런 복잡한 픽셀쉐이더에 비해 RSX의 버텍스 쉐이딩은 비교적 단순하다. RSX의 버텍스 쉐이더는 4방향의 벡터 연산유닛과 1방향의 스칼라 연산 유닛, 이걸 텍스쳐 페치유닛 같은걸 준비하는 역할을 한다.

기본적으로 NV40의 구조에서 변한 내용은 없다. (4방향 + 1방향) × 2 오퍼레이션으로 1사이클에 10FLOPS를 실행시킬 수 있다. RSX와 G70이 같은 구성이라 생각할 때 버텍스 쉐이더가 10FLOPS의 ×8유닛, 픽셀쉐이더가 27FLOPS × 24유닛을 연산해냈을 때 연산성능은 피크로 400FLOPS가 된다. 간단히 말해 연산 성능 면에서 NV40보다 약 2배 성능을 가진 고성능 GPU라고 할 수 있다.

RSX는 128비트의 메모리인터페이스를 가지고 있으며 GDDR3 256램을 가지고 있다. CPU와 GPU의 메모리가 분산되지만 RSX는 256MB의 비디오 메모리 뿐 만 아니라 셀에 접속된 256MB의 메인메모리에도 직접 액세스가 가능하다. 즉, 반공유형의 메모리 구조란 뜻이다.


PS3의 GPU RSX와 유사한 구성인 G70의 아키텍쳐


범용 컴퓨팅에 익숙한 엑스박스360 CPU


엑스박스360의 CPU에 대해서는 현시점에서 상세한 도면 설계 내용이 공개된 바가 없다. 하지만 동일 구성의 CPU코어를 3개 탑재한 멀티 코어 CPU가 현존하며 그 점에 대해서는 PC가 지향하는 CPU와 비슷하다 할 수 있겠다.

CPU코어는 파워피시 G5를 베이스로 하고 있지만 매우 간략화 되어 있는 형태를 보인다. 셀의 PPE보다는 복잡하지만 PC 성능의 파워피시와 비교했을 때 간단하다.

다시 말해 비상식적으로 간단한 코어를 8개 탑재시킨 셀, 비교적 심플한 코어를 3개 가지고 있는 것이 엑스박스360의 CPU다. CPU코어를 단순하게 만들기 위해 1사이클에 맞는 실행 명령 수는 PC성능의 CPU보다는 떨어지지만 동작주파수는 3,2GHz로 높기 때문에 성능범위는 그만큼 높을 거라 추측된다.

하지만 CPU코어는 게임에 자주 사용되는 단정도 부동 소수점 연산에 대해 강화되어 있다. 각각의 코어에 SIMD연산 유닛, VMX를 탑재시킴으로 엑스박스에서 사용된 32개의 VMX레지스터가 엑스박스360에서는 128개로 강화되었다. 이런 강화로 인해 레지스터의 경쟁이 줄어들어 컴파일러의 최적화가 이루어져 부동소수점연산의 실효성능이 높아진다.

정확히 CPU전체의 부동소수점연산성능은 115.2GFOPS로 셀의 반정도 밖에 되지 않는다. 이건 CPU코어의 개수가 부족하기 때문이다. 하지만 셀에서 범용적으로 사용되는 타입의 코어가 PPE 1개인 것에 비해, 엑스박스360의 CPU의 각 코어는 하이퍼 스레딩같은 멀티스레딩 기능을 가지고 있다. 그래서 최대 6개 스레드를 동시에 실행시킬 수 있다.

CPU와 GPU를 이어주는 시스템버스는 21.6GB/s대역이며 PS3와는 다르게 CPU측의 메모리와 접촉하지 않고 GPU측의 메모리 512를 공유하도록 구성된 것이 특징이다.


엑스박스360 CPU 아키텍쳐


혁신적인 유니파이드 쉐이더를 자랑하는 엑스박스360의 GPU


엑스박스360의 GPU는 이제까지 존재하지 않았던 버텍스 쉐어더와 픽셀쉐이더를 통합하는 구성을 채택했다. 주목해서 볼 것은 유니파이드 쉐이더와 인텔리전트 eDRAM, 이 두 가지. 엑스박스360의 GPU의 쉐이더에는 버텍스 쉐이더와 픽셀쉐이더의 구분이 없다. 두 기능을 통합시킨 아키텍쳐로 유니파이드 쉐이더가 48유닛, 아레이 형태로 들어가 있다. 이런 유니파이드 쉐이더 형의 아키텍쳐는 내년에 처음 복수 등장 할 것으로 여겨지지만 이제까지 이런 경우는 없었다. 2006년을 새롭게 장식할 GPU의 새로운 형식인 것이다.

이 기기의 GPU에는 한 종류의 유니파이드 쉐이더로 동시에 정점처리와 픽셀처리를 하지 않는다. 정점처리의 배경이 높을 때는 유니파이드 쉐이더군의 정점처리 업무가 많이 나눠지며 역으로 픽셀쉐이더의 처리 요구가 높아질 때는 그쪽으로 맡아 처리한다(다시 말해 유동적이란 말이다). 동적인 쉐이더로 정점이나 픽셀 업무를 해당하며 효율적인 쉐이더를 작동시킨다.

엑스박스360의 GPU에는 쉐이더 스케쥴을 제어하는 시켄서란게 탑재되어 있다. 쉐이더로 처리한 데이터는 파이프 커뮤니케이션이란 유닛으로 다음의 처리 유닛으로 분리한다. 정점데이터의 경우 프라이미티브 어셈블리에 보내져 최종적으로 픽셀 데이터를 라스터라이즈 시켜 다시 유니파이드 쉐이더로 돌려보낸다. 픽셀 데이터의 경우 직접 메모리 컨트롤러에 보내져 렌더링되지만, 호스트 쉐이더의 픽셀처리 프로세서 군, (엔비디아 용어로 ROP)에서 Z처리와 알파블렌딩, 안티앨리어싱이 이뤄진다.

여기서 흥미로운 사실은 엑스박스360의 GPU로는 일반적인 GPU가 가진 유닛을 GPU의 다이(반도체 본체)이상 가질 수 없단 점이다. 엑스박스360의 GPU의 GPU의 패키지에는 인텔리전트 eDRAM 다이가 탑재되어 있어 GPU의 전용 인터페이스에 접속된다. 이 eDRAM에는 Z/알파/스텐실/AA 의 처리를 맡은 로직이 탑재되어 있으며, 인텔리전트 eDRAM 상에서 처리한다. 다시 말해 GPU쪽에서 eDRAM으로 명령을 보내는 것만으로 무거운 안티앨리어싱같은 처리에서 자유로워진 셈이다.


엑스박스360 GPU 아키텍쳐


PS2이후 게임기는 컴퓨터 테크놀러지와 대등한 위치에 서게 되었다. 이번에 확실히 밝혀진 PS3와 엑스박스360의 스펙을 보더라도 경쟁의 수레바퀴가 돌아가기 시작했음을 알리고 있다. 그리고 차세대 게임기는 단순히 게임을 즐기는 머신에서 벗어나 좀 더 뛰어난 범용성을 가진 머신으로 진화해가고 있다는 것 자체만으로도 게이머들에게 또 다른 재미를 얻을 수 있는 요소로 자리 잡을 것이다.

[김정석 게임동아 리뷰 전문 필자]

게임동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.