이 벤치가 완성되기까지 신세진 분들이 많지만 그 중에서
- 라데온 5830을 제공해 주신 손운용님,
- 라데온 5850을 빌려주신 양슬기님,
- 라데온 4890을 빌려주신 김대철님,
- 지포스 GTX260을 빌려주신 방완석님과
- 지포스 GTX280을 빌려준 김우영군에게 감사의 뜻을 전합니다.



1. 라데온 HD 5830 소개


상당히 큰 박스입니다. 심지어 지금까지 본 어떤 5850 박스보다도 큽니다. -_-;


카드를 들어내자 부속품 상자가 나오는데... 부속은 상당히 단촐합니다.
보조전원 단자 변환케이블, D-SUB <-> DVI 변환단자, CF 브릿지, 드라이버 CD, 매뉴얼이 동봉되어 있습니다.


보조전원을 "반드시" 끼워야 합니다.


5개의 히트파이프가 내장된 쿨러에, 6핀 보조전원 2개를 요구합니다.
하나의 6핀 보조전원이 최대 75W를 공급하므로 최대 150W까지 추가로 공급해 줄 수 있습니다.


위에서부터 라데온 5850, 5830, 5770입니다. 길이가 오히려 5850보다 더 깁니다;


위에서부터 지포스 GTX280, 라데온 5830, 4890입니다. GTX280보다는 조금 짧습니다.

라데온 5830은 5870 / 5850과 같은 RV870 (Cypress) 칩으로부터 만들어진 제품입니다.
5870이 RV870 칩이 될 수 있는 완전체라면, 5850 / 5830은 그로부터 조금씩 기능이 제한된 버전입니다.


하나의 RV870 칩이 5870으로 생산되기 위해서는 아래의 요건을 충족시켜야 합니다.

1. 850MHz 이상의 작동속도
2. 스트림프로세서 (SP) 유닛의 완결성 (1600개)
3. 텍스처 매핑 유닛 (TMU) 의 완결성 (80개)

3. 렌더링 파이프 (ROP) 의 완결성 (32개)


위에서 1~3번 중 어느 하나라도 충족되지 못하면 해당 RV870 칩은 5870으로 생산될 수 없습니다.
한 RV870 칩이 1번만을 충족시키지 못하거나, ROP가 멀쩡하고 SP 중 적어도 1440개는 무결하다면
그 칩은 작동속도를 725MHz로 낮추고 SP를 1440개로, TMU를 72개로 줄여 5850으로 출시됩니다.
하지만 어떤 칩이 ROP에 결함이 있거나 멀쩡한 SP가 1440개를 밑돌 경우엔 5850으로도 만들어질 수 없죠.
이런 불량칩을 구제하기 위해, SP를 1120개로, TMU를 56개로, ROP를 16개로 줄인 버전이 5830입니다.
오리지널 RV870 칩에 비하면 SP / TMU의 30% (480개 / 24개), ROP의 절반 (16개) 이 줄어들었습니다.
5870 / 5850에 비해 줄어든 스펙이 너무 크므로 작동 속도는 5850보다 높은 800MHz가 되었습니다.

5830은 스펙 대비 낮은 소비전력/저발열, DX11/Eyefinity 지원 등 RV870 칩의 특징을 고스란히 갖고 있으나

앞에서 말한 SP / ROP의 제약 때문에 5870 / 5850보다 낮은 성능을 보일 것임을 예상해볼 수 있습니다.
특히 현존하는 게임들이 GPU의 쉐이더 성능 (SP 갯수에 비례) 을 다 뽑아내는 경우는 드문 반면에
픽셀을 렌더링하는 ROP 가 줄어든 점은 실제 게임성능에 병목현상을 야기할 가능성이 높습니다.

이 벤치에서는 5830의 성능을 검증함과 동시에,
AMD의 라인업 상으로 5830의 위아래에 위치하는 5850과 5770과의 비교를 통해
5830이 정확히 어느 시장을 겨냥하는 제품인지 살펴보고자 합니다.
또한 뒤에서 나오겠지만, 5830이 그간 알려진것과 달리 제가 받은 제품은 수율이 상당히 좋았습니다.
전압조절이 불가능해 모든 설정을 기본전압에서 맞춰야 했는데도 950/1200에서 모든 테스트가 가능했습니다.
오버클럭에 대해선 이 글 후반에 다루도록 하겠습니다.



2. 테스트 설정


테스트에 사용한 그래픽카드는 아래와 같습니다.

- AMD Radeon HD 5850 1GB (Core 725MHz / Memory 1,000MHz)
 └ 5850 OC (Core 925MHz / Memory 1,150MHz)
- AMD Radeon HD 5830 1GB (Core 800MHz / Memory 1,000MHz)
 └ 5830 OC (Core 950MHz / Memory 1,200MHz)
- AMD Radeon HD 5770 1GB (Core 850MHz / Memory 1,200MHz)
 └ 5770 OC (Core 1,000MHz / Memory 1,400MHz)
- AMD Radeon HD 4890 1GB (Core 850MHz / Memory 975MHz)
- AMD Radeon HD 4870 1GB (Core 750MHz / Memory 900MHz)
- nVIDIA GeForce GTX285 1GB (Core domain 648MHz / Core shader 1,476MHz / Memory 1,242MHz)
- nVIDIA GeForce GTX280 1GB (Core domain 602MHz / Core shader 1,296MHz / Memory 1,107MHz)
- nVIDIA GeForce GTX260 896MB (Core domain 576MHz / Core shader 1,242MHz / Memory 999MHz)

테스트에 사용한 시스템은 아래와 같습니다.

<Hardware>
- CPU: AMD Phenom II X4 965 Black Edition 4.1GHz (HT Reference Clock 200MHz x Multiplier 20.5)
- Motherboard: MSI 790FX-GD70
- RAM: GeIL EVO-ONE DDR3 PC3-12800 CL7 2GB x 2EA
- Storage: Intel X25-M G2 MainStream SATA SSD 80GB
- Power Supply: Zalman ZM850-HP 80PLUS


<Software>
- Operating System: Microsoft Windows 7 Professional K 64-bit
- AMD Graphics Driver: Catalyst 10.3 Preview / 10.3a (for 5830 only)
- nVIDIA Graphics Driver: GeForce 196.21 WHQL

테스트에 사용한 게임은 아래와 같습니다. (alphabetical order)

- 3DMark Vantage
- Call of Juarez 2: Bound in Blood [Demo]
- Crysis: Warhead
- F.E.A.R 2: Project Origin
- S.T.A.L.K.E.R: Clear Sky
- Warhammer 40,000: Dawn of War [Demo]


또한, 게임 테스트는 아니지만 GPU의 범용적인 활용이란 추세에 맞춰
각 그래픽카드의 GPGPU성능을 측정해 보았습니다.
ElcomSoft 사의 Wireless Security Auditor 라는 프로그램으로, 랜덤 해시파일의 암호를 찾도록 했습니다.

- ElcomSoft Wireless Security Auditor



3. 테스트 방법

3DMark Vantage는 아래와 같이 Graphics Test 1 / 2만 실행하여 GPU Score를 얻었습니다.
아래와 같은 과정을 거쳐 3DMark Vantage GPU Score를 얻었습니다. (Performance / High Presets)

메인 화면에서 CPU Test 1 / 2를 선택 해제합니다. (CPU Score를 얻을 필요가 없습니다.)

OPTIONS -> FEATURES TESTS에서 테스트 여섯개를 모두 선택 해제합니다. 이후 실행.

게임 테스트에서는 각 그래픽카드로 각 게임을 플레이하며 최저/평균 프레임수를 측정했습니다.
테스트한 해상도는 1280x1024 (3DMark Vantage only), 1680x1050, 1920x1200 입니다.
1920x1200에서는 각 게임에서 줄 수 있는 가장 높은 옵션을, 1680x1050은 한단계씩 내린 옵션을 주었습니다.
1680x1050 해상도는 22인치 이하의 대부분의 와이드 모니터에서 지원하는 최대 해상도이고
1920x1200 해상도는 24인치 이상 30인치 미만의 모니터에서 지원하는 최대 해상도입니다.
대부분의 사용자들이 실제로 사용하는 환경과 비슷하게 맞추는 것을 염두에 두었습니다.

구체적으로, 게임별로 플레이한 부분은 아래와 같습니다.

- Call of Juarez: 챕터 1 클리어
- Crysis: 첫 장 "Call me Ishmael" 의 첫 시퀀스 (바위 위로 점프)
- F.E.A.R 2: 인터벌 1의 첫 시퀀스 스킵, 발키리빌딩 안에서 최초의 세이브포인트까지
- S.T.A.L.K.E.R: 침상에서 일어나 기지 내 미션을 수행하며 기지 밖으로 나가기까지
- Dawn of War: Day 1 클리어


한편, GPGPU 성능측정을 위한 ElcomSoft Wireless Security Auditor의 사용법은 아래와 같습니다.

1. http://www.elcomsoft.com/download/ewsa.zip 에서 트라이얼 버전을 다운, 설치
2. 실행 후 (트라이얼 버전은 15초 딜레이 필요) 아래 사진을 따라함

ewsa_1.jpg

맨 처음 실행하면 [File] 메뉴를 선택합니다.

ewsa_2.jpg
ewsa_3.jpg
ewsa_4.jpg 
ewsa_5.jpg 
ewsa_6.jpg

CPU를 테스트할땐 GPU 가속을 해제합니다.

당연한 말이지만, GPU를 테스트할땐 체크해야 합니다.

ewsa_7.jpg

설정 저장 후 Stark Attack 아이콘을 클릭하면 위 스샷처럼 복호과정이 진행됩니다.

ewsa_8.jpg

테스트가 끝나면 암호를 찾는 데 실패했다고 뜨거나 성공했다고 뜹니다. 어느 쪽이든 결과엔 영향이 없습니다.
우측 상단에 Average Speed가 뜨는데, CPU or GPU가 연산한 속도를 나타냅니다. 이 값을 3회 얻었습니다.



4. 테스트 결과 및 분석

3DMark Vantage


3DMark는 벤치마킹 프로그램의 특성상 쉐이더 성능에 편중된 결과를 보여주곤 합니다.
쉐이더를 처리하는 스트림프로세서가 1120개로 많은 5830이 좋은 점수를 내고 있습니다.
(5850의 스트림프로세서는 1440개, 5770/4800 시리즈는 800개로 5830이 정확히 그 사이에 위치합니다.)
특히 Performance Preset에서는 오버클럭된 5830의 점수가 5850보다도 좋았습니다.
과연 그럼 실제 게임에서의 성능은 어떨까요? 여전히 5830이 좋은 성능을 보여줄까요?

Call of Juarez: Bound in Blood [Demo]


Call of Juarez로 게임벤치를 해보니 솔직히 의외였습니다.
5830은 상위 제품에 비해 반토막난 ROP 때문에 게임성능이 많이 떨어진다는 것이 상식처럼 여겨졌는데,
실제로 테스트해보니 꽤 준수한 성능을 보여줍니다.
다만 3DMark Vantage에서 오버된 5830은 5850의 성능을 넘어섰지만, 게임에선 5850에 미치진 못하는군요.
이 게임에서만 그런지, 다른 게임에서도 꾸준히 좋은 성능을 보여줄지 두고 봅시다.
한편, 미들레인지의 경쟁상대인 5770 / 4870 / GTX260 셋의 접전도 주목할만한 부분입니다.
서로 거의 비슷한 프레임을 기록했던 1680x1050 해상도의 결과와 달리
고해상도로 올라가자 5770이 나머지 둘과 약간의 격차를 보이며 뒤처지는 모습입니다.
128bit로 좁아진 메모리 대역폭에 발목이 잡힌 듯 합니다.

Crysis: Warhead


Crysis에서는 5830이 맥을 못 추는 모습입니다. 노오버 기준으로 비슷한 체급인 GTX280, 4890에게 밀립니다.
(GTX280은 단종되었지만, GTX275와 거의 같은 성능입니다. 따라서 GTX275로 간주하고 봐도 무방합니다.)
모델명과는 상당히 다르게, 5850보다는 5770에 더 가까운 성능을 보이는 것 같습니다.
여전히 5770은 하위권에 머물러 있고, 고해상도에서 4870의 약진이 눈에 띄는 부분입니다.
특히 타 게임에서 GTX280 / 4890과 어깨를 나란히 하던 오버클럭된 5770은
이 게임에선 해상도가 올라가자 차라리 4870에 더 가까운 성능을 보이고 있습니다.

F.E.A.R 2: Project Origin


F.E.A.R 2에서는 다시 5830이 이름값을 하는 것 같군요.
여전히 5830은 오버해도 5850을 따라잡지는 못하지만 GTX280 / 4890보다는 좋은 성능을 보입니다.
중위권에선 4890 / 5770 OC / GTX280이 거의 같은 성능을 보이며 엎치락뒤치락 하고 있습니다.
한편 GTX260은 두 해상도에서 모두 바닥을 벗어나지 못하고 있습니다.

S.T.A.L.K.E.R: Clear Sky


여기서는 5830의 성능이 매우 이상한 양상으로 나옵니다. (테스트를 몇 번 다시 해봤습니다;;)
저해상도에서는 5770보다도 저조한 성능을 보이는데, 오히려 고해상도에서 5850을 턱밑까지 추격합니다.
드라이버 최적화가 되지 않아 저해상도에서 제 성능을 못 내고 있거나,
고해상도에서의 일부 옵션이 제대로 적용되지 않아 실제 성능 이상으로 높게 나온게 아닐까 짐작합니다.
한편, 이 게임에선 지포스 시리즈의 성능 순위도 이상합니다. -_-; 벤치용으로 좋지 않은 게임 같군요;
아무튼 액면 그대로 해석하자면, 지포스 계열에 최적화가 잘 안되어 성능이 잘 안 나오는것 같습니다.

Warhammer 40,000: Dawn of War [Demo]


워해머에서는 다시 5830이란 이름값을 하는 것 같습니다.
다만 그래프의 전후에 위치한 다른 그래픽카드에 비해 최저프레임이 유독 떨어지는 모습을 보이는데,
드라이버가 최적화되지 않았거나 타 그래픽카드에 비해 적은 ROP가 특정 구간에서 병목을 초래한 듯 합니다.
또한 이 게임에서는 5770이 4870 / GTX260 (고해상도 only) 보다 확실히 나은 성능을 보여줍니다.
GPU 클럭이 같고 스트림프로세서 갯수가 같은 4890과 5770은 거의 비슷한 성능을 보이고 있습니다.
렌더링이 많이 요구되지 않는 전략 시뮬레이션의 특성상 GPU의 성능만이 많이 반영된 것 같습니다.

마지막으로, 이 벤치에선 그간 다른 곳에선 다루지 않았던 GPGPU 성능을 측정해 보았습니다.

ElcomSoft Wireless Security Auditor


이 프로그램은 GPU 가속을 지원하는데, CUDA에 최적화되었지만 AMD의 그래픽카드도 사용 가능합니다.
그런데 CUDA에 최적화되었단 말이 무색하게 상위권을 라데온 시리즈가 독식하고 있습니다.
(5770은 알 수 없는 이유로 제대로 테스트되지 않았습니다.)
GPU의 연산능력은 같은 아키텍처의 GPU일 경우 스트림프로세서 (쉐이더) 갯수에 거의 정비례합니다.
들쭉날쭉한 게임성능을 보이던 5830은 이제서야 많은 스트림프로세서 갯수의 장점을 살리고 있습니다.
한편, 현존하는 가장 빠른 프로세서들조차 가장 느린 GPU 가속의 1/3에도 미치지 못하는 성능을 보입니다.

마지막으로, 지금까지 살펴본 게임 성능을 5830 대비 표로 모아 보았습니다.


출시 후 이름값을 못하는 성능에 뭇매를 맞은 5830이지만 이번엔 한결 나아진 모습을 보이는것 같습니다.
여러 요인이 있을 수 있겠지만 비로소 '공식' 드라이버가 지원된 점이 한몫 한 것 같습니다.
대체로 5770과는 16~17%, 5850과는 22~29% 성능차를 보여 5850보다는 5770에 더 가까운 성능입니다.
성능대로 이름을 짓자면 아직도 5830이 되긴 한참 멀었습니다-_-; (한 5790쯤이 어땠을지...)
GTX280 (= 275), 4890과는 거의 비슷한 성능이고, GTX260과는 약간 거리를 둔 성능차를 보여줍니다.



5. 5830 오버클럭

AMD 그래픽카드를 오버클럭하는 가장 손쉬운 방법은 카탈리스트 오버드라이브입니다.
5830을 지원하는 드라이버는 "5830 전용 카탈리스트" 10.2 / 그저께 공개된 카탈리스트 10.3a 입니다.
10.3a에서는 5830도 기존의 5000 시리즈와 차이 없이 제대로 인식해서 설치됩니다.

카탈리스트를 설치한 뒤 "고급" 모드로 들어와서 상단의 그래픽 메뉴를 눌러보면 오버드라이브가 있습니다.


그런데 오버드라이브에서 제공하는 오버클럭 폭이 너무 작습니다. 고작 75MHz라니...
아무튼 오버클럭을 하려면 전압을 올려줘야 하니 MSI Afterburner를 켜 봤습니다.


...???
전압조절이 안되네요-_-;
(보통 이럴 경우 우측하단의 Settings -> Unlock Core Voltage 메뉴를 클릭하면 전압조절이 활성화되는데, 5830에선 그것마저 먹히지 않았습니다. 최근에 나온 제품이라 프로그램이 지원을 안하는지 모를 일입니다.)
아무튼 전압변경마저 불가능해지자 다른 변수 생각할것 없이 한계클럭만 찾으면 되서 편하긴 하더군요;
AMD GPU Clock Tool을 이용했습니다.


가장 간단한 사용법을 자랑합니다. 숫자를 직접 입력하고 Set Clocks을 클릭하면 됩니다.
그런데 전압조절도 불가능한것 치고는 꽤 좋은 오버율을 보여줬습니다.
기본전압에서 코어 975MHz / 메모리 1200MHz까지 3D마크 밴티지와 크라이시스를 돌릴 수 있었습니다.
(아쉽게 다른 게임에서 테스트 진행이 불가능하여, 이 벤치에선 최종적으로 950 / 1200 설정을 썼습니다.)




6. More on this topic

5830의 성능이 5850보다 낮을 것이라는 건 이미 스펙상으로 유추가 가능했던 내용이지만
4890보다도 일부 테스트에서 떨어지는 성능을 보이는 것은 단순한 최적화 미비로 치부하기엔 부족해 보입니다.
(특히나 10.3a 드라이버로 많은 성능향상이 된 직후이기 때문에...)

RV870 칩의 코어 구조를 보며 근본적인 원인에 대해 생각해 봅시다.

<5800 시리즈의 구조>


<RV870 vs RV840 vs RV790>


두번째 그림에서 보듯 RV870 칩은 RV840의 듀얼코어 격으로 해석할 수 있는데,

5830은 듀얼코어 방식인 RV870의 양쪽 '코어' 에서 대칭적으로 SP / ROP를 삭제한 버전입니다.
여기서 중요한 것은, RV840과 유사한 구조인 RV790 (라데온 4800 시리즈) 칩과 비교했을 때인데
코어 하나가 온전히 16개의 ROP를 사용하는 4800 시리즈와 달리
5830은 '코어' 하나에 배분된 ROP는 사실상 8개에 불과하므로 실제 렌더링 성능은 더 떨어질 수도 있습니다.
이는 듀얼코어의 양쪽에 명령어를 배분하는 디스패치 로직이 100% 이상적인 배분을 하지 못하기 때문인데
쉽게 얘기하자면 듀얼코어 CPU가 같은 클럭 싱글코어의 두 배의 성능을 내지 못하는 이유와 같습니다.

따라서 현 시점에서는 5830이 드라이버 최적화가 이루어진다고 하더라도
5000 시리즈의 명령어 처리 알고리즘이 4800 시리즈에 비해 획기적으로 개선되는 패치가 아닌 한
5830이 4890을 안정적 & 항구적으로 상회하는 것은 어려울 것으로 보입니다.
다만 5870 / 5850과 같은 기판을 재활용한 경우 막힌 ROP를 뚫는 개조법이 알려질지도 모르는 일입니다.
최소한 ROP가 24개만 되었어도 지금보다는 훨씬 좋은 성능을 보였으리라 생각됩니다.

개인적으로는, AMD (ATi) 의 선례를 보았을 때 5830도 개조방법이 발견되지 않을까 생각합니다.


지금까지 긴 글을 읽어주셔서 감사합니다~ ^,.^