기글 하드웨어 하드웨어 포럼
컴퓨터 하드웨어에 관한 이야기를 자유롭게 나누는 곳입니다.
그 동안 페놈의 암울한 모습만 보아왔습니다.
오늘 서핑중에 발견한.......
페놈의 새로운 모습입니다....

뭐... 다른 벤치들은 항상 보던 결과와 같습니다...
Linpack 이 무엇이냐고 물어보신다면.....
Linpack은 부동소수점 연산 성능을 계측하는 프로그램입니다.
Linpack을 병렬화시켜서 슈퍼컴퓨터의 성능 측정에도 사용합니다.
그렇다고 우리들과 거리가 먼 프로그램 종류도 아닙니다.
코어2쿼드나 코어2듀오를 사용하시는 분들도 아마... 저것과 비슷한 프로그램을 사용했을 것입니다.
CPU를 혹사시키는 ... 인텔번이라는 것을 많이 사용하시죠?
그 인텔번이 Linpack의 한종류 입니다.
오늘 서핑중에 발견한.......
페놈의 새로운 모습입니다....

뭐... 다른 벤치들은 항상 보던 결과와 같습니다...
Linpack 이 무엇이냐고 물어보신다면.....
Linpack은 부동소수점 연산 성능을 계측하는 프로그램입니다.
Linpack을 병렬화시켜서 슈퍼컴퓨터의 성능 측정에도 사용합니다.
그렇다고 우리들과 거리가 먼 프로그램 종류도 아닙니다.
코어2쿼드나 코어2듀오를 사용하시는 분들도 아마... 저것과 비슷한 프로그램을 사용했을 것입니다.
CPU를 혹사시키는 ... 인텔번이라는 것을 많이 사용하시죠?
그 인텔번이 Linpack의 한종류 입니다.
2008.11.20 22:16:06
서버나 슈퍼 컴퓨터에서의 성능은 정말 발군이었으니까요. 이번 45나노 제품은 IPC 상승분도 있고, 클럭 상승분도 있으니 네할렘과 비교해 어느쪽이 이길 지 정말 흥미롭지요^^
2008.11.20 22:46:07
절대적 기준에서 네할렘이 밀리긴 하지만, 서버처럼 다수의 프로세서를 병렬 구성하는 경우에
채산성에서 아주 유리하겠지요. AMD 앞으로도 분발해주었으면 좋겠어요 ^^
채산성에서 아주 유리하겠지요. AMD 앞으로도 분발해주었으면 좋겠어요 ^^
2008.11.20 22:50:55
넨할렘 HT OFF 시 성능저하폭이좀있는것같군요;;~ 상하이는 과연어떻게될지 넨할렘 2WAY VS 상하이 4WAY ~ 가격은 비슷한것으로알고있는;;~
2008.11.20 22:56:02
네할렘이야 HT빨로 상하이보다는 확실히 우위에 있을겁니다. 아키텍쳐도 서버에 맞게끔 변형 시키기도 했지만.
흠. 2.5GHz의 페넘 9850이 저정도면 3G 이상의 상하이에서는 최소한 킨텔의 C2Q급 제온 정도는 우습게 넘기겠군요.
흠. 2.5GHz의 페넘 9850이 저정도면 3G 이상의 상하이에서는 최소한 킨텔의 C2Q급 제온 정도는 우습게 넘기겠군요.
2008.11.21 02:00:29
TLB버그도 서버 컴퓨팅이 아닌 이상에는 별 의미가 없지요.
AMD의 버그가 프로세서 내 캐시 사이의 특정 버스가 오작동하는 것이고,
QPI가 시스템 내의 장치간에 존재하는버스에서 발생하는 것이라는 세부적인 현상이 아니라,
"버그라는 것이 존재하는 상황"이라는 좀 더 거시적인 상황으로 보자는 것입니다.
사실 버그의 심각성은 개인 사용자에게 끼치는 영향이 없을 정도라고 봐도 무방하지만,
반응의 판이함이 의아하다는 이야기입니다. 페넘의 경우에 나타났던 극렬한 구매의향 감소와 달리
QPI 버그의 경우는 거의 묻혀가다시피 한다는 거죠.
무엇인지도 모르는 QPI와 TLB의 버그를 접하면서, 상이한 반응을 보이는 두 상황의 대조가 마음에 들지 않는다는 것입니다 ^^
AMD의 버그가 프로세서 내 캐시 사이의 특정 버스가 오작동하는 것이고,
QPI가 시스템 내의 장치간에 존재하는버스에서 발생하는 것이라는 세부적인 현상이 아니라,
"버그라는 것이 존재하는 상황"이라는 좀 더 거시적인 상황으로 보자는 것입니다.
사실 버그의 심각성은 개인 사용자에게 끼치는 영향이 없을 정도라고 봐도 무방하지만,
반응의 판이함이 의아하다는 이야기입니다. 페넘의 경우에 나타났던 극렬한 구매의향 감소와 달리
QPI 버그의 경우는 거의 묻혀가다시피 한다는 거죠.
무엇인지도 모르는 QPI와 TLB의 버그를 접하면서, 상이한 반응을 보이는 두 상황의 대조가 마음에 들지 않는다는 것입니다 ^^
2008.11.21 11:19:31
그건 소프트웨어적인 레벨, 즉 바이오스 레벨에서 해결하는 임시방편이였고요,
하드웨어적으로 해결한게 B3스테핑이예요. L3비활성화 시키는 임시방편에서 넘어간 방법입니다. 그래서 퍼포먼스 하락이 전혀 없습니다.
그리고 제가 페넘 9500쓸때 TLB패치 끄고 몇달간 이것저것 돌려봤지만(일부러 무거운 작업도 여러개 돌려보고)
TLB때문에 생긴 문제는 없었습니다 - _-a 이것도 솔직히 로또 확률이라고는 합니다만 이걸 엄청 부풀려서 이야기 하더군요.(참고로 실제로 TLB버그 증상 호소한 분도 있긴 했습니다) 따지고 보면 콘로 초기형에도 이 문제가 있었고, 실제로 이 문제를 호소한 적도 극히 일부 있었습니다.
제가 보기에는, 암드의 버그는 똑같은 정도의 버그라 하더라도 성능과 브랜드 밸류가 떨어진다는 이유로 외면 받는데
킨텔의 버그는 성능이 원체 좋으니 그냥 넘어가는 분위기인듯.
하드웨어적으로 해결한게 B3스테핑이예요. L3비활성화 시키는 임시방편에서 넘어간 방법입니다. 그래서 퍼포먼스 하락이 전혀 없습니다.
그리고 제가 페넘 9500쓸때 TLB패치 끄고 몇달간 이것저것 돌려봤지만(일부러 무거운 작업도 여러개 돌려보고)
TLB때문에 생긴 문제는 없었습니다 - _-a 이것도 솔직히 로또 확률이라고는 합니다만 이걸 엄청 부풀려서 이야기 하더군요.(참고로 실제로 TLB버그 증상 호소한 분도 있긴 했습니다) 따지고 보면 콘로 초기형에도 이 문제가 있었고, 실제로 이 문제를 호소한 적도 극히 일부 있었습니다.
제가 보기에는, 암드의 버그는 똑같은 정도의 버그라 하더라도 성능과 브랜드 밸류가 떨어진다는 이유로 외면 받는데
킨텔의 버그는 성능이 원체 좋으니 그냥 넘어가는 분위기인듯.
2008.11.21 11:45:45
제 의도가 충분히 전달되지 않은 것 같습니다.
표현방식에 부족한 점이 있었다면 사과드릴게요 ^^
일반적인 사용자에게 비슷하게 받아들여질 인텔과 AMD의 문제에 대한
반응의 판이함이 못 마땅하다고 말씀드린 것입니다.
그리고 TLB버그는 Race condition 상태에서 상호배제의 실패로 인해 순차적인 연산이 불가능해진 탓에
시스템이 교착상태에 빠지게 되는 것이라는 것도 익히 알려진 사실이구요.
최종적으로는 298개의 erata를 수정하여 해결한 것으로 알고 있습니다만.
인텔의 QPI 버그가 NUMA 문제라고 하면 거의 Cache Coherence와 직결될 것 같은데
그렇게 되면 프로세서 설계 문제로 연관되니 QPI버그 자체와의 관계는 줄어들겠지요.
제 생각에는 다른 원인이 아닐까 조심스레 추측해봅니다 ^^
표현방식에 부족한 점이 있었다면 사과드릴게요 ^^
일반적인 사용자에게 비슷하게 받아들여질 인텔과 AMD의 문제에 대한
반응의 판이함이 못 마땅하다고 말씀드린 것입니다.
그리고 TLB버그는 Race condition 상태에서 상호배제의 실패로 인해 순차적인 연산이 불가능해진 탓에
시스템이 교착상태에 빠지게 되는 것이라는 것도 익히 알려진 사실이구요.
최종적으로는 298개의 erata를 수정하여 해결한 것으로 알고 있습니다만.
인텔의 QPI 버그가 NUMA 문제라고 하면 거의 Cache Coherence와 직결될 것 같은데
그렇게 되면 프로세서 설계 문제로 연관되니 QPI버그 자체와의 관계는 줄어들겠지요.
제 생각에는 다른 원인이 아닐까 조심스레 추측해봅니다 ^^
2008.11.21 12:20:34
서로간의 의견을 교환하는 것인데.... 사과라뇨... 받을 자격도 없습니다.
원래 어떤 이야기가 슝하고 나오면 떠들기 좋아하는게 사람의 심리이니 어쩔수 없는 것 같습니다.
인텔은 자신들의 브랜드로 감추고 있으니.... 문제가 있어도 압력을 조금 가하여 수그러들게 만들겠죠?
출시된 네할렘을 볼때는 은령강님 말씀처럼 프로세서 설계와 캐쉬일관성 문제는 아닌 것 같습니다..
2소켓 이상에서 NUMA와 관련되어 이런 것이 아닐까요?
대충 이런형태로 4소켓의 형태가 구현되겠죠
모든 CPU들은 통신은 QPI를 통해 연결이 되어 있습니다.
RAM1 - CPU1 - QPI - CPU2 - RAM2
l QPI lQPI
RAM3 - CPU3 - QPI - CPU4 - RAM4
생각해볼수 있는게...
QPI를 통해서 각 CPU간에 탑재된 메모리의 접근이 자유롭고 동작이 원할해야 되는데 그게 아닐까요?
근데 이것도 캐쉬와 연관이 되는 말이군요...
원래 어떤 이야기가 슝하고 나오면 떠들기 좋아하는게 사람의 심리이니 어쩔수 없는 것 같습니다.
인텔은 자신들의 브랜드로 감추고 있으니.... 문제가 있어도 압력을 조금 가하여 수그러들게 만들겠죠?
출시된 네할렘을 볼때는 은령강님 말씀처럼 프로세서 설계와 캐쉬일관성 문제는 아닌 것 같습니다..
2소켓 이상에서 NUMA와 관련되어 이런 것이 아닐까요?
대충 이런형태로 4소켓의 형태가 구현되겠죠
모든 CPU들은 통신은 QPI를 통해 연결이 되어 있습니다.
RAM1 - CPU1 - QPI - CPU2 - RAM2
l QPI lQPI
RAM3 - CPU3 - QPI - CPU4 - RAM4
생각해볼수 있는게...
QPI를 통해서 각 CPU간에 탑재된 메모리의 접근이 자유롭고 동작이 원할해야 되는데 그게 아닐까요?
근데 이것도 캐쉬와 연관이 되는 말이군요...
작성된지 2주일이 지난 글에는 새 코멘트를 달 수 없습니다.
