TechReport의 SSD 연속 데이터 기록 내구성 테스트는 여전히 계속되고 있습니다. 4개월 쯤 전에는 누적 데이터 쓰기 600TB를 돌파했는데 그때 모든 SSD는 정상적으로 작동하고 있었으며 성능도 안정적이었습니다. 삼성 840 시리즈만 일부 TLC 셀의 수명이 떨어졌을 뿐이며(사용에는 지장 없음) 일부 MLC 낸드 플래시도 손상된 구역이 나타났을 뿐입니다.

 

이러다보니 100TB마다 경과 보고를 하는 건 포기하고 바로 1PB, 그러니까 1000TB로 가게 됐습니다. 그리고 마침내, 1000TB의 데이터 쓰기가 끝났고 이제서 경과를 밝히게 됐는데요. 이쯤 되니 각양각색으로 망가진 SSD가 등장하게 됐다고 하네요.

 

1.jpg

 

테스트에 사용한 SSD입니다.

 

커세어 뉴트론 GTX 240GB

인텔 SSD 355 240GB

킹스톤 하이퍼X 3K 240GB(2개를 준비해서 한개는 데이터 압축, 한개는 압축 안함)

삼성 840 256GB

삼성 840 프로 256GB

 

 

첫번째 희생자: 킹스톤 하이퍼X 3K

 

위에서 설명한대로 이 제품은 데이터를 압축한 것고 압축하지 않기로 설정한 것의 2가지로 테스트했습니다. 그리고 이미 짐작하고 계신대로, 암축을 하지 않은 쪽이 테스트 통과에서 실패했습니다.

 

728TB의 데이터를 기록하자 사망했거든요. 반면 그걸 압축한 쪽은 501TB를 기록하는 데 그쳤을 뿐입니다.

 

첫번째 경고는 700TB의 시점에서였습니다. 그걸 무시하자 725TB에서 다시 에러가 났는데 이건 운영체제에서 난 것입니다. 윈도우가 하드디스크의 에러를 발견했으니 데이터를 당장 백업하지 않으면 날리게 될 지도 모른다고.

 

경고가 뭐라 뜨건 테스트를 밀어 부치자 경고가 계속해서 뜨더니 3TB 정도를 기록하고 죽었습니다. Anvil에서도 에러가 뜨네요. 디스크 자체는 여전히 액세스가 되지만 마지막 SMART 데이터를 내놓은 후 벽돌이 됐습니다.

 

2.gif

 

사실상 진정한 표시 수명은 낸드 플래시 칩의 완정성이 아니라 손상 지수 MWI라 할 수 있겠습니다. 대부분의 퍼스트파티와 서드파티 툴은 이를 기준으로 해서 SSD의 잔여 수명을 표시합니다.

 

공장에서 나왔을 때 이 숫자는 100입니다. 그리고 SSD를 사용하기 시작하면 점점 줄어들고 마지막에 0이 되면 수명이 다 하는 것이지요. 이론적으로는 여전히 이 때도 일정 시간은 쓸 수 있지만요. 이것은 치환된 섹터와는 전혀 무관한 것입니다.

 

위 그래프를 보면 700TB 시점에선 MWI가 10으로 떨어졌고 728TB에선 0ㅇ이 됐습니다.

 

3.gif

 

이번엔 에러입니다. 600TB를 넘어선 순간부터 각종 에러가 급격하게 늘어나게 됩니다. 마지막엔 986개의 치환된 섹터(600TB에선 10개밖에 없었습니다), 111개의 프로그램 실패, 381개의 삭제 실패가 떴습니다. 이것은 무효된 섹터의 절반이 ECC 에러 검증 실패에서 비롯된 것이란 이야기입니다.

 

하이퍼X 3K는 일정한 비례의 예비 용량을 갖추고 있습니다. 하지만 그 용도는 내부 관리 기능과 RAISE(샌드포스의 관리 기술)이기에 섹터 치환에 쓸 수 있는 양이 매우 적고, 그래서 일정 수준을 넘어서면 급격하게 에러가 늘어납니다.

 

킹스톤은 수명이 다한 디스크는 로딩을 거부하기에 검사도 불가능하다고 설명합니다.

 

 

두번째 희생자. 인텔 SSD 335

 

누적 쓰기 데이터가 700TB에 도달했을 때 SMART에서 에러가 뜨기 시작합니다. 하지만 사용에는 별 문제가 없습니다. 낸드 플래시 메모리 셀은 별 문제가 없으며 오직 1개의 치환된 섹터가 존재할 뿐입니다. 이것은 300TB의 데이터를 기록했을 때부터 존재했던 것이지요.

 

계속해서 데이터 기록을 해 나가서 50TB를 더 써 넣어 750TB가 되자 문제가 발생합니다. 데이터 쓰기를 담당한 Anvil Storage Utilities 에서 에러를 뱉어내기 시작한 것이지지요. 프로그램 자체가 응답을 하지 않았습니다. 다행인 건 프로그램을 껐다 켜자 다시 됐다는 것. 로그는 남았는데(나중에 분석할 예정입니다) 다시 데이터를 기록할 순 없었습니다.

 

4.gif

 

SSD 335는 700TB를 기록한 후에 MWI 지수가 0으로 떨어졌습니다. 이것은 낸드 플래시를 더 이상 신뢰할 수 없게 됐으니 계속해서 사용할 수 없다는 것입니다.

 

이상한 건 쓰기 에러가 난 후에 SMART 역시 어떤 정보도 보고하지 않았다는 것입니다. 그 어떤 툴에서도 엑세스할 수 없었지요. 이것은 SMART 기술이 시대에 뒤떨어졌다는 말일지도 모르겠습니다.

 

시스템을 재부팅하자 인텔 SSD 툴박스에선 이 SSD를 인식했고 검사할 수 있었지만 용량은 0GB로 나와 사용이 불가능했습니다.

 

인텔은 이 결과과 예상대로 나온 것이며, 쓰기 에러가 난다는 건 이 드라이브를 오직 읽기 전용으로만 쓸 수 있다는 것, 또 계속해서 엑세스를 시도해 봤자 자살일 뿐이라고 밝혔습니다. 

 

5.jpg

 

 

세번째 희생자: 삼성 840

 

TLC 낸드 플래시는 앞서지도 뒤쳐지지도 않았습니다. 그래도 안심하셔도 좋습니다. 900TB를 넘길 때까지 버티고 있거든요.

 

사실 200TB를 돌파했을 때 치환된 섹터가 나타났고 이후에도 계속 늘어나 마지막엔 3500개가 됐습니다. 하지만 예비용 용량이 비교적 많은 덕분에 오래동안 버틸 수 있습니다.

 

900TB의 데이터를 기록한 후에도 840은 여전히 정상이었습니다. 삼성의 SSD 매지션에선 상당한 예비 용량이 남아 있다고 알려주기도 합니다. 간혹 가다가 SSD 매지션이 다운되고 Anvil도 응답이 없고 운영체제의 검사 도구도 무소식이고 오직 인텔의 스토리지 드라이버 보고만이 '알려지지 않은' 삼성 SATA 디바이스가 있다고 알려줄 때만 있습니다만.

 

숱한 보고 끝에 마지막 순간에선 SMART 데이터 역시 손실이 됐습니다. 더 이상 데이터를 기록할 수 없었을 때엔 900TB를 도달한 상태였습니다.

 

6.gif

 

웨어 레벨링 카운터는 300TB를 넘겼을 때 이미 0이 됐습니다. 하지만 삼성의 SSD 매지션에선 여전히 정상이라 표기했으며 실제로도 사용에 문제가 없었습니다.

 

게속해서 테스트를 수행하자 예비 공간은 점점 줄어들었습니다. 하지만 SSD가 죽을 때에도 이미 40%가 남아 있었으니 이론적으로는 더 버틸 수 있다는 말이 되겠네요. SMART 로그가 사라져 어떤 원인으로 죽었는지 알 수 없지만요.

 

7.gif

 

또 다른 중요한 숫자는 복구 불가능한 에러입니다. 이것은 300TB의 데이터를 기록했을 때부터 출현했는데 그땐 176개였습니다. 당시에 데이터 완정성을 교차 시험하기 위한 200GB 용량의 파일 해시가 수차례 실패했기에 새로 복사할 수밖에 없었습니다. 하지만 이후에 그 숫자는 늘어나지 않았습니다.

 

그러다 800~900TB의 어느 시점에 이 복구 불가능한 에러는 갑자기 119개가 늘어나 295개가 됐습니다. 이때 Anvil은 에럴르 보고하지 않았지만 이것이 바로 사망의 원흉이지 않을까 생각합니다. 

 

삼성은 840을 사용중인 사람들은 에러 보고를 유심히 봐야 하며, 만약 호환성 에러, 블루스크린 등이 뜬다면 돌연사할 수도 있으니 추가 조치를 해야 한다고 설명합니다.

 

8.jpg

 

 

1PB 클럽. 3명의 생존자들

 

커세어 뉴트론 GTX, 삼성 840 프로, 킹스톤 하이퍼X 3K(압축 설정)은 모두 1PB를 넘어서도 살아 있습니다. 이는 기적이라도 할 수 있는데요. 왜냐하면 저마다 표기 수명을 200TB씩 넘긴 상황이기 때문입니다.

 

9.jpg

 

10.gif

 

하이퍼X 3K는 데이터를 압축한 덕분에 실제로 낸드 플래시에 기록된 데이터는 716TB밖에 안됩니다. 30%를 절약한 셈이죠.

 

수명은 10밖에 안 남았지만 치환된 섹터는 2개밖에 없습니다. 그리고 프로그램 실패나 삭제 실패도 없죠(압축을 하지 않았을 땐 천개가 넘었지만), 낸드 플래시의 상태도 양호합니다.

 

그 건재함은 앞으로도 계속될 듯 합니다. 남은 건 치환 섹터가 언제 급증하느냐일 듯.

 

11.gif

 

삼성 840 프로의 수명은 400TB에서 이미 바닥을 기었고 500tB에선 0이 됐습니다. 700TB부터는 에비 용량도 점점 줄어들기 시작했으나 아직 20%밖에 쓰지 않았습니다.

 

SSD 매지션에선 아직 양호하다 나오지만 죽지 않을 거라고 보장은 못하겠네요.

 

12.gif

 

치환된 섹터는 600TB를 넘어서자 폭증해 총 1836개가 됐습니다. 각 섹터는 1.5MB니까 총 2.7GB인 셈. 이론적으로는 아직 많은 예비 공간이 있습니다. 

 

13.gif

 

커세어 뉴트론 GTX의 결과는 참 모호합니다. 수명이 여전히 80이나 남아 있고 치환된 섹터는 1개도 없습니다. 불가사의한 결과지요. 이 추세대로 간다면 4PB까지는 살아남을 수 있을 것 같지만 그건 두고봐야 알 일.

 

 

성능 테스트

 

그럼 각 SSD의 성능을 봅시다. 여기선 죽어나간 것도 포함.

 

14.gif

 

4MB 순차 읽기 속도

 

15.gif

 

4MB 순차 쓰기 속도

 

16.gif

 

4KB 랜덤 읽기 속도

 

17.gif

 

4KB 랜덤 쓰기 속도

 

결과는 대체적으로 처음과 같습니다. 하이퍼X 3K는 처음에 랜덤 엑세스가 폭발했지만 지금은 안정적이네요.

 

커세어 뉴트론 GTX는 여전히 좋은 결과를 보여줍니다. 하지만 마지막 순차 읽기에선 큰 폭의 하락을 보여줬으며, 5번을 반복 테스트했으나 마찬가지 결과가 나왔습니다. 원인은 모릅니다. 1.1PB의 테스트에서 다시 보도록 하죠.

 

삼성 840은 마지막 랜덤 엑세스에서 성능 하락이 있었는데 이건 SSD의 수명이 다 된 것과 상관이 있을 듯 합니다.

 

18.gif

 

평균 쓰기 속도의 들쑥날쑥한 결과는 놀랄 것도 아닙니다. 840 프로는 요동이 꽤 두드러지는 편이며 뉴트론 GTX는 뒤로 갈수록 점점 늘어나고 있습니다.

 

이러한 기복은 다들 100TB를 경계로 나타났다 사라지곤 했습니다.

 

19.gif

 

사망한 3개 제품의 결과를 보면 그 파동이 어떤지를 보다 쉽게 알 수 있습니다. 인텔과 킹스톤의 변화는 그나마 경미한 편이며 삼성 840은 뒤로 갈수록 점점 심해집니다. 사망 직전의 데이터가 없는 건 아쉽네요.

 

 

결론

1PB라는 숫자를 달성했습니다. 이를 통과한 SSD는 축하해야 마땅하지만 통과하지 못한 제품 역시 비난할 건 없습니다. 왜냐하면 그들 제품 역시 자신의 가치를 증명했으며 귀한 경험이 됐으니까요.

 

사망의 그 순간까지 SSD는 양호한 성능을 보여주었습니다. 이것은 SSD가 전체 라이프 사이클을 통틀어서 우수한 성능을 유지한다는 이야기를 증명했다고 말할 수 있겠습니다.

 

하지만 SSD마다 그 마지막 결과와 방식은 달랐습니다. 인텔 SSD 335는 자신의 한계를 미리 예견하고 자살하는 쪽에 가까웠으며 킹스톤 하이퍼X 3K는 마지막까지 남은 힘을 비틀어 짜냈습니다.

 

삼성 840의 마지막 순간은 상당히 갑작스러운 것이었으며 수상하기도 했습니다. 하지만 TLC 낸드 플래시의 내구성을 믿을 수 있다는 걸 증명했다고 말할 수 있겠습니다. 비록 대량의 치환된 섹터를 댓가로 한 것이나 그것이 용량에 미치는 영향은 매우 적었습니다.

 

비록 여기에 테스트한 제품이 많지 않지만 그래도 이것 하나는 분명하게 이야기할 수 있습니다. SSD에 매일같이 데이터를 기록하고 사용 습관이 아무리 고약하다 하더라도 700TB를 채우는 데는 전혀 문제가 없을 거라고.

 

20.jpg

 

이곳에선 나머지 3개의 SSD를 대상으로 계속해서 테스트해 나갈 것이라 합니다.

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.