대용량NAND플래시 메모리의 신뢰성이 급격하게 악화되고 있다. 「Flash Memory Summit 2010」의 플래시 메모리에 관한 강연을 청강하는 한, 이렇게 결론 하지 않을 수 없다.

 

 신뢰성이라고 해도 여러가지 있다. 당장, 문제가 되는 것은 다시쓰기가능회수(고쳐 쓰기 수명)이라고 읽어내 잘못율이다. 반도체제조 기술의 미세화가 진행하는 것으로, 고쳐 쓰기 수명이 줄어들고 있다. 그로부터, 다값화 (다비트화)이 진행하는 것이라도, 고쳐 쓰기 수명이 줄어들고 있다. 물론 이것은 소재로서의 이야기이며, 제품으로서의 신뢰성을 유지하는 기술의 도입이 진행하고 있다.

 

 NAND플래시 메모리는 데이타를 써 넣을 때에, 미리 데이타를 소거 해 놓을 필요가 있다. 이 소거 동작이 memory cell에 큰 스트레스를 준다. 미세화는, 스트레스에 대한 내성을 약화시키는 방향에 일한다. 그리고 고쳐 쓰기를 되풀이하면, memory cell의 데이타 읽어 냄에 있어서의 잘못율 (비트 잘못율:BER)이 증가한다.

 

 다값화와는, 1개의 memory cell에 2bit,혹은 3bit이상의 데이타를 기록하는 것을 가리킨다. 2bit를 기록하는 기술은 MLC, 3bit를 기록하는 기술은 TLC이라고 부르고 있다. 덧붙이자면 1bit를 기록하는 종래 기술은 구별 때문에, SLC이라고 불린다.

 

 MLC에서는, memory cell에 4가지의 전압을 써 넣는다. 당연이면서, 2가지의 전압을 써 넣는 SLC에 비교하면, MLC은 마진이 적다. 고쳐 쓰기를 되풀이하면, SLC에 비교해서 비트 잘못율이 증가한다. TLC에서는 게다가 엄격하다. memory cell에 8가지의 전압을 써 넣기 때문이다. 고쳐 쓰기 수명은 MLC보다도 짧아진다. SLC에서는 5만∼10만회, MLC에서는 5,000∼1만회, TLC에서는 약 1,000회 (혹은 1,000회미만)이라고 하는 것이 5xnm세대∼2xnm세대의 고쳐 쓰기 수명이다.

 

photo001.jpg

 

미세화와 다값화 (다비트화)에 의한 고쳐 쓰기 수명의 변화. Anobit의 강연 자료로부터

 

photo002.jpg

 

민생용NAND플래시 메모리의 고쳐 쓰기 수명(왼쪽의 세로축). 횡축은 명기되지 않고 있지만, 미세화 (오른쪽으로 나아갈 만큼 자세해진다)을 의미한다. Micron Technology의 강연 자료로부터

 

 

●블록채의 품질 편차(차이)가 증대

photo003.jpg

 

고쳐 쓰기 회수와 블록채의 읽어 냄 잘못율의 관계. 다시쓰기가능회수가 적을 때는 블록채의 잘못율의 편차(차이)가 3.5배이지만, 고쳐 쓰기 회수가 많아지면 잘못율의 편차(차이)가 40배에도 퍼져버린다. Smart Modular Technologies의 강연 자료로부터

 

 NAND플래시 메모리는 데이타를 1bit단위에서는 읽고 쓰지 않는다. 페이지 단위로 읽고, 블록 단위로 다시쓴다. 페이지의 크기는 통상, 4KB 혹은 8KB이다. 블록은 통상, 128페이지 혹은 256페이지이므로, 블록의 크기는 512KB∼2MB이 된다. 블록의 크기가 2MB (16Mbit)이라고, 16Gbit의 NAND플래시 메모리는 1,024개의 블록을 내장한다.

 

 여기서 문제가 되는 것이, 블록채의 신뢰성의 편차(차이)다. 초기 상태에서는, 블록채의 비트 잘못율의 편차(차이)는 작다. 모두 상당히 낮은 값에 머무른다. 그런데, 고쳐 쓰기를 되풀이해 가면 블록채의 비트 잘못율의 편차(차이)가 증대한다. 같은 실리콘 다이 안(속)에, 품질이 높은 블록과 품질이 낮은 블록이 존재하고 있는 것이, 명확이 되어 온다.

 


 

● 읽어내지 않는데도 memory cell이 열화한다

photo004.jpg

 

고쳐 쓰기 회수라고 읽어내 회수에 의한 비트 잘못율 (읽어 냄 디스터브(disturb))의 변화. 고쳐 쓰기 회수(PE Cycles)이라고 읽어내 회수(Rd Disturbs)이 늘어나는 동시에, 비트 잘못율이 증가한다. Smart Modular Technologies의 강연 자료로부터

 

 NAND플래시 메모리의 비트 잘못율이 증대하는 것은, 특정한 조건이 일치한 블록이다. 특정한 블록에 치우쳐서 계속해서 읽어내고 있으면, 고쳐 쓰기 회수가 많이,동시에, 장기간에 걸쳐 읽어내지 않는 블록의 잘못율이 증가한다.

 

 이것만으로는 무슨 일인가 모르므로, 좀더 자세하게 설명하자. 고쳐 쓰기 회수가 많아질 만큼 memory cell에 대한 스트레스가 축적하고, 기록한 데이타가 시간경과와 함께 사라지기 쉬워진다. 여기까지는 이해하기 쉽다. 문제는 그 후다. 특정한 블록 (예를 들면 블록A∼블록B)만을 되풀이해서 읽어냈다로 하자. 이 때, 읽어내지 않는 블록에 스트레스가 걸리는 것이다. 읽어내지 않는 블록에는 아무 것도 스트레스가 걸리지 않는다고 생각하는 경향이 있지만, NAND플래시 메모리는 읽어내지 않는 블록에도 전압이 겹친다. 이것 때문에 기록한 데이타가 조금씩 사라져 간다 (구체적으로는, 문지방 전압이 조금씩 저하한다). 이 불량은 「읽어내 디스터브(disturb)(Read Disturb)」이라고 불리고 있어, 플래시 메모리와 같은 전하를 모으는 타입의 불휘발성 메모리에 특유한 불량 모드다.

 

 읽어 냄 디스터브(disturb)는 다값화의 비트수를 많게 하는 동시에, 큰 위협이 된다. SLC보다도 MLC, MLC보다도 TLC에서, 비트 잘못율이 증대한다.

 

 

●잘못 정정을 강화, 더욱 강화

 최선단의 대용량NAND플래시 메모리에서는, 데이타의 읽고 쓰기를 되풀이할 만큼, 비트 잘못율이 늘어난다. memory cell이 파괴되어 있는 것은 아니므로, 장황 블록 (여분인 블록을 마련해서 불량 블록과 교환하는 수법)은 대책이 안된다. 잘못 정정 부호(ECC:Error Correction Code)에 의해 읽어낸 데이타를 정정하게 된다.

 

 최근의 미세화와 다값화에 의해 NAND플래시 메모리의 잘못 정정은 급속히 강화되는 경향에 있다. SLC에서는 1bit의 허밍 부호로 끝나고 있었지만, MLC에서는 BCH(Bose-Chaudhuri-Hocquenghem)부호를 사용하게 되어 왔다. MLC에서는 미세화와 함께, BCH부호의 비트수가 4bit로부터 8bit, 24bit와 급속히 길게(오래) 되어가고 있다. 장래의 대용량NAND플래시 메모리용에는, LDPC(Low Density Parity Check)부호나 독자적인 신호 처리 기술(MSP:Memory Signal Processing)등이 검토되어 있다.

 

photo005.jpg

 

미세화에 의한 잘못 정정 부호의 복잡함의 증대. Micron Technology의 강연 자료로부터

 

photo006.jpg

 

NAND플래시 메모리의 잘못 정정 부호의 전환. MemCon Tokyo 2010로 마이크론 저팬이 강연한 자료로부터

 

photo007.jpg

 

다값화에 의한 고쳐 쓰기 수명이라고 잘못해 정정 비트의 전환. Anobit의 강연 자료로부터

 

photo008.jpg

 

LDPC(Low Density Parity Check)부호에 의한 잘못 정정의 효과. 35심볼의 리드·솔로몬 부호(RS부호) 및 32bit의 BCH(Bose-Chaudhuri-Hocquenghem)부호와 비교해서 높은 효과를 얻고 있다로 한다. Cadence Design Systems(원Denali Software)의 강연 자료로부터

 

photo009.jpg

 

 

●잘못 정정의 강화는 비용 증가와 성능저하를 초대한다

 잘못 정정 기능의 강화는 당연이면서, 비용의 증대와 성능의 저하를 초대한다. 잘못 정정 처리를 짊어지는 것은 controller 팁이다. controller 회로의 규모(실리콘 면적)이 증대하고, 읽어 냄 속도와 다시써 속도가 저하한다. 모두 미세화와 다값화에 의해, 게다가 심각해진다.

 

 거기에서, 종래와는 다른 논리연산 아키텍처를 도입하는 것으로, 잘못 정정 회로의 규모를 축소하는 시도가 Flash Memory Summit에서는 드러나고 있었다. 예를 들면 확률(확실다움)의 개념을 가져오는 것으로, 논리 게이트수를 종래의 몇십분의 1에 줄인다고 한다.

 

photo010.jpg

 

잘못 정정 기술의 고도화에가 되는 논리 게이트수의 증가. Micron Technology의 강연 자료로부터

 

photo011.jpg

 

LDPC부호의 잘못 정정에 【베이즈】논리를 짜 넣는 것으로, 트랜지스터수가 적은 잘못 정정 회로를 실현된다. 【베이즈】논리연산에서는 「1」인 확률과 「0」인 확률의 승산을 추론의 기초로 한다. Lyric Semiconductor의 강연 자료로부터

 

 

●잘못 정정 회로를 NAND플래시에 내장에

 게다가, NAND플래시 메모리의 실리콘 다이에 잘못해 정정 기능을 내장시키는 움직임이 나왔다. 잘못 정정의 강화가, 고쳐 쓰기 성능을 대폭 저하시키는 우려가 있기 때문이다.

 

 NAND플래시 메모리의 데이타 고쳐 쓰기에서는, 대상 블록의 데이타를 controller에 읽어 완전히 이해해서 잘못 정정 처리를 걸 필요가 있다. 잘못 정정의 강화는 필연적으로 처리 시간을 증대시킨다. 데이타의 고쳐 쓰기가 연속해서 생기면, 잘못 정정 처리가 보틀넥(bottleneck)이 되어서 controller의 동작이 현저하게 늦어질 지 모른다.

 

 거기에서 잘못해 정정 기능을 controller측이 아니고, NAND플래시 메모리측에 갖게 하는 것으로, controller를 잘못해 정정 처리로부터 석방한다. 이러한 NAND플래시 메모리는 「EZ(ECC Zero) NAND」라고 부르고 있다. NAND플래시 메모리의 업계단체인 ONFi(Open NAND Flash Interface)의 공통 규격 「ONFi 2.3」라고, Flash Memory Summit 2010의 개최 전날인 8월16일에, EZ NAND의 규격책정이 아나운스되었다. 금후는 Micron Technology나 Hynix Semiconductor등으로부터, EZ NAND의 제품이 출하될 전망이다.

 

photo012.jpg

 

「EZ(ECC Zero) NAND」메모리의 아키텍처. SanDisk의 강연 자료로부터

 

photo013.jpg

 

controller에 잘못해 정정을 짜 넣고 있는 것에 의한 오버헤드. 예를 들면 16bit의 BCH부호에 의한 잘못 정정 처리(현재의 MLC타입에 사용되고 있는 것)에서는, 어떤 블록의 데이타를 읽어 완전히 이해해서 다른 블록에 써 넣을 때(카피 백 동작시)에, 잘못 정정 처리에 약 83μs를 필요로 한다. Micron Technology의 강연 자료로부터

 

photo014.jpg

 

EZ NAND(잘못 정정을 짜 넣은 플래시 메모리)에서 카피 백을 실행했을 경우. controller에 있어서의 오버헤드가 제로가 되는 동시에, 복수의 카피 백을 병렬에 실행할 수 있다. Micron Technology의 강연 자료로부터

 

 

NAND플래시의 신뢰성은 반도체 수준으로부터 스토리지 수준에

 

photo015.jpg

 

NAND플래시 메모리의 고쳐 쓰기 수명(Endurance cycle)과 데이타 보유 시간(Data retention)의 관계. Hot Chips 22에 있어서의 Samsung Electronics의 강연 자료로부터

 

 NAND플래시 메모리의 신뢰성을 나타내는 중요한 지표에는, 고쳐 쓰기 수명의 이외에 데이타 보유 시간이 있다. 그 명칭 대로, memory cell에 데이타를 어느 정도의 기간, 보유하고 있을 수 있을지를 가리키는 것이다. 일반적으로는, 불휘발성 반도체 메모리의 데이타 보유 시간은 10년이상,으로 여겨지고 있다.

 

 그전의 NAND플래시 메모리는 1만회,혹은 10만회라고 한 고쳐 쓰기 수명을 만족시킨 후에, 10년간의 데이타 보유 시간을 보증하고 있었다. 이것은 대단히 엄격한 설계로, NAND플래시 메모리를 대용량화하기 위해서는 무리가 있었다. 현재에서는, 고쳐 쓰기 수명을 만족시킨 후의 데이타 보유 기간은 1년이라고 하는 것이, 반도체업계단체JEDEC의 표준설계가 되고 있다. 신뢰성 수준으로서는 저하하게 된다.

 

 NAND플래시 메모리의 신뢰성은, 지금까지의 반도체 메모리의 상식을 일탈한 수준에 저하하고 있다. 단, HDD와 비교하면, NAND플래시 메모리의 신뢰성은 아직 높다. HDD에서는 강력한 잘못 정정 처리를 거는 것은 상식이며, 이미 일부의 기종에서는, NAND플래시 메모리에서는 미도입의 LDPC부호를 토입된 상태다로 여겨진다. NAND플래시 메모리는 기억 용량당의 비용을 급속히 저하시키는 것으로, PC이나 서버등에 스토리지로서 채용되게 되었다. 비용 저감과 바꿔 반도체 수준의 신뢰성을 잃어버리는 것은, 오히려 당연한 것에도 느낀다.  

기글하드웨어(http://gigglehd.com/zbxe)에 올라온 모든 뉴스와 정보 글은 다른 곳으로 퍼가실 때 작성자의 허락을 받아야 합니다. 번역한 뉴스와 정보 글을 작성자 동의 없이 무단 전재와 무단 수정하는 행위를 금지합니다.