熱門關(guān)鍵詞: 聯(lián)樂 宇瞻工業(yè)級TF卡 工業(yè)閃存卡品牌 固態(tài)硬盤品牌
工業(yè)級固態(tài)硬盤和軍工級固態(tài)硬盤必須擁有極高的可靠性。但是,現(xiàn)實中固態(tài)硬盤會遭受復(fù)雜、苛刻的環(huán)境和使用工況,供電偶爾遭遇故障或者失效。遺憾的是,SSD固態(tài)硬盤對于這種外部電源的異常掉電的抵抗能力先天不足,異常掉電會造成數(shù)據(jù)丟失,甚至整個固態(tài)硬盤失效。
電源的失效事件包括從瞬態(tài)欠壓到長時間完全斷電的情況。這些事件可以因為供電網(wǎng)絡(luò)、外置UPS的部件、系統(tǒng)電源(熔斷,線纜故障),或者是在振動、熱量、沖擊等條件下的PCB或者連接頭失效而引起。
睿達硬件級斷電保護功能的SSD
SSD固態(tài)硬盤層面的電源失效的風(fēng)險,部分的決定于安全供電的措施是否完善。電源失效能夠?qū)е孪到y(tǒng)延遲,甚至永久性的數(shù)據(jù)丟失。根據(jù)睿達研發(fā)部門進行的數(shù)十萬次主機異常掉電測試發(fā)現(xiàn),目前市面上的各類SSD固態(tài)硬盤,根據(jù)產(chǎn)品的不同,大約有1/346~1/2000的概率導(dǎo)致SSD固態(tài)硬盤系統(tǒng)數(shù)據(jù)損壞導(dǎo)致無法識別。根據(jù)第三方的測試,大約有1/170~1/2000分之一的情況下,丟失系統(tǒng)數(shù)據(jù)。
對SSD固態(tài)硬盤而言,掉電保護比其他設(shè)備更加必要。這和SSD固態(tài)硬盤的存儲介質(zhì)——閃存的有很大的關(guān)系。當(dāng)SSD固態(tài)硬盤正在對一個Nand閃存的塊進行編程(寫入)時,編程的操作必須完整執(zhí)行,以確保數(shù)據(jù)可靠地保存。當(dāng)正在編程時,SSD固態(tài)硬盤的供電出現(xiàn)問題的話,對數(shù)據(jù)是一種極大的危險,尤其是對MLC介質(zhì)的SSD固態(tài)硬盤。對MLC閃存而言,這種危險是雙重的。
原因有兩個:
一是Nand閃存讀取的最小單位是頁,而擦除的最小單位是塊。當(dāng)一個新的頁的數(shù)據(jù)需要寫入時,SSD固態(tài)硬盤通常需要將寫入目標(biāo)頁的"鄰居"讀取到緩存,合并成新的數(shù)據(jù)進行存儲或者轉(zhuǎn)存。如果在這個過程當(dāng)中電源失效,就會有很大的風(fēng)險。
原因二是因為MLC Nand Flash使用存儲單元的同一個物理頁,來存儲2個邏輯頁的數(shù)據(jù)。當(dāng)在對高頁進行編程中電源失效,低頁所存儲的有效數(shù)據(jù)也會丟失或損壞。通常我們將其稱為"低頁數(shù)據(jù)損壞"。TLC也是同理。
用戶數(shù)據(jù)丟失,和主機操作系統(tǒng)—SSD固態(tài)硬盤的"通信"方式有關(guān)。當(dāng)主機將數(shù)據(jù)寫入指令發(fā)送給SSD固態(tài)硬盤時,這些數(shù)據(jù)實際還存儲在緩存中。為了追求高性能,SSD將會通知主機操作系統(tǒng)數(shù)據(jù)已經(jīng)完整寫入,實際上,數(shù)據(jù)仍然在處理中。如果此時電源失效,SSD固態(tài)硬盤的主控?zé)o法在斷電之前完成數(shù)據(jù)寫到閃存,那么數(shù)據(jù)將會丟失。之后,當(dāng)主機請求這些數(shù)據(jù)時,SSD控制器可以報告這些數(shù)據(jù)已經(jīng)"無法恢復(fù)"或者提供原有的舊數(shù)據(jù)給主機。后面這種情況下,主機甚至都不知道數(shù)據(jù)是不正確的。
02 丟失系統(tǒng)數(shù)據(jù)SSD固態(tài)硬盤為了提高性能,板載Flash之間組成了陣列/RAID的方式在運作,所有的數(shù)據(jù)都是分散到多片F(xiàn)lash存儲。同時,在每一片F(xiàn)lash中,數(shù)據(jù)的存儲位置都不是連續(xù)的。這些動作,都由SSD固態(tài)硬盤控制器中,F(xiàn)TL層操作。所有這些數(shù)據(jù)的存儲,都會形成一張映射表存儲,以便SSD控制器實現(xiàn)物理LBA地址和主機邏輯LBA地址之間的轉(zhuǎn)換或翻譯。映射表必須被創(chuàng)建并維護,否則就無法讀取所存儲的數(shù)據(jù)。而每當(dāng)新數(shù)據(jù)寫入時,映射表必須被更新。映射表文件被存儲在SSD固態(tài)硬盤的某個區(qū)域,輔以比用戶數(shù)據(jù)更高水平的ECC保護。而映射表數(shù)據(jù),在主機斷電時,也難逃厄運。如果斷電時映射表數(shù)據(jù)丟失,SSD固態(tài)硬盤將會表現(xiàn)為數(shù)據(jù)損壞,返回(損壞的)舊數(shù)據(jù),或者徹底的無法識別。
Agrade睿達存儲的異常斷電保護有固件級和硬件級兩類:小容量SSD采用固件級斷電保護,大容量SSD在固件級斷電保護的基礎(chǔ)上增加了硬件級斷電保護功能。硬件級斷電保護需要有獨立的硬件電路,包括應(yīng)急供電用的電容、用于發(fā)現(xiàn)斷電并觸發(fā)保護機制的電壓監(jiān)視控制芯片等。
睿達所有的固態(tài)硬盤在設(shè)計時都會考慮掉電保護機制,而且要能覆蓋所有可能發(fā)生的極端條件,以及保護機制自身不會犯錯,這也是工業(yè)級固態(tài)硬盤和軍工級固態(tài)硬盤區(qū)別于其他一般消費類固態(tài)硬盤的關(guān)鍵因素。
本文標(biāo)簽: 斷電保護機制——高可靠性固態(tài)硬盤必須具備的功能