PTT推薦

Re: [請益] 2t 遊戲用SSD選擇(flashid數據研究)

看板PC_Shopping標題Re: [請益] 2t 遊戲用SSD選擇(flashid數據研究)作者
Cubelia
(大胸智乃)
時間推噓 9 推:9 噓:0 →:20

好讀
https://www.ptt.cc/PC_Shopping/E.9MBefSMfttdw

先幫樓主拍拍,三爽v6真的雷自己就算了還雷到別人
現在SSD貴森森也只能送修,奇妙的是創見還允許用戶拒用三爽顆粒XD

以下99%內容都是腦補出來的,請看看就好

=

研究了一下樓主flashid給出來的資料,這是很有研究價值的東西
不過裡面的數據並不能完全相信

1.未有官方解釋 2.幾乎只能靠字面意義來推敲,縮寫也很難懂
而且很多的數值都是空的(-1或0),單位更不用說
看到有fail之類的不要自己嚇自己,也別拿這個去和原廠盧,就當參考用

進入主題
一. smi_nvme_flash_id.txt
https://i.imgur.com/EMhw8Bg.png

1.三星v6 136L TLC顆粒、原廠測試壞塊19個、三星D4 DRAM
(創見到底三爽DRAM庫存壓多深==)
2.搞不懂FBlock意思

這是我們看flashid最主要的檔案,上面會有控制器、韌體、顆粒等資訊
精華是下面的遙測(telemetry)數據,這些是控制器所記錄的內部資料
由於NVMe SMART項目都標準化
只能從遙測看以前SATA SSD能看出的ECC、重定位、壞塊資料
而台廠群聯和慧榮的資料剖析方式都有被攻破了
(螃蟹、英韌、聯芸我沒有玩過,所以不知道有無相關資料)


下面的遙測(不同控制器項目會較少,或是可解讀項目不同)
https://i.imgur.com/waNbtUj.png

ECC理論順序為硬LDPC=>(read retry)=>軟LDPC=>RAID ECC
向右修正能力越強但越費時間,SMI整套稱為NANDXtend技術

硬LDPC解碼不行的話就得...

1.TLC read retry(重讀)
重讀就是來回調整電壓看能不能讀出正確數據

2.ECCUnc(軟LDPC失敗)
重讀也不行就得用軟LDPC,耗時較大
正常來說多少會出現的,切勿慌張,因為還有RAID ECC這招

3.重定位和XOR Fail都有相同數值
XOR就是奇偶校驗,也是RAID ECC的原理之一
猜測RAID ECC為最後防線,可以理數值和重定位次數相同
連RAID ECC也沒有辦法就宣告無法恢復了,也就出現ECC錯誤事件


這是我最近從網拍買的MTE220S 512GB(美光/Spectek AS等級96L TLC)
可以看到僅軟LDPC失敗有紀錄,RAID ECC無失敗紀錄
https://i.imgur.com/0hvjNfY.png

實際沒跳0E
https://i.imgur.com/TP3i0L2.png

自用了超過五年的MTE220S 512GB(美光/自封64L TLC)
這條用比上面那條還久,沒想到都沒軟LDPC失敗,可能64L舊顆粒體質更好
https://i.imgur.com/I1nFUWz.png

實際也沒跳0E
https://i.imgur.com/7moRYcT.jpeg

-

二. 至於smi_nvme_flash_id_ec.txt這個是顆粒的磨損值
ec應該為Erase Count(抹除次數),裡面的BAD數量可對應前述19個壞塊

三. smi_nvme_flash_id_smart.txt就單純的NVMe SMART數據
用CrystalDiskInfo也能見到
不過下面有溫度警告的統計次數


四. 那真的壞掉的案例呢?
之前有板友tyf99用Klevv C720爆0E的案例,今天終於能當教材了

phison_e12_flash_id_ec.txt
前面提過這是顆粒的磨損數據
https://i.imgur.com/AVGmBIq.png
可以看到有一整排BAD,這個就是"1片"晶片壞掉
群聯的數據可以看到單獨的晶片,慧榮的好像不行
(正常來說一定都有壞塊的,但不可能這樣整欄BAD,請不要拿這個和客服盧)

phison_nvme_flash_id_smart.txt也有顯示ECC錯誤,包含RAID ECC也沒救
https://i.imgur.com/zxFf1bq.png

SSD外觀顆粒內部是好幾片晶片疊起來
你能看到M.2 2230 TLC用一顆2TB,裡面其實就高達16片NAND Flash晶片
當然SSD正反面貼那麼多顆,全部加起來也會有很多片晶片

--

姊姊 姊姊 我們好像變成簽名檔了

雷姆 雷姆 好像真的是這麼一回事呢


--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.255.51.22 (臺灣)
PTT 網址

knight714 03/20 01:42這件事最搞笑的是我上個月有打開軟體看

knight714 03/20 01:42過 那時候0E還是0

knight714 03/20 01:42這次出問題一看0E直接變成22萬

炸翻XD

E7lijah 03/20 01:43

Depthsharky 03/20 01:440E不一定吧

Depthsharky 03/20 01:45我自己體感上使用出問題了 讀出來是0

Depthsharky 03/20 01:46後續讀不到硬碟 重裝重灌 就讀出來

個人理解是位於故障區域的資料被用戶操作動到,確認ECC錯誤後才會記錄下來 所以有些三星SSD是用魔術師工具箱"完整掃描"才爆出0E 不然就得等控制器主動refresh碰到 我其實很想寫一篇用Linux nvme-cli自我檢測SSD的文章,但都懶得寫

※ 編輯: Cubelia (111.255.51.22 臺灣), 03/20/2025 01:54:36

wensety2007 03/20 02:13詳細推

tn601374 03/20 02:54還好都買金金 fury

BlackCoal 03/20 06:11

jack61031 03/20 10:36超硬知識推一個

arenoe 03/20 12:27

Lemming 03/20 18:34存資料時後面都會加較驗 SSD跟HDD都一樣

Lemming 03/20 18:34因為有bit error rate這種東西

Lemming 03/20 18:35不加下次拿出來的時候不知道有沒有錯

Lemming 03/20 18:35但加的位元數有限不然浪費空間

Lemming 03/20 18:36所已有Uncorrectable BER的概念

Lemming 03/20 18:36SSD一般15次方分之一 企業級17次方

Lemming 03/20 18:36比同級的HDD好太多了

Lemming 03/20 18:37所以讀取校驗時才會發現錯誤

Lemming 03/20 18:37平常沒碰到沒事 我是隔壁看到TEAM客服

Lemming 03/20 18:38在那邊亂回才想起細節的 我大學專題(EE)

Lemming 03/20 18:38做過光纖的BER 道理都類似

Lemming 03/20 18:38其實量夠大都會出現錯誤 但是這次一堆

Lemming 03/20 18:38廠商在那邊誤導 把那種量太大跳出幾個

Lemming 03/20 18:39機率上發生的那種 拿來當成拒絕理由

Lemming 03/20 18:39拜託 他們跳得像是有做到15次方喔幹

Cubelia 03/20 19:38消費級HDD是14次方分之一,再上去15次方

Cubelia 03/20 19:39就NAS、企業級等規格了