Re: [心得] GN 13、14代問題影片重點整理
剛看完GN的影片,小弟我想從另一個角度來聊聊
一般半導體廠是怎麼做FA/RA/解issue的
以下長文,且為了方便理解會忽略許多細節與大量相對不準確用語
各路大神若不吝指教,先萬分感謝~~
依我個人的經驗,當產品出問題時,基本有三條主線要解
1.為什麼會發生,真因(root cause)是什麼
2.如何改善/根除異常,不再產出瑕疵品
3.為什麼瑕疵品會被出貨
第一條主線找真因的部分,Steve說了會委外實驗室來做,但沒特別講怎麼做
這邊非常粗略介紹IC FA其中一種常見的流程
這邊借用IST的圖來一用
https://i.imgur.com/5U4IbsM.png
Step1.電性測試
這邊是要先確認晶片哪組腳位/function是異常的,且是什麼異常
最簡單常見的作法是拿sample測電流電壓的反應曲線(I-V curve)
電測根據結果不同,能很粗略地判斷可能是什麼原因
舉例:電壓通再大電流都躺平是0=>斷路(open)=>可能是開孔分層delam
電壓通大電流增加但不同步=>高阻=>可能是介面層雜質/氧化
沒通電壓卻有電流=>短路(short)=>可能是電遷移
Step2.非破壞檢測
有了第一步的判斷,知道缺陷"可能"長怎樣之後
接下來就是要大範圍(eg. memory controller或是整顆die...XD)尋找可能的故障點 以CPU來說,我看超音波也免了,直接上Xray/3D Xray做定位可能比較快
Step3.前處理
晶片是3D結構,上一步通常只能判斷故障點的2D位置,或是知道很粗略的3D位置
接下來就是要把晶片磨到預定要看的那一層
但如果狀況很複雜,沒辦法判斷缺陷在哪一層,那就會Step3/4之間來回橫跳
Step4.主菜
找到目標點之後就是FIB切下去...前題是有找到就是了
下面是網路上隨便找一張FIB切開的樣子,看看到底長怎樣
https://i.imgur.com/IC2d6H2.png
這時候通常也會搭配XPS看元素成分,阿如果還不夠就請出大神TEM/element mapping
以CPU/SOC來說能走到這一步其實就噴非常*n多錢了
Q跟神山有問題的時候常常是一波爆送30顆樣品去分析,有一兩顆有切中就不錯了 找不到原因回頭切第二波第三波第n波都是非常有可能低
GN送幾顆去如果也能切中真的是祖上積德不然就是I家爛到出汁,隨便切都中
那I家也不要切FIB了,切腹吧
好,假設我們現在知道缺陷長怎樣了
"理論上"就可以下一些手段去做初步的改善
用業界的講法就是D2明確之後就可以下D3然後想D5怎麼下
這個就等GN找實驗室分析的結果或I家自己出來講ㄅ
最後來談可靠度驗證RA(realibility assurance)的部分
這部分是有JEDEC規範的,以我最常接觸的就是HAST系列測試
高溫+高壓+高濕度,還有是否通bias電壓的差別(uHAST vs bHAST)
RA的流程跟參數都是有規範的,例如像下面這樣(一樣借用IST的圖):
https://i.imgur.com/Gr7f276.png
這樣的業界標準測試不可能不做,也幾乎不可能亂做,
亂做/改RA數據被客戶抓到真的會被告死
但是
與其說QA流程有問題/RA亂做/造假數據/etc...
我更覺得是JEDEC公版測試其實已經越來越不夠用
像上圖中的溫度參數,最嚴苛的是130度,這對一般晶片測試可能已經非常夠用
但對A/I兩家動輒95~100度的工作溫度來說,130度真的還能叫"嚴苛"?
以下是超級不負責任亂猜
1.I家沒有意識到要用更高的標準跑RA,JEDEC pass就pass
2.I家用原本產品規格跑tighten RA,但臨時改規格(eg.頻率)又沒重跑RA,想說hold的住3.I家Q Lab乖乖過期
4.G桑虎軀一震說給我出,然後準備上法院被電爆
5.掰不下去惹
然後這種RA才看得出來的defect最致命的點在於
一旦RA沒抓到之後大量生產,更不可能回頭做這些測試
生產線的QA就算百百檢也抓不出來
現在I家應該除了內部全力找到原因之外,應該就是努力兜說帖安撫客戶了ㄅ
--
樓下噓又在帶風向
客戶X 律師O
好久不見,可惜這篇沒有掛
這次災情很難定位 2顆切不到明確病灶不意外
專業推
某大師:沒直接點出主因=帶風向?
這幾天電蝦真的神人輩出,文章品質比其他
站要好上一截
某:不管啦,沒有講真因就是帶風向
也可能HTOL電壓設得太低,看不到問題
點
所以其實我也不是很看好GN他們送檢能夠找
到根源就是了,但光他願意花那麼多錢送就
值得給個respect
對阿 超多$$ 可能打水漂 或中大獎
想問喵編,最近13、14代有賣很差嗎?這次
事件真的有影響到實際銷售嗎?
一堆專業鄉民跑出來
i5還是賣很好(菸
雖然我都有看沒有懂
大部分人都沒在做功課的吧,店家推什麼
就買什麼,你看前面才一篇買146kf的
因為我自己體感是覺得對實際銷售似乎沒什
麼太大影響,畢竟會關注的還是少數
品牌機都14代CPU了吧?表示13代已...
神人輩出m(_ _)m
市面上有一大堆可能要重驗證的產品
144 145照賣阿 146K以上也是照賣阿
又不負責修 也沒倒楣到剛售出就出事
吧(X 超過一個月都是跟消費者說找代
理/原廠 跟底部銷售端應該是沒差
intel有問題固然是事實,但youtuber跟
網路上的說詞也聽聽就好,很多都不懂
裝懂,出一張嘴最厲害
大環境還能說你那區有沒有跳電(X
要不要買個UPS
這次問題就是intel也不知道 也解決不了
大家當然用自己的依據下去猜問題點了
不然要怎樣
雞尾酒療法自救拉 怎辦 當鴕鳥又不會
解決
我就說實話了,一定會有人說帶風向
答案就是沒有。而且至少在台灣,i比A只看
37樓發言..頓時水桶蓋突然炸裂了!有沒有
掛??
從問題爆發以來都更新三波BIOS了
CPU還是爆 是要怎麼辦 嘴砲說沒問題嗎
量不看銷售值,應該在8:2到7:3之間
其實從問組機單的i:A也可以看出一二
A牌還是小眾吧,筆電跟品牌機也少。
然後因為core ultra 200差不多要上市了
尤其現在很多學生也不買筆電都用平板
A筆電跟套裝機是台灣比較少進
所以各通路13/14代高階的U其實庫存水準應
去圖書館發現準備考試的幾乎都用iPad
該都在低點。通路不怕U賣不出,比較怕板子
筆電這幾天大概只看到十台
清不掉
要說這事件對通路的困擾就是的確售後需求
帶風向大師可以提供反證嗎?
還是只會跳針說在帶風向?
增加了,這個其實看各站各板出來喵說BSOD
的文章頻率也可以推知一二
感謝喵編解答
所以我說喜歡Intel的其實也不用難過,畢
竟實際影響真的不大
PTT跟現實世界風向不同也不是第一次了
有時候看某些推文吹大哥要死了,我看報表
都有平行世界的感覺:) 有時候還有美股二
板的感覺
賣自家保固給企業的OEM比較頭疼?
然後台灣市場跟全球市場其實也有落差
所以要怎麼自我詮釋其實也無妨。但是回歸
實際面,真的客人在進行消費時,i或A的品
牌喜好可能也沒那麼重,尤其是沒有沉浸在
3C產業的人。打個比方直接問家人CPU有哪兩
家,可能答案會是華碩蘋果等等也說不一定
或可能知道英特爾美超微,但是真的要跟各
位的長輩說英特爾以前只出四核心不長進...
intel在幹嘛真的匪夷所思,14代是re
fresh 所以13代有的問題可能14代也
解不掉,但是問題就出在13代試產到M
他們可能就喔喔,好好好。但並不見得會影
P前這中間完全沒有發現問題嗎?
不專業猜可能是fail rate低直接放過
或是測項沒有cover到壓力的long run
? 只覺得蠻扯的
響消費決策
如果風暴只有這樣 那確實影響不大 如果
風暴越演越烈就不好說了
最主要還是企業客戶跟OEM市場的反饋
角度不同而已 末端小眾消費者/企業
就看Intel有沒有辦法擺平阿 最好給力點
我還等著抄intc的底勒
通路/代理 光是通路不賣專業維修只做
更換的話 通路哪有影響
最好再來個重磅消息 股價跌低一點
會做功課的不會去給小賣店宰
會被宰的不會懷疑到CPU
企業機構那種跟人買服務的就不同了
會找供應方算帳
同意樓上所言,我也是覺得企客跟OEM才是
主戰場
然後供應商就看INTEL給的好處夠不夠 給得
夠當然願意幫忙擦屁股
給不夠那就是CEO像P4時期一樣出來下跪道
歉,那時候就是抄底intc的最佳時點了
小眾消費端這就是保內RMA跟嘗試延壽
推
其實面對企客OEM,要i社拿15去換14/13,應
該也是做得出來的,順便延長客戶合約,半
買半送
小眾消費端就天生韭菜命 只是這次剛好踢
到GN這塊鐵板而已
GN團隊就專門做這種吃力不討好的
對這些不做功課的就是不用客氣 揶揄下去
就對了他們下次才知道要先做功課
就算真給他們切到問題 也不見得能回本
上次看到CPU大翻車應該是AMD的推土機了
只是推土機只是效能不好,I社這次是產
品良率有很大的問題
可以搜尋AMD TLC BUG
TLB,而不是TLC
對 記錯了 謝謝
然後AMD TLB Bug是飛龍時代 不是推土機
連不良批次都沒法確定,代表整批都風險批
,但沒人敢和intel索賠,最後還是真香。
最可悲的是這次問題種種指向INTEL但是
現在別說索賠連叫囂一下INTEL也要
戰戰兢兢的 完全就是被吃得死死
RA 時間完全不夠啊
intel發聲明了 真的有氧化問題
不過說跟CPU不穩定無關
這是打預防針?先承認有氧化?
這麼精密的電子元件居然說氧化沒影響歐?
GN送兩三顆去切就怕到跳出來先喊有氧化問
題但不是原因所以就是在裝死嘛早就知道問
題了w
看來i家是咬死了只要更新BIOS就可解決
如果解決不了..你去找你的主機板廠商啊
沒錯 要切FIB沒那麼簡單切中啦 常常切一堆S
ample都沒切到問題點
切已經沒意義啦。i就說會氧化啊
有些狀況還要調layout來比對 才知道有沒有
問題 FA沒那麼簡單做啦
沒有切到問題點 說什麼都沒意義
切出來氧化i說是早期庫存嘛
氧化是地球的錯,地球上氧太多了
你拿這張SEM比較可惜只能做EDX
EDX定性容易有雜訊。
確定目標點拿auger出來mapping
爽啊刺啊~~
1X%的不良率...
重點是RA過了,你inline有變異會重做RA
嗎? 只要in SPEC 大多是大事化小小事化
無吧
嗯嗯 跟我想的一樣
專業推
強調已解決2023年的問題就是承認有過問題?
可能需要誰去追問那批晶片去向 是銷毀了沒?
這FIB切出來怎麼都沒窗簾效應也太漂亮,
我切出來都好醜
不良是整批還是某期間或是整個就有
問題還不確定呢
另外有TCT HTST環境是150度可以做
還好我用AMD
但JEDEC不是只有高階才驗阿...
理論上真有問題,應該不分產品線吧?
2023也才去年
2023年初跟2023年底也是2023,14代也就20
24年初發布的,2023年末應該就開始生產
的
AZ大說的都是封裝段的可靠度測試
跟這次GN說的前段不太一樣喔
看電蝦漲姿勢
資訊不對稱 一般user哪知道發生什麼事
你太不了解製造業 要做到不被客戶抓
包的方法多的是XD
業務要求生產幾顆 最後能達標 什麼
超產改時間、減少驗證流程 達到客戶
需求量 否則獎金績效怎麼來
看了ID原來是大佬冒犯了… 我是想表
達對外即使說的多麼頭頭是道 對內整
個公司文化才是信心來源
對工廠來說合規的都是良品 不是100%無
缺陷的才是良品
巷子內的 專業
每年都要做的ORM 這樣真的會過?
咦,怎麼不繼續跳針GN帶風向了?
爆
[心得] Intel Gen13/14在BIOS預設下不穩定(國內外相關案例整理與建更新資訊:Intel Gen13/14簡單降壓教學 #1bqrNL4p (PC_Shopping) 本文同步發布於巴哈電硬版 本來這是附在置底的捷元保內無料一事中的額外話題爆
[情報] GN 耶穌開始調查Intel不良的原因 新資料GN 收到一些內線,內線說intel這次的問題是因為製程 的抗氧化(anti-oxidation) 塗層有問題,造成長期或高 壓使用下會氧化產生的不良。如果這是真的,這無法靠 主板設定解決。受影響的CPU達百萬顆。60
[情報] GN影片中提及的可能的氧化機制先打個預防針 我是化學背景但不是半導體製程背景 (雖然我在的實驗室也滿像台積電在做的東西) 所以製程的詳細知識我也不是很懂 我在實驗上會用到的鍍層方法是電化學鍍層與物理氣相沉積(熱蒸鍍)48
[心得] iPhone XR 不顯示 不開機 維修心得分享哈囉~~~大家好~今年只剩下一個月了,不知道大家今年過的好嗎? 今天來跟大家分享 iPhone XR 顯示異常 維修心得 機主表示: 既然已經給其他店家檢測過了,那基本上就可以確定是主機板異常造成的不顯示 維修開始~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~44
Re: [閒聊] GN挑戰Speedrun技嘉PSU(原文啃光) 一般常見的OCP/OPP測試大致如下 黃色是電壓,藍色是電流,電子負載設定電流以步進方式增加, 可設定起始電流、步進幅度、每步時間,當電流逐漸增加,直到碰到OCP/OPP門檻時,35
[閒聊] GN評測美亞便宜假金牌PSU(但是不會爆炸)笑死 G排繼續被拿出來鞭 不過被鞭活該 連消費者安全都罔顧的廠商真的沒有支持的必要34
[閒聊] PSA:M.2介面SSD會消失可檢查+3.3V電壓最近蒐集到兩篇M.2 NVMe SSD會消失的案例,剛好可以當教材 RE:【討論】2023 Q4 SSD(固態硬碟)選購指南(1111更新) 【問題】m.2硬碟執行遊戲到一半會消失(已解決)22
[心得] POWER-Z KM002C Lite USB電壓電流表測試狼窩2.0無廣告好讀版: 狼窩1.0好讀版:16
Re: [問題] 電池不回充回答原PO問題,除了CDI,都有可能直接導致不回充 找出問題前可先來討論原理,了解原理後對於找故障點會更容易 下圖是一般摩托車的發電架構 ┌───┐ ┌───┐ ┌──┐ │發電機│→黃線→│整流器│→紅黑線→│電池│9
[心得] Baseus倍思45W大功率數顯車充BS-C20CTW狼窩好讀版: 感謝網友出借此產品供在下測試 產品特色: ●PD45W大功率輸出,智慧分流