Home
探索 Uedu
學生控制台
註冊會員/登入
研究知情同意中心
教師控制台
課程設定
支援與訊息
Uptime 數據

UeduGPTs

--

Jupyters

4

UG26 CISOSE26
臺北 AQI 40 · 臺中 AQI 26 · 臺南 AQI 24 · 高雄 AQI 28

AI 回覆桌面通知

AI 助教回覆完成時顯示桌面通知

聊天訊息通知

同學在討論區發送訊息時通知

聲音通知

每當有新通知時播放提示音

元件與封裝
元件與封裝

CoWoS 與 3D IC 封裝

當電晶體微縮放慢,把晶片疊起來成了新的進步引擎。

CoWoS 與 3D IC 封裝 概念示意插圖
概念示意插圖(AI 生成,僅供輔助理解,非精確技術圖示)
研究所  ·  約 20 分鐘  ·  CoWoS3D IC先進封裝

當微縮放慢,封裝接棒成為進步引擎

摩爾定律式的電晶體微縮逐漸放緩、成本攀升,「把晶片疊起來、拼起來」成為延續系統效能的新引擎,業界稱之為「超越摩爾(More-than-Moore)」。其中最具代表性的兩項技術是 CoWoS(Chip-on-Wafer-on-Substrate)這類 2.5D 整合,與真正垂直堆疊的 3D IC。它們是 AI 加速器能餵飽數千個運算核心、達到 TB/s 級記憶體頻寬的物理基礎。

CoWoS:2.5D 的矽中介層架構

CoWoS 的核心是一片矽中介層(silicon interposer)——一塊本身不含主動電晶體、但佈滿超高密度走線與矽穿孔(TSV,Through-Silicon Via)的矽板。多顆晶粒(運算晶片 + 多顆 HBM 記憶體堆疊)以微凸塊(micro-bump)覆晶接到中介層上表面,中介層再透過 TSV 與底部 C4 凸塊連到封裝基板。

垂直堆疊(由上而下):
  運算晶粒 / HBM 堆疊
    ↓ micro-bump(pitch ~ 40~50 µm)
  矽中介層(含 RDL 細線 + TSV)
    ↓ C4 bump(pitch ~ 100~150 µm)
  封裝基板(substrate)
    ↓ BGA 球
  PCB

之所以稱「2.5D」:晶粒仍是並排(不是疊在彼此上方),但靠中介層的細線實現近似 3D 的高密度連接。矽中介層的優勢在於走線密度遠高於有機基板——線寬/線距可達次微米,配合 micro-bump 的細 pitch,提供 HBM 所需的數千條並行 I/O。

為什麼 HBM 非 CoWoS 不可

HBM(High Bandwidth Memory)是多顆 DRAM 晶粒以 TSV 垂直堆疊(4/8/12/16 層)而成的記憶體立方體,採用極寬的介面(1024-bit/堆疊起跳)以低時脈換超高頻寬。如此寬的匯流排無法走傳統基板,必須靠矽中介層的細線連到運算晶片:

世代 介面寬度/堆疊 每堆疊頻寬 典型堆疊高度
HBM2E 1024-bit ~ 460 GB/s 8-Hi
HBM3 1024-bit ~ 819 GB/s 8/12-Hi
HBM3E 1024-bit > 1.2 TB/s 8/12-Hi

一顆 AI 加速器搭配 6~8 顆 HBM 堆疊,總記憶體頻寬可達數 TB/s——這正是大型 AI 模型訓練的命脈,也是「記憶體牆」的硬體解方。

3D IC:真正的垂直堆疊

3D IC 把主動晶粒直接疊在另一顆主動晶粒上方,以 TSV 或更先進的混合鍵合(hybrid bonding)做垂直電氣連接。與 micro-bump 相比,混合鍵合是 Cu-Cu 直接金屬鍵合 + 介電質鍵合,無凸塊、無焊料,連接 pitch 可從 micro-bump 的數十 µm 一舉降到 < 10 µm 甚至次微米

  • 連接密度暴增數十至數百倍,頻寬密度與能效大幅躍進。
  • 垂直距離極短,互連寄生電容與延遲、能耗顯著下降(趨近晶片內走線)。

代表性應用是把 SRAM 快取或記憶體晶粒直接疊在邏輯晶粒上方(如把大容量快取 3D 堆疊到 CPU 上),大幅擴充頻寬與容量而不犧牲核心面積。SoIC 一類晶圓級 3D 鍵合即屬此範疇。

關鍵結構元件解析

  • TSV(矽穿孔):垂直貫穿矽晶的銅導通柱,直徑數 µm、深寬比可達 10:1 以上,需深矽蝕刻(DRIE)+ 阻障層 + 銅電鍍 + CMP。TSV 的寄生電容、漏電與「keep-out zone」(周圍應力影響電晶體特性的禁置區)是設計約束。
  • micro-bump:晶粒對中介層的微凸塊,pitch 約 40~50 µm,是 CoWoS 互連密度的瓶頸之一。
  • 混合鍵合:表面需原子級平整(CMP 控制至埃米級),於室溫接合介電質、退火使銅互擴形成連續金屬連接,對潔淨度與對準(overlay)要求極嚴。
  • RDL(重佈線層):在中介層或扇出封裝上重新分配 I/O 的細線層。

封裝方案比較

方案 維度 互連 bump/pitch 頻寬密度 主要用途
覆晶 BGA 2D C4 bump ~ 150 µm 一般 SoC
扇出(InFO) 2.xD RDL ~ 數十 µm 行動 SoC
EMIB(嵌入矽橋) 2.5D 局部矽橋 ~ 45 µm 局部高速連接
CoWoS-S(矽中介層) 2.5D 全幅矽中介層 + TSV ~ 40~50 µm 很高 AI/HPC + HBM
3D IC / SoIC(混合鍵合) 3D Cu-Cu 直接鍵合 < 10 µm 極高 快取/記憶體疊邏輯

取捨、失效模式與熱挑戰

  • 熱密度是頭號敵人:3D 堆疊把多層高功率晶粒疊在一起,散熱路徑被上層阻擋,下層或被夾層晶粒形成熱點。對策包括背面散熱、矽中介層開散熱通道、甚至微流道(microfluidic cooling)直接在矽內走冷卻液。
  • 熱機械應力與翹曲:矽中介層(大面積)與基板的 CTE 不匹配在熱循環下造成翹曲,誘發 micro-bump 裂、白凸、中介層裂。大尺寸中介層(已超過光罩面積,需拼接 reticle stitching)尤其難控。
  • 良率乘積問題:CoWoS 把多顆昂貴 KGD + HBM 疊在一片中介層上,任一環節失效都報廢整個高價模組,KGD 篩選與鍵合良率攸關成本。
  • TSV 應力與可靠度:TSV 周圍的壓電應力改變鄰近電晶體特性,銅與矽 CTE 差造成的疲勞、電遷移是長期可靠度議題。
  • 產能瓶頸:CoWoS/SoIC 產能成為 AI 晶片真正的供給瓶頸,擴產週期長、設備昂貴。

前沿現況

矽中介層持續放大(多倍光罩面積、reticle stitching)以塞進更多運算晶粒與 HBM;混合鍵合 pitch 向次微米推進,使 3D 與 2.5D 界線模糊,演化為「3.5D」混合架構(先 3D 疊邏輯+SRAM,再 2.5D 接 HBM);共封裝光學(CPO)把矽光子引擎拉進封裝以突破電氣 I/O 的頻寬與能耗牆;玻璃基板、面板級扇出(FOPLP)等新載體也在競逐下一代整合平台。封裝,已從產業鏈末端的「後段」,躍升為決定系統效能的前沿戰場。

延伸閱讀:〈Chiplet 與異質整合〉、〈先進封裝:Chiplet、CoWoS 與 2.5D/3D IC〉、〈記憶體入門:DRAM、NAND 與 HBM〉。

接著問 AI 助教

點一下複製提問,到 ClassroomGPT、優學伴(AIDA)或你的 UeduGPTs 頻道貼上,AI 會引用本專區內容回答。

AI 共讀助教正在陪你讀:CoWoS 與 3D IC 封裝
嗨!我是這篇文章的共讀助教,只根據〈CoWoS 與 3D IC 封裝〉的內容回答。可以問我「解釋某段」「舉個例子」「出題考我」,或反白文中段落後點下方「解釋選取段落」。