Home
探索 Uedu
學生控制台
註冊會員/登入
研究知情同意中心
教師控制台
課程設定
支援與訊息
Uptime 數據

UeduGPTs

--

Jupyters

4

UG26 CISOSE26
臺北 AQI 40 · 臺中 AQI 26 · 臺南 AQI 24 · 高雄 AQI 28

AI 回覆桌面通知

AI 助教回覆完成時顯示桌面通知

聊天訊息通知

同學在討論區發送訊息時通知

聲音通知

每當有新通知時播放提示音

元件與封裝
元件與封裝

記憶體入門:DRAM、NAND 與 HBM

運算晶片是大腦,記憶體就是工作桌與書櫃——AI 時代的另一個主角。

記憶體入門:DRAM、NAND 與 HBM 概念示意插圖
概念示意插圖(AI 生成,僅供輔助理解,非精確技術圖示)
研究所  ·  約 19 分鐘  ·  記憶體DRAMNANDHBM

運算與記憶的分工

若把處理器比作大腦,記憶體就是工作桌與書櫃。電腦的儲存階層(memory hierarchy)依「快但貴小」到「慢但便宜大」排列:SRAM 快取 → DRAM 主記憶體NAND 快閃儲存 → 硬碟。AI 時代的算力暴漲,使「記憶體牆(memory wall)」——資料搬運跟不上運算——成為系統瓶頸,HBM 正是為了打破這道牆而生。理解這三種記憶體的元件物理與架構取捨,是理解現代運算系統的另一半。

DRAM:1T1C 的精巧與脆弱

儲存原理

DRAM(Dynamic RAM)的儲存單元是極簡的 1T1C:一個存取電晶體加一個儲存電容。電容充飽電代表 1、放掉代表 0。整個陣列以字元線(word line)選列、位元線(bit line)讀寫,達到極高密度。

為什麼「Dynamic」:更新

電容會漏電,電荷在數十毫秒內就流失。因此 DRAM 必須週期性更新(refresh):典型每 64 ms(或先進品 32 ms)把每一列讀出再寫回。代價是:

  • 更新功耗:閒置時仍持續耗電,是行動裝置待機功耗的來源之一。
  • 更新佔用頻寬:更新期間該 bank 不能存取。

讀取本身是破壞性的——把電容電荷傾倒到 bit line 上,需 sense amplifier(感測放大器)辨識微小電壓差並回寫

微縮困境

DRAM 微縮的瓶頸在電容:要維持足夠電荷(足夠的訊號雜訊比),電容值不能太小,於是電容被做成極高深寬比的深溝槽或柱狀堆疊(high aspect ratio)。先進 DRAM 已逼近製程極限,業界轉向 EUV 微影4F² 單元、垂直通道電晶體乃至研究中的 3D DRAM。失效模式上,row hammer(反覆存取某列導致鄰列位元翻轉)是著名的可靠度與資安問題。

NAND Flash:非揮發與 3D 堆疊

浮閘儲存原理

NAND Flash浮閘(floating gate)電荷捕捉層(charge trap)儲存電荷,斷電不丟失(非揮發)。寫入靠量子穿隧(Fowler-Nordheim tunneling)把電子注入浮閘,改變電晶體 $V_{\mathrm{th}}$;讀取則量測 $V_{\mathrm{th}}$ 落在哪個區間。

多階儲存與耐久度

每個單元可存多個 bit,靠細分 $V_{\mathrm{th}}$ 區間:

類型 bits/cell $V_{\mathrm{th}}$ 階數 耐久度(P/E cycles) 用途
SLC 1 2 ~100,000 工業/高可靠
MLC 2 4 ~3,000 早期消費
TLC 3 8 ~1,000 主流 SSD
QLC 4 16 ~數百 大容量低成本

存越多 bit,每 GB 成本越低,但耐久度與讀寫速度下降——這是 NAND 最核心的取捨。寫入會磨損穿隧氧化層,故有壽命上限(P/E cycles)。

3D NAND:往上堆

平面微縮到極限後,NAND 改走垂直堆疊:把記憶單元一層層往上疊,現已達 200+ 層(先進品邁向 300~400 層)。3D NAND 用垂直通道孔(channel hole)一次蝕穿數百層,是製程上極具挑戰的高深寬比蝕刻。堆得越高,單位面積容量越大,但蝕刻均勻度、層間應力、字元線電阻都成為挑戰。NAND 還需寫入前先抹除(erase before write)、以區塊為單位抹除,因此 SSD 需FTL(Flash Translation Layer)wear leveling(磨損平均)garbage collection 來管理。

HBM:用 3D 堆疊打破記憶體牆

為什麼需要 HBM

GPU/AI 加速器的瓶頸常不在算力而在餵資料的頻寬。傳統 DDR/GDDR 靠提高單腳速度與位元,但接腳數與功耗受限。HBM(High Bandwidth Memory)改變思路:把多顆 DRAM die 垂直堆疊,用極寬的介面換頻寬。

TSV 與堆疊架構

HBM 的關鍵是 TSV(Through-Silicon Via,矽穿孔):在 DRAM die 上鑽出垂直導通孔,把堆疊的 4/8/12 層 DRAM die 在垂直方向直接連通,底部一顆 base die 負責對外。整個 HBM stack 透過 2.5D 封裝(如 CoWoS)矽中介層(interposer)與 GPU 並排相連。

  • 超寬介面:HBM 每 stack 提供 1024-bit 介面(傳統 GDDR 僅 32-bit/chip),靠寬度而非高頻取勝。
  • 頻寬:單顆 HBM3/HBM3E stack 可達 數百 GB/s 到 ~1 TB/s;一張 AI 加速卡配多顆 HBM,總頻寬達 數 TB/s
  • 能效:短距離、低擺幅的堆疊互連,每 bit 搬運能耗遠低於長距 PCB 走線。

$$\text{頻寬} = \text{介面位元寬} \times \text{等效資料率}$$

HBM3 範例(單 stack):$1024\ \text{bit} \times 6.4\ \text{Gbps/pin} \approx 819$ GB/s;八顆 stack 並聯 $\approx 6.5$ TB/s 級系統頻寬。

取捨

HBM 性能極佳,但成本高、製造難:TSV 良率、die 堆疊鍵合(hybrid bonding / micro-bump)、CoWoS 中介層產能都是瓶頸。這也是當前 AI 晶片供應的主要卡點之一——HBM 與先進封裝產能,往往比運算晶粒本身更稀缺。

三者比較與系統定位

維度 DRAM NAND Flash HBM
揮發性 揮發 非揮發 揮發
單元結構 1T1C 浮閘/電荷捕捉 1T1C(3D 堆疊 die)
角色 主記憶體 大容量儲存 AI/HPC 高頻寬記憶體
微縮路線 電容微縮+EUV 3D 層數堆疊 TSV die 堆疊
關鍵瓶頸 電容微縮、refresh 耐久度、HAR 蝕刻 TSV 良率、封裝產能
主要取捨 密度 vs. 漏電 成本 vs. 壽命 頻寬 vs. 成本

前沿與展望

記憶體的前沿圍繞三條主線:HBM 持續堆高層數與引入 hybrid bonding(取代 micro-bump,縮短間距)、3D DRAM 把儲存單元也立體化、以及新興非揮發記憶體(MRAM、ReRAM、PCM)嘗試填補 DRAM 與 NAND 之間的速度/成本間隙,並朝存內運算(compute-in-memory)發展——直接在記憶體陣列內做乘加,從根本上繞過記憶體牆。在 AI 主導的算力競賽中,記憶體已從配角躍升為決定系統效能與供應鏈的主角之一。

延伸閱讀:〈先進封裝:Chiplet、CoWoS 與 2.5D/3D IC〉、〈CoWoS 與 3D IC 封裝〉、〈電晶體與 MOSFET:晶片的開關〉。

接著問 AI 助教

點一下複製提問,到 ClassroomGPT、優學伴(AIDA)或你的 UeduGPTs 頻道貼上,AI 會引用本專區內容回答。

AI 共讀助教正在陪你讀:記憶體入門:DRAM、NAND 與 HBM
嗨!我是這篇文章的共讀助教,只根據〈記憶體入門:DRAM、NAND 與 HBM〉的內容回答。可以問我「解釋某段」「舉個例子」「出題考我」,或反白文中段落後點下方「解釋選取段落」。