觀測天文與望遠鏡(進階):光子的會計戰爭
從散粒雜訊、CCD 方程式到自適應光學,看一張漂亮的星系照片如何從噪音的汪洋裡被誠實地數出來
一張漂亮的星系照片,背後其實是一場光子的會計戰爭
入門篇我們談過:口徑決定集光力與解析力,光譜學讓我們讀出星星的成分。但這裡藏著一個更殘酷的現實——當你把望遠鏡指向一個遙遠星系,每一秒鐘可能只有寥寥數個光子(photon)落進你的偵測器,而同時,地球大氣的輝光、月光的散射、偵測器自身的電子雜訊,正一刻不停地往你的影像裡灌「假訊號」。
換句話說,現代觀測天文學的核心難題,往往不是「光夠不夠多」,而是「我能不能把真正的星光,從一片雜訊的汪洋裡,誠實地數出來」。這是一場關於光子的會計戰爭。要打贏它,我們必須理解光子如何被計數、雜訊從何而來、以及如何用訊雜比(signal-to-noise ratio)這把尺,量化我們對每一個像素的信任程度。這一篇,我們就鑽進望遠鏡焦平面背後的偵測物理與統計,看看一張「漂亮的照片」是怎麼從噪音裡被搶救出來的。

從光子到電子:偵測器到底在數什麼
肉眼與底片的時代,天文學家用「亮不亮」做半定量的判斷。但自 1970 年代電荷耦合元件(charge-coupled device, CCD)問世後,天文觀測就變成了一門光子計數(photon counting)的精密科學。
CCD 的原理是光電效應:一顆光子打進矽晶格,若能量夠大,就激發出一個光電子(photoelectron),被困在一個個微小的電位井(potential well,即像素)裡。曝光結束後,晶片把每個像素累積的電子量依序「倒」出來,轉成數位讀數(ADU, analog-to-digital unit)。因此偵測器本質上不是在量「亮度」,而是在數電子的個數。
這裡有兩個關鍵指標決定了偵測器的好壞:
- 量子效率(quantum efficiency, QE):入射光子能成功轉成可記錄電子的比例。現代背照式(back-illuminated)CCD 在可見光波段的 QE 可達 90% 以上——意思是每 10 個光子打進來,約有 9 個被記錄。對比人眼視桿細胞的有效 QE 大約只有幾個百分點,這就是為什麼同一台望遠鏡,接上 CCD 後能看到的天體,遠比目視深得多。
- 增益(gain, $g$):一個 ADU 讀數對應多少個電子。例如 $g = 2\ e^-/\text{ADU}$,代表讀數每加 1,背後是 2 個電子。把讀數乘上增益,我們才能回到真正有物理意義的「電子數」,進而做雜訊估算。
理解這條「光子 → 光電子 → ADU」的轉換鏈,是看懂後續所有雜訊分析的前提:因為雜訊不是發生在「亮度」上,而是發生在離散的、可數的電子上。
散粒雜訊:連完美的偵測器也躲不掉的根本極限
假設我們造出一台 QE = 100%、零缺陷的完美偵測器,是不是就能精準量到星星的亮度了?答案是不行。因為光子抵達本身就是一個隨機過程。
光子的到達服從卜瓦松分布(Poisson distribution):如果某像素平均期望收到 $N$ 個光子,那麼任何一次實際曝光收到的數目會在 $N$ 附近隨機漲落,其標準差正好是:
$$\sigma_{\text{shot}} = \sqrt{N}$$
這就是散粒雜訊(shot noise,又稱光子雜訊)。它不是儀器的缺陷,而是光的量子本質帶來的、無法消除的統計極限。它的後果非常深刻:你收到的光子越多,雜訊的絕對值越大($\sqrt{N}$ 隨 $N$ 增長),但雜訊的相對比例卻越小:
$$\frac{\sigma_{\text{shot}}}{N} = \frac{\sqrt{N}}{N} = \frac{1}{\sqrt{N}}$$
這條 $1/\sqrt{N}$ 的關係,是整個觀測天文學的命脈。它告訴我們:想把測量精度提高一倍,光子數必須變成四倍;想提高十倍,光子數要變成一百倍。這也解釋了為什麼天文學家對「曝光時間」如此斤斤計較——時間翻倍,光子數翻倍,訊雜比只增加 $\sqrt{2} \approx 1.41$ 倍。精度是用時間的平方根換來的,極其昂貴。
訊雜比方程式:把所有雜訊源加總起來
真實的觀測裡,落進像素的不只有目標星光。我們來盤點一場曝光中所有的「電子來源」:
- 目標訊號 $N_\star$:來自天體本身的光電子。
- 天空背景 $N_{\text{sky}}$:大氣輝光、月光散射、黃道光等灑滿整個視野的背景光,每個像素都有一份。
- 暗電流(dark current) $N_{\text{dark}}$:偵測器在沒有光照時,熱激發產生的「假電子」。這就是為什麼科學級 CCD 要冷卻——溫度每降約 6–7 °C,暗電流大致減半。
- 讀出雜訊(read noise) $\sigma_{\text{read}}$:把電子轉成數位讀數的電路,每次讀取引入的固定雜訊(單位是電子數,與曝光時間無關)。
前三項都是會被「數出來」的電子,各自貢獻散粒雜訊(標準差為其平方根);讀出雜訊則是獨立的一項。由於這些雜訊源互相獨立,總雜訊是各項變異數(variance)的平方根相加(雜訊以平方相加,不是線性相加)。於是著名的CCD 方程式(CCD equation)寫成:
$$\text{SNR} = \frac{N_\star}{\sqrt{N_\star + n_{\text{pix}}\left(N_{\text{sky}} + N_{\text{dark}} + \sigma_{\text{read}}^2\right)}}$$
其中 $n_{\text{pix}}$ 是星象佔據的像素數。這條式子是每一位觀測者規劃曝光、估算可達深度的工作母機。它揭示了兩種截然不同的觀測情境:
- 亮源(訊號主導):當 $N_\star$ 遠大於其他項,分母約為 $\sqrt{N_\star}$,於是 $\text{SNR} \approx \sqrt{N_\star}$。此時你被自己的散粒雜訊限制,唯一的辦法就是收更多光子。
- 暗源(背景主導):當目標極暗,分母由天空背景與讀出雜訊主導。此時 $\text{SNR} \approx N_\star / \sqrt{n_{\text{pix}} N_{\text{sky}}}$。想看得更深,除了增大口徑,還得壓低天空背景——這正是太空望遠鏡、暗夜保護區、窄波段濾鏡存在的理由。
動手算一下:這張影像值得信任嗎?
假設我們用某台望遠鏡對一顆暗星曝光,估算各項電子數如下:目標訊號 $N_\star = 900\ e^-$,星象佔 $n_{\text{pix}} = 9$ 個像素,每像素天空背景 $N_{\text{sky}} = 200\ e^-$、暗電流 $N_{\text{dark}} = 0$(已充分冷卻)、讀出雜訊 $\sigma_{\text{read}} = 5\ e^-$。
先算分母內的背景與儀器雜訊變異數:
$$n_{\text{pix}}\left(N_{\text{sky}} + \sigma_{\text{read}}^2\right) = 9 \times (200 + 25) = 9 \times 225 = 2025$$
加上目標自身的散粒雜訊:
$$\sqrt{N_\star + 2025} = \sqrt{900 + 2025} = \sqrt{2925} \approx 54.1$$
於是:
$$\text{SNR} = \frac{900}{54.1} \approx 16.6$$
SNR $\approx 16.6$ 換算成測光誤差約為 $1/16.6 \approx 6\%$,對應星等不確定度約 $1.086/\text{SNR} \approx 0.065$ 個星等——這對許多研究已經堪用。
現在做個關鍵練習:如果曝光時間加倍會怎樣?目標、天空、暗電流這三項「會累積的電子」都翻倍(讀出雜訊不變,因為它與時間無關):
$$\text{SNR}_2 = \frac{1800}{\sqrt{1800 + 9\times(400 + 25)}} = \frac{1800}{\sqrt{1800 + 3825}} = \frac{1800}{\sqrt{5625}} = \frac{1800}{75} = 24$$
SNR 從 16.6 升到 24,提升約 1.45 倍——略高於純散粒雜訊預期的 $\sqrt{2} \approx 1.41$。原因正是:讀出雜訊這項固定成本被攤薄了。這個小細節說明了一件實務上的大事:在讀出雜訊主導的領域,少數幾張長曝光勝過大量短曝光的疊加;反之在天空主導的領域,分多次曝光比較不吃虧,還能剔除宇宙射線。
不只是口徑:étendue 與系統穿透率
入門篇強調「口徑就是一切」,但那是對單一目標而言。當我們關心的是巡天(survey)——在固定時間內掃描盡可能大的天區、收集盡可能多的天體——衡量標準就變成了 étendue(光學擴展量,又稱 AΩ 乘積):
$$\text{Étendue} = A \times \Omega$$
其中 $A$ 是收光面積(正比於 $D^2$),$\Omega$ 是視場立體角(field of view)。一台口徑巨大但視場狹窄的望遠鏡(如為了極深成像而生的儀器),étendue 不見得高;而薇拉·魯賓天文台(Vera C. Rubin Observatory)的設計哲學,正是用 8.4 公尺口徑搭配異常寬廣的視場,把 étendue 推到極致,才能每隔幾個晚上就把整片南天掃描一遍。
此外,從天體到電子,光子在每一個介面都會被「課稅」。系統穿透率(system throughput)是望遠鏡反射鏡反射率、濾鏡穿透率、與偵測器 QE 的連乘積:
$$\eta_{\text{total}} = \eta_{\text{mirror}} \times \eta_{\text{filter}} \times \text{QE}$$
每面反射鏡反射率約 90–96%,多片光學元件串起來,加上濾鏡與 QE,一台典型望遠鏡最終可能只有三、四成的光子真正轉成可用電子。這提醒我們:紙面上的口徑只是上限,真正決定靈敏度的,是這條完整的光子預算鏈。鍍膜老化、灰塵、濾鏡選擇,都會悄悄吃掉得來不易的光子。
把大氣磨平:自適應光學的工程細節
入門篇提過自適應光學(adaptive optics, AO)能校正大氣擾動。這裡我們看它實際如何運作,以及它的代價與限制。
大氣湍流會把原本平整的星光波前(wavefront)揉皺。AO 系統的工作迴路是:用波前感測器(wavefront sensor)——常見的夏克–哈特曼感測器(Shack–Hartmann sensor)以一組微透鏡陣列,把入射波前切成許多小塊,量測每一塊光點的偏移,反推出波前在各處的傾斜;接著電腦算出校正量,驅動一面變形鏡(deformable mirror)上數百到數千個致動器,在毫秒級的時間內把鏡面壓成「反向皺褶」,剛好抵銷大氣的扭曲。整個迴路每秒重複數百到上千次,因為大氣的相干時間(coherence time)只有幾毫秒。
衡量 AO 校正得好不好,用的是史特列爾比(Strehl ratio, $S$):實際影像峰值強度相對於理想無像差影像峰值的比值,介於 0 到 1。$S = 1$ 是完美繞射極限,地面 AO 在近紅外常能達到 0.3–0.8。它與殘餘波前誤差 $\sigma$(單位為弧度的相位)近似服從馬雷夏爾公式(Maréchal approximation):
$$S \approx \exp\left(-\sigma^2\right)$$
這個指數關係很無情:殘餘相位誤差稍微變大,史特列爾比就急遽崩塌。波長越長,同樣的物理皺褶換算成相位誤差越小,所以 AO 在紅外比在可見光容易做得好——這也是為什麼地面紅外 AO 成像能逼近、甚至局部超越哈伯。
AO 還有兩個迷人的限制。其一,它需要一顆夠亮的參考星來量波前,但天上不一定剛好有;於是天文學家用雷射導引星(laser guide star)——把強雷射打上約 90 公里高的鈉原子層,激發出一顆人造亮點當參考。其二,校正只在參考星周圍一個很小的等暈角(isoplanatic angle)內有效(通常只有幾十角秒),因為遠處的光走過的是不同的大氣路徑。突破這個限制的多共軛自適應光學(multi-conjugate AO)用多顆導引星與多面變形鏡,校正更大的視野——這是極大望遠鏡(ELT)時代的關鍵技術。
重點回顧
- 現代偵測器(CCD/CMOS)本質是在數光電子:理解「光子 → 光電子(受 QE 折損)→ ADU(乘增益)」這條鏈,是所有雜訊分析的基礎。
- 散粒雜訊 $\sigma = \sqrt{N}$ 是光的量子本質帶來的根本極限;相對精度依 $1/\sqrt{N}$ 改善,所以精度貴得驚人——精度翻倍要光子變四倍。
- CCD 方程式把目標、天空背景、暗電流、讀出雜訊統一進一條訊雜比公式;亮源被自身散粒雜訊限制,暗源被背景與讀出雜訊限制,對應不同的觀測策略。
- 巡天看的是 étendue($A\Omega$)而非單純口徑;而系統穿透率(鏡面 × 濾鏡 × QE 的連乘)才是真正決定靈敏度的光子預算。
- 自適應光學用波前感測器 + 變形鏡以毫秒級迴路即時磨平大氣;校正品質以史特列爾比衡量,受等暈角限制,並可用雷射導引星補上參考星的不足。
深入探討(研究所視角)
從卜瓦松到高斯:為什麼測光誤差是 1.086/SNR
散粒雜訊嚴格來說服從卜瓦松分布,但當期望光子數 $N$ 夠大(通常 $N \gtrsim 20$),卜瓦松分布趨近於高斯分布,標準差仍為 $\sqrt{N}$,這讓我們能用熟悉的高斯統計做誤差傳遞。星等定義為 $m = -2.5\log_{10}(F) + \text{const}$,對通量 $F$ 微分可得測光誤差與 SNR 的關係:
$$\sigma_m = \frac{2.5}{\ln 10}\,\frac{\sigma_F}{F} = 1.086 \times \frac{1}{\text{SNR}}$$
這條 $\sigma_m \approx 1.086/\text{SNR}$ 是測光學的常用速算式:SNR = 100 對應約 0.011 星等誤差,SNR = 10 對應約 0.11 星等。值得強調的是,這已假設雜訊由統計漲落主導;實務中還有系統誤差(systematic error)——平場(flat field)不完美、天空背景估計偏差、儀器非線性等——它們不隨曝光時間以 $1/\sqrt{t}$ 下降,最終會在很高的 SNR 處設下一道「系統地板」,這也是高精度系外行星凌星測光最棘手的戰場。
數據縮減:平場、暗框與偏壓的物理意義
從原始(raw)CCD 影像到可用科學數據,必須經過數據縮減(data reduction)。三類校正框各有明確的物理目標:偏壓框(bias frame) 量測零曝光下讀出電路的基準電位(去除電子學偏移);暗框(dark frame) 在相同曝光時間、不開快門下量測暗電流的空間分布;平場(flat field) 對均勻光源曝光,記錄每個像素 QE 的差異與光學系統的暗角(vignetting)、灰塵陰影。校正公式為:
$$\text{Science} = \frac{\text{Raw} - \text{Bias} - \text{Dark}}{\text{Flat (normalized)}}$$
理解這條式子能看清一件深刻的事:偏壓與暗框是加法性雜訊(要相減去除),平場是乘法性響應差異(要相除歸一)。把它們搞混(例如忘了先減暗框就除平場)會引入系統誤差,污染後續所有測光與光譜分析。
干涉測量與孔徑合成:用相位重建影像
入門篇提到 EHT 用全球基線達到微角秒解析度。其背後的物理是孔徑合成(aperture synthesis):根據范西特–澤尼克定理(van Cittert–Zernike theorem),一個非相干源在空間中產生的互相干函數(complex visibility),正是天體亮度分布的傅立葉變換(Fourier transform)。每一對望遠鏡基線量到傅立葉空間($uv$ 平面)上的一個取樣點:
$$V(u, v) = \iint I(l, m)\, e^{-2\pi i (ul + vm)}\, dl\, dm$$
地球自轉讓基線在 $uv$ 平面上掃出弧線,逐步填補取樣(這稱為地球自轉合成,Earth-rotation synthesis),最後對 visibility 做反傅立葉變換並反卷積(deconvolution,如 CLEAN 演算法),重建出影像。等效解析度由最長基線 $B_{\max}$ 決定,可達 $\theta \approx \lambda / B_{\max}$。這意味著解析力不再受限於單一鏡面的物理尺寸,而是望遠鏡能拉開多遠——這正是現代電波天文學,乃至於未來太空干涉儀(space interferometry)企圖直接成像系外行星表面的終極武器。從數光子到重建相位,觀測天文學的每一步,都是人類把微弱訊號從噪音與失真中,一點一點奪回來的工程奇蹟。