宇宙大尺度結構（進階）：把星系地圖讀成精密宇宙學

從兩點相關函數、功率譜到紅移空間扭曲——一張看似凌亂的星系分佈，如何成為量測暗能量與檢驗重力的鋒利探針

進階 · 約 16 分鐘 ·#宇宙學#大尺度結構#功率譜#紅移空間扭曲#結構成長率#宇宙網

為什麼一張「亂糟糟」的星系地圖，能精準回答暗能量的問題？

入門篇帶你走過了宇宙網(cosmic web)的長相：纖維、節點、空洞，以及它如何從十萬分之一的密度漣漪長成。但若你把一張真正的史隆數位巡天(SDSS)星系地圖攤開來看，第一印象其實是「凌亂」——幾億個亮點散落各處，纖維時隱時現，沒有兩條一模一樣。問題來了：宇宙學家如何從這片看似主觀的圖案中，擠出像哈伯常數、暗能量狀態方程那樣精確到百分之幾的數字？

答案是：我們從來不直接「看圖說故事」。大尺度結構真正的語言是統計。任何一張星系分佈，都被視為某個底層機率場的一次隨機抽樣；我們關心的不是哪個星系在哪裡，而是這個場的統計性質——它有多「成團」、在哪個尺度上振盪、隨時間長多快。本篇要談的，正是這套把「亂糟糟」轉譯成可檢驗物理的工具，以及它為何能成為當代精密宇宙學最鋒利的刀。

宇宙大尺度結構進階概念示意圖

兩點相關函數：成團程度的數學定義

要量化「星系有多愛聚在一起」，最基本的工具是兩點相關函數(two-point correlation function) $\xi(r)$。它的定義很直觀：相對於完全隨機(泊松)分佈，在距離某星系 $r$ 處、體積 $\mathrm{d}V$ 內找到另一個星系的「超額機率」。

$$\mathrm{d}P = \bar{n}\,[1 + \xi(r)]\,\mathrm{d}V$$

其中 $\bar{n}$ 是星系的平均數密度。若 $\xi(r) = 0$，代表該尺度上星系彼此獨立、純隨機；$\xi(r) > 0$ 代表比隨機更密集(成團)；$\xi(r) < 0$ 代表比隨機更稀疏(反聚集，正是空洞的特徵)。

觀測上，星系的 $\xi(r)$ 在小尺度($r \lesssim 10 \ \text{Mpc}/h$)可以漂亮地用冪律描述：

$$\xi(r) \approx \left(\frac{r}{r_0}\right)^{-\gamma}, \qquad \gamma \approx 1.8, \quad r_0 \approx 5 \ \text{Mpc}/h$$

這裡 $r_0$ 稱為「相關長度(correlation length)」，是 $\xi=1$ 的尺度，約 $5$ 百萬秒差距(以 $h = H_0/100$ 表示，免去哈伯常數不確定性的標準寫法)。$\gamma \approx 1.8$ 這個冪次幾十年來在各代巡天中驚人地穩定，本身就是重力塑造結構的指紋。

實務上怎麼算 $\xi(r)$？最常用的是 Landy–Szalay 估計量，它比較「真實星系兩兩配對數(DD)」、「隨機點兩兩配對數(RR)」與「真實—隨機交叉配對數(DR)」：

$$\hat{\xi}(r) = \frac{DD - 2\,DR + RR}{RR}$$

之所以要造一群「隨機點」陪襯，是因為巡天有複雜的邊界、天區遮罩與選擇效應；用同樣幾何的隨機目錄當分母，這些系統效應大致會被約掉。這是一個關鍵心法：大尺度結構分析的精度，常常不取決於你的星系，而取決於你多懂自己的隨機目錄。

功率譜：把宇宙網拆成不同尺度的波

$\xi(r)$ 活在「位置空間」，但結構成長的物理在「波數空間」更乾淨。對密度對比場 $\delta(\mathbf{x})$ 做傅立葉轉換，得到各個波模 $\delta(\mathbf{k})$，其變異數就是功率譜(power spectrum) $P(k)$：

$$\langle \delta(\mathbf{k})\,\delta^*(\mathbf{k}') \rangle = (2\pi)^3 \, P(k)\,\delta_D^3(\mathbf{k} - \mathbf{k}')$$

直覺上，$P(k)$ 告訴你「尺度 $\lambda \sim 2\pi/k$ 的起伏有多強」。大 $k$(小尺度)、小 $k$(大尺度)。功率譜與相關函數其實是同一資訊的兩種表達——它們互為傅立葉變換對：

$$\xi(r) = \int \frac{\mathrm{d}^3 k}{(2\pi)^3}\, P(k)\, e^{i\mathbf{k}\cdot\mathbf{r}}$$

為什麼宇宙學家偏愛 $P(k)$？因為在線性區(大尺度、$\delta \ll 1$)，不同波模彼此獨立演化、互不耦合。每個 $\delta(\mathbf{k})$ 都按入門篇提過的線性成長因子 $D(a)$ 同步放大，於是整個功率譜的形狀被凍結、只有振幅隨時間長：

$$P(k, a) = D^2(a)\, P_{\text{lin}}(k)$$

這種「各尺度獨立、整體等比例長大」的乾淨行為，讓 $P(k)$ 成為連接早期宇宙(原初功率譜)與晚期觀測(星系分佈)的理想橋樑。

功率譜有個標誌性形狀：在某個特徵波數 $k_{\text{eq}}$ 處出現轉折(turnover)。比 $k_{\text{eq}}$ 大的尺度，$P(k) \propto k^{n_s}$，其中 $n_s \approx 0.965$ 是原初譜指數(接近但略小於 1，這個微小偏離是暴脹理論的關鍵預測之一)；比 $k_{\text{eq}}$ 小的尺度則被壓抑。轉折發生的位置對應「物質—輻射相等時期(matter-radiation equality)」進入視界的尺度——在輻射主導期，過快的膨脹壓制了結構成長(這稱為 Mészáros 效應)，於是小尺度功率被相對削弱。換句話說，$P(k)$ 的轉折，是宇宙能量組成在結構上刻下的烙印。

動手算一下：星系數量、體積與「為什麼大尺度這麼難測」

宇宙學測量大尺度功率譜時，最大的敵人之一是樣本變異(cosmic variance)：在最大的尺度上，可觀測宇宙裡能放進去的獨立波模很少，統計起來天生不準。我們來估個量級。

假設一個巡天涵蓋共動體積 $V = 1 \ (\text{Gpc}/h)^3$，想測波長 $\lambda = 150 \ \text{Mpc}/h$ 附近的模(正好是 BAO 尺度)。對應波數 $k \approx 2\pi/\lambda$。在波數空間，一個球殼 $k$ 到 $k+\Delta k$ 內的獨立模數約為：

$$N_{\text{modes}} \approx \frac{4\pi k^2\,\Delta k}{(2\pi)^3 / V} = \frac{V\,k^2\,\Delta k}{2\pi^2}$$

取 $k \approx 0.042 \ h/\text{Mpc}$、$\Delta k \approx 0.01 \ h/\text{Mpc}$、$V = 10^9 \ (\text{Mpc}/h)^3$：

$$N_{\text{modes}} \approx \frac{10^9 \times (0.042)^2 \times 0.01}{2\pi^2} \approx \frac{10^9 \times 1.76\times10^{-5}}{19.7} \approx 8.9 \times 10^{2}$$

也就是大約 $900$ 個獨立模。功率譜測量的相對誤差約為 $1/\sqrt{N_{\text{modes}}} \approx 1/\sqrt{900} \approx 3.3\%$。

這個簡單估算揭露了一件深刻的事：要把大尺度誤差壓到 $1\%$，模數得增加約 10 倍，巡天體積也得跟著放大約 10 倍。 這正是為什麼 DESI、Euclid 這類新一代計畫要拼命擴大巡天天區與紅移深度——不是貪多，而是被宇宙的統計極限逼著走。可觀測宇宙只有一個，最大尺度上能抽的「樣本」就那麼多，這是物理硬限制，再厲害的望遠鏡也無法繞過。

紅移空間扭曲：缺陷如何變成寶藏

入門篇用哈伯—勒梅特定律把紅移換成距離。但這裡藏著一個微妙的問題：星系除了隨宇宙膨脹退行，還有自己的本動速度(peculiar velocity)——也就是被周圍重力拉扯產生、疊加在哈伯流之上的額外運動。我們測到的紅移其實是兩者之和：

$$cz_{\text{obs}} = cz_{\text{cosmo}} + v_{\text{pec},\parallel}$$

本動速度沿視線方向的分量會「污染」距離推算，使我們畫出的三維地圖在視線方向被扭曲——這稱為紅移空間扭曲(redshift-space distortions，RSD)。它有兩種截然不同的面貌：

Fingers of God（上帝之指）：在已塌縮的星系團內部，星系繞質心高速亂飛(每秒上千公里)。這些隨機本動速度讓同一團星系在紅移空間被「拉長」成沿視線方向的細條，看起來像一根根指向觀測者的手指。這是小尺度、非線性的效應。

Kaiser 效應（大尺度壓扁）：在尚未塌縮的大尺度上，物質正整體地朝高密度區流入。流入的一側星系本動速度朝我們、另一側遠離我們，淨效果是讓結構在紅移空間沿視線方向被「壓扁」，使密度等高線變得比真實更扁平。

乍看之下，RSD 是把好好的地圖搞亂的「缺陷」。但宇宙學家的精彩反轉在於：這個扭曲量本身正比於物質流動的速度，而流速正是結構成長速率的直接反映。 Kaiser 在線性區給出，紅移空間功率譜相對真實空間多了一個與視線夾角 $\mu = \cos\theta$ 有關的因子：

$$P_s(k, \mu) = \left(1 + \beta\,\mu^2\right)^2 P_r(k), \qquad \beta = \frac{f}{b}$$

這裡 $b$ 是星系偏置(galaxy bias，星系比暗物質更成團的倍率)，而 $f$ 是我們真正想要的寶物——結構成長率(growth rate)：

$$f \equiv \frac{\mathrm{d}\ln D}{\mathrm{d}\ln a} \approx \Omega_m(a)^{\gamma}, \qquad \gamma \approx 0.55$$

$f$ 衡量「結構成長有多快」，而它對重力理論極度敏感。廣義相對論預測 $\gamma \approx 0.55$；許多修改重力(modified gravity)理論則給出不同的 $\gamma$。於是，原本擾人的紅移扭曲，搖身一變成了檢驗愛因斯坦重力在宇宙尺度是否仍成立的探針。實務上量到的是組合量 $f\sigma_8$（$\sigma_8$ 是 $8 \ \text{Mpc}/h$ 球內密度起伏的均方根，後面會談），因為它不依賴難以獨立測定的偏置 $b$。一個原本的「測量缺陷」，最終成了宇宙學最重要的成長率觀測量之一——這是大尺度結構研究裡反覆出現的美學。

從線性到非線性：宇宙網是怎麼「織」出來的

入門篇說過，當 $\delta$ 接近 $1$，線性理論失效。那纖維與空洞這種高度非線性、又帶方向性的圖案，究竟從何而來？關鍵洞見來自 澤爾多維奇近似(Zel'dovich approximation)。

澤爾多維奇的想法極其優雅：與其追蹤密度怎麼長，不如追蹤物質粒子怎麼移動。每個粒子從初始(拉格朗日)位置 $\mathbf{q}$ 出發，位移正比於初始重力場：

$$\mathbf{x}(\mathbf{q}, t) = \mathbf{q} + D(t)\,\boldsymbol{\psi}(\mathbf{q})$$

其中 $D(t)$ 是線性成長因子、$\boldsymbol{\psi}$ 是由初始位能決定的位移場。神奇之處在於：結構塌縮的形態，取決於位移場梯度張量(可視為初始潮汐場)的三個本徵值 $\lambda_1 \ge \lambda_2 \ge \lambda_3$。物質總是沿最大壓縮方向(最大本徵值)先塌縮，於是：

三個方向都不太壓縮 → 仍是低密度的空洞；
沿一個方向先塌縮 → 物質擠成一片牆(pancake / sheet)；
再沿第二個方向塌縮 → 收成一條纖維(filament)；
三個方向都塌縮 → 聚成一個節點(node)，也就是星系團。

這就是宇宙網幾何的物理起源：不是巧合，而是初始潮汐場本徵結構在重力下展開的必然層級。現代的「宇宙網分類器」（如 T-web、Hessian 方法）正是計算每一點密度場或潮汐場的本徵值，依其正負個數把空間自動標記為空洞／牆／纖維／節點。澤爾多維奇近似在 $\delta \sim 1$ 前都驚人地準確，之後則需 N 體數值模擬(N-body simulation) 接手——把數十億顆粒子放進虛擬宇宙，逐步積分牛頓重力，讓宇宙網在電腦裡自己長出來。

看一個例子：σ8 與「結構成熟度」

我們常用一個單一數字概括「今日宇宙有多成團」：$\sigma_8$。它定義為半徑 $8 \ \text{Mpc}/h$ 的球內，密度對比 $\delta$ 的均方根：

$$\sigma_8^2 = \langle \delta_R^2 \rangle \Big|_{R = 8\,\text{Mpc}/h} = \int \frac{\mathrm{d}^3k}{(2\pi)^3}\, P(k)\, |W(kR)|^2$$

其中 $W(kR)$ 是半徑 $R$ 的球形窗函數。為什麼挑 $8 \ \text{Mpc}/h$？歷史上這是個經驗選擇——在這個尺度上，亮星系的 $\delta$ 起伏恰好約為 $1$（也就是 $\sigma_8 \approx 1$ 量級），正好坐在線性與非線性的交界，量起來既穩定又敏感。

當代觀測給出 $\sigma_8 \approx 0.81$。我們可以反推：在 $8 \ \text{Mpc}/h$ 球內，密度起伏的典型振幅約 $81\%$，已經是「接近 1」的非線性門檻——這定量地說明，今日宇宙在十百萬秒差距尺度上「剛好」成熟到開始塌縮成結構。

更有意思的是把它接回成長率。$\sigma_8$ 隨時間正比於成長因子 $D(a)$：$\sigma_8(a) = D(a)\,\sigma_8(0)/D(0)$。於是 RSD 測到的 $f\sigma_8$ 同時鎖住了「結構有多成熟($\sigma_8$)」與「結構長多快($f$)」。把不同紅移的 $f\sigma_8(z)$ 串成一條曲線，就能檢驗它是否符合廣義相對論在 $\Lambda$CDM 下的預測——目前數據與標準模型大致相符，但低紅移端是否有輕微偏低（即所謂 $S_8$ 張力），仍是當前研究的熱點。

重點回顧

大尺度結構的真正語言是統計：我們不研究單一星系，而是把分佈視為機率場的抽樣，用兩點相關函數 $\xi(r)$ 與功率譜 $P(k)$（兩者互為傅立葉對）量化成團程度。
$P(k)$ 在線性區各波模獨立、整體按 $D^2(a)$ 等比成長，並在 $k_{\text{eq}}$ 處出現轉折，烙印著物質—輻射相等時期與宇宙能量組成。
紅移空間扭曲(RSD) 表面上是本動速度造成的地圖缺陷（Fingers of God 與 Kaiser 效應），實則是測量結構成長率 $f \approx \Omega_m^{0.55}$ 的探針，可用來檢驗重力理論。
澤爾多維奇近似用初始潮汐場的本徵值解釋宇宙網幾何：依塌縮方向數，自然產生空洞→牆→纖維→節點的層級。
$\sigma_8 \approx 0.81$ 概括今日結構成熟度，與 $f$ 組成的 $f\sigma_8$ 是當代精密宇宙學最關鍵的成長率觀測量之一。

深入探討（研究所視角）

暈質量函數與偏置：把暗物質暈接到可見星系

統計工具描述的是底層(主要是暗物質)密度場，但我們觀測到的是星系——兩者之間隔著暗物質暈(dark matter halo) 與偏置(bias) 的橋樑。Press–Schechter 理論及其延伸(excursion set / Sheth–Tormen)給出暈質量函數(halo mass function)：單位體積、單位質量區間內、質量為 $M$ 的暈的數密度

$$\frac{\mathrm{d}n}{\mathrm{d}M} = \frac{\bar{\rho}_m}{M}\, f(\nu)\, \frac{\mathrm{d}\ln\nu}{\mathrm{d}M}, \qquad \nu = \frac{\delta_c}{\sigma(M)}$$

其中 $\delta_c \approx 1.686$ 是球塌縮模型給出的「臨界線性密度對比」（線性外推下，密度起伏超過此值即視為已塌縮），$\sigma(M)$ 是質量尺度 $M$ 對應的密度起伏均方根。$\nu$ 是「峰高」——越高代表越稀有、越大的暈。這個架構解釋了為何巨大星系團如此稀少（高 $\nu$ 指數壓抑），以及暈數目對 $\sigma_8$ 與 $\Omega_m$ 的指數級敏感性，使星系團計數(cluster counts) 成為另一條獨立的宇宙學約束。

星系並非無偏地描繪暗物質。在大尺度的線性偏置近似下 $\delta_g = b\,\delta_m$，而高峰偏置(peak-background split)指出，越大質量的暈、$b$ 越大——這是因為大暈傾向誕生在大尺度過密的背景上。理解偏置是把 $\xi_{\text{galaxy}}$ 翻譯回 $\xi_{\text{matter}}$、進而做精密宇宙學的必經關卡，也是當前 EFTofLSS（大尺度結構有效場論）等理論框架著力處理的核心。

高階統計與場層級推論：超越兩點函數

兩點函數只能完整描述高斯隨機場。但重力的非線性演化會把初始接近高斯的場揉出非高斯性——纖維、空洞這種帶相位關聯的結構，資訊大量藏在三點、四點等高階矩中。三點相關函數及其傅立葉對偶雙譜(bispectrum) $B(k_1, k_2, k_3)$ 因此攜帶了 $P(k)$ 看不到的訊息：它能同時打破成長率 $f$、偏置 $b$ 與 $\sigma_8$ 之間的簡併，也是搜尋原初非高斯性(primordial non-Gaussianity，$f_{\text{NL}}$)——暴脹不同模型的關鍵判據——的主戰場。

更前沿的方向是場層級推論(field-level inference) 與機器學習：不再把場壓縮成 $\xi$ 或 $P(k)$ 這類摘要統計（必然丟失資訊），而是直接對整個觀測密度場、結合可微分的前向模擬(differentiable forward model)做貝氏推論，原則上榨取每一比特的宇宙學資訊。配合 DESI、Euclid、Vera Rubin 天文台(LSST) 與 SKA 等將測繪數十億星系與中性氫的計畫，大尺度結構正從「驗證 $\Lambda$CDM」邁向「以前所未有的精度逼問暗能量本質、重力是否正確、以及暴脹留下的原初印記」。從一張看似亂糟糟的星系地圖，到這些直指宇宙根本問題的數字，靠的始終是同一件事：把隨機，當成最嚴謹的物理來讀。

← 上一篇

宇宙大尺度結構：星系如何織成宇宙網

--

4

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定