光伏太陽能發電建模之特徵建構與選擇：一個機器學習框架

1. 簡介與概述

將光伏（PV）太陽能發電整合至工業製程，是減少溫室氣體排放與提升永續性的關鍵策略。然而，太陽能固有的間歇性與變動性，對電網穩定性與可靠能源供應構成重大挑戰。因此，準確的短期光伏發電預測，對於有效的能源管理、負載平衡與營運規劃至關重要。

本文提出一個新穎的機器學習框架，用於提前1小時的太陽能發電預測。其核心創新在於兩階段方法：首先，使用切比雪夫多項式與三角函數將原始特徵集擴展至高維度空間；其次，採用量身定制的特徵選擇方案，結合約束線性回歸，建立針對特定天氣的預測模型。相較於標準模型，所提方法旨在更有效地捕捉氣象變數與發電功率之間複雜的非線性關係。

2. 方法論

2.1 資料與輸入特徵

本模型利用涵蓋光伏系統輸出與相關環境因素的歷史時間序列資料。關鍵輸入特徵包括：

自回歸項： 前一個15分鐘區間的太陽能發電量。
天氣狀況： 類別型資料（例如：晴朗、多雲、雨天）。
氣象變數： 溫度、露點、濕度與風速。
時間特徵： 透過資料的時間序列特性隱含考量。

2.2 使用切比雪夫多項式進行特徵建構

為了建模潛在的非線性關係，原始特徵向量 $\mathbf{x}$ 被轉換至高維度空間。對於每個連續輸入特徵 $x_i$，會生成一組第一類切比雪夫多項式 $T_k(x_i)$，直到指定的階數 $K$。第 $k$ 階的切比雪夫多項式以遞迴方式定義：

$T_0(x) = 1$

$T_1(x) = x$

$T_{k+1}(x) = 2xT_k(x) - T_{k-1}(x)$

同時加入特徵的三角函數（正弦與餘弦）以捕捉週期性模式。此建構方式創造了一個豐富且具表現力的特徵空間 $\Phi(\mathbf{x})$，能夠表示複雜的函數關係。

2.3 特徵選擇與約束回歸

並非所有建構出來的特徵都具有相關性。採用一種基於封裝（wrapper）的特徵選擇方法，以識別針對不同天氣條件最具預測力的子集。隨後，擬合一個約束線性回歸模型：

$\min_{\beta} \| \mathbf{y} - \Phi(\mathbf{X})\beta \|_2^2$

並對係數 $\beta$ 施加約束（例如，若物理關係表明某些輸入應僅對輸出產生正向影響，則施加非負性約束）。此步驟確保了模型的簡潔性與物理可解釋性，同時維持準確度。

3. 實驗結果與分析

3.1 效能指標

主要的評估指標是預測與實際提前1小時光伏發電功率之間的均方誤差（MSE）。較低的MSE表示較高的預測準確度。

效能摘要

所提方法： 在所有測試情境中均達到最低的MSE。

關鍵優勢： 在多樣化的天氣條件下表現優異，特別是在瞬變時期（例如：雲層掠過）。

3.2 與基準模型之比較

所提框架與數個經典機器學習模型進行了基準比較：

支援向量機（SVM）/ 支援向量回歸（SVR）
隨機森林（RF）
梯度提升決策樹（GBDT）

結果： 基於切比雪夫的特徵建構與選擇方法，其MSE持續低於所有基準模型。這證明了針對太陽能預測問題，明確地設計一個高維度特徵空間是有效的，相較於僅依賴集成樹方法固有的特徵組合能力或SVM中的核技巧。

4. 技術細節與數學框架

本模型可總結為一個將輸入映射到提前1小時預測 $\hat{P}_{t+1}$ 的函數 $f$：

$\hat{P}_{t+1} = f(\mathbf{x}_t) = \beta_0 + \sum_{j \in S} \beta_j \phi_j(\mathbf{x}_t)$

其中：

$\mathbf{x}_t$ 是時間 $t$ 的特徵向量。
$\{\phi_j\}$ 是從切比雪夫/三角函數擴展中選出的基底函數。
$S$ 是由特徵選擇演算法選出的索引集合。
$\beta$ 是透過約束最小平方法估計的係數。

可以加入對某些 $j$ 的約束 $\beta_j \geq 0$，以反映物理知識（例如：輻照度與功率呈正相關）。

5. 分析框架：一個非程式碼範例

考慮一個簡化的情境，預測多雲天氣下中午的發電功率。框架的工作流程如下：

輸入： 上午11:45的特徵：功率=150 kW，溫度=25°C，濕度=60%，雲量指數=0.5（多雲）。
特徵建構： 建立新特徵：$T_2(Temp)=2*(25)^2 -1$、$sin(Humidity)$、$Cloud Cover * T_1(Temp)$ 等。這可能會產生20多個衍生特徵。
特徵選擇（針對「多雲」模型）： 封裝方法識別出在這些條件下，只有其中5個特徵對預測至關重要，例如：$Power_{t-1}$、$T_2(Temp)$、$Cloud Cover$、$sin(Humidity)$ 以及一個交互作用項。
約束預測： 針對「多雲」的特定回歸模型，僅使用5個選定的特徵及其預先學習的係數（並施加雲量係數為非正的約束），計算出預測值：$\hat{P}_{12:00 PM} = 165 kW$。

6. 未來應用與研究方向

混合物理-ML模型： 將所提的資料驅動方法與物理光伏效能模型（例如來自NREL系統顧問模型的模型）整合，可增強模型的穩健性與外推能力。
機率性預測： 將框架擴展至輸出預測區間（例如，透過對選定特徵進行分位數回歸），對於風險感知的電網運作至關重要。
分散式光伏的邊緣運算： 在各個太陽能農場的邊緣裝置上部署輕量級版本的特徵選擇與回歸模型，以實現即時、在地化的預測。
跨氣候的遷移學習： 研究為一個地理區域選擇的特徵集，如何能適應或微調至具有不同天氣模式的其他區域。
與深度學習整合： 將選定的切比雪夫特徵作為循環神經網路（RNN）或Transformer模型的資訊輸入，以捕捉超過一小時的長期時間依賴性。

7. 參考文獻

Yang, Y., Mao, J., Nguyen, R., Tohmeh, A., & Yeh, H. G. (年份). Feature Construction and Selection for PV Solar Power Modeling. 期刊/會議名稱.
Mellit, A., & Pavan, A. M. (2010). A 24-h forecast of solar irradiance using artificial neural network: Application for performance prediction of a grid-connected PV plant at Trieste, Italy. Solar Energy, 84(5), 807-821.
National Renewable Energy Laboratory (NREL). (2023). Solar Forecasting. https://www.nrel.gov/grid/solar-forecasting.html
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer. (關於特徵擴展與正則化的基礎知識).
Isola, P., Zhu, J. Y., Zhou, T., & Efros, A. A. (2017). Image-to-image translation with conditional adversarial networks. Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1125-1134). (作為另一個ML領域中變革性框架的範例被引用，類似於本文的特徵建構方法).

8. 分析師觀點：核心見解與評論

核心見解： 本文的真正貢獻不僅是另一個太陽能預測模型；它是一個嚴謹的兩步驟特徵工程協議，將表徵學習與模型擬合分離開來。透過明確建構一個高維度的切比雪夫空間，它迫使模型去考量特定的非線性與交互作用項，而像GBDT這類黑箱模型可能效率低下地偶然發現，或根本無法發現。這是從「希望演算法找到它」轉向「架構出訊號所在的空間」。這讓人聯想到其他領域成功框架背後的哲學，例如CycleGAN中精心設計的生成器/鑑別器架構，為非配對影像轉換結構化了學習問題。

邏輯流程： 邏輯清晰且優雅：1) 承認太陽能發電複雜的非線性物理特性。2) 不僅僅是將原始資料丟給非線性模型；而是使用數學上合理的基底函數（切比雪夫多項式非常適合近似）系統性地擴展輸入空間。3) 使用封裝方法進行特徵選擇——這是一種計算成本高但目標明確的方法——將此空間修剪為針對特定天氣條件、可解釋的子集。4) 應用約束回歸以注入物理先驗知識（例如：「更多雲層不可能產生更多電力」）。這個流程比典型的應用於現成ML模型的「網格搜尋超參數」方法更具原則性。

優點與缺陷：
優點： 該方法達到了優越的MSE，證明了其經驗價值。針對特定天氣的建模是務實的。約束的使用增加了一層穩健性與可解釋性，這在純ML方法中常常缺失。這是工程系統中「玻璃盒」機器學習的一個絕佳範例。
缺陷：針對每種天氣類型，基於封裝的特徵選擇的計算成本，是即時適應或大規模部署的主要瓶頸。本文缺乏對所選特徵集穩定性的討論——它們是否會因略有不同的訓練資料而劇烈變化？此外，雖然擊敗SVR、RF和GBDT是好的，但與一個調校良好的深度學習模型（例如LSTM或Temporal Fusion Transformer）或一個複雜的梯度提升實作（如XGBoost，其本身具備特徵交互能力）進行比較，是2023年以後研究中一個明顯的遺漏。

可行動的見解： 對於產業從業者而言，本文是建構更可靠、針對特定場址的預測模型的藍圖。最直接的收穫是，在跳入複雜演算法之前，先投資於特徵工程基礎設施。首先在您的歷史資料上實作這個切比雪夫擴展流程。然而，對於營運系統，應將封裝方法替換為更具擴展性的過濾方法（如互資訊）或嵌入式方法（如LASSO回歸）來進行特徵選擇，以減少計算開銷。與領域專家合作，定義回歸中最關鍵的物理約束。這種混合、深思熟慮的方法，很可能比僅僅租用更大的雲端實例來訓練更大的神經網路，帶來更好的回報。

目錄