भाषा चुनें

पीवी सौर ऊर्जा मॉडलिंग के लिए फीचर निर्माण एवं चयन: एक मशीन लर्निंग फ्रेमवर्क

चेबीशेव बहुपद फीचर विस्तार और प्रतिबंधित रिग्रेशन का उपयोग करके 1-घंटा आगे फोटोवोल्टाइक शक्ति पूर्वानुमान के लिए एक नए मशीन लर्निंग फ्रेमवर्क का विस्तृत विश्लेषण।
solarledlight.org | PDF Size: 0.2 MB
रेटिंग: 4.5/5
आपकी रेटिंग
आपने पहले ही इस दस्तावेज़ को रेट कर दिया है
PDF दस्तावेज़ कवर - पीवी सौर ऊर्जा मॉडलिंग के लिए फीचर निर्माण एवं चयन: एक मशीन लर्निंग फ्रेमवर्क

विषय सूची

1. परिचय एवं अवलोकन

औद्योगिक प्रक्रियाओं में फोटोवोल्टाइक (पीवी) सौर ऊर्जा का एकीकरण, ग्रीनहाउस गैस उत्सर्जन को कम करने और स्थिरता बढ़ाने की एक प्रमुख रणनीति है। हालाँकि, सौर ऊर्जा की अंतर्निहित रुक-रुक कर आने वाली और परिवर्तनशील प्रकृति, ग्रिड स्थिरता और विश्वसनीय ऊर्जा आपूर्ति के लिए महत्वपूर्ण चुनौतियाँ प्रस्तुत करती है। इसलिए, प्रभावी ऊर्जा प्रबंधन, लोड संतुलन और परिचालन योजना के लिए पीवी बिजली उत्पादन का सटीक अल्पकालिक पूर्वानुमान महत्वपूर्ण है।

यह शोध पत्र 1-घंटा आगे सौर शक्ति पूर्वानुमान के लिए एक नवीन मशीन लर्निंग फ्रेमवर्क प्रस्तुत करता है। इसकी मूल नवीनता इसके दो-चरणीय दृष्टिकोण में निहित है: पहले, चेबीशेव बहुपदों और त्रिकोणमितीय फलनों का उपयोग करके मूल फीचर सेट को एक उच्च-आयामी स्थान में विस्तारित करना; दूसरा, मौसम-विशिष्ट पूर्वानुमानात्मक मॉडल बनाने के लिए एक अनुकूलित फीचर चयन योजना के साथ प्रतिबंधित रैखिक रिग्रेशन का उपयोग करना। प्रस्तावित विधि का उद्देश्य मौसम संबंधी चर और बिजली उत्पादन के बीच जटिल, गैर-रैखिक संबंधों को मानक मॉडलों की तुलना में अधिक प्रभावी ढंग से पकड़ना है।

2. पद्धति

2.1 डेटा एवं इनपुट फीचर्स

मॉडल ऐतिहासिक समय-श्रृंखला डेटा का उपयोग करता है जिसमें पीवी सिस्टम आउटपुट और प्रासंगिक पर्यावरणीय कारक दोनों शामिल हैं। प्रमुख इनपुट फीचर्स में शामिल हैं:

2.2 चेबीशेव बहुपदों के साथ फीचर निर्माण

संभावित गैर-रैखिकताओं को मॉडल करने के लिए, मूल फीचर वेक्टर $\mathbf{x}$ को एक उच्च-आयामी स्थान में रूपांतरित किया जाता है। प्रत्येक निरंतर इनपुट फीचर $x_i$ के लिए, पहली तरह के चेबीशेव बहुपदों $T_k(x_i)$ का एक सेट एक निर्दिष्ट डिग्री $K$ तक उत्पन्न किया जाता है। डिग्री $k$ का चेबीशेव बहुपद पुनरावर्ती रूप से परिभाषित किया गया है:

$T_0(x) = 1$

$T_1(x) = x$

$T_{k+1}(x) = 2xT_k(x) - T_{k-1}(x)$

आवधिक पैटर्न को पकड़ने के लिए फीचर्स के त्रिकोणमितीय फलन (साइन और कोसाइन) भी जोड़े जाते हैं। यह निर्माण एक समृद्ध, अभिव्यंजक फीचर स्पेस $\Phi(\mathbf{x})$ बनाता है जो जटिल कार्यात्मक संबंधों का प्रतिनिधित्व करने में सक्षम है।

2.3 फीचर चयन एवं प्रतिबंधित रिग्रेशन

सभी निर्मित फीचर्स प्रासंगिक नहीं हैं। विभिन्न मौसम स्थितियों के लिए सबसे अधिक पूर्वानुमानात्मक उपसमुच्चय की पहचान करने के लिए एक रैपर-आधारित फीचर चयन विधि का उपयोग किया जाता है। इसके बाद, एक प्रतिबंधित रैखिक रिग्रेशन मॉडल फिट किया जाता है:

$\min_{\beta} \| \mathbf{y} - \Phi(\mathbf{X})\beta \|_2^2$

गुणांक $\beta$ पर प्रतिबंधों के अधीन (उदाहरण के लिए, गैर-नकारात्मकता प्रतिबंध यदि भौतिक संबंध बताते हैं कि कुछ इनपुट का केवल सकारात्मक प्रभाव आउटपुट पर पड़ना चाहिए)। यह चरण सटीकता बनाए रखते हुए मॉडल की संक्षिप्तता और भौतिक व्याख्यात्मकता सुनिश्चित करता है।

3. प्रायोगिक परिणाम एवं विश्लेषण

3.1 प्रदर्शन मापदंड

मूल्यांकन के लिए प्राथमिक मापदंड पूर्वानुमानित और वास्तविक 1-घंटा आगे पीवी बिजली आउटपुट के बीच माध्य वर्ग त्रुटि (एमएसई) है। कम एमएसई उच्च पूर्वानुमान सटीकता को दर्शाता है।

प्रदर्शन सारांश

प्रस्तावित विधि: परीक्षण परिदृश्यों में सबसे कम एमएसई प्राप्त किया।

मुख्य लाभ: विविध मौसम स्थितियों में, विशेष रूप से संक्रमणकालीन अवधियों (जैसे, गुजरते बादल) के दौरान श्रेष्ठ प्रदर्शन।

3.2 आधारभूत मॉडलों के साथ तुलना

प्रस्तावित फ्रेमवर्क की तुलना कई शास्त्रीय मशीन लर्निंग मॉडलों के साथ की गई:

परिणाम: चेबीशेव-आधारित फीचर निर्माण और चयन दृष्टिकोण ने लगातार सभी आधारभूत मॉडलों की तुलना में कम एमएसई दिया। यह सौर पूर्वानुमान समस्या के लिए अनुकूलित एक उच्च-आयामी फीचर स्पेस को स्पष्ट रूप से इंजीनियर करने की प्रभावकारिता को प्रदर्शित करता है, बनाम केवल एन्सेम्बल ट्री विधियों या एसवीएम में कर्नेल ट्रिक्स की अंतर्निहित फीचर संयोजन क्षमताओं पर निर्भर रहना।

4. तकनीकी विवरण एवं गणितीय फ्रेमवर्क

मॉडल को एक फलन $f$ के रूप में संक्षेपित किया जा सकता है जो इनपुट को 1-घंटा आगे पूर्वानुमान $\hat{P}_{t+1}$ पर मैप करता है:

$\hat{P}_{t+1} = f(\mathbf{x}_t) = \beta_0 + \sum_{j \in S} \beta_j \phi_j(\mathbf{x}_t)$

जहाँ:

कुछ $j$ के लिए प्रतिबंध $\beta_j \geq 0$ को भौतिक ज्ञान को प्रतिबिंबित करने के लिए शामिल किया जा सकता है (उदाहरण के लिए, विकिरण शक्ति के साथ सकारात्मक रूप से सहसंबद्ध है)।

5. विश्लेषण फ्रेमवर्क: एक गैर-कोड उदाहरण

आंशिक रूप से बादल वाले दिन दोपहर में बिजली का पूर्वानुमान लगाने के लिए एक सरलीकृत परिदृश्य पर विचार करें। फ्रेमवर्क का कार्यप्रवाह है:

  1. इनपुट: सुबह 11:45 बजे फीचर्स: शक्ति=150 किलोवाट, तापमान=25°C, आर्द्रता=60%, बादल आवरण सूचकांक=0.5 (आंशिक रूप से बादल)।
  2. फीचर निर्माण: नए फीचर्स बनाएं: $T_2(Temp)=2*(25)^2 -1$, $sin(Humidity)$, $Cloud Cover * T_1(Temp)$, आदि। इससे 20+ व्युत्पन्न फीचर्स उत्पन्न हो सकते हैं।
  3. फीचर चयन ("आंशिक रूप से बादल" मॉडल के लिए): रैपर विधि पहचानती है कि इन स्थितियों में पूर्वानुमान के लिए इनमें से केवल 5 फीचर्स महत्वपूर्ण हैं, जैसे, $Power_{t-1}$, $T_2(Temp)$, $Cloud Cover$, $sin(Humidity)$, और एक इंटरैक्शन पद।
  4. प्रतिबंधित पूर्वानुमान: "आंशिक रूप से बादल" विशिष्ट रिग्रेशन मॉडल, केवल 5 चयनित फीचर्स और उनके पूर्व-सीखे गए गुणांकों का उपयोग करते हुए (एक प्रतिबंध के साथ कि बादल आवरण गुणांक गैर-सकारात्मक है), पूर्वानुमान की गणना करता है: $\hat{P}_{12:00 PM} = 165 kW$।

6. भविष्य के अनुप्रयोग एवं शोध दिशाएँ

7. संदर्भ

  1. Yang, Y., Mao, J., Nguyen, R., Tohmeh, A., & Yeh, H. G. (Year). Feature Construction and Selection for PV Solar Power Modeling. Journal/Conference Name.
  2. Mellit, A., & Pavan, A. M. (2010). A 24-h forecast of solar irradiance using artificial neural network: Application for performance prediction of a grid-connected PV plant at Trieste, Italy. Solar Energy, 84(5), 807-821.
  3. National Renewable Energy Laboratory (NREL). (2023). Solar Forecasting. https://www.nrel.gov/grid/solar-forecasting.html
  4. Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer. (फीचर विस्तार और नियमितीकरण की नींव के लिए)।
  5. Isola, P., Zhu, J. Y., Zhou, T., & Efros, A. A. (2017). Image-to-image translation with conditional adversarial networks. Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1125-1134). (एक अन्य एमएल डोमेन में एक परिवर्तनकारी फ्रेमवर्क के उदाहरण के रूप में उद्धृत, यहाँ फीचर निर्माण दृष्टिकोण के अनुरूप)।

8. विश्लेषक का दृष्टिकोण: मूल अंतर्दृष्टि एवं आलोचना

मूल अंतर्दृष्टि: इस पेपर का वास्तविक योगदान केवल एक और सौर पूर्वानुमान मॉडल नहीं है; यह एक अनुशासित, दो-चरणीय फीचर इंजीनियरिंग प्रोटोकॉल है जो प्रतिनिधित्व लर्निंग को मॉडल फिटिंग से अलग करता है। एक उच्च-आयामी चेबीशेव स्पेस का स्पष्ट रूप से निर्माण करके, यह मॉडल को विशिष्ट गैर-रैखिक और इंटरैक्शन पदों पर विचार करने के लिए मजबूर करता है जिन पर जीबीडीटी जैसे ब्लैक-बॉक्स मॉडल अक्षम रूप से या बिल्कुल नहीं ठोकर खा सकते हैं। यह "आशा करें कि एल्गोरिदम इसे ढूंढ ले" से "उस स्थान का वास्तुकला करें जहां सिग्नल रहता है" की ओर एक कदम है। यह अन्य क्षेत्रों में सफल फ्रेमवर्क के पीछे के दर्शन की याद दिलाता है, जैसे कि साइकलजीएएन में सावधानीपूर्वक डिज़ाइन किए गए जनरेटर/डिस्क्रिमिनेटर आर्किटेक्चर जो अनपेयर्ड इमेज ट्रांसलेशन के लिए सीखने की समस्या को संरचित करते हैं।

तार्किक प्रवाह: तर्क सुसंगत और सुरुचिपूर्ण है: 1) सौर उत्पादन की जटिल, गैर-रैखिक भौतिकी को स्वीकार करें। 2) केवल कच्चे डेटा को एक गैर-रैखिक मॉडल पर न फेंकें; इसके बजाय, गणितीय रूप से उचित आधार फलनों (चेबीशेव बहुपद सन्निकटन के लिए उत्कृष्ट हैं) के साथ इनपुट स्पेस का व्यवस्थित रूप से विस्तार करें। 3) इस स्पेस को एक मौसम-स्थिति-विशिष्ट, व्याख्यात्मक उपसमुच्चय तक छाँटने के लिए फीचर चयन के लिए एक रैपर विधि का उपयोग करें—एक कम्प्यूटेशनल रूप से महंगी लेकिन लक्षित दृष्टिकोण। 4) भौतिक पूर्व ज्ञान (जैसे, "अधिक बादल अधिक बिजली उत्पन्न नहीं कर सकते") को इंजेक्ट करने के लिए प्रतिबंधित रिग्रेशन लागू करें। यह पाइपलाइन ऑफ-द-शेल्फ एमएल मॉडल पर लागू सामान्य "हाइपरपैरामीटर पर ग्रिड-खोज" दृष्टिकोण से अधिक सिद्धांत-आधारित है।

शक्तियाँ एवं दोष:
शक्तियाँ: विधि श्रेष्ठ एमएसई प्राप्त करती है, जो इसके अनुभवजन्य मूल्य को साबित करती है। मौसम-विशिष्ट मॉडलिंग व्यावहारिक है। प्रतिबंधों का उपयोग मजबूती और व्याख्यात्मकता की एक परत जोड़ता है जो शुद्ध एमएल दृष्टिकोण में अक्सर गायब रहती है। यह इंजीनियरिंग सिस्टम के लिए "ग्लास-बॉक्स" एमएल का एक बेहतरीन उदाहरण है।
दोष: प्रत्येक मौसम प्रकार के लिए रैपर-आधारित फीचर चयन की कम्प्यूटेशनल लागत वास्तविक समय अनुकूलन या बड़े पैमाने पर तैनाती के लिए एक प्रमुख बाधा है। पेपर में चयनित फीचर सेट की स्थिरता पर चर्चा का अभाव है—क्या वे थोड़े अलग प्रशिक्षण डेटा के साथ बेतहाशा बदल जाते हैं? इसके अलावा, जबकि एसवीआर, आरएफ और जीबीडीटी को हराना अच्छा है, एक अच्छी तरह से ट्यून किए गए डीप लर्निंग मॉडल (जैसे, एक एलएसटीएम या टेम्पोरल फ्यूजन ट्रांसफॉर्मर) या एक परिष्कृत ग्रेडिएंट बूस्टिंग कार्यान्वयन जैसे एक्सजीबूस्ट की तुलना, जिसकी अपनी फीचर इंटरैक्शन क्षमताएं हैं, 2023+ के शोध में एक स्पष्ट चूक है।

कार्रवाई योग्य अंतर्दृष्टि: उद्योग के व्यवसायियों के लिए, यह पेपर अधिक विश्वसनीय, साइट-विशिष्ट पूर्वानुमान मॉडल बनाने के लिए एक खाका है। तत्काल टेकअवे जटिल एल्गोरिदम पर कूदने से पहले फीचर इंजीनियरिंग बुनियादी ढांचे में निवेश करना है। अपने ऐतिहासिक डेटा पर इस चेबीशेव विस्तार पाइपलाइन को लागू करके शुरू करें। हालाँकि, परिचालन प्रणालियों के लिए, कम्प्यूटेशनल ओवरहेड को कम करने के लिए फीचर चयन के लिए रैपर विधि को अधिक स्केलेबल फिल्टर विधि (जैसे पारस्परिक सूचना) या एम्बेडेड विधि (जैसे लासो रिग्रेशन) से बदलें। रिग्रेशन के लिए सबसे महत्वपूर्ण भौतिक प्रतिबंधों को परिभाषित करने के लिए डोमेन विशेषज्ञों के साथ साझेदारी करें। यह संकर, विचारशील दृष्टिकोण केवल एक बड़े तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए एक बड़ा क्लाउड इंस्टेंस किराए पर लेने की तुलना में बेहतर रिटर्न देने की संभावना है।