1. 서 론
2. 선형회귀모델(Linear Regression, LR) 특성 및 분석방법
2.1 선형회귀분석법(Linear Regression Analysis)
2.2 최소자승법(Least Square Method)
2.3 정확도 평가
3. 발전소 데이터를 활용한 발전량예측 및 실험결과
3.1 일사량, 전력데이터를 학습한 선형회귀분석
3.2 태양전지모듈 온도별 일사량, 전력데이터를 학습한 선형회귀분석
3.3 일사량, 전류, 전압데이터를 학습한 선형회귀분석
4. 결 론
1. 서 론
최근 정부의 ‘재생에너지 3020정책 ’에 따라 신재생 에너지 설비의 보급이 확대되고 있다1). 신재생에너지 중에서도 청정 무한한 태양의 빛 에너지를 변환시켜 전기를 생산하는 태양광 발전이 각광을 받고 있다2). 현재 국내의 재생에너지원 중에서 가장 많은 비중을 차지하고 있는 태양광 발전소는 2021년 신재생에너지 보급지원사업의 지원내용과 대상이 넓어짐에 따라 2021년 5월 기준 국내 태양광발전소의 개수는 88,279 개소 , 태양광 발전소용량은 14,834 MW로 계속 증가하고 있다3,4). 그러나 태양광 발전시스템은 특성상 기상상태 및 계절적 요인과 먼지, 구름, 눈과 같은 외부적인 요인으로 전력 생산량의 변동이 크고 제어가 불가능하기 때문에 설치 후 운영 및 발전성능 현황에 대한 관심이 부족한 실정이다5,6). 따라서 발전소의 관리자나 수요공급량을 관리 및 계획해야 하는 전력사업자들은 태양광발전 전력생산량의 불확실성을 개선하고 효율적인 발전과 유지보수를 위해 발전량을 예측하고 모니터링 하는 시스템이 필요하며 이에 대한 연구가 활발하게 진행되고 있다7,8,9,10,11,12). References [9]-[10]은 기상청에서 제공하는 기상데이터를 이용하여 실시간 태양광 발전량을 예측하는 모델을 제안했다7). [11]-[12]은 태양광 일사량을 예측하는 간접적인 예측방법을 사용하여 태양광 발전량을 예측하였다5). 이와 같이 수행된 연구에서는 태양광 발전량을 예측하기 위해 학습데이터로 기상기후데이터를 활용하였지만 특정지역의 발전소 전력량을 보다 세밀하게 진단하기 위해서는 추가적인 현장데이터의 활용이 필요하다.
본 논문에서는 발전소 현장데이터를 학습하여 발전량을 예측하고 이에 대한 정확성을 검증하는 연구를 수행하였다. 이를 위해 학습방법으로는 머신러닝 학습모델 중 선형회귀(Linear Regression, LR)분석법을 적용하였다. 기존 선형회귀분석법은 입력변수인 일사량데이터와 출력변수인 전력데이터를 학습하여 발전량을 바로 예측할 수 있지만 태양광발전시스템이 오작동하는 경우에 예측 발전량의 정확도가 낮아지는 단점이 있다. 본 논문에서는 이러한 문제점을 개선하기 위해 발전량을 바로 예측하지 않고 입력변수인 일사량데이터와 새로운 출력변수인 전압과 전류데이터를 학습하여 발전량을 예측하였다. 그 결과 전압과 전류데이터를 각각 학습시킨 선형회귀식이 기존의 방법보다 발전량을 더 잘 예측했다.
2. 선형회귀모델(Linear Regression, LR) 특성 및 분석방법
본 논문에서는 태양광 발전소의 발전량을 예측 및 진단관리하기 위해 머신러닝 학습모델 중 선형회귀분석법에 관해 고찰하였으며 과거 데이터를 기반으로 학습한 선형회귀식이 실제 발전량과 비교했을 때 오차 값과 정확도평가에 관해 고찰하였다. 각 내용은 다음과 같다.
2.1 선형회귀분석법(Linear Regression Analysis)
선형회귀분석법은 회귀모델의 가장 기본적이고 일반적으로 사용되는 예측모델로 주어진 데이터를 나타내는 최적의 직선을 찾아냄으로써 입력(x)과 출력(y)사이의 선형적인 관계를 모델링하는 회귀분석기법이다. 단순 선형회귀식을 수식으로 표현하면 y = a + bx 과 같다. 이 수식은 예측에 관련된 독립변수 x를 통해 예측하려고 하는 결과 값인 종속변수 y를 도출해내는 것이다. Fig. 1은 선형회귀분석법을 나타낸 것이다.
2.2 최소자승법(Least Square Method)
최소자승법이란 Fig. 1의 실제 값(yi)과 추정 값인 선형회귀식(y = a + bx)과의 근사오차 값(Residual)이 최소가 되도록 하는 계수 a, b를 구하는 수학적인 방법이다. 편차제곱의 총합 X2을 근사오차(Residual)라고 하며 식(1)과 같이 표현된다.
근사오차 값(Residual)이 최소가 되도록 하는 계수 a, b를 구하기 위해서는 계수 a, b를 근사오차 값(Residual)에 대해 각각 편미분한 값이 0이 되면 되고 식(2), 식(3)과 같이 표현한다.
식(2), 식(3)을 연립방정식으로 풀게 되면 근사오차 값(Residual)이 최소가 되는 계수 a, b가 식(4), 식(5)과 같이 얻어진다.
2.3 정확도 평가
과거 데이터를 기반으로 학습한 선형회귀 모델 중 실제 데이터와 비교하여 오차가 가장 작은 최적의 선형회귀식을 선정할 때 모델의 평가지표로 RMSE (Root Mean Square Error)와 R2 (Coefficient of Determination, 결정계수)를 사용하여 성능을 평가한다. 각 내용은 다음과 같다.
(1) RMSE (Root Mean Square Error)
실제값과 추정값의 오차를 제곱하여 평균한 값의 제곱근 오차를 사용하는 방법으로 식(6)과 같다.
RMSE는 표준편차를 일반화시킨 척도로서 실제 값과 추정 값의 차이인 오차의 양을 나타내는데 사용한다.
(2) R2 (Coefficient of Determination, 결정계수)
선형회귀식의 y절편 a와 기울기 b의 상관관계 정도를 수치적으로 나타내며 선형회귀식의 추정 값이 실제 값을 얼마나 잘 예측할 수 있는지를 말해준다. 식(7)과 같이 나타낼 수 있다.
는 실제 데이터 값의 평균을 나타내는 평균직선으로 실제 데이터 값인 와 과거데이터를 기반으로 학습한 선형회귀식의 추정 값인 가 얼마나 적합한지 비교, 평가하는 척도이다. R2의 값이 1에 가까울수록 추정 값과 실제 값의 정확도가 높다는 것을 의미한다.
3. 발전소 데이터를 활용한 발전량예측 및 실험결과
본 논문에서는 발전소의 발전량을 예측하기 위해 Table 1과 같은 전기적 특성의 태양전지모듈을 18직렬 X 48병렬로 연결하고 경사 15° 고정식으로 설치한 경상북도 상주시의 300 KW급 태양광 발전소의 현장데이터를 수집하였다. Table 2는 인버터 정보이다. 수집한 데이터는 2020년 02월 19일부터 2021년 04월 30일까지의 전압, 전류, 전력, 경사면 일사량, 모듈온도 10분 데이터이다. 먼저는 2020년 1월 1일부터 2020년 12월 31일까지의 과거데이터를 정규화 분석하였다. 분석결과 Fig. 2에서는 300 KW 발전소에서 일사량이 1000 W/m2일 때 출력이 약 240 KW 발전되는 것을 통해 20%의 출력저하가 발생하고 있는 데이터라는 것을 알 수 있었고 Fig. 4에서는 일사량에 따른 전압이 700V를 넘지 못하는 것을 통해 태양광발전시스템에서 인버터가 전압을 제어하는 오류가 발생하고 있다는 것을 알 수 있었다. 다음으로는 정규화 분석을 한 발전소 데이터를 고장(계절적 요인, 먼지, 부분 음영과 같은 시스템적 출력 저하)이 아닌 상황이라 가정 하에 선형회귀분석법에 적용하여 학습하였으며 입력변수와 출력변수는 Table 3과 같다. 선형회귀식의 계수와 R2 (결정계수)는 엑셀(Excel) 툴의 추세선 서식을 사용하여 구했다. 마지막으로는 학습한 선형회귀식의 성능을 평가하기 위해 정확도평가 중 RMSE와 R2를 사용하여 실제 값(2021년 02월 19일부터 2021년 04월 30일까지의 전력데이터)과 추정 값(2020년 01월 01일부터 2020년 12월 31일까지의 발전소 데이터를 학습한 선형회귀식의 예측전력)의 오차를 비교하여 최적의 선형회귀모델을 제안한다.
Table 1.
Electrical characteristics of PV module
| PMPP : 360 [W] | ISC : 9.75 [A] | VOC : 47.73 [V] | IMPP : 9.24 [A] | VMPP : 39.98 [V] |
Table 2.
Inverter specifications
Table 3.
Linear Regression Analysis according to input(x) and output(y) variables
| Input (x) variable | Output (y) variable | |
| Method 1 | Irradiation data | Power data |
| Method 2 | Irradiation, temperature data | Power data |
| Method 3 | Irradiation data | Voltage, Current data |
3.1 일사량, 전력데이터를 학습한 선형회귀분석
300 KW급 태양광 발전소에서 수집한 데이터 중 1년 동안의 일사량(300~ 1000 W/m2), 발전소 전력(0~300 KW)데이터를 선형회귀모델에 적용하여 학습하였다.
Fig. 2는 X축인 일사량 데이터와 Y축인 전력데이터를 선형회귀모델에 적용하여 학습해본 결과이다. Table 4은 학습을 통해 얻은 선형회귀방정식과 R2 그리고 RMSE 값이다. Fig. 2와 Table 4의 결과 값을 통해 선형회귀 2차식이 실제전력 값과의 오차인 RMSE가 13.9136 [KW]로 가장 작았다. 이후 성능이 가장 좋은 2차 선형회귀방정식 y = - 8e- 05x2 + 0.315x – 2.1847을 통해 발전량을 예측해본 결과 전력 값이 2021년 02월 19일부터 2021년 04월 30일까지의 실제 전력데이터 값과 16.4241 [KW]만큼 오차가 발생했다.
Table 4.
Regression equation, R2, RMSE of Linear Regression Analysis that learned irradiation, power data
3.2 태양전지모듈 온도별 일사량, 전력데이터를 학습한 선형회귀분석
태양전지모듈의 전압은 모듈 온도가 1℃ 올라감에 따라 전압 값의 0.28%만큼 감소한다. 온도에 따라서 모듈의 전압이 달라지기 때문에 동일한 일사량, 전류 값을 가지더라도 출력 편차가 발생한다. 온도에 따른 출력 편차를 줄이고 더 나은 발전량 예측을 위하여 본 절에서는 300 KW급 태양광 발전소에서 수집한 데이터 중 1년 동안의 일사량(300~1000 W/m2), 발전소 전력(0~300 KW)데이터를 태양전지모듈온도에 따라 세분화하고 선형회귀모델에 적용하여 학습하였다. 태양전지모듈의 온도 범위는 20℃로 나눴다. 온도 범위를 20℃로 나누면 태양전지모듈 한 장당 0.056 V의 오차가 발생하고 어레이로 계산하게 되면 1.008 V의 오차범위가 발생한다. 전체 어레이 전압인 700 V에서 1 V는 0.2%의 오차이므로 문제가 없다고 가정하여 범위를 설정했다.
Fig. 3의 (a), (b), (c), (d)와 Tables 5, 6, 7, 8은 태양전지모듈온도를 - 25℃ ~ 0℃, 0℃ ~ 20℃, 20℃ ~ 40℃, 40℃ ~ 60℃로 구분하고 이에 따른 일사량, 전력데이터를 선형회귀모델의 1차식, 2차식, 3차식으로 학습한 결과이다. 태양전지모듈온도 - 25℃ ~ 0℃ 범위에서는 선형회귀방정식 중 1차식이 16.0141 [KW]로 실제전력 값과의 오차인 RMSE가 가장 작았다. 나머지 0℃ ~ 20℃, 20℃ ~ 40℃, 40℃ ~ 60℃ 범위에서는 선형회귀방정식 중 2차식이 16.3056 [KW], 12.2348 [KW], 11.7055 [KW]로 실제전력 값과의 오차인 RMSE가 가장 작았다. 태양전지모듈 온도범위에 따라 성능이 가장 좋은 선형회귀방정식을 사용하여 발전량을 예측해본 결과 전력 값이 2021년 02월 19일부터 2021년 04월 30일까지의 실제 전력데이터 값과 16.0761 [KW]만큼 오차가 발생했다. 이전 3.1절의 선형회귀모델보다 더 나아진 발전량 예측결과를 확인할 수 있었다.
Table 5.
Regression equation, R2, RMSE of Linear Regression Analysis that learned irradiation and power data according to PV module temperature (-25°C ~ 0°C)
Table 6.
Regression equation, R2, RMSE of Linear Regression Analysis that learned irradiation and power data according to PV module temperature (0°C ~ 20°C)
Table 7.
Regression equation, R2, RMSE of Linear Regression Analysis that learned irradiation and power data according to PV module temperature (20°C ~ 40°C)
Table 8.
Regression equation, R2, RMSE of Linear Regression Analysis that learned irradiation and power data according to PV module temperature (40°C ~ 60°C)
3.3 일사량, 전류, 전압데이터를 학습한 선형회귀분석
본 절에서는 이전 3.1절과 3.2절의 선형회귀모델보다 더 나은 발전량 예측을 위하여 300 KW급 태양광 발전소에서 수집한 데이터 중 1년 동안의 일사량(300~1000 W/m2)과 전압데이터, 일사량(300~1000 W/m2)과 전류데이터를 각각 선형회귀모델에 적용하여 학습하였다.
Fig. 4는 X축인 일사량 데이터와 Y축인 전압데이터를 선형회귀모델에 적용하여 학습해본 결과이다. Table 9는 학습을 통해 얻은 선형회귀방정식과 R2 그리고 RMSE 값이다. Fig. 4와 Table 9의 결과 값을 통해 선형회귀 2차식이 실제전압 값과의 오차가 25.9242 [V]로 가장 좋았다.
Table 9.
Regression equation, R2, RMSE of Linear Regression Analysis that learned irradiation, voltage data
Fig. 5는 X축인 일사량 데이터와 Y축인 전류데이터를 선형회귀모델에 적용하여 학습해본 결과이다. Table 10는 학습을 통해 얻은 선형회귀방정식과 R2 그리고 RMSE 값이다. Fig. 5와 Table 10의 결과 값을 통해 선형회귀 3차식이 실제전류 값과의 오차가 23.0445 [A]로 가장 좋았다. 태양광 발전량을 예측하기 위해서는 일사량-전압데이터를 학습한 선형회귀식 중 성능이 가장 좋은 2차식과 일사량-전류데이터를 학습한 선형회귀식 중 성능이 가장 좋은 3차식을 곱해야 한다. Fig. 6은 전압, 전류를 통한 발전량 예측모델을 2021년 02월 19일부터 2021년 04월 30일까지 실제 전력데이터 값과 비교해본 결과이다. 정확도 평가인 RMSE를 계산해본 결과전력 값이 15.9235 [KW]만큼 오차가 발생했다. Fig. 7은 2021년 3월 17일 하루 동안의 실제 발전량과 예측 발전량을 나타낸 것이며 그 수치인 일일 발전량은 Table 11에 표현하였다 . 이를 통해 전압과 전류를 곱하여 얻은 발전량 예측모델이 앞선 3.1절과 3.2절의 발전량 예측모델보다 더 높은 정확도를 보였다.
Table 10.
Regression equation, R2, RMSE of Linear Regression Analysis that learned irradiation, current data
4. 결 론
본 논문에서는 태양광 발전소의 전력량을 예측 및 진단관리하기 위해 발전소 현장데이터를 활용하여 선형회귀모델을 설계하고 실제 값과 정확도 평가를 통해 최적의 선형회귀식을 제안한다.
(1) 태양광 발전소의 전력량을 예측 및 진단관리하기 위해 경상북도 상주시의 300 KW급 태양광 발전소의 현장데이터를 수집하였다.
(2) 수집한 데이터는 전압, 전류, 전력, 경사면 일사량, 모듈온도데이터이며 2020년01월01일부터 2020년12월31일까지의 데이터를 기반으로 학습했다.
(3) 일사량과 전력데이터를 학습시킨 선형회귀식은 2차식이 성능이 가장 좋았고 2021년 02월19일부터 2021년04월31일까지의 실제 전력데이터 값과 비교해본 결과 전력 값이 16.4241 [KW]만큼 오차가 발생했다.
(4) 더 나은 발전량 예측을 위해 태양전지모듈온도에 따른 일사량과 전력데이터를 학습시킨 선형회귀식은 태양전지모듈온도 - 25℃ ~ 0℃ 범위에서는 1차식이 성능이 가장 좋았고 나머지 0℃ ~ 20℃, 20℃ ~ 40℃, 40℃ ~ 60℃ 범위에서는 2차식이 성능이 가장 좋았으며 2021년 01월01일부터 2021년04월31일까지의 실제 전력데이터 값과 비교해본 결과 전력 값이 16.0761 [KW]만큼 오차가 발생했다.
(5) 마지막으로 일사량과 전압데이터, 일사량과 전류데이터를 각각 학습시킨 선형회귀식을 곱하여 얻은 발전량 예측모델은 2021년 02월 19일부터 2021년 04월 30일까지의 실제 전력데이터 값과 비교해본 결과 전력 값이 15.9235 [KW]만큼 오차가 발생했다.
(6) 선형회귀모델의 입력변수와 출력변수를 다르게 하여 학습해본 결과 일사량과 전압데이터, 일사량과 전류데이터를 각각 학습시킨 선형회귀식을 곱하여 얻은 발전량 예측모델이 가장 발전량을 잘 예측하였으며 이 모델을 적용하면 태양광 발전소의 전력량을 예측 및 진단관리가 가능하다.









