Research Article

Journal of the Korean Solar Energy Society. 30 December 2022. 105-114
https://doi.org/10.7836/kses.2022.42.6.105

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 이론적 배경

  •   2.1 시계열 분석 모델

  • 3. 일사량 예보모델 구축 실험

  •   3.1 시계열 분석기법을 이용한 일사량 예보모델

  •   3.2 ARIMA 모델과 SARIMA 모델을 이용한 일사량 예보모델 정확도 평가

  • 4. 결 론

1. 서 론

세계적으로 기후 위기가 심각한 문제로 대두되면서 신재생 에너지 필요성에 대한 인식과 생산량 또한 증가하는 추세이다. 이러한 세계적인 추세에 따라 국내 신재생 에너지 생산량은 지난 8년 동안 지속적인 상승세를 보였으며, 신재생 에너지 생산량 중 태양광 발전량의 비중은 2012년 2.7%에서 2020년 33.6%로 큰 폭으로 증가했다1). 태양광 발전에는 다양한 기상 요소가 영향을 미치는데, 그 중 일사량은 가장 큰 영향을 미치는 기상 요소이다. 즉, 태양광 발전량의 정확한 예측을 위해서는 일사량 예측이 중요하다.

정확한 일사량 및 태양광 발전량을 예측하기 위한 연구들은 과거부터 꾸준히 진행되었다. 관련 선행 연구로 Suh et al. (2018)2)은 ARIMA, ARIMAX, seaonal ARIMA 등의 시계열 분석기법을 이용하여 광주와 청주 지역의 일사량을 1시간 단위로 예측하는 예보 모델을 구축하였으며, Kim (2017)3)은 일사량 외 기상변수들과 대기권 밖 일사량 변수를 이용한 다중회귀모델 및 ARIMA, ARIMAX 시계열 분석기법을 이용한 서울의 일사량을 1시간 단위로 예측하는 예보 모델을 구축하였다. El Alani et al. (2021)4)은 모로코의 하늘 영상 데이터와 일사량, 기상 변수를 CNN (Convolutional Neural Network)과 MLP (Multilayer Perceptron)을 결합한 CNN-MLP모델에 적용하여 향후 15분 일사량을 예측하였다. 또한 Lee et al. (2019)5)Jung et al. (2022)6)은 seasinal ARIMA, VAR, ARIMA 등의 시계열 분석기법과 태양광 발전소의 발전량 데이터를 이용하여 태양광 발전량 예보모형을 구축하였다.

본 연구에서는 기존 연구보다 상세화 된 시간해상도의 일사량을 예측하기 위해 초단시간 일사량 선행예보 모델을 일사량만을 이용하여 구축하고자 한다. 대전 지점에서 15분 단위로 관측된 두 종류의 일사량[수평면 전일사량(이하 GHI), 법선면 직달일사량(이하 DNI)] 데이터에 대해 계절성을 고려하지 않은 ARIMA 모델과 계절성을 고려한 SARIMA 모델이라는 두 가지 시계열 분석 모델을 적용하여 향후 15분부터 2시간 까지의 일사량을 예측하고, 어느 모델의 예측 정확성이 더 우수한지 비교하고자 한다.

2. 이론적 배경

2.1 시계열 분석 모델

(1) ARIMA

ARIMA (Auto-Regressive Integrated Moving Average) 모델은 과거의 관측값과 오차, 차분 절차를 이용하여 현재의 시계열 값을 설명하는 모델로, auto-regressive (AR) 모델, moving average (MA) 모델을 동시에 포함한다. 시계열 Zt가 AR 모델의 차수 p, MA 모델의 차수 q와 차분 차수 d를 갖는 ARIMA(p,d,q) 과정을 따르며 평균 μ를 가질 때, 모델식은 식(1)의 형태로 표현된다.

(1)
ϕ(B)W˙t=θ(B)εt,where,W˙t=(1-B)d(Zt-μ),ϕ(B)=1-ϕ1(B)--ϕp(Bp),ϕ(B)=1-θ1(B)--θq(Bq),εt~iidN(0,σ2)

p : AR 모델의 차수로, t 시점의 시계열 값에 (t-1),…,(t-p) 시점의 시계열 값이 영향을 주는 것을 의미한다.

d : 차분을 의미하며, t 시점의 시계열 값에 (t-d) 시점의 시계열 값을 빼서 정상 시계열로 만들어준다.

q : MA 모델의 차수로, t 시점의 시계열 값에 (t-1),…,(t-q) 시점의 연속적인 오차들이 영향을 주는 것을 의미한다.

이때, ϕ(B),θ(B)는 각각 AR, MA 모델에 대한 다항식이고 B는 후진연산자(Back shift operator)이며 d는 시계열 Zt의 차분 차수이다. 시계열 자료에 대한 ARIMA 모델의 적합 절차는 다음과 같다. 첫 번째로, 정상성(Stationarity)에 대해 검정한다. 정상성이란 시계열의 평균이나 분산 등, 확률적인 성질들이 시간의 흐름에 영향을 받지 않는(time-invariant) 것을 의미한다. 만약 비정상적일 경우, 변수변환 혹은 차분을 통해 정상성을 만족시키는 작업이 선행되어야 하며, 이 과정에서 자기상관함수(Autocorrelation Function, ACF)와 부분자기상관함수(Partial Autocorrelation Function, PACF) 등의 그림을 활용할 수 있다. 두 번째로, 잠정 모델의 AICc (Corrected Akaike’s information criterion) 통계량 등을 산출하여 가장 적합하다고 생각되는 모델의 모수 p, d, q를 결정한다. 결정된 모델의 적절성을 판단하는 통계적 진단 방법으로는 잔차의 ACF와 PACF를 계산하여 잔차의 독립성을 검정하는 잔차 분석 방법을 주로 이용한다. 마지막으로, 도출된 모델을 예측 모델로 하여 미래의 시계열 값을 예측한다.

(2) SARIMA (Seasonal ARIMA)

SARIMA (Seasonal ARIMA)모델은 ARIMA 모델에 계절성과 주기적 특성을 고려한 모델이며, 시계열을 구성하는 구성성분들이 확률적이거나 다른 성분들과 상관이 있는 경우에 사용할 수 있다. 시계열 Zt가 계절주기 S를 갖는 SARIMA(p,d,q)(P,D,Q)S 과정을 따를 때 식(2)로 표현할 수 있다.

(2)
ϕp(B)ΦP(BS)(1-B)d(1-BS)D(Zt-μ)=θq(B)ΘQ(BS)εt,where,ϕp(B)=1-ϕ1(B)--ϕp(Bp),θ(B)=1-θ1(B)--θq(Bq),ΦP(BS)=1-Φ1(B)--ΦP(BP),ΘQ(BS)=1-Θ(B)--ΘQ(BQ),εt~iidN(0,σ2),

여기서, B는 후진연산자이고 ϕp(B)θq(B)는 각각 p차, q차 차수를 가지는 비계절적 AR, MA 모델에 대한 다항식이며, ΦP(BS)ΘQ(BS)는 각각 P차, Q차 차수를 갖는 계절적 AR, MA 연산자, d와 D는 각각 비계절적 및 계절적 차분 차수를 의미한다.

SARIMA 모델을 통한 시계열 자료의 예측은 ARIMA 모델의 절차와 비슷하나, 시계열 자료의 계절성과 주기적 특성을 고려한다는 차이가 있다. 먼저, 시계열 자료의 비정상성과 계절성 존재 여부에 대한 검정을 실시하고, 존재한다면 비계절적 및 계절 차분을 통해 비정상성과 계절성을 제거한다. 두 번째는, ACF와 PACF 그래프, AICc 통계량 등을 통해 비계절적 차수 p, q와 계절적 차수 P, Q를 선택하여 잠정 모델을 결정하는 모델 식별단계이다. 세 번째로, 모델의 계수를 정확히 추정하고 잔차 분석 등을 통해 추정된 잠정 모델의 통계적 적합성을 판단한다. 모델이 통계적으로 유의하지 않은 것으로 나타나면 식별 단계로 돌아가 다른 잠정 모델을 선택하여 모델의 계수 추정 및 적합성 검정을 반복한다. 위 단계를 반복하여 최종적으로 확정된 모델을 통해 시계열 자료의 예측값을 구한다.

본 연구에서는 구분을 위하여 ARIMA 모델은 비계절적 모델로, SARIMA 모델은 계절적 모델로 정의한다.

3. 일사량 예보모델 구축 실험

대전지점 일사량 예보모델 구축을 위해 2019년 1월 21일 18:45 ~ 2021년 12월 31일 23:45, 약 3년간의 1분 단위로 관측된 일사량 데이터를 이용하였다. 최종 데이터를 구축하기 위해 사전에 결측치 대체를 진행하였으며, 결측 시점을 기준으로 1분 전후 관측치의 평균값으로 대체하였다. 1분 전후 관측치가 존재하지 않을 경우 선형보간을 이용하여 결측치 대체를 진행했다.

최종 데이터를 구성한 이후에는 2019년 1월 21일 18:45 ~ 2020년 12월 31일 23:45 데이터를 모델 구축(training) 용도로, 2021년 1월 1일 00:00 ~ 2021년 12월 31일 23:45 데이터를 모델 평가(test) 용도로 구분했다. 다음 Fig. 1은 GHI에 대해 모델 구축과 모델 평가 용도로 구분한 그림이다.

https://static.apub.kr/journalsite/sites/kses/2022-042-06/N0600420609/images/kses_2022_426_105_F1.jpg
Fig. 1

Overview of training and test data set for solar irradiance data (GHI)

3.1 시계열 분석기법을 이용한 일사량 예보모델

(1) 시계열 기법을 이용한 GHI 예보모델

본 연구에서는 ARIMA (p, d, q) 모델에서의 p, d, q 차수를 결정하기 위해 통계적 모델 적합 판별 척도인 AICc를 사용하였다. AICc (Corrected Akaike’s information criterion)7)는 기존 AIC에 모수의 개수로 패널티를 준 척도이며, 낮을수록 모델의 적합도가 우수함을 의미한다. SARIMA 모델 또한 ARIMA 방식과 마찬가지로 AICc를 이용하여 모델의 차수를 결정하였다. Table 1은 AICc 척도를 이용하여 GHI에 대해 시계열 모델 차수를 결정한 결과를 나타낸 것이다.

Table 1

Two time series models for GHI

GHI Time series analysis model
ARIMA ARIMA(4, 1, 2)
SARIMA SARIMA(1, 0, 2)(0, 1, 0)96

Table 1에서 채택된 ARIMA와 SARIMA 모델을 이용해서 GHI에 대해 15분부터 2시간까지의 일사량을 예측하였다.

다음 Fig. 2Fig. 3는 모델 평가(test) 기간 중 일부인 2021년 1월 1일 00:00 ~ 2021년 1월 3일 23:45의 실제 GHI 값과 각각 ARIMA 모델과 SARIMA모델을 이용한 15분, 30분, 60분, 120분 예측 GHI 값을 나타낸 그림이다. 실선이 관측값이며 빨간색, 초록색, 파란색, 노란색 점선이 각각 채택된 예측 모델을 이용하여 얻은 GHI의 향후 15분, 30분, 60분, 120분 선행예보값이다. 모든 선행예보 구간에서 전체적인 경향을 잘 맞추는 것으로 보이지만 향후 예보시간이 길어질수록 하루의 일사량 최대값을 과대추정하는 양상을 보인다.

https://static.apub.kr/journalsite/sites/kses/2022-042-06/N0600420609/images/kses_2022_426_105_F2.jpg
Fig. 2

The actual value and predicted value of GHI for 15, 30, 60, 120 minutes using ARIMA model

https://static.apub.kr/journalsite/sites/kses/2022-042-06/N0600420609/images/kses_2022_426_105_F3.jpg
Fig. 3

The actual value and predicted value of GHI for 15, 30, 60, 120 minutes using SARIMA model

(2) 시계열 기법을 이용한 DNI 예보모델

DNI도 GHI와 마찬가지로 두 종류의 시계열 모델에 대해 AICc를 이용하여 차수를 결정하였다. Table 2는 AICc척도를 이용하여 DNI에 대해 시계열 모델 차수를 결정한 결과를 나타낸 것이다.

Table 2에서 채택된 SARIMA 모델을 이용해서 두 종류의 일사량에 대해 15분부터 2시간까지의 일사량을 예측하였다.

Table 2

Two time series models for DNI

DNI Time series analysis model
ARIMA ARIMA(5, 0, 0)
SARIMA SARIMA(3, 0, 5)(0, 1, 0)96

다음 Fig. 4Fig. 5는 모델 평가(test) 기간 중 일부인 2021년 1월 1일 00:00 ~ 2021년 1월 3일 23:45의 실제 DNI 값과 각각 ARIMA 모델과 SARIMA모델을 이용한 15분, 30분, 60분, 120분 예측 DNII 값을 나타낸 그림이다. 실선이 관측값이며 빨간색, 초록색, 파란색, 노란색 점선이 각각 채택된 예측 모델을 이용하여 얻은 DNI의 향후 15분, 30분, 60분, 120분 선행예보값이다. 모든 선행예보 구간에서 전체적인 경향을 잘 맞추는 것으로 보이지만, SARIMA 모델을 이용한 선행예보 모델에서 일사량 값의 과대추정 및 과소추정 양상이 두드러지게 나타난다.

https://static.apub.kr/journalsite/sites/kses/2022-042-06/N0600420609/images/kses_2022_426_105_F4.jpg
Fig. 4

The actual value and predicted value of DNI for 15, 30, 60, 120 minutes using ARIMA model

https://static.apub.kr/journalsite/sites/kses/2022-042-06/N0600420609/images/kses_2022_426_105_F5.jpg
Fig. 5

The actual value and predicted value of DNI for 15, 30, 60, 120 minutes using SARIMA model

3.2 ARIMA 모델과 SARIMA 모델을 이용한 일사량 예보모델 정확도 평가

본 연구에서는 ARIMA와 SARIMA 모델을 이용한 일사량 예보모델의 정확도를 평가하기 위해 예측 오차 척도로 RMSE (Root Mean Square Error)와 nRMSE (Normalized Root Mean Squre Error)를 이용하였다. 평균 제곱근 오차라고도 불리는 RMSE는 추정값과 실제 관측값의 차이를 다룰 때 흔히 사용하는 측도이며, nRMSE는 RMSE를 관측값의 (최댓값-최솟값) 혹은 평균값으로 나눈 후 100을 곱하여 표준화한 지표이다. 두 지표 모두 추정값과 관측값의 차이로 정확도를 평가하기 때문에, 수치가 작은 모델이 실제 관측값을 더 정확하게 추정하는 모델이라고 해석할 수 있다. 본 연구에서는 nRMSE 도출 시 RMSE를 관측값의 (최댓값-최솟값)으로 나눈 후 100을 곱한 값을 사용하였다.

다음 Table 3은 ARIMA와 SARIMA 모델을 이용하여 모델 평가 구간(2021년 1월 1일 00:00 ~ 2021년 12월 31일 23:45)의 GHI를 예측했을 때의 예측 오차를 나타낸 것이다. GHI의 예측에 있어 향후 15분 ~ 75분까지의 예측은 ARIMA 모델을 이용하여 구축한 일사량 선행예보 모델의 nRMSE가 6% ~ 10%로, 8% ~ 11%인 SARIMA 모델을 이용하여 구축한 일사량 선행예보 모델보다 예측 정확도 측면에서 우수한 것으로 나타났다. 반면, 향후 90분 ~ 120분까지의 예측은 SARIMA 모델을 이용하여 구축한 선행예보 모델의 nRMSE가 10% ~ 11%로 ARIMA 모델을 이용하여 구축한 일사량 선행예보 모델의 nRMSE 보다 낮은 것을 확인하였다.

Table 3

Comparing prediction errors of GHI with two time series models

ARIMA model SARIMA model
RMSE (Unit: W/m2) nRMSE (Unit: %) RMSE (Unit: W/m2) nRMSE (Unit: %)
Forecast 15 min 81.95 6.25 105.17 8.02
Forecast 30 min 95.80 7.30 116.19 8.86
Forecast 45 min 108.22 8.25 124.12 9.46
Forecast 60 min 118.94 9.07 128.79 9.82
Forecast 75 min 130.08 9.91 133.53 10.18
Forecast 90 min 141.72 10.80 138.05 10.52
Forecast 105 min 153.28 11.68 142.23 10.84
Forecast 120 min 164.14 12.51 145.51 11.09

다음 Table 4는 ARIMA와 SARIMA 모델을 이용하여 모델 평가 구간(2021년 1월 1일 00:00 ~ 2021년 12월 31일 23:45)의 DNI를 예측했을 때의 예측 오차를 나타낸 것이다. DNI의 예측에 있어서는 향후 15분 ~ 120분 까지의 전 선행예보 구간에서 ARIMA 모델을 이용한 일사량 선행예보모델이 SARIMA 모델을 이용하여 구축한 일사량 선행예보모델이 더 낮은 예측 오차를 보여 예측 정확도 측면에서 우수하였다.

Table 4

Comparing prediction errors of DNI with two time series models

ARIMA model SARIMA model
RMSE (Unit: W/m2) nRMSE (Unit: %) RMSE (Unit: W/m2) nRMSE (Unit: %)
Forecast 15 min 101.70 10.32 130.01 13.20
Forecast 30 min 118.91 12.07 149.12 15.14
Forecast 45 min 132.75 13.48 163.43 16.59
Forecast 60 min 142.98 14.52 172.93 17.56
Forecast 75 min 152.22 15.45 181.88 18.46
Forecast 90 min 161.31 16.38 190.00 19.29
Forecast 105 min 169.86 17.24 197.62 20.06
Forecast 120 min 177.70 18.04 204.24 20.73

4. 결 론

본 연구에서는 대전 지점의 두 종류의 일사량 관측 데이터(GHI, DNI)에 대해 ARIMA와 SARIMA 모델이라는 두 개의 시계열 분석기법을 적용하여 예측 정확도를 RMSE와 nRMSE 측도를 이용하여 비교하였다. GHI의 예측에 적합한 모델은 향후 예보 시간 별로 달랐으며, DNI 예측의 경우 전 선행예보 구간에서 ARIMA를 이용한 선행예보 모델이 더 적합한 것으로 확인되었다.

향후 연구로 외생변수를 추가한 다양한 시계열 모델 적용 방안을 연구해보고자 한다. 기온, 습도, 운량 등 일사량 외 기상 변수를 사용한 ARIMAX (Auto-regressive Integrated Moving Average Exogenous Model) 모델과 SARIMAX (Seasonal ARIMAX) 모델을 이용하여 구축한 일사량 선행예보 모델이 외생변수를 추가하지 않은 본 연구의 모델보다 더 높은 예측 정확도를 가질 것으로 기대된다. 하지만 일사량과 상관관계가 높은 기상변수만을 외생변수로 사용해야 예측 정확도의 향상을 기대할 수 있으며, 간결함의 원칙을 만족하는 모델을 구축할 수 있다. 따라서, 대전 지점에서 관측된 일사량 외 기상 변수와 일사량과의 상관계수를 계산하여, 높은 상관관계에 있는 변수를 사용한 ARIMAX 모델과 SARIMAX 시계열 분석기법을 적용하여 보고자 한다.

또한, 본 연구에서 사용된 3년보다 더 긴 기간의 일사량 관측 데이터를 이용한다면, 일사량의 주기성 및 계절성이 확연히 드러나게 되어 실제 관측치에 더 근접한 예측값을 얻으리라 기대된다.

Acknowledgements

이 연구는 2022년도 한국에너지기술연구원의 재원으로 초단시간 선행예보 모델을 위한 입력요소 추정 사업의 지원과 과학기술정보통신부의 재원으로 한국연구재단의 지원(No. NRF-2021R1A2C1007095)을 받아 수행한 연구 과제임.

References

1
The Center of New & Renewable Energy in Korea Energy Agency, Renewable Energy Supply Statistics in 2020, 2022. https://www.knrec.or.kr/biz/pds/statistic/view.do?no=120 last accessed on the 1st September 2022.
2
Suh, Y. -M., Son, H., and Kim, S., Solar Radiation Forecasting by Time Series Models, The Korean Journal of Applied Statistics, Vol. 31, No. 6, pp. 785-799, 2018, https://doi.org/10.5351/KJAS.2018.31.6.785 10.5351/KJAS.2018.31.6.785
3
Kim, S., A Study on Solar Irradiance Forecasting with Weather Variables, The Korean Journal of Applied Statistics, Vol. 30, No. 6, pp. 1005-1013, 2017, https://doi.org/10.5351/KJAS.2017.30.6.1005 10.5351/KJAS.2017.30.6.1005
4
El Alani, O., Abraim, M., Ghennioui, H., Ghennioui, A., Ikenbi, I., and Dahr, F. E., Short Term Solar Irradiance Forecasting Using Sky Images based on a Hybrid CNN-MLP Model, Energy Reports, Vol. 7, pp. 888-900. 2021, https://doi.org/10.1016/j.egyr.2021.07.053 10.1016/j.egyr.2021.07.053
5
Lee, D. -H., Jung, A. -H., Kim, J. -Y., Kim, C. -K., Kim., H. -G., and Lee, Y. -S., Solar Power Generation Forecast Model Using Seasonal ARIMA, Journal of The Korean Solar Energy Society, Vol. 39, No. 3, pp. 59-66, 2019, https://doi.org/10.7836/kses.2019.39.3.059 10.7836/kses.2019.39.3.059
6
Jung, A. -H., Lee, D. -H., Kim, J. -Y., Kim, C. -K., Kim, H. -G., and Lee, Y. -S., Regional Photovoltaic Power Forecasting Using Vector Autoregression Model in South Korea, Energies, Vol. 15, No. 21, 7853, 2022, https://doi.org/10.3390/en15217853 10.3390/en15217853
7
Cavanaugh, J. E., Unifying the Derivations for the Akaike and Corrected Akaike Information Criteria, Statistics & Probability Letters, Vol. 33, No. 2, pp. 201-208, 1997, https://doi.org/10.1016/S0167-7152(96)00128-9 10.1016/S0167-7152(96)00128-9
페이지 상단으로 이동하기