0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

詳細分析14種可用于時間序列預測的損失函數(shù)

深度學習自然語言處理 ? 來源:PaperWeekly ? 2023-02-14 09:19 ? 次閱讀

摘要

時間序列預測方法包括使用一組歷史時間序列進行預測,在信號處理、模式識別、計量經(jīng)濟學、數(shù)學金融、天氣預報、地震預測等領域都有廣泛應用。過去時間序列預測方法以線性方法為主,然而在許多最新的應用中已經(jīng)嘗試使用機器學習、深度學習、高斯過程和人工神經(jīng)網(wǎng)絡等技術來進行時間序列預測。 在處理時間序列預測問任務時,損失函數(shù)的選擇非常重要,因為它會驅(qū)動算法的學習過程。以往的工作提出了不同的損失函數(shù),以解決數(shù)據(jù)存在偏差、需要長期預測、存在多重共線性特征等問題。
本文工作總結(jié)了常用的的 14 個損失函數(shù)并對它們的優(yōu)缺點進行分析,這些損失函數(shù)已被證明在不同領域提供了最先進的結(jié)果。本文在在各種時間序列基準任務上對它們的表現(xiàn)進行分析,希望能助行業(yè)專業(yè)人士和研究人員快速的為任務選取合適的損失函數(shù),避免過多的實驗嘗試。

5340a860-abeb-11ed-bfe3-dac502259ad0.png

問題背景

回歸是一種常見的預測建模技術,用于估計兩個或多個變量之間的關系。它是一種監(jiān)督學習技術,可以定義為用于對相關實數(shù)變量之間的關系建模的統(tǒng)計技術和自變量。
時間序列數(shù)據(jù)與一般基于回歸的數(shù)據(jù)略有不同,因為在特征中添加了時間信息,使目標更加復雜。時間序列數(shù)據(jù)具有以下組成部分

level:每個時間序列都有一個 base level,簡單的 base level 的計算可以直接通過對歷史數(shù)據(jù)進行平均/中位數(shù)計算得到;

周期性:時間序列數(shù)據(jù)也有一種稱為周期性的模式,它不定期重復,這意味著它不會以相同的固定間隔出現(xiàn);

趨勢:表示時間序列在一段時間內(nèi)是增加還是減少。也就是說,它有上升(增加)或下降(減少)的趨勢;

季節(jié)性:在一段時間內(nèi)重復出現(xiàn)的模式稱為季節(jié)性;

噪聲:在提取水平、周期性、趨勢和季節(jié)性之后,剩下的就是噪聲,噪聲是數(shù)據(jù)中完全隨機的變化。

每個機器學習模型的基本目標都是改進模型的選定指標并減少與之相關的損失。用于時間序列預測的機器學習或深度學習模型的一個重要組成部分是損失函數(shù),模型的性能是根據(jù)損失函數(shù)來衡量的,促使了模型參數(shù)的更新。

14種損失函數(shù)分析

3.1 Mean Absolute Error (MAE)

MAE,也稱為 L1 損失,是預測值與實際值之間的絕對誤差:

53724c44-abeb-11ed-bfe3-dac502259ad0.png

所有樣本值的絕對誤差的均值就稱為 MAE:

538d69fc-abeb-11ed-bfe3-dac502259ad0.png

53a40374-abeb-11ed-bfe3-dac502259ad0.png

▲ MAE Loss與Predictions的性能圖
MAE 是回歸模型中經(jīng)常使用的一種簡單有效的損失函數(shù)。但是由于異常值,回歸問題中的變量可能不是嚴格的高斯變量會帶來一些問題。

53c7b2c4-abeb-11ed-bfe3-dac502259ad0.png

3.2 Mean Squared Error (MSE) MSE,也稱為 L2 損失,是預測值與實際值之間的平方誤差:

53f2658c-abeb-11ed-bfe3-dac502259ad0.png

所有樣本值的平方誤差的均值就稱為 MSE,也稱作均方誤差:

54187024-abeb-11ed-bfe3-dac502259ad0.png

MSE 也稱為二次損失,因為懲罰是平方而不是與誤差成正比。當誤差被平方時,離群值被賦予更多的權(quán)重,為較小的誤差創(chuàng)建一個平滑的梯度。受益于這種對巨大錯誤的懲罰,有助于優(yōu)化算法獲得參數(shù)的最佳值。鑒于錯誤是平方的,MSE 永遠不會是負數(shù),錯誤的值可以是 0 到無窮大之間的任何值。隨著錯誤的增加,MSE 呈指數(shù)增長,好的模型的 MSE 值將接近于 0。

5443d2dc-abeb-11ed-bfe3-dac502259ad0.png

546f2130-abeb-11ed-bfe3-dac502259ad0.png

3.3 Mean Bias Error (MBE) 高估或低估參數(shù)值的傾向稱為偏差或平均偏差誤差。偏差的唯一可能方向是正向或負向。正偏差表示數(shù)據(jù)誤差被高估,而負偏差表示誤差被低估。
實際值和預期值之間的差異被測量為平均偏差誤差(MBE)。預測中的平均偏差由 MBE 量化。除了不考慮絕對值外,它實際上與 MAE 相同。應謹慎對待 MBE,因為正向誤差和負向誤差可能會相互抵消。

54a0652e-abeb-11ed-bfe3-dac502259ad0.png

54c20792-abeb-11ed-bfe3-dac502259ad0.png

▲ MBE Loss與Predictions的性能圖

54e3317e-abeb-11ed-bfe3-dac502259ad0.png

3.4 Relative Absolute Error (RAE)

RAE 的計算將總絕對誤差除以平均值與實際值之間的絕對差值:

54ff4a58-abeb-11ed-bfe3-dac502259ad0.png

5512e716-abeb-11ed-bfe3-dac502259ad0.png

RAE 是一種基于比率的指標,用于評估預測模型的有效性。RAE 的可能值介于 0 和 1 之間。接近零的值(零是最佳值)是良好模型的特征。

552924fe-abeb-11ed-bfe3-dac502259ad0.png

▲ RAE Loss與Predictions的性能圖

5549f102-abeb-11ed-bfe3-dac502259ad0.png

3.5 Relative Squared Error (RSE) RSE 衡量在沒有簡單預測器的情況下結(jié)果的不準確程度。這個簡單的預測變量僅代表實際值的平均值。結(jié)果,相對平方誤差將總平方誤差除以簡單預測變量的總平方誤差以對其進行歸一化??梢栽谝圆煌瑔挝挥嬎阏`差的模型之間進行比較。

55607eb8-abeb-11ed-bfe3-dac502259ad0.png

557987b4-abeb-11ed-bfe3-dac502259ad0.png

559f5462-abeb-11ed-bfe3-dac502259ad0.png

▲ RSE Loss與Predictions的性能圖

55bea948-abeb-11ed-bfe3-dac502259ad0.png

3.6 Mean Absolute Percentage Error (MAPE) 平均絕對百分比誤差(MAPE),也稱為平均絕對百分比偏差(MAPD),是用于評估預測系統(tǒng)準確性的指標。它通過從實際值減去預測值的絕對值除以實際值來計算每個時間段的平均絕對百分比誤差百分比。由于變量的單位縮放為百分比單位,因此平均絕對百分比誤差(MAPE)廣泛用于預測誤差。當數(shù)據(jù)中沒有異常值時,它效果很好,常用于回歸分析和模型評估。

55e37dfe-abeb-11ed-bfe3-dac502259ad0.png

559f5462-abeb-11ed-bfe3-dac502259ad0.png

▲ MAPE Loss與Predictions的性能圖

561f199a-abeb-11ed-bfe3-dac502259ad0.png

3.7 Root Mean Squared Error (RMSE)

MSE 的平方根用于計算 RMSE。均方根偏差是 RMSE 的另一個名稱。它考慮了實際值的變化并測量誤差的平均幅度。RMSE 可以應用于各種特征,因為它有助于確定特征是否增強模型預測。當非常不希望出現(xiàn)巨大錯誤時,RMSE 最有用。

565cedce-abeb-11ed-bfe3-dac502259ad0.png

567387a0-abeb-11ed-bfe3-dac502259ad0.png

▲RMSE Loss與Predictions的性能圖

568cdbd8-abeb-11ed-bfe3-dac502259ad0.png

3.8 Mean Squared Logarithmic Error (MSLE)

均方對數(shù)誤差(MSLE)衡量實際值與預期值之間的差異。添加對數(shù)減少了 MSLE 對實際值和預測值之間的百分比差異以及兩者之間的相對差異的關注。MSLE 將粗略地處理小的實際值和預期值之間的微小差異以及大的真實值和預測值之間的巨大差異。

56b1cbaa-abeb-11ed-bfe3-dac502259ad0.png

這種損失可以解釋為真實值和預測值之間比率的度量:

56e78042-abeb-11ed-bfe3-dac502259ad0.png

57033e2c-abeb-11ed-bfe3-dac502259ad0.png

▲MSLE Loss與Predictions的性能圖

57337c4a-abeb-11ed-bfe3-dac502259ad0.png

3.9 Root Mean Squared Logarithmic Error (RMSLE)

RMSLE 通過應用 log 到實際和預測的值,然后進行相減。當同時考慮小誤差和大誤差時,RMSLE 可以避免異常值的影響。

574a74ae-abeb-11ed-bfe3-dac502259ad0.png

576ca84e-abeb-11ed-bfe3-dac502259ad0.png

▲RMSLE Loss與Predictions的性能圖

57931646-abeb-11ed-bfe3-dac502259ad0.png

3.10 Normalized Root Mean Squared Error (NRMSE) 歸一化均方根誤差(NRMSE)RMSE 有助于不同尺度模型之間的比較。該變量具有觀測范圍的歸一化 RMSE(NRMSE),它將 RMSE 連接到觀測范圍。

57c020b4-abeb-11ed-bfe3-dac502259ad0.png

57d45a16-abeb-11ed-bfe3-dac502259ad0.png

▲NRMSE Loss與Predictions的性能圖

5809a324-abeb-11ed-bfe3-dac502259ad0.png

3.11 Relative Root Mean Squared Error (RRMSE)

RRMSE 是沒有維度的 RMSE 變體。相對均方根誤差(RRMSE)是一種均方根誤差度量,它已根據(jù)實際值進行縮放,然后由均方根值歸一化。雖然原始測量的尺度限制了 RMSE,但 RRMSE 可用于比較各種測量方法。當您的預測被證明是錯誤的時,會出現(xiàn)增強的 RRMSE,并且該錯誤由 RRMSE 相對或以百分比表示。

5824bc5e-abeb-11ed-bfe3-dac502259ad0.png

583cf1ca-abeb-11ed-bfe3-dac502259ad0.png

▲RRMSE Loss與Predictions的性能圖

5857abd2-abeb-11ed-bfe3-dac502259ad0.png

3.12 Huber Loss Huber 損失是二次和線性評分算法的理想組合。還有超參數(shù) delta. 對于小于 delta 的損失值,應該使用 MSE;對于大于 delta 的損失值,應使用 MAE。這成功地結(jié)合了兩種損失函數(shù)的最大特點。

586d9e2e-abeb-11ed-bfe3-dac502259ad0.png

58967dbc-abeb-11ed-bfe3-dac502259ad0.png

▲Huber Loss與Predictions的性能圖

58ab9d14-abeb-11ed-bfe3-dac502259ad0.png

3.13 LogCosh Loss

LogCosh 計算誤差的雙曲余弦的對數(shù)。這個函數(shù)比二次損失更平滑。它的功能類似于 MSE,但不受重大預測誤差的影響。鑒于它使用線性和二次評分技術,它非常接近 Huber 損失。

58da17d4-abeb-11ed-bfe3-dac502259ad0.png

58f69986-abeb-11ed-bfe3-dac502259ad0.png

▲LogCosh Loss與Predictions的性能圖

59122034-abeb-11ed-bfe3-dac502259ad0.png

3.14 Quantile Loss 分位數(shù)回歸損失函數(shù)用于預測分位數(shù)。分位數(shù)是指示組中有多少值低于或高于特定閾值的值。它計算跨預測變量(獨立)變量值的響應(因)變量的條件中位數(shù)或分位數(shù)。除了第 50 個百分位數(shù)是 MAE,損失函數(shù)是 MAE 的擴展。它不對響應的參數(shù)分布做出任何假設,甚至為具有非常量方差的殘差提供預測區(qū)間。

59432f12-abeb-11ed-bfe3-dac502259ad0.png

5961bfd6-abeb-11ed-bfe3-dac502259ad0.png

▲Quantile Loss與Predictions的性能圖

599b95ee-abeb-11ed-bfe3-dac502259ad0.png

實驗分析各種損失函數(shù)在時間序列任務上的表現(xiàn)

數(shù)據(jù)集

電力負荷數(shù)據(jù)集-數(shù)據(jù)集包含 370 點/客戶端的電力消耗。

交通數(shù)據(jù)集-數(shù)據(jù)集包含 15 個月的每日數(shù)據(jù)(440 條每日記錄),描述了舊金山灣區(qū)高速公路不同車道隨時間變化的占用率,數(shù)值介于 0 和 1 之間。

Favorita 數(shù)據(jù)集-包含日期、商店和商品信息、該商品是否正在促銷以及單位銷售額的雜貨數(shù)據(jù)集。

波動率數(shù)據(jù)集-數(shù)據(jù)集包含衡量金融資產(chǎn)或指數(shù)過去波動性。

評估指標
實驗使用 P10、P50 和 P90 度量評估了所有損失函數(shù)的性能。預測的上限和下限可以通過分位數(shù)提供。80% 置信區(qū)間是可以獲得的值范圍,例如,通過使用預測類型 0.1(P10)和 0.9(P90)。在 10% 的情況下,觀測值應小于 P10 值,在 90% 的情況下 P90 值應更高。 總的來說:

在電力數(shù)據(jù)集的任務上,Quantile Loss、MSE 和 RRMSE 損失表現(xiàn)良好。

在交通數(shù)據(jù)集任務上,Log Cosh Loss、Quantile Loss 和 MAE 表現(xiàn)更好。

在 Favorita 數(shù)據(jù)集任務上,RAE、LogCosh Loss 和 Quantile Loss 表現(xiàn)更好。

在波動率數(shù)據(jù)集任務上,Quantile Loss、MAE 和 Huber Loss 表現(xiàn)更好。

59e47264-abeb-11ed-bfe3-dac502259ad0.png

5a184436-abeb-11ed-bfe3-dac502259ad0.png

5a39cade-abeb-11ed-bfe3-dac502259ad0.png

5a6adbf6-abeb-11ed-bfe3-dac502259ad0.png

總結(jié)展望

損失函數(shù)在確定給定目標的良好擬合模型中起著關鍵作用。對于時間序列預測等復雜目標,不可能確定通用損失函數(shù)。有很多因素,如異常值、數(shù)據(jù)分布的偏差、ML 模型要求、計算要求和性能要求。沒有適用于所有類型數(shù)據(jù)的單一損失函數(shù)。在主要關注模型架構(gòu)和數(shù)據(jù)類型的學術環(huán)境中,損失函數(shù)可以通過用于訓練的數(shù)據(jù)集屬性(如分布、邊界等)來確定。 這項工作試圖構(gòu)建特定損失函數(shù)可能有用的情況,例如在數(shù)據(jù)集中出現(xiàn)異常值的情況下,均方誤差是最佳策略;然而,如果有更少的異常值,則平均絕對誤差將是比 MSE 更好的選擇。同樣,如果我們希望保持平衡,并且我們的目標基于百分位數(shù)損失,那么使用 LogCosh 是更好的方法。本文總結(jié)了用于時間序列預測的 14 個著名損失函數(shù),并開發(fā)了一種易于處理的損失函數(shù)形式,用于改進和更準確的優(yōu)化。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:最新綜述:詳細分析14種可用于時間序列預測的損失函數(shù)

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    DVI接口詳細分析

    DVI接口詳細分析DVI 接口規(guī)格和定義 DVI 有DVI 1.0 和DVI 2.0 兩標準,其中 DVI 1.0 僅用了其中的一組信號傳輸信道(data0-data2 ),傳輸圖像的最高像素時鐘
    發(fā)表于 08-11 09:51

    工程師應該掌握的20個模擬電路(詳細分析及參考答案).pdf

    工程師應該掌握的20個模擬電路(詳細分析及參考答案).pdf
    發(fā)表于 04-07 13:28

    三極管特性曲線詳細分析

    三極管特性曲線詳細分析,特性曲線看不懂,
    發(fā)表于 06-29 16:34

    uboot代碼詳細分析

    [url=]uboot代碼詳細分析[/url]
    發(fā)表于 01-29 13:51

    詳細分析一下USB協(xié)議

    本文跟大家一起詳細分析一下USB協(xié)議。
    發(fā)表于 05-24 06:16

    詳細分析stm32f10x.h

    每日開講---學習STM32不得不看的剖析(詳細分析stm32f10x.h)摘要: 學習STM32不得不看的剖析(詳細分析stm32f10x.h)。/**這里是STM32比較重要的頭文件*******************************************
    發(fā)表于 08-05 07:44

    詳細分析了VTIM和VMIN的功能

    上一篇文章中,我們詳細分析了VTIM和VMIN的功能,《嵌入式Linux 串口編程系列2--termios的VMIN和VTIME深入理解》 也明白了這兩個參數(shù)設計的初衷和使用方法,接下來我們 就詳細
    發(fā)表于 11-05 07:09

    請問一下怎樣對stm32的啟動代碼進行詳細分析

    請問一下怎樣對stm32的啟動代碼進行詳細分析呢?
    發(fā)表于 11-26 07:10

    電子工程師需要掌握的20個模擬電路的詳細分析

    電子工程師需要掌握的20個模擬電路的詳細分析
    發(fā)表于 09-28 06:22

    電子工程師必須掌握的20個模擬電路詳細分析

    內(nèi)含參考答案以及詳細分析
    發(fā)表于 10-07 07:15

    科學數(shù)據(jù)時間序列預測方法

    針對傳統(tǒng)的時間序列分析方法預測科學數(shù)據(jù)效果較差的特點,提出了一結(jié)合自組織神經(jīng)網(wǎng)絡和灰色理論的時間
    發(fā)表于 12-31 23:56 ?10次下載

    電子整流器工作原理詳細分析

    電子整流器工作原理詳細分析
    發(fā)表于 02-27 10:43 ?2.5w次閱讀

    Buck變換器原理詳細分析

    Buck變換器原理詳細分析
    發(fā)表于 09-15 17:26 ?30次下載
    Buck變換器原理<b class='flag-5'>詳細分析</b>

    物聯(lián)網(wǎng)的產(chǎn)業(yè)生態(tài)是怎樣的詳細分析概述

    物聯(lián)網(wǎng)的產(chǎn)業(yè)生態(tài)是怎樣的詳細分析概述
    的頭像 發(fā)表于 12-08 10:00 ?5058次閱讀

    正激有源鉗位的詳細分析

    正激有源鉗位的詳細分析介紹。
    發(fā)表于 06-16 16:57 ?60次下載