0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

時(shí)間序列分析的定義

數(shù)據(jù)分析與開發(fā) ? 來源:一個(gè)數(shù)據(jù)人的自留地 ? 作者:數(shù)據(jù)人創(chuàng)作者聯(lián)盟 ? 2022-03-16 16:17 ? 次閱讀

01

時(shí)間序列分析的定義

1.1

概念

首先,時(shí)間序列定義為在一定時(shí)間間隔內(nèi)按時(shí)間順序測量的某個(gè)數(shù)量。時(shí)間序列分析是指將歷史數(shù)據(jù)分解為四部分來看——趨勢、周期、時(shí)期和不穩(wěn)定因素,然后綜合這些因素,提出預(yù)測。時(shí)間序列分為平穩(wěn)序列和非平穩(wěn)序列兩大類。平穩(wěn)序列是不存在趨勢只存在隨機(jī)性的序列,非平穩(wěn)序列則是包含趨勢、季節(jié)性和隨機(jī)性的序列。

從最廣泛的形式來說,時(shí)間序列分析是關(guān)于推斷過去一系列數(shù)據(jù)點(diǎn)發(fā)生了什么,并試圖預(yù)測未來會發(fā)生什么。時(shí)間序列分析試圖了解過去并預(yù)測未來。

1.2

分類

通常,時(shí)間序列通常包含以下類型:

1、趨勢-趨勢是時(shí)間序列中一致的方向性運(yùn)動。這些趨勢將是確定性的或隨機(jī)的。時(shí)間序列在長時(shí)間內(nèi)呈現(xiàn)出來的長期上升或下降的變動;

2、季節(jié)性變化-許多時(shí)間序列都包含季節(jié)性變化。在代表業(yè)務(wù)銷售或氣候水平的系列中尤其如此。我們經(jīng)常看到商品的季節(jié)性變化,特別是那些與生長季節(jié)或年度溫度變化有關(guān)的商品(例如天然氣)。

3、序列依賴性-時(shí)間序列(尤其是金融序列)最重要的特征之一就是序列相關(guān)性。當(dāng)時(shí)間上相互靠近的時(shí)間序列觀測值傾向于相互關(guān)聯(lián)時(shí),就會發(fā)生這種情況。

02

時(shí)間序列分析的步驟

時(shí)間序列預(yù)測的步驟是:

fe4a328e-9752-11ec-952b-dac502259ad0.jpg

在開始平穩(wěn)性檢驗(yàn)步驟之前,我首先想和大家分享的是平穩(wěn)性檢驗(yàn)的目的。平穩(wěn)性檢驗(yàn)為了確定沒有隨機(jī)趨勢或確定趨勢,否則將會產(chǎn)生“偽回歸”問題.偽回歸是說,有時(shí)數(shù)據(jù)的高度相關(guān)僅僅是因?yàn)槎咄瑫r(shí)隨時(shí)間有向上或向下的變動趨勢, 并沒有真正聯(lián)系.這樣數(shù)據(jù)中的趨勢項(xiàng),季節(jié)項(xiàng)等無法消除, 從而在殘差分析中無法準(zhǔn)確進(jìn)行分析。

2.1

平穩(wěn)性檢驗(yàn)

(一)圖示法

平穩(wěn)性指的是期望不變,方差恒定,協(xié)方差不隨時(shí)間改變,協(xié)方差只依賴于K這個(gè)時(shí)間跨度,不依賴于時(shí)間點(diǎn)t本身。

fe63d856-9752-11ec-952b-dac502259ad0.jpgfe70d31c-9752-11ec-952b-dac502259ad0.jpgfe922b8e-9752-11ec-952b-dac502259ad0.jpg

給定這些假設(shè)前提的目的是便于后續(xù)技術(shù)上的處理。根據(jù)時(shí)序圖粗略來判斷序列是否平穩(wěn),平穩(wěn)時(shí)序圖的特征為圍繞均值不斷波動,而非平穩(wěn)時(shí)序圖表現(xiàn)為在不同時(shí)間段具有不同的均值。圖a為平穩(wěn)時(shí)序圖,圖b為非平穩(wěn)時(shí)序圖。

fea3d15e-9752-11ec-952b-dac502259ad0.jpg

然而僅依靠圖像判斷時(shí)間序列的平穩(wěn)性,肯定是不精確的,因此需要進(jìn)行單位根檢驗(yàn)(DF檢驗(yàn)和ADF檢驗(yàn))進(jìn)一步判斷。

(二)單位根檢驗(yàn)

1、DF檢驗(yàn)

fecc97ec-9752-11ec-952b-dac502259ad0.png

fee33434-9752-11ec-952b-dac502259ad0.png

(原假設(shè) H0:序存在單位根 ,即參數(shù)δ=0)

檢驗(yàn)時(shí)間序列的平穩(wěn)性,一般可通過檢驗(yàn)帶有截距項(xiàng)的一階自回歸模型:

fef8d03c-9752-11ec-952b-dac502259ad0.png

對上式可通過進(jìn)行普通最小二乘法的t檢驗(yàn)完成(t檢驗(yàn)的原假設(shè):H0:βj=0。即若P值<0.05,則拒絕原假設(shè),證明δ≠0,序列平穩(wěn)。

2、ADF檢驗(yàn) 因DF檢驗(yàn)假設(shè)ut為白噪聲,序列為一階自回歸的模型,但實(shí)際上隨機(jī)干擾項(xiàng)并非為白噪聲序列,且序列并非為一階自回歸生成,因此用普通最小二乘法進(jìn)行估計(jì)的t統(tǒng)計(jì)量會受到無關(guān)參數(shù)的影響,導(dǎo)致DF檢驗(yàn)無效。

如果時(shí)間序列包含有明顯的隨時(shí)間變化的某種趨勢,DF檢驗(yàn)必須保證能夠剔除這種趨勢,否則時(shí)間趨勢的成分會進(jìn)入ut,導(dǎo)致ut非白噪聲序列,進(jìn)而偏離了最初的假設(shè)。因此形成了ADF檢驗(yàn)。ADF檢驗(yàn)是由下面3個(gè)模型完成:

ff046ff0-9752-11ec-952b-dac502259ad0.png

其中t為時(shí)間變量,代表序列隨時(shí)間變化的趨勢。

模型的檢驗(yàn)原理同DF檢驗(yàn),即t檢驗(yàn);檢驗(yàn)順序?yàn)椋?)、(2)、(1);三個(gè)模型全部檢驗(yàn)通過,才能證明該序列是平穩(wěn)時(shí)間序列。

2.2

時(shí)間序列常見的三種模型

序列通過平穩(wěn)性檢驗(yàn)后,就可以建立時(shí)間序列模型了,當(dāng)序列不平穩(wěn)時(shí),對序列進(jìn)行差分或者取對數(shù)處理。對時(shí)序數(shù)據(jù)進(jìn)行差分處理,例如在R語言的“diff”函數(shù)可確定(P值<0.05,則拒絕原假設(shè),序列不存在單位根,經(jīng)1階差分后,序列平穩(wěn))。

對一個(gè)時(shí)間序列預(yù)處理后檢驗(yàn)出該序列為平穩(wěn)時(shí)間序列說明該模型有提取信息的價(jià)值,就要進(jìn)行下一步的模型建立來擬合該模型然后做出預(yù)測。下面介紹擬合時(shí)間序列的三個(gè)重要模型。

(一)AR(p)模型

自回歸模型(Autoregressive model,簡稱AR模型),用同一變數(shù)例如x的之前各期,亦即x1至xt-1來預(yù)測本期xt的表現(xiàn),并假設(shè)它們?yōu)橐淮尉€性關(guān)系。因?yàn)檫@是從回歸分析中的線性回歸發(fā)展而來,只是不用x預(yù)測y,而是用x預(yù)測 x(自己);所以叫做自回歸。

AR(p)模型簡記形式如下: ff1bf1c0-9752-11ec-952b-dac502259ad0.png 其中p為自回歸階數(shù)。Φ0=0稱為中心化AR(p)模型。p階自回歸模型的自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)p階截尾。

(二)MA(q)模型 MA模型(moving average model)移動平均模型,簡記形式如下:

ff37d048-9752-11ec-952b-dac502259ad0.png

其中q為移動平均的階數(shù)。q階移動平均模型自相關(guān)系數(shù)q階截尾,偏自相關(guān)系數(shù)拖尾。

(三)ARMA(p,q)模型 自回歸滑動平均模型(Autoregressive moving average model,簡稱:ARMA模型)。是研究時(shí)間序列的重要方法,由自回歸模型(簡稱AR模型)與移動平均模型(簡稱MA模型)為基礎(chǔ)“混合”構(gòu)成。它比AR模型法與MA模型法估計(jì)更精確,但其參數(shù)估算比較繁瑣。ARMA(p,q)模型簡記形式如下:

ff46686a-9752-11ec-952b-dac502259ad0.png

當(dāng)q=0時(shí),ARMA(p,q)模型就退化成了AR(p)模型;

當(dāng)p=0時(shí),ARMA(p,q)模型就退化成了MA(q)模型;

ARMA(p,q)模型具有自相關(guān)系數(shù)不截尾,偏自相關(guān)系數(shù)也不截尾的性質(zhì)。

2.3

模型的選擇與定階

了解了時(shí)間序列的三種常見模型后,應(yīng)該如何選擇模型并確定模型的階數(shù)呢?通常使用ACF與PACF圖判定法。

說到時(shí)間序列分析,一定離不開自相關(guān)函數(shù)(auto-correlation function,ACF)和偏自相關(guān)函數(shù)(Partial auto-correlation function,PACF),ACF可以提供具有滯后值的任何序列的自相關(guān)值。

簡單來說,它描述了該序列的當(dāng)前值與其過去的值之間的相關(guān)程度。時(shí)間序列可以包含趨勢,季節(jié)性,周期性和殘差等成分。ACF在尋找相關(guān)性時(shí)會考慮所有這些成分。直觀上來說,ACF 描述了一個(gè)觀測值和另一個(gè)觀測值之間的自相關(guān),包括直接和間接的相關(guān)性信息。

PACF可以提供殘差(在去除了之前的滯后已經(jīng)解釋的影響之后仍然存在)與下一個(gè)滯后值的相關(guān)性。因此,如果殘差中有任何可以由下一個(gè)滯后建模的隱藏信息,我們可能會獲得良好的相關(guān)性,并且在建模時(shí)我們會將下一個(gè)滯后作為特征。

討論完兩個(gè)重要函數(shù)后,就成功了一半,接下來就是選擇模型和確定階數(shù)了,由此引入兩個(gè)詞:截尾和拖尾。

截尾是指時(shí)間序列的自相關(guān)函數(shù)(ACF)或偏自相關(guān)函數(shù)(PACF)在大于某個(gè)常數(shù)k后快速趨于0為k階截尾;拖尾是ACF或PACF始終有非零取值,不會在k大于某個(gè)常數(shù)后就恒等于零(或在0附近隨機(jī)波動)。趨于0在實(shí)際分析過程中通常被處理為在2倍標(biāo)準(zhǔn)差之內(nèi)。

ff5ebab4-9752-11ec-952b-dac502259ad0.png

ff710ac0-9752-11ec-952b-dac502259ad0.png

以上面兩張圖為例,ACF拖尾,PACF一階截尾,因此可以選擇AR(1)模型進(jìn)行擬合,說到模型擬合,各位統(tǒng)計(jì)學(xué)前輩早已為我們總結(jié)好以下規(guī)律:

ff84bc32-9752-11ec-952b-dac502259ad0.png

2.4

模型的確定與檢驗(yàn)

通過以上內(nèi)容,大家對時(shí)間序列的三種模型有了初步了解。那么應(yīng)該如何確定最優(yōu)模型呢?通常有以下幾點(diǎn):

(1)同一種模型,在盡可能描述數(shù)據(jù)信息的前提下選擇低階模型,階數(shù)越高,模型會越復(fù)雜

(2)高階AR(p)、MA(q)模型與較低階ARMA(p,q)模型之間選擇較低階ARMA(p,q)模型

(3)合適模型的殘差應(yīng)滿足均值為零的正態(tài)分布,而且任何滯后階數(shù)的殘差相關(guān)系數(shù)都為零。

接下來分享的是殘差檢驗(yàn)的方法:

方法一:通過繪制正態(tài)分布的QQ來檢驗(yàn):圖像近似為過原點(diǎn)的一條直線,則殘差服從正態(tài)分布且均值為零。該步驟可通過R語言的“qqnormt”函數(shù)實(shí)現(xiàn)。如下圖:

ff973e34-9752-11ec-952b-dac502259ad0.jpg

方法二:通過R語言的“Box.test”函數(shù)實(shí)現(xiàn)該檢驗(yàn),若P>0.05,接受原假設(shè),即任何滯后階數(shù)的殘差都不相關(guān),殘差檢驗(yàn)通過。

03

示例分享

回到開頭的例子,當(dāng)小毛同學(xué)拿到數(shù)據(jù)后首先應(yīng)該繪制銷售額隨時(shí)間變化的曲線,觀察數(shù)據(jù)的整體趨勢,如果有季節(jié)性趨勢,應(yīng)該利用差分或者移動平均的方法消除季節(jié)因素,接下來在消除增長趨勢,然后利用單位根檢驗(yàn)來檢驗(yàn)數(shù)據(jù)的平穩(wěn)性,最后利用數(shù)據(jù)的ACF和PACF函數(shù)確定階數(shù)和模型。

其實(shí)在這一步有一種偷懶的辦法就是利用R語言中的auto.arima”函數(shù)可自動篩選出p,q,但還是希望大家能夠了解背后的邏輯。模型確定好之后可以利用R語言中的forecast函數(shù)預(yù)測未來N期的銷量,至此小毛的預(yù)測工作終于可以告一段落了。

本次分享到此結(jié)束,歡迎大家批評指正~

審核編輯:何安

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 序列
    +關(guān)注

    關(guān)注

    0

    文章

    70

    瀏覽量

    19529

原文標(biāo)題:時(shí)間序列分析淺談

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    本章主講時(shí)間序列的信息提取,章節(jié)中有許多概念定義和數(shù)學(xué)公式,并配有Python代碼演示,細(xì)細(xì)品讀與理解動手演練,還是很開拓思維視野的。下面以筆記形式進(jìn)行展開。 時(shí)間
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    之前對《時(shí)間序列與機(jī)器學(xué)習(xí)》一書進(jìn)行了整體瀏覽,并且非常輕松愉快的完成了第一章的學(xué)習(xí),今天開始學(xué)習(xí)第二章“時(shí)間序列的信息提取”。 先粗略的翻閱第二章,內(nèi)容復(fù)雜,充斥了大量的
    發(fā)表于 08-14 18:00

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥瞰這本書

    清晰,從時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過精心設(shè)計(jì),對理論知識進(jìn)行了
    發(fā)表于 08-12 11:28

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列
    發(fā)表于 08-12 11:21

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于
    發(fā)表于 08-11 17:55

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書概覽與時(shí)間序列概述

    的,書籍封面如下。下面對全書概覽并對第一章時(shí)間序列概述進(jìn)行細(xì)度。 一. 全書概覽 全書分為8章,每章的簡介如下: ●第1章“時(shí)間序列概述”:介紹
    發(fā)表于 08-07 23:03

    深度學(xué)習(xí)中的時(shí)間序列分類方法

    時(shí)間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的重要任務(wù)之一,廣泛應(yīng)用于人體活動識別、系統(tǒng)監(jiān)測、金融預(yù)測、醫(yī)療診斷等多個(gè)領(lǐng)域。隨著深度學(xué)習(xí)技術(shù)
    的頭像 發(fā)表于 07-09 15:54 ?524次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來?

    模型提供了充足的“燃料”——從互聯(lián)網(wǎng)中收集的文本、圖片和視頻數(shù)據(jù)量巨大,為訓(xùn)練數(shù)據(jù)密集型的大模型提供了可能。 而時(shí)間序列分析作為數(shù)據(jù)科學(xué)的一個(gè)重要分支,其重要性在各行業(yè)中愈發(fā)凸顯。 目前,時(shí)間
    發(fā)表于 06-25 15:00

    是否可以在建立連接后編程自定義跳頻序列?

    是否可以在建立連接后編程自定義跳頻序列?
    發(fā)表于 05-31 06:08

    時(shí)間序列分析的異常檢測綜述

    時(shí)間序列是在不同時(shí)點(diǎn)記錄一個(gè)或多個(gè)變量值的數(shù)據(jù)。例如,每天訪問網(wǎng)站的人數(shù)、每月城市的 average 溫度、每小時(shí)的股票價(jià)格等。時(shí)間序列非常重要,因?yàn)樗鼈冊试S我們
    的頭像 發(fā)表于 03-11 09:36 ?547次閱讀
    <b class='flag-5'>時(shí)間</b><b class='flag-5'>序列</b><b class='flag-5'>分析</b>的異常檢測綜述

    深度學(xué)習(xí)在時(shí)間序列預(yù)測的總結(jié)和未來方向分析

    2023年是大語言模型和穩(wěn)定擴(kuò)散的一年,時(shí)間序列領(lǐng)域雖然沒有那么大的成就,但是卻有緩慢而穩(wěn)定的進(jìn)展。Neurips、ICML和AAAI等會議都有transformer結(jié)構(gòu)(BasisFormer
    的頭像 發(fā)表于 02-24 08:26 ?730次閱讀
    深度學(xué)習(xí)在<b class='flag-5'>時(shí)間</b><b class='flag-5'>序列</b>預(yù)測的總結(jié)和未來方向<b class='flag-5'>分析</b>

    ICLR 2024高分投稿:用于一般時(shí)間序列分析的現(xiàn)代純卷積結(jié)構(gòu)

    這篇是 ICLR 上用 TCN 來做一般的時(shí)間序列分析的論文,在 Rebuttal 之后的分?jǐn)?shù)為 888,算得上是時(shí)間序列領(lǐng)域相關(guān)的論文中最
    的頭像 發(fā)表于 12-18 16:05 ?774次閱讀
    ICLR 2024高分投稿:用于一般<b class='flag-5'>時(shí)間</b><b class='flag-5'>序列</b><b class='flag-5'>分析</b>的現(xiàn)代純卷積結(jié)構(gòu)

    準(zhǔn)確的時(shí)間記錄在時(shí)間序列數(shù)據(jù)分析中的重要性

    時(shí)間序列數(shù)據(jù)是一系列隨時(shí)間間隔收集的數(shù)據(jù)點(diǎn),使我們能夠跟蹤時(shí)間的變化。時(shí)間序列數(shù)據(jù)可以跟蹤從毫秒
    的頭像 發(fā)表于 11-09 09:18 ?837次閱讀

    時(shí)間序列分析的四個(gè)基本Python庫介紹

    在本文中,我們將介紹四個(gè)主要的Python庫——statmodels、tslearn、tssearch、 tsfresh ——每個(gè)庫都針對時(shí)間序列分析的不同方面進(jìn)行了定制。這些庫為從預(yù)測到模式識別
    的頭像 發(fā)表于 11-03 10:17 ?751次閱讀
    <b class='flag-5'>時(shí)間</b><b class='flag-5'>序列</b><b class='flag-5'>分析</b>的四個(gè)基本Python庫介紹

    時(shí)間序列的基礎(chǔ)模型像自然語言處理那樣存在嗎

    時(shí)間序列預(yù)測領(lǐng)域在最近的幾年有著快速的發(fā)展,比如N-BEATS、N-HiTS、PatchTST和TimesNet。 大型語言模型(LLM)最近在ChatGPT等應(yīng)用程序中變得非常流行,因?yàn)樗鼈兛梢?/div>
    的頭像 發(fā)表于 11-03 10:15 ?569次閱讀
    <b class='flag-5'>時(shí)間</b><b class='flag-5'>序列</b>的基礎(chǔ)模型像自然語言處理那樣存在嗎