Exponential Glidande-Medelvärde Window Längd
Med tanke på en tidsserie xi vill jag beräkna ett viktat glidande medelvärde med ett medelvärde för N-poäng där viktningen gynnar nyare värden över äldre värden. Vid val av vikter använder jag det kända faktumet att en geometrisk serie konvergerar till 1, dvs summa (frac) k, förutsatt att oändligt många termer tas. För att få ett diskret antal vikter som summerar till enhet, tar jag helt enkelt de första N-termen i den geometriska serien (frac) k och normaliserar sedan med deras summa. När N4 till exempel ger detta de icke normaliserade vikterna, som efter normalisering av deras summa ger det glidande medelvärdet är då helt enkelt summan av produkten av de senaste 4 värdena mot dessa normaliserade vikter. Denna metod generaliserar på det uppenbara sättet att flytta fönster med längd N, och verkar också beräkningsmässigt lätt. Finns det någon anledning att inte använda det här enkla sättet att beräkna ett viktat glidande medelvärde med hjälp av exponentiella vikter som jag frågar eftersom Wikipedia-posten för EWMA verkar mer komplicerad. Vilket får mig att undra om textboken definitionen av EWMA kanske har några statistiska egenskaper som ovanstående enkla definitionen inte eller är de faktiskt motsvarade frågade 28 nov 12 kl 23:53 Till att börja med antar du 1) att det inte finns några ovanliga värden och ingen nivåskift och ingen tidstrender och inga säsongsdummier 2) att det optimala viktade medlet har vikter som faller på en jämn kurva som beskrivs med 1 koefficient 3) att felvariationen är konstant att det inte finns någon känd orsaksserie Varför alla antaganden. ndash IrishStat 1 okt 14 kl 21:18 Ravi: I det givna exemplet är summan av de första fyra termerna 0.9375 0.06250.1250.250.5. Så de första fyra termerna rymmer 93,8 av den totala vikten (6,2 är i den stympade svansen). Använd detta för att erhålla normaliserade vikter som summan till enhet genom att uppräkna (dividera) med 0,9375. Detta ger 0,06667, 0,133, 0,2667, 0,5333. ndash Assad Ebrahim 1 okt 14 kl 22:21 Ive fann att beräkning exponetiellt vägd rinnande medelvärden använder överlinjelänge leftarrow overline alpha (x - overline), alfalt1 är en enkel enlinjemetod, som är lätt, om bara ungefär tolkbar i termer av ett effektivt antal prover Nalpha (jämför detta formulär med formuläret för beräkning av löpande medelvärde), kräver bara det aktuella datumet (och det aktuella medelvärdet) och är numeriskt stabilt. Tekniskt innefattar denna tillvägagångssätt all historia i genomsnittet. De två viktigaste fördelarna med att använda hela fönstret (i motsats till den stympade som diskuteras i frågan) är att det i vissa fall kan underlätta analytisk karakterisering av filtreringen och det minskar fluktuationerna som induceras om en mycket stor (eller liten) data Värdet är en del av datamängden. Tänk exempelvis på filterresultatet om data är alla noll förutom ett datum vars värde är 106. svarat 29 nov 12 vid 0: 33Denna funktionalitet är experimentell och kan ändras eller tas bort helt i en framtida release. Elastic kommer att göra ett bra sätt att lösa några problem, men experimentella funktioner är inte föremål för stöd SLA av officiella GA-funktioner. Med tanke på en beställd serie data, flyttar Moving Average aggregation ett fönster över data och avger det genomsnittliga värdet för det här fönstret. Med tanke på data 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. kan vi beräkna ett enkelt glidande medelvärde med Windows-storlek på 5 enligt följande: Flytta medelvärden är en enkel metod för att släta sekventiell data. Flytta medelvärden tillämpas vanligtvis på tidsbaserad data, såsom aktiekurser eller servervärden. Utjämningen kan användas för att eliminera högfrekventa fluktuationer eller slumpmässigt brus, vilket medger att lägre frekvenstrender lättare kan visualiseras, såsom säsonglighet. Syntaxedit Linearedit Den linjära modellen tilldelar en linjär viktning till punkter i serien, så att äldre datapoäng (till exempel de i början av fönstret) bidrar med en linjärt mindre mängd till det totala genomsnittet. Den linjära viktningen bidrar till att minska fördröjningen bakom datan, eftersom äldre punkter har mindre inflytande. En linjär modell har ingen speciella inställningar att konfigurera. Som den enkla modellen kan fönsterstorleken förändra beteendet hos det glidande medlet. Exempelvis kommer ett litet fönster (fönstret: 10) att noggrant spåra data och bara släta ut småskaliga fluktuationer: Figur 3. Linjärt glidande medelvärde med fönster av storlek 10 I motsats här är ett linjärt glidande medelvärde med större fönster (fönster: 100) kommer att släta ut alla högre frekvensfluktuationer och lämnar endast lågfrekventa, långsiktiga trender. Det tenderar också att ligga bakom den faktiska data med en betydande mängd, men oftast mindre än den enkla modellen: Figur 4. Linjärt glidande medelvärde med fönster av storlek 100 Multiplikativ Holt-Wintersedit Multiplikation anges genom inställningstyp: mult. Denna variation är att föredra när den säsongsbetonade påverkan multipliceras mot dina data. T. ex. om den säsongsbetonade påverkan är x5 data, snarare än att helt enkelt lägga till den. Standardvärdena för alfa och gamma är 0,3 medan beta är 0,1. Inställningarna accepterar alla float från 0-1 inklusive. Standardvärdet för perioden är 1. Den multiplikativa Holt-Winters-modellen kan vara Minimized Multiplicative Holt-Winters verk genom att dividera varje datapunkt med säsongsvärdet. Det här är problematiskt om någon av dina data är noll eller om det finns luckor i data (eftersom detta resulterar i en dividend-by-zero). För att bekämpa detta plockar mult Holt-Winters alla värden med en mycket liten mängd (110-10) så att alla värden är noll. Detta påverkar resultatet, men endast minimalt. Om dina data är noll eller om du föredrar att se NaN när nollor uppstår, kan du inaktivera detta beteende med pad: false Predictionedit Den rörliga genomsnittsmodellen stöder ett prediktionsläge som kommer att försöka extrapolera i framtiden med tanke på strömmen jämn, glidande medelvärde. Beroende på modell och parameter kan dessa förutsägelser vara eller inte är korrekta. Förutsägelser aktiveras genom att lägga till en förutspådningsparameter för varje glidande genomsnittlig aggregering, med angivande av antalet förutsägelser som du vill lägga till i slutet av serien. Dessa förutsägelser kommer att spridas i samma intervall som dina hinkar: Den enkla. linjära och ewma-modeller ger alla platta förutsägelser: de sammanfaller huvudsakligen med medelvärdet av det sista värdet i serien, vilket ger en platt bild. Figur 11. Enkelt rörligt medelvärde med fönster av storlek 10, förutsäga 50 Holtmodellen kan däremot extrapolera baserat på lokala eller globala konstanta trender. Om vi ställer in ett högt beta-värde kan vi extrapolera baserat på lokala konstanta trender (i det här fallet går prognoserna ner, eftersom data i slutet av serien var på väg nedåt): Figur 12. Hålllinjär glidmedel med fönster av storlek 100, förutsäga 20, alfa 0,5, beta 0,8 I motsats, om vi väljer en liten beta. förutsägelserna är baserade på den globala konstanta trenden. I denna serie är den globala trenden något positiv, så förutsägelsen gör en skarp u-sväng och börjar en positiv lutning: Figur 13. Dubbelt exponentiellt glidande medelvärde med fönster av storlek 100, förutsäga 20, alfa 0,5, beta 0,1 Holtwintersmodellen har potential att leverera de bästa förutsägelserna, eftersom det också innehåller säsongsvariationer i modellen: Figur 14. Holt-Winters glidande medelvärde med fönster av storlek 120, förutsäga 25, alfa 0,8, beta 0,2, gamma 0,7, period 30Dokumentationsutgång tsmovavg tsobj, s, fördröjning) returnerar det enkla glidande medelvärdet för för finansiella tidsserieobjekt, tsobj. lagring indikerar antalet tidigare datapunkter som används med aktuell datapunkt vid beräkning av glidande medelvärde. output tsmovavg (vektor, s, lag, dim) returnerar det enkla glidande medlet för en vektor. lagring indikerar antalet tidigare datapunkter som används med aktuell datapunkt vid beräkning av glidande medelvärde. output tsmovavg (tsobj, e, timeperiod) returnerar det exponentiella vägda glidande medlet för finansiella tidsserieobjekt, tsobj. Det exponentiella glidande medlet är ett viktat glidande medelvärde, där tidsperioden bestämmer tidsperioden. Exponentiella glidande medelvärden minskar fördröjningen genom att tillämpa mer vikt på de senaste priserna. Till exempel väger ett 10-årigt exponentiellt glidande medel det senaste priset med 18,18. Exponentiell andel 2 (TIMEPER 1) eller 2 (WINDOWSIZE 1). output tsmovavg (vektor, e, timeperiod, dim) returnerar det exponentiella vägda glidande medlet för en vektor. Det exponentiella glidande medlet är ett viktat glidande medelvärde, där tidsperioden bestämmer tidsperioden. Exponentiella glidande medelvärden minskar fördröjningen genom att tillämpa mer vikt på de senaste priserna. Till exempel väger ett 10-årigt exponentiellt glidande medel det senaste priset med 18,18. (2 (tidsperiod 1)). output tsmovavg (tsobj, t, numperiod) returnerar det triangulära glidande medlet för finansiella tidsserieobjekt, tsobj. Det triangulära glidande genomsnittet släpper ut dataen. tsmovavg beräknar det första enkla glidande medlet med fönsterbredd på taket (numperiod 1) 2. Då räknar man ut ett andra enkelt glidande medelvärde på det första glidande medlet med samma fönsterstorlek. output tsmovavg (vektor, t, numperiod, dim) returnerar det triangulära glidande medlet för en vektor. Det triangulära glidande genomsnittet släpper ut dataen. tsmovavg beräknar det första enkla glidande medlet med fönsterbredd på taket (numperiod 1) 2. Då räknar man ut ett andra enkelt glidande medelvärde på det första glidande medlet med samma fönsterstorlek. output tsmovavg (tsobj, w, vikter) returnerar det vägda glidande medlet för det finansiella tidsserieobjektet, tsobj. genom att leverera vikter för varje element i det rörliga fönstret. Vektorns längd bestämmer storleken på fönstret. Om större viktfaktorer används för senare priser och mindre faktorer för tidigare priser, är trenden mer mottaglig för de senaste ändringarna. output tsmovavg (vektor, w, vikter, dim) returnerar det viktade glidande medlet för vektorn genom att leverera vikter för varje element i det rörliga fönstret. Vektorns längd bestämmer storleken på fönstret. Om större viktfaktorer används för senare priser och mindre faktorer för tidigare priser, är trenden mer mottaglig för de senaste ändringarna. output tsmovavg (tsobj, m, numperiod) returnerar det modifierade glidande medlet för det finansiella tidsserieobjektet, tsobj. Det modifierade glidande medlet liknar det enkla glidande medlet. Tänk på argumentet numperiod att vara fördröjningen av det enkla glidande medlet. Det första modifierade glidmedlet beräknas som ett enkelt glidande medelvärde. Efterföljande värden beräknas genom att lägga till det nya priset och subtrahera det senaste genomsnittet från den resulterande summan. output tsmovavg (vektor, m, numperiod, dim) returnerar det modifierade glidande medlet för vektorn. Det modifierade glidande medlet liknar det enkla glidande medlet. Tänk på argumentet numperiod att vara fördröjningen av det enkla glidande medlet. Det första modifierade glidmedlet beräknas som ett enkelt glidande medelvärde. Efterföljande värden beräknas genom att lägga till det nya priset och subtrahera det senaste genomsnittet från den resulterande summan. dim 8212 dimension för att fungera längs positivt heltal med värde 1 eller 2 Dimension för att fungera längs, specificerat som ett positivt heltal med ett värde av 1 eller 2. dim är ett valfritt inmatningsargument och om det inte ingår som en ingång, värde 2 antas. Standarden för dim 2 indikerar en radorienterad matris, där varje rad är en variabel och varje kolumn är en observation. Om dim 1. ingången antas vara en kolumnvektor eller kolumnorienterad matris, där varje kolumn är en variabel och varje rad en observation. e 8212 Indikator för exponentiell glidande medelfunktionsvektor Exponentiell glidmedel är ett viktat glidande medelvärde, där timeperiod är tidsperioden för exponentiell glidande medelvärde. Exponentiella glidande medelvärden minskar fördröjningen genom att tillämpa mer vikt på de senaste priserna. Till exempel väger ett 10-årigt exponentiellt glidande medel det senaste priset med 18,18. Exponentiell procentandel 2 (TIMEPER 1) eller 2 (WINDOWSIZE 1) timeperiod 8212 Tidsperiod nonnegative heltal Välj ditt landMoving Average Filter Du kan använda modulen Moving Average Filter för att beräkna en serie ensidiga eller tvåsidiga medelvärden över ett dataset , med en fönsterlängd som du anger. När du har definierat ett filter som uppfyller dina behov kan du applicera det på valda kolumner i en dataset genom att ansluta den till Apply Filter-modulen. Modulen gör alla beräkningar och ersätter värden inom numeriska kolumner med motsvarande glidande medelvärden. Du kan använda det resulterande rörliga genomsnittsvärdet för plottning och visualisering, som en ny jämn grundlinje för modellering, för att beräkna avvikelser mot beräkningar för liknande perioder, och så vidare. Denna typ av medel hjälper dig att avslöja och förutse användbara tidsmönster i retrospektiv och realtidsdata. Den enklaste typen av glidande medel börjar vid ett visst prov i serien och använder medelvärdet för den positionen plus de tidigare n-positionerna i stället för det faktiska värdet. (Du kan definiera n som du vill.) Ju längre period n över vilken medelvärdet beräknas, desto mindre varians kommer du att ha bland värden. När du också ökar antalet använda värden, desto mindre effekt har ett enskilt värde på det resulterande genomsnittet. Ett glidande medelvärde kan vara ensidigt eller tvåsidigt. I ett ensidigt medel används endast värden som föregår indexvärdet. I ett tvåsidigt medel används tidigare och framtida värden. För scenarier där du läser streamingdata är kumulativa och viktade glidmedelvärden särskilt användbara. Ett kumulativt glidande medel tar hänsyn till punkterna före den aktuella perioden. Du kan vikta alla datapunkter lika vid beräkning av medelvärdet, eller du kan se till att värden närmare den aktuella datapunkten vägs starkare. I ett vägt rörligt medelvärde. alla vikter måste summa till 1. I ett exponentiellt rörligt medelvärde. medelvärdena består av ett huvud och en svans. som kan vägas. En lättviktig svans innebär att svansen följer huvudet ganska nära, så genomsnittet beter sig som ett glidande medelvärde på en kort viktningstid. När svansviktarna är tyngre, beter sig medelvärdet mer som ett längre enkelt glidande medelvärde. Lägg till Moving Average Filter-modulen i ditt experiment. För längd. skriv ett positivt heltal värde som definierar den totala storleken på det fönster som filtret appliceras på. Detta kallas också filtermasken. För ett glidande medel bestämmer längden på filtret hur många värden som medelvärde i glidfönstret. Längre filter kallas också högre orderfilter, och ger ett större räkningsfönster och en närmare approximation av trendlinjen. Kortare eller lägre ordningens filter använder ett mindre räkningsfönster och mer liknar de ursprungliga uppgifterna. För Typ. välj vilken typ av rörligt medelvärde som ska tillämpas. Azure Machine Learning Studio stöder följande typer av rörliga genomsnittliga beräkningar: Ett enkelt glidande medelvärde (SMA) beräknas som ett obestämt rullande medelvärde. Triangulära glidande medelvärden (TMA) är i genomsnitt två gånger för en jämnare trendlinje. Ordet triangulärt härrör från formen av vikterna som appliceras på data, vilket betonar centrala värden. Ett exponentiellt rörligt medelvärde (EMA) ger större vikt åt de senaste data. Viktningen sjunker exponentiellt. Ett modifierat exponentiellt rörligt medelvärde beräknar ett löpande rörligt medelvärde, där beräkning av glidande medelvärdet vid någon punkt beaktar det tidigare beräknade glidande medlet vid alla föregående punkter. Denna metod ger en jämnare trendlinje. Med en enda punkt och ett nuvarande glidande medel beräknas det kumulativa glidande genomsnittet (CMA) det glidande medelvärdet vid den aktuella punkten. Lägg till datasetet som har de värden du vill beräkna ett glidande medelvärde för och lägg till modulen Apply Apply. Anslut det rörliga medelfiltret till den vänstra ingången på Apply Filter. och anslut datasetet till höger ingång. Använd kolumnväljaren i tillämpningsfiltermodulen för att ange vilka kolumner filtret ska appliceras på. Som standard kommer det filter du skapar att appliceras på alla numeriska kolumner, så var noga med att utesluta några kolumner som inte har lämpliga data. Kör experimentet. På den punkten ersätts det aktuella (eller indexvärdet) för varje uppsättning värden som definieras av filterlängdsparametern med det glidande medelvärdet.
Comments
Post a Comment