Flytta medelvärden Om denna information är ritad på ett diagram ser det ut så här: Detta visar att det finns en stor variation i antalet besökare beroende på säsong. Det finns mycket mindre på hösten och vintern än våren och sommaren. Men om vi ville se en trend i antalet besökare kunde vi beräkna ett 4-punkts glidande medelvärde. Det gör vi genom att hitta det genomsnittliga antalet besökare under de fyra kvartalen 2005: Då finner vi det genomsnittliga antalet besökare under de senaste tre kvartalen 2005 och första kvartalet 2006: Sedan de sista två kvartalen 2005 och de två första kvartalen av 2006: Observera att det sista genomsnittet vi kan hitta är under de två sista kvartalen 2006 och de första två kvartalen 2007. Vi räknar de glidande medelvärdena på ett diagram och ser till att varje genomsnitt är ritat i mitten av de fyra kvartalen det täcker: Vi kan nu se att det finns en väldigt liten nedåtgående trend hos besökarna. Hur beräknar jag säsongsvariationen från ett 4-punkts glidande medelvärde Om jag har en lista över försäljning per kvartal i 2 år, säg. Från dessa data kan jag beräkna 4-punkts glidmedelvärde. Vanligtvis, försäljningsrörande medelvärde (trend). visa mer Om jag har en lista över försäljning per kvartal i 2 år, säg. Från dessa data kan jag beräkna de 4 poäng glidande medelvärdena. Vanligtvis var det genomsnittliga (trend) säsongsmässiga variationen och det skulle ha varit lätt om jag hade gjort 3 eller 5 poäng glidande medelvärden (dvs. udda antal) Försäljning. Trend. Säsongsvariation x. en. d y. b. e z. c. f Försäljning. Trend. Säsongsvariation x. en y. b z Tar jag bara ett 2-punktigt glidande medelvärde av trenden för att få siffrorna i anpassning. Tyvärr hoppas du förstår min fråga It039 är lite svårt att förklara. Som du har insett, med ett trepunkts eller fempunkts glidande medelvärde, anpassas dina datapunkter med dina ursprungliga data. Tja, det fyrapunkts glidande medlet skulle ge dig en trendlinje med datapunkter som är inriktade mitt i mittpunkten mellan dina ursprungliga data och så jag tror att du ska interpolera mellan de glidande medelpunkterna. Eftersom de rörliga genomsnittliga datapunkterna är jämnt fördelade på båda sidor av dina ursprungliga data, innebär interpolering att medelvärdena uppgår till varandra, så jag håller med med ditt förslag om att ta ytterligare ett tvåpunkts glidande medelvärde som ett sätt att beräkna trenden. Jag skulle dock referera till det som interpolation istället för som ett vidare rörligt medelvärde. John middot 7 år sedan middot just nu svara på denna fråga Relaterade frågor Rapportera missbruk Rapportera missbruk Tyvärr, du har nått din dagliga frågegräns. Tjäna fler poäng eller kom tillbaka imorgon för att fråga mer. Om du kostar 5 poäng, och då väljer du ett bra svar får du 3 poäng. Frågor måste följa gemenskapens riktlinjer. Media uppladdning misslyckades. Du kan försöka lägga till media igen eller fortsätt och skicka svaret Media Upload misslyckades. Du kan försöka lägga till media igen eller fortsätt och skicka frågan. Uppladdad bild är mindre än den minsta tillåtna 320 x 240 pixelstorleken. Tyvärr, filformat stöds inte. Du kan bara ladda upp bilder med en storlek mindre än 5 MB. Du kan bara ladda upp videor med en storlek mindre än 60 MB. Generera förhandsgranskning Fortsätt och skicka ditt svar. Uppladdad video kommer att vara live efter bearbetning. Gå vidare och skicka din fråga. Uppladdad video kommer att vara live efter bearbetning. Sändningsförfrågan. Detta kan ta en eller två minuter Uploading. Spreadsheet genomförande av säsongjustering och exponentiell utjämning Det är enkelt att utföra säsongsjustering och passa exponentiella utjämningsmodeller med Excel. Skärmbilderna och diagrammen nedan är hämtade från ett kalkylblad som har upprättats för att illustrera multiplicativ säsongsjustering och linjär exponentiell utjämning på följande kvartalsförsäljningsdata från Outboard Marine: För att få en kopia av kalkylarkfilen själv klickar du här. Den version av linjär exponentiell utjämning som kommer att användas här för demonstration är Brown8217s version, bara för att den kan implementeras med en enda kolumn med formler och det finns bara en utjämningskonstant för att optimera. Vanligtvis är det bättre att använda Holt8217s version som har separata utjämningskonstanter för nivå och trend. Prognosprocessen fortskrider enligt följande: (i) Första uppgifterna är säsongrensade (ii) så skapas prognoser för säsongrensade data via linjär exponentiell utjämning och (iii) slutligen är de säsongrensade prognoserna kvoterade för att få prognoser för den ursprungliga serien . Säsongsjusteringsprocessen utförs i kolumnerna D till G. Det första steget i säsongjustering är att beräkna ett centrerat glidande medelvärde (utfört här i kolumn D). Detta kan göras genom att ta medeltalet av två ettåriga medelvärden som kompenseras av en period i förhållande till varandra. (En kombination av två förskjutna medelvärden i stället för ett enda medel behövs för centreringsändamål när antalet årstider är jämnt.) Nästa steg är att beräkna förhållandet till glidande medelvärde, dvs. de ursprungliga uppgifterna dividerat med det rörliga genomsnittet i varje period - vilket görs här i kolumn E. (Detta kallas också kvotrend-cyclequot-komponenten i mönstret, i den mån trend - och konjunkturseffekter kan anses vara allt som förblir efter medeltal över en helårs värde av data. Naturligtvis kan förändringar från månad till månad som inte beror på säsongsmässighet bestämas av många andra faktorer, men tolvmånadersgenomsnittet släpper i stor utsträckning över dem.) Beräknat säsongsindex för varje säsong beräknas genom att medeltalvärdera alla förhållanden för den aktuella säsongen, vilket görs i cellerna G3-G6 med en AVERAGEIF-formel. Medelvärdena är sedan återkalnade så att de summeras till exakt 100 gånger antalet perioder i en säsong, eller 400 i detta fall, vilket görs i cellerna H3-H6. Nedan i kolumn F används VLOOKUP-formler för att infoga det lämpliga säsongsindexvärdet i varje rad i datatabellen, enligt kvartalet av det representerar. Det centrerade rörliga genomsnittet och de säsongrensade uppgifterna ser ut så här: Observera att det glidande medlet oftast ser ut som en mjukare version av den säsongrensade serien, och den är kortare i båda ändarna. Ett annat arbetsblad i samma Excel-fil visar tillämpningen av den linjära exponentiella utjämningsmodellen till säsongrensade data, som börjar i kolumn G. Ett värde för utjämningskonstanten (alfa) anges ovanför prognoskolumnen (här i cell H9) och För enkelhets skyld tilldelas serienavnet quotAlpha. quot (namnet är tilldelat med kommandot quotInsertNameCreatequot.) LES-modellen initieras genom att de första två prognoserna ställs lika med det första verkliga värdet av den säsongrensade serien. Formeln som används här för LES-prognosen är recirkulär form av Brown8217s modell: Denna formel är inmatad i cellen som motsvarar den tredje perioden (här, cell H15) och kopieras därifrån. Observera att LES-prognosen för den aktuella perioden avser de två föregående observationerna och de två föregående prognosfelen, liksom värdet av alfa. Således avser prognosformeln i rad 15 endast data som var tillgängliga i rad 14 och tidigare. (Självklart, om vi ville använda enkla istället för linjär exponentiell utjämning, kunde vi istället ersätta SES-formeln. Vi kan också använda Holt8217s snarare än Brown8217s LES-modell, vilket skulle kräva ytterligare två kolumner med formler för att beräkna nivån och trenden som används i prognosen.) Felen beräknas i nästa kolumn (här kolumn J) genom att subtrahera prognoserna från de faktiska värdena. Roten medelkvadratfelet beräknas som kvadratroten av felets varians plus kvadraten av medelvärdet. (Detta följer av den matematiska identiteten: MSE VARIANCE (fel) (AVERAGE (fel)). 2.) Vid beräkning av medelvärdet och variansen av fel i denna formel är de två första perioderna uteslutna eftersom modellen inte faktiskt börjar prognosera tills den tredje perioden (rad 15 på kalkylbladet). Det optimala värdet av alfa kan hittas antingen genom att manuellt byta alfa tills den minsta RMSE finns, annars kan du använda quotSolverquot för att utföra en exakt minimering. Värdet av alfa som Solver hittat visas här (alfa0.471). Det är vanligtvis en bra idé att plotta felet i modellen (i transformerade enheter) och även att beräkna och plotta sina autokorrelationer vid lags på upp till en säsong. Här är en tidsserie-plot av de (säsongrensade) felen: Felautokorrelationerna beräknas med hjälp av funktionen CORREL () för att beräkna korrelationerna av felen med sig självfördröjda av en eller flera perioder - detaljer visas i kalkylbladsmodellen . Här är en plot av autokorrelationerna av felen vid de första fem lagsna: Autokorrelationerna på lags 1 till 3 ligger mycket nära noll, men spetsen vid lag 4 (vars värde är 0,35) är lite besvärligt - det tyder på att säsongsjusteringsprocessen har inte varit helt framgångsrik. Det är emellertid faktiskt endast marginellt signifikant. 95 signifikansband för att testa om autokorrelationer skiljer sig signifikant från noll är ungefär plus-eller-minus 2SQRT (n-k), där n är provstorleken och k är fördröjningen. Här är n 38 och k varierar från 1 till 5, så kvadratroten-av-n-minus-k är omkring 6 för dem alla, och gränserna för att testa den statistiska signifikansen av avvikelser från noll är därför ungefär plus - eller-minus 26 eller 0,33. Om du varierar värdet av alfa för hand i denna Excel-modell kan du observera effekten på tidsserierna och autokorrelationsdiagrammen för felen, liksom på det roten-kvadratiska felet, vilket kommer att illustreras nedan. Nedan i kalkylbladet är prognostiseringsformeln quotbootstrappedquot in i framtiden genom att bara ersätta prognoser för faktiska värden vid den punkt där den faktiska data löper ut - dvs. där quotthe futurequot börjar. (Med andra ord, i varje cell där ett framtida datavärde skulle inträffa läggs en cellreferens in som pekar på prognosen för den perioden.) Alla övriga formler kopieras helt enkelt ovanifrån: Observera att fel för prognoser för framtiden beräknas alla vara noll. Det betyder inte att de faktiska felen kommer att vara noll, men snarare återspeglar den bara det faktum att vi förutspår att framtida data kommer att motsvara prognoserna i genomsnitt. De resulterande LES-prognoserna för säsongrensade data ser så här ut: Med detta speciella värde av alfa, vilket är optimalt för prognoser med en period framåt, är den prognostiserade trenden något uppåt, vilket återspeglar den lokala trenden som observerades under de senaste 2 åren eller så. För andra värden av alfa kan en väldigt annorlunda trendprojektion erhållas. Det är vanligtvis en bra idé att se vad som händer med den långsiktiga trendprojektionen när alfa varieras, eftersom det värde som är bäst för kortsiktiga prognoser inte nödvändigtvis är det bästa värdet för att förutsäga den mer avlägsna framtiden. Till exempel är här resultatet som erhålls om värdet av alfa manuellt ställs in på 0,25: Den prognostiserade långsiktiga trenden är nu negativ snarare än positiv. Med ett mindre värde av alfa lägger modellen större vikt vid äldre data i dess uppskattning av nuvarande nivå och trend och dess långsiktiga prognoser speglar den nedåtgående trend som observerats under de senaste 5 åren snarare än den senaste uppåtgående trenden. Detta diagram illustrerar också tydligt hur modellen med ett mindre värde av alfa är långsammare att svara på quotturning pointsquot i data och tenderar därför att göra ett fel på samma tecken under många perioder i rad. Dess 1-stegs prognosfel är större i genomsnitt än de som erhållits tidigare (RMSE på 34,4 i stället för 27,4) och starkt positivt autokorrelerade. Lag-1 autokorrelationen 0,56 överstiger väsentligen värdet 0,33, beräknat ovan för en statistiskt signifikant avvikelse från noll. Som ett alternativ till att sänka värdet av alfa för att introducera mer konservatism i långsiktiga prognoser, läggs en kvotränningsdämpningsquot-faktor ibland till modellen för att den planerade trenden ska flata ut efter några perioder. Det sista steget i att bygga prognosmodellen är att quoteraasonizequot LES prognoserna genom att multiplicera dem med lämpliga säsongsindex. De resesaliserade prognoserna i kolumn I är alltså helt enkelt produkten av säsongsindexen i kolumn F och de säsongrensade LES-prognoserna i kolumn H. Det är relativt lätt att beräkna konfidensintervaller för enstegsprognoser som gjorts av denna modell: först beräkna RMSE (root-mean-squared-felet, vilket är bara kvadratroten till MSE) och beräkna sedan ett konfidensintervall för den säsongrensade prognosen genom att lägga till och subtrahera två gånger RMSE. (Generellt är ett 95 konfidensintervall för en prognos för en period framöver ungefär lika med punktprognosen plus-eller-minus-två gånger den beräknade standardavvikelsen för prognosfel, förutsatt att felfördelningen är ungefär normal och provstorleken är tillräckligt stor, säg 20 eller mer. Här är RMSE istället för standardavvikelsen för provets standardavvikelse den bästa uppskattningen av standardavvikelsen för framtida prognosfel eftersom det tar hänsyn både till slumpmässiga variationer.) Förtroendebegränsningarna för den säsongrensade prognosen återförsäljas sedan. tillsammans med prognosen, genom att multiplicera dem med lämpliga säsongsindex. I detta fall är RMSE lika med 27,4 och den säsongrensade prognosen för den första framtida perioden (dec-93) är 273,2. så är det säsongrensade 95 konfidensintervallet från 273,2-227,4 218,4 till 273,2227,4 328,0. Multiplicera dessa gränser med Decembers säsongsindex på 68,61. vi uppnår lägre och övre konfidensgränser på 149,8 och 225,0 kring prognosen för 93-procentiga prognoser på 187,4. Förtroendebegränsningar för prognoser mer än en period framöver kommer i allmänhet att öka som prognoshorisonten ökar på grund av osäkerhet om nivå och trend samt säsongsfaktorer, men det är svårt att beräkna dem generellt med analytiska metoder. (Det lämpliga sättet att beräkna konfidensgränser för LES-prognosen är att använda ARIMA-teorin, men osäkerheten i säsongsindex är en annan fråga.) Om du vill ha ett realistiskt konfidensintervall för en prognos mer än en period framåt, tar du alla källor till felaktigt är det bästa sättet att använda empiriska metoder: till exempel för att få ett konfidensintervall för en 2-stegs prognos, kan du skapa en annan kolumn i kalkylbladet för att beräkna en prognos för två steg före varje period ( genom att förstärka prognosen med ett steg framåt). Beräkna sedan RMSE för prognosfel med två steg framåt och använd detta som utgångspunkt för ett konfidensintervall med 2 steg framåt.
No comments:
Post a Comment