flytende gjennomsnitt. Gjennomgang av tidsserier data observasjoner like fordelt i tid fra flere påfølgende perioder Kalt flytting fordi det kontinuerlig rekomputeres når nye data blir tilgjengelige, går det fremover ved å slippe den tidligste verdien og legge til den nyeste verdien For eksempel er det bevegelige gjennomsnittet på seks - salgsalg kan beregnes ved å ta gjennomsnittet av salget fra januar til juni, deretter gjennomsnittet av salget fra februar til juli, deretter mars til august osv. Flytte gjennomsnitt 1 redusere effekten av midlertidige variasjoner i data, 2 forbedre Tilpasning av data til en linje En prosess som kalles utjevning for å vise data s trend tydeligere, og 3 markere en verdi over eller under trenden. Hvis du beregner noe med svært høy varians, er det best du kan gjøre, å finne tall ut det bevegelige gjennomsnittet. Jeg ønsket å vite hva det bevegelige gjennomsnittet var av dataene, så jeg ville få en bedre forståelse av hvordan vi gjorde. Når du prøver å finne ut noen tall som ofte endrer seg St du kan gjøre er å beregne den gjennomsnittlige gjennomsnittlige gjennomsnittlige gjennomsnittlige MAP-prisen. Når du beregner et løpende bevegelig gjennomsnitt, er gjennomsnittet i mellomtiden fornuftig. I det forrige eksempelet beregnet vi gjennomsnittet av de første 3 tidsperiodene og lagde det ved siden av periode 3 Vi kunne ha plassert gjennomsnittet midt i tidsintervallet på tre perioder, det vil si ved siden av periode 2 Dette fungerer bra med ulike tidsperioder, men ikke så bra for like tidsperioder Så hvor skal vi plassere første glidende gjennomsnitt når M 4. Teknisk vil det bevegelige gjennomsnittet falle på t 2 5, 3 5. For å unngå dette problemet glatter vi MAs ved å bruke M 2 Således glatter vi de jevne verdiene. Hvis vi gjennomsnittlig et jevnt antall vilkår, vi trenger å glatte de jevne verdiene. Følgende tabell viser resultatene ved å bruke M 4. David, ja, MapReduce er ment å operere på en stor mengde data. Og ideen er at det generelt ikke bør være kort og redusere funksjoner hvordan mange mappers eller hvor mange reduksjonsmidler det er, det er jus t optimalisering Hvis du tenker nøye på algoritmen jeg postet, kan du se at det ikke spiller noen rolle hvilken mapper får hvilke deler av dataene hver inngangspost vil være tilgjengelig for alle redusere operasjoner som trenger det. Joe K 18 september 12 kl 22:30. I beste av min forståelse er glidende gjennomsnitt ikke pent kart til MapReduce-paradigmet siden beregningen er i hovedsak skyvevindu over sorterte data, mens MR er behandling av ikke-kryssede områder av sorterte data Løsning jeg ser er som følger a For å implementere tilpasset partisjoner til være i stand til å lage to forskjellige partisjoner i to løp. I hvert løp vil reduksjonene dine få forskjellige dataområder og beregne glidende gjennomsnitt hvor passende jeg skal prøve å illustrere. I første løpsdata for reduksjonsapparater skal være R1 Q1, Q2, Q3, Q4 R2 Q5 , Q6, Q7, Q8. Her vil du cacluate glidende gjennomsnitt for noen Qs. In neste løp skal reduksjonsapparatene få data som R1 Q1 Q6 R2 Q6 Q10 R3 Q10 Q14. Og caclulate resten av bevegelige gjennomsnitt. Da må du aggregere results. Idea av tilpasset partisjoner at den vil ha to driftsformer - hver gang å dele inn i like områder, men med litt skift I en pseudokode vil det se ut som denne partisjonsknappen SHIFT MAXKEY numOfPartitions hvor SHIFT vil bli tatt fra konfigurasjonen MAXKEY maksimal verdi av nøkkelen jeg antar for enkelhet at de starter med null. RecordReader, IMHO er ikke en løsning siden den er begrenset til spesifikk splitt og kan ikke glide over splittens grense. En annen løsning ville være å implementere tilpasset logikk for å dele inndataene den er del av av InputFormat Det kan gjøres å gjøre 2 forskjellige lysbilder, ligner partisjonering. ansvaret 17. september kl. 12 på 8 59.
No comments:
Post a Comment