Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- Pomiary - wiele obserwacji(rekordow) - kazda obsrwacja opisana przez ustalona liczbe cech ( atrybutow)
- rejestrujemy atrybuty numeryczne, jak wzrost i waga, kategoryczne (zwane
- też nominalnymi), jak kolor oczu oraz złożone (formalnie numeryczne, ale
- zazwyczaj przetwarzane inaczej), jak odcisk palca i skan siatkówki
- pomiary wzrostu - zmienna losowa z losowym zaburzeniem
- 3 ---
- Grupowanie :
- Ocena jakosci :
- odleglosc zwykle ujemnie skorelowana z prawdopodobieństwem np d(x,y) = 1/p(x,y)
- Odleglosc skupieniowa oraz odleglosc miedzyskupieniowa
- K Means - losowe centroidy, tworzysz grupy - nowe centroidy to uśrednione środki tych grup, i tka aż nie będzie zmiany
- SUpervised - maja juz nadane klasy
- DBScan - sasiedztwo wektorow oddalonych <e, rozpatrzymy dla wektorow jak jest geste to wwzystkie wektory z danej grupy oznaczamy jako rozpatrzone
- Proces stochastyczny, proces losowy – rodzina zmiennych losowych określonych na pewnej przestrzeni probabilistycznej o
- Szeregiem czasowym nazywamy ci ˛ag (x1,x2,..., xt
- ,...)
- nast ˛epuj ˛acych po sobie obserwacji pewnego zjawiska.
- Trend albo tendencja rozwojowa – monotoniczny składnik w modelu zależności badanej cechy statystycznej od czasu.
- Autokorelacja - Mniej formalnie jest to statystyka opisująca, w jakim stopniu dany wyraz szeregu zależy od wyrazów poprzednich w szeregu czasowym
- srednia - suma po xi
- wariancja - s^2 = 1/n Suma po (xi-srednia)^2
- odchylenie - v
- Rozwazamy zwykle dwa zasadnicze modele: ˙
- I addytywny
- Xt = Tt +St +Et
- ,
- I multiplikatywny
- Xt = Tt ×St ×Et
- ,
- SMAk (t) = 1/k ∑i=−m xt+j
- ,
- Stacjonarnos´c szeregu czasowego jest podstawowym wymogiem ´
- do zbudowania skutecznego modelu predykcji
- Proces nazywamy stacjonarnym, jezeli dla dowolnych ˙ t,k ∈ T:
- I wartos´c oczekiwana jest stała ´
- E(Xt) = E(Xt+k ) = µ
- I autokowariancja zalezy jedynie od ˙ k
- Proces stacjonarny (Xt)t∈T złozony wył ˛acznie ze zmiennych losowych ˙
- parami nieskorelowanych nazywamy białym szumem.
- support A → C (nośnik, wsparcie)
- supp(A → C) = supp(A ∪ C),
- confidence A → C (wiarygodność, zaufanie)
- conf(A → C) = supp(A ∪ C) / supp(A).
- lift A → C
- lift(A → C) = confidence(A → C) / supp(C) - wplyw
- leverage A → C
- leverage(A → C) = supp(A → C) – supp(A) supp(C).
- Nm = 14, pm1 = 6/14, pm2 = 8/14
- Qm
- (F) = 2 * 6/14 * 8/14 = 0.4898
- W bardzo wielu praktycznych problemach, aby usun ˛ac´
- niestacjonarnos´c z szeregu czasowego, wystarczy rozwa ´ zy˙ c´
- szereg róznic ˙ Xt −Xt−1
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement