Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- Jakie jest prawdopodobieństwo że losując 240 osób z 400 60% będzie palić
- n = 400
- pali = 240
- alfa = 0.02
- ma wyjść 3.16
- Wylosowano 300 osobową próbę z studentów mieszkających w akademików
- Zapytano czy warunki są ok, tylko 120 zadowolonych
- alfa = 0.02
- h0: połowa jest zadowolonych, ha: mniej niż połowa jest zadwolonych
- pd = 120/300 = 0.4
- p0 = 0.5
- n = 300
- 1) qnorm(0.02)
- 2) wyliczyć u u <- pd - p0 / sqrt(p0 * (1 - p0) / n)
- 3) pnorm(u) <- jakie jest prawdopodobieństwo że trafi się taka próba że połowa jest zadowolonych
- ________
- Na podstawie zbioru adult i zmiennej income zweryfikuj hipotezę że co 4 amerykanin ma duże
- dochody na poziomie istotności alfa = 0.02
- można zrobić summary(data) lub użyć which lub table(data$income)
- p0 = 0.25
- pd = 0.24
- u <- (pd - p0) / sqrt(p0 * (1 - p0) / n) = -3.82
- qnorm(0.02) = -2.053749
- pnorm(u) = 6.41e-05
- h0: p = 1/4
- ha: p < 1/4
- Test istotności dla frakcji
- __________
- Test istotności dla różnicy dwóch frakcji
- 2 populacje o rozkładzie dwumianowym
- populacje
- p1 - frakcje elementów pierwszej populacji
- p2 -
- Ho: p1 = p2
- Ha: p1 != p2
- liczba sukcesów w 1 populacji przez liczbe elementów w 1 populacji
- p1d (daszek) = x1/n1
- p1d - p2d jest zmienną losową
- Jeżeli h0 jest prawdziwa to p1d - p2d ma rozkład normalny N(p1 - p2 (= 0), sqrt(pd(1 - pd) (1/n1 + 1/n2)))
- p2d = x2/n2
- pd = x1 + x2 / n1 + n2
- Zadanie:
- Zachorowanie na miażdżycę w mieście i na wsi czy takie same?
- 800 z miasta, 60 chorych
- 1200 ze wsi 60 chorych
- alfa = 0.05, zweryfikować
- x1 <- 60
- x2 <- 60
- n1 <- 800
- n2 <- 1200
- pd <- (x1 + x2) / (n1 + n2)
- sd <- sqrt(pd * (1 - pd) * (1/n1 + 1/n2))
- u <- (p1d - p2d) / sd
- qnorm(0.025) <- obszar zabroniony = 1.95
- u = 2.3
- Czyli odrzucamy bo u > obszar zabroniony
- Zadanie 2:
- Przynależność do S czy taka sama dla pracowników administracji oraz roboli.
- na 300 z admin 180 nalezy
- na 500 robotników 400 należy
- alfa = 0.05
- x1 <- 180
- x2 <- 400
- n1 <- 300
- pd <- (x1 + x2) / (n1 + n2)
- sd <- sqrt(pd * (1 - pd) * (1/n1 + 1/n2))
- p1d <- x1/n1
- p2d <- x2/n2
- u <- (p1d - p2d) / sd = -6.133315
- qnorm(0.025) = -1.959964
- Zadanie 3:
- Na podstawie zbioru adultUCI i na kolunie income zweryfikuj hipotezę że frakcja kobiet o wysokich
- zarobkach jest taka jak frakcja mężczyzn o wysokich zarobkach dla alfa = 0.02
- kobiety <- data[data$sex == 'Female',]
- men <- data[data$sex == 'Male',]
- x1 <- 1179
- n1 <- 1179 + 9592
- x2 <- 6662
- n2 <- 6662 + 15128
- pd <- (x1 + x2) / (n1 + n2)
- sd <- sqrt(pd * (1 - pd) * (1/n1 + 1/n2))
- p1d <- x1/n1
- p2d <- x2/n2
- u <- (p1d - p2d) / sd = -38.9729
- qnorm(0.01) = -2.326348
- Odrzucamy bo -38.97 leży w obszarze odrzucenia
- 19.05
- Test zgodności fi ^2
- Przykład 11.1 (statystyka od podstaw książka)
- Przez 300 dni obserwowano pracę pewnej maszyny rejestrując liczbę uszkodzeń w trakcie dnia.
- l. uszkoden l. dni (ni) P npi
- 0 140 0.449329 134.79
- 1 110 0.3594632 107.83
- 2 30 0.1437853 43.13
- 3 10 0.03834274 11.5
- 4 10 0.007668548 2.30
- +4 x 0.015
- 3+ 20 14.3
- Dla poziomu istotności alfa = 0.05 zweryfikuj hipotezę, że liczba uszkodzeń ma rozład Poissona.
- P(x = k) = (lmbd^k * e ^-lmbd) / k!
- dpois(0:4, 0.8 = lmbd)
- lmbd = 110 + 60 + 30 + 30 = 230/300 ~= 0.8
- npi = dpois(0:4, 0.8) * 300
- s = ((140 - 134.79) ^ 2) / 140 + ((110 - 107.83) ^ 2) / 110 + ((30 - 43.13) ^ 2) / 40
- + ((20 - 14.3) ^ 2) / 20
- Dla zadanego rozkładu o r szacowanych parametrach statystykach ma rokład fi^2 o k-r-1 st swobody.
- 4 parametry r = 1 (lambda), -1 = 2
- w. krytyczna = 5.99
- 0.05
- 2 st swobody
- 103 0.05, rozkład normalny
- wydatki l.rodzin pi npi
- [100-300] 50 0.1 43.56
- [300-500] 100 0.28
- [500-700] 150 0.36
- [700-900] 80 0.2
- [900-1100] 20 0.05
- Znaleźć średnią i odchylenie standardowe.
- mean = (150 * 50 + 400 * 100 + 600 * 150 + 800 * 80 + 1000 * 20) / 400 = 560
- sd(c(rep(200, 50), rep(400, 100), rep(600, 150), rep(800, 80), rep(1000, 20)))
- w domu zadania 2.295 i 2.296
- Test niezależności
- hipoteza zerowa, zmienne są niezależne jeśli
- P(X=xi, Y = yi) = P(X = xi) * P(Y = yi)
- hipoteza alternatywna
- Są zależne
- B Cz P
- Zas 20 9 16 n1. = 45 p1. = 45 / 355 = 0.12
- Tab 32 72 64 n2. = 168 p2. = 168 / 355 = 0.47
- Lek 8 8 30 n3. = 46 p3. = 46 / 355 = 0.12
- Zio 52 32 12 n4. = 96 p4. = 96 / 355 = 0.27
- n.1 n.2 n.3
- n.1 = 112
- p.1 = 0.31
- n.2 = 121
- p.2 = 0.34
- n.3 = 122
- p.3 = 0.34
- pij = pi. * p.j
- (nij - n * pij)
- _______________
- npij
- St = r - 1 * s - 1 = 3 * 2 = 6
- alfa = 0.05
- M <- matrix(c(0.12 * 0.31, 0.12 * 0.34, 0.12 * 0.34, 0.47 * 0.31, 0.47 * 0.34, 0.47 * 0.34, 0.12 * 0.31, 0.12 * 0.34, 0.12 * 0.34, 0.27 * 0.31, 0.27 * 0.34, 0.27 * 0.34), nrow = 4, byrow = TRUE)
- M2 = M * 355
- M3 = M - M2
- M4 = M3^2
- M5 = M4 / M2
- out <- sm(M5)
- 342.4833
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement