Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- plants = data_query.query('category == "растения"').pivot_table(index='order_id', values='revenue', aggfunc='mean')
- house = data_query.query('category == "хозяйственные товары"').pivot_table(index='order_id', values='revenue', aggfunc='mean')
- artificial = data_query.query('category == "искусственные растения, овощи и фрукты"').pivot_table(index='order_id', values='revenue', aggfunc='mean')
- kitchen = data_query.query('category == "кухонная утварь"').pivot_table(index='order_id', values='revenue', aggfunc='mean')
- -----------------------------
- Поскольку объемы выборок разнятся, применен метод Шидака (корректировка критического уровня значимости методом Шидака для снижения вероятности ошибки)
- -----------------------------
- alpha = 1 - (1 - 0.05)**(1/4)
- alpha = 1 - (1 - 0.05)**(1/4)
- results = st.ttest_ind(plants, house, equal_var = False)
- print('p-значение:', results.pvalue)
- if (results.pvalue < alpha):
- print("Отвергаем нулевую гипотезу")
- else:
- print("Не получилось отвергнуть нулевую гипотезу")
- p-значение: [1.3961919e-34]
- Отвергаем нулевую гипотезу
- Вывод: средний чек по категориям "растения" и "хозяйственные товары" различается
- -----------------------------
- alpha = 1 - (1 - 0.05)**(1/4)
- results = st.ttest_ind(plants, artificial, equal_var = False)
- print('p-значение:', results.pvalue)
- if (results.pvalue < alpha):
- print("Отвергаем нулевую гипотезу")
- else:
- print("Не получилось отвергнуть нулевую гипотезу")
- p-значение: [0.10298934]
- Не получилось отвергнуть нулевую гипотезу
- Вывод: средний чек по категориям "растения" и "искусственные товары" не различается
- -----------------------------
- alpha = 1 - (1 - 0.05)**(1/4)
-
- results = st.ttest_ind(plants, kitchen, equal_var = False)
-
- print('p-значение:', results.pvalue)
-
- if (results.pvalue < alpha):
- print("Отвергаем нулевую гипотезу")
- else:
- print("Не получилось отвергнуть нулевую гипотезу")
- p-значение: [0.00113272]
- Отвергаем нулевую гипотезу
- Вывод: средний чек по категориям "растения" и "куханная утварь" различается
- -----------------------------
- alpha = 1 - (1 - 0.05)**(1/4)
-
- results = st.ttest_ind(house, artificial, equal_var = False)
-
- print('p-значение:', results.pvalue)
-
- if (results.pvalue < alpha):
- print("Отвергаем нулевую гипотезу")
- else:
- print("Не получилось отвергнуть нулевую гипотезу")
- p-значение: [0.00597875]
- Отвергаем нулевую гипотезу
- Вывод: средний чек по категориям "искусственные товары" и "хозяйственные товары" различается
- -----------------------------
- alpha = 1 - (1 - 0.05)**(1/4)
-
- results = st.ttest_ind(house, kitchen, equal_var = False)
-
- print('p-значение:', results.pvalue)
-
- if (results.pvalue < alpha):
- print("Отвергаем нулевую гипотезу")
- else:
- print("Не получилось отвергнуть нулевую гипотезу")
- p-значение: [4.96183504e-25]
- Отвергаем нулевую гипотезу
- Вывод: средний чек по категориям "кухонная утварь" и "хозяйственные товары" не различается
- -----------------------------
- alpha = 1 - (1 - 0.05)**(1/4)
-
- results = st.ttest_ind(kitchen, artificial, equal_var = False)
-
- print('p-значение:', results.pvalue)
-
- if (results.pvalue < alpha):
- print("Отвергаем нулевую гипотезу")
- else:
- print("Не получилось отвергнуть нулевую гипотезу")
- p-значение: [0.56750443]
- Не получилось отвергнуть нулевую гипотезу
- Вывод: средний чек по категориям "кухонная утварь" и "искусственные товары" не различается
- -----------------------------
- Результат проверки статистических гипотез:
- Средний чек не различается по категориям:
- "растения" и "искусственные растения, овощи и фрукты"
- "кухонная утварь" и "хозяйственные товары"
- "кухонная утварь" и "искусственные растения, овощи и фрукты"
- Средний чек различается по категориям:
- "растения" и "хозяйственные товары"
- "растения" и "куханная утварь"
- "искусственные растения, овощи и фрукты" и "хозяйственные товары"
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement