Advertisement
Guest User

Untitled

a guest
Dec 6th, 2016
761
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 3.09 KB | None | 0 0
  1. В этом задании вы сможете немного расслабиться после реализации случайного леса и градиентного бустинга по мотивам материалов прошлой недели. Все, что нужно будет делать — запускать методы из sklearn. Вам предлагается выяснить, какое распределение лучше использовать в наивном байесовском классификаторе в зависимости от вида признаков.
  2.  
  3. Загрузите датасеты digits и breast_cancer из sklearn.datasets. Выведите несколько строчек из обучающих выборок и посмотрите на признаки. С помощью sklearn.cross_validation.cross_val_score c настройками по умолчанию и вызова метода mean() у возвращаемого этой функцией numpy.ndarray, сравните качество работы наивных байесовских классификаторов на этих двух датасетах. Для сравнения предлагается использовать BernoulliNB, MultinomialNB и GaussianNB. Насколько полученные результаты согласуются с рекомендациями из лекций?
  4.  
  5. Два датасета, конечно, еще не повод делать далеко идущие выводы, но при желании вы можете продолжить исследование на других выборках (например, из UCI репозитория).
  6.  
  7. Для сдачи задания, ответьте на приведенные ниже вопросы.
  8.  
  9. Вопрос 1
  10.  
  11. Каким получилось максимальное качество классификации на датасете breast_cancer?
  12.  
  13. Вопрос 2
  14.  
  15. Каким получилось максимальное качество классификации на датасете digits?
  16.  
  17. Вопрос 3
  18.  
  19. Выберите верные утверждения и запишите их номера через пробел (в порядке возрастания номера):
  20.  
  21. 1) На вещественных признаках лучше всего сработал наивный байесовский классификатор с распределением Бернулли
  22.  
  23. 2) На вещественных признаках лучше всего сработал наивный байесовский классификатор с мультиномиальным распределением
  24.  
  25. 3) Мультиномиальное распределение лучше показало себя на выборке с целыми неотрицательными значениями признаков
  26.  
  27. 4) На вещественных признаках лучше всего сработало нормальное распределение
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement