Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- from sklearn.datasets import load_breast_cancer
- from sklearn.naive_bayes import GaussianNB
- from sklearn.metrics import accuracy_score
- from sklearn.cross_validation import train_test_split
- def bayes_gaussian():
- '''
- Klasyfikator: http://scikit-learn.org/stable/modules/naive_bayes.html
- '''
- # pobranie danych (to samo co z tego uci)
- cancer_data = load_breast_cancer()
- # przypisanie cech i wyjscia do zmiennych
- x = cancer_data.data # cechy
- y = cancer_data.target # wyjście
- # podział na zbiór uczący i testowy -> test_size to procent ktory maja zajmowac dane testowe z calego zbioru (max=1.0)
- x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=.2)
- # utworzenie klasyfikatora
- clf = GaussianNB()
- # uczenie klasyfikatora danymi uczącymi
- clf.fit(x_train, y_train)
- # testowanie klasyfikatora
- predictions = clf.predict(x_test)
- # obliczenie skuteczności (max = 1.0)
- accuracy = accuracy_score(y_test, predictions)
- print("Accuracy score: {}".format(accuracy))
- if __name__ == '__main__':
- bayes_gaussian()
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement