Untitled

from sklearn.datasets import load_breast_cancer
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score
from sklearn.cross_validation import train_test_split


def bayes_gaussian():
    '''
    Klasyfikator: http://scikit-learn.org/stable/modules/naive_bayes.html
    '''

    # pobranie danych (to samo co z tego uci)
    cancer_data = load_breast_cancer()

    # przypisanie cech i wyjscia do zmiennych
    x = cancer_data.data  # cechy
    y = cancer_data.target  # wyjście

    # podział na zbiór uczący i testowy -> test_size to procent ktory maja zajmowac dane testowe z calego zbioru (max=1.0)
    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=.2)

    # utworzenie klasyfikatora
    clf = GaussianNB()

    # uczenie klasyfikatora danymi uczącymi
    clf.fit(x_train, y_train)

    # testowanie klasyfikatora
    predictions = clf.predict(x_test)

    # obliczenie skuteczności (max = 1.0)
    accuracy = accuracy_score(y_test, predictions)
    print("Accuracy score: {}".format(accuracy))


if __name__ == '__main__':
    bayes_gaussian()