Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import pandas as pd
- from sklearn.tree import DecisionTreeClassifier
- data = pd.read_csv('/datasets/heart.csv')
- features = data.drop(['target'], axis=1)
- target = data['target']
- scores = []
- # зададим размер блока, если их всего три
- block_size = int(len(data)/3)
- for i in range(0, len(data), sample_size):
- # < запишите массив из индексов для валидационного блока >
- valid_indexes = data.iloc[i: i + block_size].index
- # < запишите массив из индексов для обучающей выборки >
- train_indexes = (data.iloc[:i] + data.iloc[i + block_size:]).index
- # разбейте переменные features и target на выборки features_train, target_train, features_valid, target_valid
- # < напишите код здесь >
- features_train = features.iloc[train_indexes]
- features_valid = features.iloc[valid_indexes]
- target_train = target.iloc[train_indexes]
- target_valid = target.iloc[valid_indexes]
- model = DecisionTreeClassifier(random_state=0)
- model = model.fit(features_train, target_train)
- model_predictions = model.predict(features_train)
- # < оцените качество модели >
- score = f1_score(target_train, model_predictions)
- scores.append(score)
- final_score = score.mean()
- # < посчитайте среднее качество модели >
- print('Средняя оценка качества модели:', final_score)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement