Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- #1. Load dataset
- #impor library panda untuk membaca data
- import pandas
- # membaca file dan direktori tempat iris.data.csv disimpan
- direktori = "hepatisis.data.csv"
- # memberi nama variabel
- names = ['class','age', 'sex','steroid','antiviral','fatigue', 'malaise','anorexia','liver-big','liver-firm', 'spleen-palpable','spiders','ascites','varices', 'bilirubin','alk-phosphate','sgot','albumin', 'protime','histology']
- datamissing = pandas.read_csv(direktori, names=names, na_values=["?"])
- #panggil dataset
- array = datamissing.values
- # pisah input dan output
- x = array[:,0:19] #inputnya adalah kolom ke-0, 1, 2, 3
- y = array[:,0] #outputnya adalah kolom ke 4
- #imputasi mean
- imp = SimpleImputer(missing_values=np.nan, strategy="median")
- #simpan hasil imputasi ke dalam variable X
- X = imp.fit_transform(x)
- scaler = MinMaxScaler(feature_range=(0, 1))
- rescaledX = scaler.fit_transform(X)
- #2. Ringkasan dari dataset
- #mengecek jumlah baris dan kolom
- print(rescaledX.shape)
- #melihat 20 baris pertama dari dataset
- print(rescaledX.head(20))
- # melihat ringkasan statistik dari setiap atribut, yakni count, unique, top dan freq
- print(rescaledX.describe())
- #melihat detail data berdasarkan variabel, misal jumlah baris
- print(rescaledX.groupby('class').size())
- #Viasualisasi Dataset
- #UNIVARIATE PLOT untuk memahami tiap atribut/variable
- #Boxplot
- #import matplotlib.pyplot
- rescaledX.plot(kind='box', subplots=True, layout=(2,2), sharex=False, sharey=False)
- #plt.show() #not callable
- #Histogram
- #Box and Whisker Plots untuk membuat histogram setiap input variable, untuk mengetahui distribusi
- #histograms
- rescaledX.hist()
- #plt().show() #not callable
- #MULTIVARIATE PLOT untuk membantu memahami interaksi antar variable
- #Scatter Plot
- from pandas.plotting import scatter_matrix
- scatter_matrix(rescaledX)
- #pada diagoalnya terlihat korelasi yag sangat tinggi dan dapat diprediksi..
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement