Advertisement
Ekhel

Pandas Chapter II

Feb 7th, 2020
124
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 2.02 KB | None | 0 0
  1. """
  2. Melakukan Pengencekan Nilai Null
  3. """
  4.  
  5. import pandas as pd
  6. csv_data = pd.read_csv("realisasi.csv")
  7. print(csv_data.isnull().values.any())
  8.  
  9.  
  10. import pandas as pd
  11. csv_data = pd.read_csv("realisasi_missing.csv")
  12. print(csv_data.isnull().values.any())
  13.  
  14.  
  15. """
  16. Mengisi Dengan Mean
  17. """
  18.  
  19. import pandas as pd
  20. csv_data = pd.read_csv("realisasi_missing.csv")
  21. print(csv_data.mean())
  22.  
  23. print("Dataset yang masih terdapat nilai kosong ! :")
  24. print(csv_data.head(10))
  25.  
  26. csv_data=csv_data.fillna(csv_data.mean())
  27. print("Dataset yang sudah diproses Handling Missing Values dengan Mean :")
  28. print(csv_data.head(10))
  29.  
  30.  
  31. """
  32. Mengisi Dengan Median
  33. """
  34.  
  35. import pandas as pd
  36. csv_data = pd.read_csv("realisasi_missing.csv")
  37. print(csv_data.median())
  38.  
  39. """
  40. Sama dengan sesi sebelumnya dengan mean(). Untuk mengisi nilai yang kosong menggunakna fungsi fillna().
  41. """
  42.  
  43. import pandas as pd
  44. csv_data = pd.read_csv("realisasi_missing.csv")
  45. print("Dataset yang masih terdapat nilai kosong ! :")
  46. print(csv_data.head(10))
  47.  
  48. csv_data=csv_data.fillna(csv_data.median())
  49. print("Dataset yang sudah diproses Handling Missing Values dengan Median :")
  50. print(csv_data.head(10))
  51.  
  52. """
  53. Praktek Normalisasi menggunakan Scikit Learn pada Python
  54. """
  55.  
  56. import pandas as pd
  57. import numpy as np
  58. from sklearn import preprocessing
  59.  
  60.  
  61. csv_data = pd.read_csv("realisasi.csv")
  62. array = csv_data.values
  63. X = array[:,2:5] #memisahkan fitur dari dataset
  64. Y = array[:,0:1]  #memisahkan class dari dataset
  65.  
  66. dataset=pd.DataFrame({'Customer ID':array[:,0],'Gender':array[:,1],'Age':array[:,2],'Income':array[:,3],'Spending Score':array[:,4]})
  67. print("dataset sebelum dinormalisasi :")
  68. print(dataset.head(10))
  69.  
  70. min_max_scaler = preprocessing.MinMaxScaler(feature_range=(0,1)) #inisialisasi normalisasi MinMax
  71. data = min_max_scaler.fit_transform(X) #transformasi MinMax untuk fitur
  72. dataset = pd.DataFrame({'Age':data[:,0],'Income':data[:,1],'Spending Score':data[:,2],'Customer ID':array[:,0],'Gender':array[:,1]})
  73. print("dataset setelah dinormalisasi :")
  74. print(dataset.head(10))
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement