Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- # [사전 작업 사항] 데이터셋 나누기
- set.seed(12345) # 시드를 설정
- trn_idx <- sample(1:nrow(earthquate.data.scaled), 150000) # 15만개를 Training dataset으로 설정
- earthquate_trn <- earthquate.data.scaled[trn_idx,] # 1차로 trn_idx에 해당하는 것으로 Training dataset 설정
- earthquate_remain <- earthquate.data.scaled[-trn_idx,] # 그 후 남은 데이터 셋으로 새로 idx 추출
- row.names(earthquate_remain) <- NULL # 인덱스 초기화
- val_idx <- sample(1:nrow(earthquate_remain), 50000)
- earthquate_val <- earthquate_remain[val_idx,] # 5만개로 Validation dataset 설정
- earthquate_tst <- earthquate_remain[-val_idx,] # 20만개를 뺀 나머지를 test dataset으로 사용
- # 데이터 축소
- set.seed(12) # 시드를 바꿔줌
- trn_nCar <- nrow(earthquate_trn)
- trn_idx <- sample(1:trn_nCar, round(0.25*trn_nCar)) # 200개로 나누므로 숫자를 직접 입력
- earthquate_trn <- earthquate_trn[trn_idx,]
- set.seed(123) # 시드를 바꿔줌
- val_nCar <- nrow(earthquate_val)
- val_idx <- sample(1:val_nCar, round(0.25*val_nCar)) # 200개로 나누므로 숫자를 직접 입력
- earthquate_val <- earthquate_val[val_idx,]
- set.seed(1234) # 시드를 바꿔줌
- tst_nCar <- nrow(earthquate_tst)
- tst_idx <- sample(1:tst_nCar, round(0.25*tst_nCar)) # 200개로 나누므로 숫자를 직접 입력
- earthquate_tst <- earthquate_tst[tst_idx,]
- # 데이터셋 재선언
- CART.trn <- data.frame(earthquate_trn[,-69], earthquateYN = earthquate_trn[,69]) # 종속변수 = 69번째 열
- CART.val <- data.frame(earthquate_val[,-69], earthquateYN = earthquate_val[,69]) # 종속변수 = 69번째 열
- CART.tst <- data.frame(earthquate_tst[,-69], earthquateYN = earthquate_tst[,69]) # 종속변수 = 69번째 열
- ANN.trn.input <- earthquate_trn[,-69]
- ANN.trn.target <- class.ind(earthquate_trn[,69])
- ANN.val.input <- earthquate_val[,-69]
- ANN.val.target <- class.ind(earthquate_val[,69])
- ANN.tst.input <- earthquate_tst[,-69]
- ANN.tst.target <- class.ind(earthquate_tst[,69])
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement