Untitled

# [사전 작업 사항] 데이터셋 나누기
set.seed(12345) # 시드를 설정
trn_idx <- sample(1:nrow(earthquate.data.scaled), 150000) # 15만개를 Training dataset으로 설정

earthquate_trn <- earthquate.data.scaled[trn_idx,] # 1차로 trn_idx에 해당하는 것으로 Training dataset 설정

earthquate_remain <- earthquate.data.scaled[-trn_idx,] # 그 후 남은 데이터 셋으로 새로 idx 추출
row.names(earthquate_remain) <- NULL # 인덱스 초기화
val_idx <- sample(1:nrow(earthquate_remain), 50000)
earthquate_val <- earthquate_remain[val_idx,] # 5만개로 Validation dataset 설정
earthquate_tst <- earthquate_remain[-val_idx,] # 20만개를 뺀 나머지를 test dataset으로 사용

# 데이터 축소
set.seed(12) # 시드를 바꿔줌
trn_nCar <- nrow(earthquate_trn)
trn_idx <- sample(1:trn_nCar, round(0.25*trn_nCar)) # 200개로 나누므로 숫자를 직접 입력
earthquate_trn <- earthquate_trn[trn_idx,]

set.seed(123) # 시드를 바꿔줌
val_nCar <- nrow(earthquate_val)
val_idx <- sample(1:val_nCar, round(0.25*val_nCar)) # 200개로 나누므로 숫자를 직접 입력
earthquate_val <- earthquate_val[val_idx,]

set.seed(1234) # 시드를 바꿔줌
tst_nCar <- nrow(earthquate_tst)
tst_idx <- sample(1:tst_nCar, round(0.25*tst_nCar)) # 200개로 나누므로 숫자를 직접 입력
earthquate_tst <- earthquate_tst[tst_idx,]

# 데이터셋 재선언
CART.trn <- data.frame(earthquate_trn[,-69], earthquateYN = earthquate_trn[,69]) # 종속변수 = 69번째 열
CART.val <- data.frame(earthquate_val[,-69], earthquateYN = earthquate_val[,69]) # 종속변수 = 69번째 열
CART.tst <- data.frame(earthquate_tst[,-69], earthquateYN = earthquate_tst[,69]) # 종속변수 = 69번째 열

ANN.trn.input <- earthquate_trn[,-69]
ANN.trn.target <- class.ind(earthquate_trn[,69])

ANN.val.input <- earthquate_val[,-69]
ANN.val.target <- class.ind(earthquate_val[,69])

ANN.tst.input <- earthquate_tst[,-69]
ANN.tst.target <- class.ind(earthquate_tst[,69])