Advertisement
Guest User

Untitled

a guest
Jan 23rd, 2018
59
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.61 KB | None | 0 0
  1. Witam,
  2. Zajrzałam do Pana danych, ma Pan do wyboru surowe (raw) i przetworzone już dane:
  3. E-GEOD-9829.processed.1.zip
  4. E-GEOD-9829.processed.2.zip
  5. E-GEOD-9829.processed.3.zip
  6. z tych 3 folderów z wszystkich plików wczytać VALUE i połączyć w jedną tabelę:
  7. nazwy wierszy to ID próbek czyli np. GSM248830, nazwy kolumn ID_REF czyli np. SNP_A-1909444
  8.  
  9. Poniżej widać jakie mamy podtypy nowotworu wczytane z danych klinicznych które możemy przewidywać korzystając z SVM
  10. i ile obserwacji mamy do każdego podtypu.
  11.  
  12. ########################
  13. library(data.table)
  14. ########signature database: EXP, RNA Transcript ID vs ID patents
  15. opis.data = read.delim2("C:/Users/aaaaaaaaaaaaaaaaaaaa/ownCloud/HepatocellularCarcinoma/data/E-GEOD-9829.sdrf.txt",
  16. skip=0, sep='\t')
  17. View(opis.data) # dim(RPM) # gene 21309 observation 288
  18. table(opis.data$FactorValue..CLASS.)
  19.  
  20. CTNNB1 inflammation not specified Polysomy chr7 Proliferation Unannotated
  21. 24 18 197 9 23 17
  22.  
  23. clin.data = read.delim2("C:/Users/aaaaaaaaaaaaaaaaaaaa/ownCloud/HepatocellularCarcinoma/data/GSE9829_clinical_info.txt",
  24. header = TRUE, skip=1, sep='\t')
  25. View(clin.data) # dim(RPM) #
  26. table(clin.data$Class) #molecular subtype (molekularne podtypy nowotworu)
  27.  
  28. CTNNB1 Inflammation Polysomy chr7 Proliferation Unannotated
  29. 20 24 18 9 23 17
  30. ###################################################################################
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement