Advertisement
Guest User

Untitled

a guest
Jan 19th, 2020
318
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 3.90 KB | None | 0 0
  1. Квалитет на воздух Problem 4 (0 / 0)
  2. Дадено е податочно множество за податоци на сензори (data) за проверка на квалитетот на воздухот за месец декември 2016 година. Податоците за квалитетот на воздухот се од општинскиот центар за мониторинг на животната средина во Пекинг. Секој ред од множеството претставува часовна вредност за следниве атрибути (сензори):
  3.  
  4. hour: час на податокот
  5. PM2.5: PM2.5 концентрација (ug/m^3)
  6. SO2: SO2 концентрација (ug/m^3)
  7. NO2: NO2 концентрација (ug/m^3)
  8. CO: CO концентрација (ug/m^3)
  9. O3: O3 концентрација (ug/m^3)
  10. TEMP: температура (Целзиусови степени)
  11. PRES: притисок (hPa)
  12. DEWP: температура на точка на росење (Целзиусови степени)
  13. RAIN: врнежи (mm)
  14. WSPM: брзина на ветер (m/s)
  15. Потребно е да направите модел на дрво на одлука со кој ќе се предвидува нивото на PM10 честички во воздухот (класите се дадени во променливта labels). Позитивната класа (1) означува висока концентрација на PM10 честички во воздухот, а негативната класа (0) го означува спротивниот случај. Податочното множество има непостоечки вредности означени со 'NA' (момент во кој сензорот не бил во функција). Овие вредности треба да се пополнат со статистиката stat (вредност прочитана од стандарден влез) на претходните 10 временски чекори од дадениот сензор (доколку во некоја од 10те претходни вредости повторно се појавува 'NA', таа вредност треба да се игнорира).
  16.  
  17. Потребно е да изградите модел за предвидување на класата на чекорот T, доколку се познати податоците до чекор T - 1. Користете два лизгачки прозорци со големина 3 и големина 8, каде што поместувањето е со вредност 1 за да го креирате податочното множество. Како карактеристики во податочното множество користете ги вредностите од средната вредност (mean) и максималната вредност (max). Податочното множество поделете го на податочно множество за тренирање со првите n проценти од секоја од класите, и множество за тестирање со следните (100-n) проценти од секоја од класите. Пресметајте точност, прецизност и одзив со помош на тестирачкото податочно множество.
  18.  
  19. точност = (tp + tn) / (tp + tn + fp + fn)
  20.  
  21. прецизност = tp / (tp + fp)
  22.  
  23. одзив = tp / (tp + fn)
  24. tp - број на точно предвидени позитивни класи
  25.  
  26. fp - број на грешно предвидени позитивни класи
  27.  
  28. tn - број на точно предвидени негативни класи
  29.  
  30. fn - број на грешно предвидени негативни класи
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement