Advertisement
Guest User

k-means uwagi

a guest
May 26th, 2019
112
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.11 KB | None | 0 0
  1. Algorithmand -> Algorithm and
  2. various measures of cluster scatter -> z kodu nie widziałem nigdzie żebyście mierzyli cluster scatter. Ja jako cluster scatter rozumiem jakąś metrykę, która mówi jak bardzo dane wewnątrz klastra były zbliżone do siebie, i jak bardzo dane w różnych klastrach były od siebie oddalone. Można np liczyć średnią odległość każdych obserwacji wewnątrz klastra (to chcemy jak najmniejsze) i średnią odległość danych w różnych klastrach (to chcemy jak największe).
  3. number of clusters cannot exceed data dimension: Ja jako data dimension rozumiem to ile atrybutów(kolumn) jest w każdej obserwacji, wtedy nie wiem czemu miałby być wymóg żeby k było mniejsze niż data dimension. Jeśli jako data dimension rozumiesz liczbę obserwacji to ok.
  4. Body (???) of the function -> Zapewne chodzi o sygnaturę funkcji.
  5. verion of the function -> version of the function
  6. Difference in speed between functions - domyślam się który czas tyczy się której implementacji, ale nie jest to napisane w tekście. Dodatkowo możnaby zapuścić symulację kilka razy i wyciągnąc średnią.
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement