SHARE
TWEET

k-means uwagi

a guest May 26th, 2019 73 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. Algorithmand -> Algorithm and
  2. various measures of cluster scatter -> z kodu nie widziałem nigdzie żebyście mierzyli cluster scatter. Ja jako cluster scatter rozumiem jakąś metrykę, która mówi jak bardzo dane wewnątrz klastra były zbliżone do siebie, i jak bardzo dane w różnych klastrach były od siebie oddalone. Można np liczyć średnią odległość każdych obserwacji wewnątrz klastra (to chcemy jak najmniejsze) i średnią odległość danych w różnych klastrach (to chcemy jak największe).
  3. number of clusters cannot exceed data dimension: Ja jako data dimension rozumiem to ile atrybutów(kolumn) jest w każdej obserwacji, wtedy nie wiem czemu miałby być wymóg żeby k było mniejsze niż data dimension. Jeśli jako data dimension rozumiesz liczbę obserwacji to ok.
  4. Body (???) of the function -> Zapewne chodzi o sygnaturę funkcji.
  5. verion of the function -> version of the function
  6. Difference in speed between functions - domyślam się który czas tyczy się której implementacji, ale nie jest to napisane w tekście. Dodatkowo możnaby zapuścić symulację kilka razy i wyciągnąc średnią.
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
 
Top