nanorocks

recommenden_systems_lab22_ex

May 20th, 2018
192
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 4.55 KB | None | 0 0
  1. # -*- coding: utf-8 -*-
  2.  
  3. """
  4. Да се напишат функции за пресметување на сличност базирани на Пеарсонова корелација и
  5. Евклидово растојание кои ќе враќаат торка од сличноста и бројот на заеднички елементи. За прочитани имиња
  6. на двајца корисници да се испечатата торките што ги враќаат двете функции.
  7. """
  8.  
  9.  
  10. oceniPoKorisnici={
  11.     'Lisa Rose': {'Catch Me If You Can': 3.0 , 'Snakes on a Plane': 3.5, 'Superman Returns': 3.5, 'You, Me and Dupree': 2.5, 'The Night Listener': 3.0, 'Snitch': 3.0},
  12.     'Gene Seymour': {'Lady in the Water': 3.0, 'Snakes on a Plane': 3.5, 'Just My Luck': 1.5,  'The Night Listener': 3.0,'You, Me and Dupree': 3.5},
  13.     'Michael Phillips': {'Catch Me If You Can': 2.5, 'Lady in the Water': 2.5,'Superman Returns': 3.5, 'The Night Listener': 4.0, 'Snitch': 2.0},
  14.     'Claudia Puig': {'Snakes on a Plane': 3.5, 'Just My Luck': 3.0,'The Night Listener': 4.5, 'Superman Returns': 4.0,'You, Me and Dupree': 2.5},
  15.     'Mick LaSalle': {'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0,'Just My Luck': 2.0, 'Superman Returns': 3.0, 'You, Me and Dupree': 2.0},
  16.     'Jack Matthews': {'Catch Me If You Can': 4.5, 'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0,'The Night Listener': 3.0, 'Superman Returns': 5.0, 'You, Me and Dupree': 3.5, 'Snitch': 4.5},
  17.     'Toby': {'Snakes on a Plane':4.5, 'Snitch': 5.0},
  18.     'Michelle Nichols': {'Just My Luck' : 1.0, 'The Night Listener': 4.5, 'You, Me and Dupree': 3.5, 'Catch Me If You Can': 2.5, 'Snakes on a Plane': 3.0},
  19.     'Gary Coleman': {'Lady in the Water': 1.0, 'Catch Me If You Can': 1.5, 'Superman Returns': 1.5, 'You, Me and Dupree': 2.0},
  20.     'Larry': {'Lady in the Water': 3.0, 'Just My Luck': 3.5, 'Snitch': 1.5, 'The Night Listener': 3.5}
  21.     }
  22.  
  23.  
  24. from math import sqrt
  25.  
  26.  
  27. # Vrakja merka za slicnost bazirana na rastojanieto za person1 i person2
  28. def sim_distance(oceni, person1, person2):
  29.     # Se pravi lista na zaednicki predmeti (filmovi)
  30.  
  31.     filmovi1=set(oceni[person1].keys())
  32.     filmovi2=set(oceni[person2].keys())
  33.     zaednicki = filmovi1.intersection(filmovi2)
  34. #     print(filmovi1)
  35. #     print(filmovi2)
  36. #     print(zaednicki)
  37. #     for item in oceni[person1].keys():
  38. #         if item in oceni[person2]:
  39. #             zaednicki.add(item)
  40. #     # ako nemaat zaednicki rejtinzi, vrati 0
  41.     if len(zaednicki) == 0: return 0
  42. #     # Soberi gi kvadratite na zaednickite razliki
  43.     suma = 0.0
  44.     for item in zaednicki:
  45.         ocena1 = oceni[person1][item]
  46.         ocena2 = oceni[person2][item]
  47.         suma += (ocena1 - ocena2) ** 2
  48. #         print(item, person1, ocena1, person2, ocena2)
  49.  
  50.     return round(1 / (1 + sqrt(suma)), 3), len(zaednicki)
  51.  
  52.  
  53. # Go vrakja koeficientot na Pearsonova korelacija pomegu p1 i p2 (licnost 1 i licnost 2)
  54. # Vrednostite se pomegu -1 i 1
  55. def sim_pearson(oceni, p1, p2):
  56.     # Se kreira recnik vo koj ke se cuvaat predmetite (filmovi) koi se oceneti od dvajcata
  57.     # Vo recnikot ni se vazni samo klucevite za da gi cuvame iminjata na filmovite koi se zaednicki, a vrednostite ne ni se vazni
  58.     zaednicki = set()
  59.     for item in oceni[p1]:
  60.         if item in oceni[p2]:
  61.             zaednicki.add(item)
  62.  
  63.     # Se presmetuva brojot na predmeti oceneti od dvajcata
  64.     n = len(zaednicki)
  65.  
  66.     # Ako nemaat zaednicki predmeti vrati korelacija 0
  67.     if n == 0: return 0
  68.  
  69.     # Soberi gi zaednickite oceni (rejtinzi) za  sekoja licnost posebno
  70.     sum1 = 0
  71.     sum2 = 0
  72.  
  73.     # Soberi gi kvadratite od zaednickite oceni (rejtinzi) za  sekoja licnost posebno
  74.     sum1Sq = 0
  75.     sum2Sq = 0
  76.  
  77.     # Soberi gi proizvodite od ocenite na dvete licnosti
  78.     pSum = 0
  79.     for item in zaednicki:
  80.         ocena1 = oceni[p1][item]
  81.         ocena2 = oceni[p2][item]
  82.         sum1 += ocena1
  83.         sum1Sq += ocena1 ** 2
  84.         sum2 += ocena2
  85.         sum2Sq += ocena2 ** 2
  86.         pSum += ocena1 * ocena2
  87.  
  88.     # Presmetaj go koeficientot na korelacija
  89.     num = pSum - (sum1 * sum2 / n)
  90.     den = sqrt((sum1Sq - pow(sum1, 2) / n) * (sum2Sq - pow(sum2, 2) / n))
  91.     if den == 0: return 0
  92.     r = num / den
  93.     return round(r, 3), len(zaednicki)
  94.  
  95.  
  96.  
  97.  
  98. if __name__ == '__main__':
  99.  
  100.     korisnik1 = 'Jack Matthews' # input()
  101.     korisnik2 = 'Gene Seymour'  # input()
  102.  
  103.     #korisnik1 = input()
  104.     #korisnik2 = input()
  105.  
  106.  
  107.     print sim_pearson(oceniPoKorisnici, korisnik1, korisnik2)
  108.     print sim_distance(oceniPoKorisnici, korisnik1, korisnik2)
Add Comment
Please, Sign In to add comment