Advertisement
Guest User

Untitled

a guest
Dec 15th, 2019
333
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 4.58 KB | None | 0 0
  1. from math import sqrt
  2. movie_reviews = {
  3.     'Lisa Rose': {'Catch Me If You Can': 3.0, 'Snakes on a Plane': 3.5, 'Superman Returns': 3.5,
  4.                   'You, Me and Dupree': 2.5, 'The Night Listener': 3.0, 'Snitch': 3.0},
  5.     'Gene Seymour': {'Lady in the Water': 3.0, 'Snakes on a Plane': 3.5, 'Just My Luck': 1.5, 'The Night Listener': 3.0,
  6.                      'You, Me and Dupree': 3.5},
  7.     'Michael Phillips': {'Catch Me If You Can': 2.5, 'Lady in the Water': 2.5, 'Superman Returns': 3.5,
  8.                          'The Night Listener': 4.0, 'Snitch': 2.0},
  9.     'Claudia Puig': {'Snakes on a Plane': 3.5, 'Just My Luck': 3.0, 'The Night Listener': 4.5, 'Superman Returns': 4.0,
  10.                      'You, Me and Dupree': 2.5},
  11.     'Mick LaSalle': {'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0, 'Just My Luck': 2.0, 'Superman Returns': 3.0,
  12.                      'You, Me and Dupree': 2.0},
  13.     'Jack Matthews': {'Catch Me If You Can': 4.5, 'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0,
  14.                       'The Night Listener': 3.0, 'Superman Returns': 5.0, 'You, Me and Dupree': 3.5, 'Snitch': 4.5},
  15.     'Toby': {'Snakes on a Plane': 4.5, 'Snitch': 5.0},
  16.     'Michelle Nichols': {'Just My Luck': 1.0, 'The Night Listener': 4.5, 'You, Me and Dupree': 3.5,
  17.                          'Catch Me If You Can': 2.5, 'Snakes on a Plane': 3.0},
  18.     'Gary Coleman': {'Lady in the Water': 1.0, 'Catch Me If You Can': 1.5, 'Superman Returns': 1.5,
  19.                      'You, Me and Dupree': 2.0},
  20.     'Larry': {'Lady in the Water': 3.0, 'Just My Luck': 3.5, 'Snitch': 1.5, 'The Night Listener': 3.5}
  21. }
  22.  
  23. def sim_distance(reviews, person1, person2):
  24.     # Se pravi lista na zaednicki predmeti (filmovi)
  25.  
  26.     filmovi1=set(reviews[person1].keys())
  27.     filmovi2=set(reviews[person2].keys())
  28.     zaednicki = filmovi1.intersection(filmovi2)
  29. #     print(filmovi1)
  30. #     print(filmovi2)
  31. #     print(zaednicki)
  32. #     for item in oceni[person1].keys():
  33. #         if item in oceni[person2]:
  34. #             zaednicki.add(item)
  35. #     # ako nemaat zaednicki rejtinzi, vrati 0
  36.     if len(zaednicki) == 0: return 0
  37. #     # Soberi gi kvadratite na zaednickite razliki
  38.     suma = 0.0
  39.     for item in zaednicki:
  40.         ocena1 = reviews[person1][item]
  41.         ocena2 = reviews[person2][item]
  42.         suma += (ocena1 - ocena2) ** 2
  43. #         print(item, person1, ocena1, person2, ocena2)
  44.  
  45.     return round(1 / (1 + sqrt(suma)),3)
  46.  
  47. # Go vrakja koeficientot na Pearsonova korelacija pomegu p1 i p2 (licnost 1 i licnost 2)
  48. # Vrednostite se pomegu -1 i 1
  49. def sim_pearson(reviews, p1, p2):
  50.     # Se kreira recnik vo koj ke se cuvaat predmetite (filmovi) koi se oceneti od dvajcata
  51.     # Vo recnikot ni se vazni samo klucevite za da gi cuvame iminjata na filmovite koi se zaednicki, a vrednostite ne ni se vazni
  52.     zaednicki = set()
  53.     for item in reviews[p1]:
  54.         if item in reviews[p2]:
  55.             zaednicki.add(item)
  56.  
  57.     # Se presmetuva brojot na predmeti oceneti od dvajcata
  58.     n = len(zaednicki)
  59.  
  60.     # Ako nemaat zaednicki predmeti vrati korelacija 0
  61.     if n == 0: return 0
  62.  
  63.     # Soberi gi zaednickite oceni (rejtinzi) za  sekoja licnost posebno
  64.     sum1 = 0
  65.     sum2 = 0
  66.  
  67.     # Soberi gi kvadratite od zaednickite oceni (rejtinzi) za  sekoja licnost posebno
  68.     sum1Sq = 0
  69.     sum2Sq = 0
  70.  
  71.     # Soberi gi proizvodite od ocenite na dvete licnosti
  72.     pSum = 0
  73.     for item in zaednicki:
  74.         ocena1 = reviews[p1][item]
  75.         ocena2 = reviews[p2][item]
  76.         sum1 += ocena1
  77.         sum1Sq += ocena1 ** 2
  78.         sum2 += ocena2
  79.         sum2Sq += ocena2 ** 2
  80.         pSum += ocena1 * ocena2
  81.  
  82.     # Presmetaj go koeficientot na korelacija
  83.     num = pSum - (sum1 * sum2 / n)
  84.     den = sqrt((sum1Sq - pow(sum1, 2) / n) * (sum2Sq - pow(sum2, 2) / n))
  85.     if den == 0: return 0
  86.     r = num / den
  87.     return round(r,3)
  88.  
  89. def zaednicki (reviews, p1, p2):
  90.     zaednicki = set()
  91.  
  92.     for item in reviews[p1]:
  93.         if item in reviews[p2]:
  94.             zaednicki.add(item)
  95.  
  96.     return len(zaednicki)
  97.  
  98. def tabela_na_slichni_korisnici(reviews):
  99.     slicnosti = {}
  100.     for item in reviews:
  101.         slicnosti[item] = {}
  102.         for item2 in reviews:
  103.             if (item != item2):
  104.                 sim1 = sim_distance(reviews,item,item2)
  105.                 sim2 = sim_pearson(reviews,item,item2)
  106.                 slicnosti[item][item2] = (sim1,sim2,zaednicki(reviews,item,item2))
  107.     return slicnosti
  108.  
  109.  
  110. if __name__ == "__main__":
  111.     korisnik1 = input()
  112.     korisnik2 = input()
  113.  
  114.     tabela = tabela_na_slichni_korisnici(movie_reviews)
  115.     print(tabela[korisnik1][korisnik2])
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement