Advertisement
SergeyNasekin

example 6

Jul 11th, 2022
1,006
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 8.00 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12.  
  13. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  14.  
  15. string ReadLine() {
  16.     string s;
  17.     getline(cin, s);
  18.     return s;
  19. }
  20.  
  21. int ReadLineWithNumber() {
  22.     int result;
  23.     cin >> result;
  24.     ReadLine();
  25.     return result;
  26. }
  27.  
  28. vector<string> SplitIntoWords(const string& text) {
  29.     vector<string> words;
  30.     string word;
  31.     for (const char c : text) {
  32.         if (c == ' ') {
  33.             if (!word.empty()) {
  34.                 words.push_back(word);
  35.                 word.clear();
  36.             }
  37.         } else {
  38.             word += c;
  39.         }
  40.     }
  41.     if (!word.empty()) {
  42.         words.push_back(word);
  43.     }
  44.  
  45.     return words;
  46. }
  47.  
  48. struct Document {
  49.     int id;
  50.     double relevance;
  51.     int rating;
  52. };
  53.  
  54. enum class DocumentStatus {
  55.     ACTUAL,
  56.     IRRELEVANT,
  57.     BANNED,
  58.     REMOVED,
  59. };
  60.  
  61. class SearchServer {
  62. public:
  63.     int GetDocumentCount() const {
  64.         return documents_.size();
  65.     }
  66.     void SetStopWords(const string& text) {
  67.         for (const string& word : SplitIntoWords(text)) {
  68.             stop_words_.insert(word);
  69.         }
  70.     }
  71.  
  72.     void AddDocument(int document_id, const string& document, DocumentStatus status, const vector<int>& ratings) {
  73.         const vector<string> words = SplitIntoWordsNoStop(document);
  74.         const double inv_word_count = 1.0 / words.size();
  75.         for (const string& word : words) {
  76.             word_to_document_freqs_[word][document_id] += inv_word_count;
  77.         }
  78.         documents_.emplace(document_id,
  79.                            DocumentData{
  80.                                    ComputeAverageRating(ratings),
  81.                                    status
  82.                            });
  83.     }
  84.  
  85.     vector<Document> FindTopDocuments(const string& raw_query, DocumentStatus status = DocumentStatus::ACTUAL) const {
  86.         const Query query = ParseQuery(raw_query);
  87.         auto matched_documents = FindAllDocuments(query, status);
  88.  
  89.         sort(matched_documents.begin(), matched_documents.end(),
  90.              [](const Document& lhs, const Document& rhs) {
  91.                  return lhs.relevance > rhs.relevance;
  92.              });
  93.         if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  94.             matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  95.         }
  96.         return matched_documents;
  97.     }
  98.  
  99.     tuple<vector<string>, DocumentStatus> MatchDocument(const string& raw_query, int document_id) const{
  100.         const Query query = ParseQuery(raw_query);
  101.         vector<string> result;
  102.         DocumentStatus status = documents_.at(document_id).status;
  103.         for(string word : query.minus_words){
  104.             if(word_to_document_freqs_.count(word)){
  105.                 return make_tuple(result,status);
  106.             }
  107.         }
  108.         for (string word : query.plus_words) {
  109.             if(word_to_document_freqs_.count(word)){
  110.                 result.push_back(word);
  111.             }
  112.         }
  113.         return make_tuple(result,status);
  114.     };
  115.  
  116. private:
  117.     struct DocumentData {
  118.         int rating;
  119.         DocumentStatus status;
  120.     };
  121.  
  122.     set<string> stop_words_;
  123.     map<string, map<int, double>> word_to_document_freqs_;
  124.     map<int, DocumentData> documents_;
  125.  
  126.     bool IsStopWord(const string& word) const {
  127.         return stop_words_.count(word) > 0;
  128.     }
  129.  
  130.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  131.         vector<string> words;
  132.         for (const string& word : SplitIntoWords(text)) {
  133.             if (!IsStopWord(word)) {
  134.                 words.push_back(word);
  135.             }
  136.         }
  137.         return words;
  138.     }
  139.  
  140.     static int ComputeAverageRating(const vector<int>& ratings) {
  141.         if (ratings.empty()) {
  142.             return 0;
  143.         }
  144.         int rating_sum = 0;
  145.         for (const int rating : ratings) {
  146.             rating_sum += rating;
  147.         }
  148.         return rating_sum / static_cast<int>(ratings.size());
  149.     }
  150.  
  151.     struct QueryWord {
  152.         string data;
  153.         bool is_minus;
  154.         bool is_stop;
  155.     };
  156.  
  157.     QueryWord ParseQueryWord(string text) const {
  158.         bool is_minus = false;
  159.         // Word shouldn't be empty
  160.         if (text[0] == '-') {
  161.             is_minus = true;
  162.             text = text.substr(1);
  163.         }
  164.         return {
  165.                 text,
  166.                 is_minus,
  167.                 IsStopWord(text)
  168.         };
  169.     }
  170.  
  171.     struct Query {
  172.         set<string> plus_words;
  173.         set<string> minus_words;
  174.     };
  175.  
  176.     Query ParseQuery(const string& text) const {
  177.         Query query;
  178.         for (const string& word : SplitIntoWords(text)) {
  179.             const QueryWord query_word = ParseQueryWord(word);
  180.             if (!query_word.is_stop) {
  181.                 if (query_word.is_minus) {
  182.                     query.minus_words.insert(query_word.data);
  183.                 } else {
  184.                     query.plus_words.insert(query_word.data);
  185.                 }
  186.             }
  187.         }
  188.         return query;
  189.     }
  190.  
  191.     // Existence required
  192.     double ComputeWordInverseDocumentFreq(const string& word) const {
  193.         return log(documents_.size() * 1.0 / word_to_document_freqs_.at(word).size());
  194.     }
  195.  
  196.     vector<Document> FindAllDocuments(const Query& query, DocumentStatus status) const {
  197.         map<int, double> document_to_relevance;
  198.         for (const string& word : query.plus_words) {
  199.             if (word_to_document_freqs_.count(word) == 0) {
  200.                 continue;
  201.             }
  202.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  203.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  204.                 if (documents_.at(document_id).status == status) {
  205.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  206.                 }
  207.             }
  208.         }
  209.  
  210.         for (const string& word : query.minus_words) {
  211.             if (word_to_document_freqs_.count(word) == 0) {
  212.                 continue;
  213.             }
  214.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  215.                 document_to_relevance.erase(document_id);
  216.             }
  217.         }
  218.  
  219.         vector<Document> matched_documents;
  220.         for (const auto [document_id, relevance] : document_to_relevance) {
  221.             matched_documents.push_back({
  222.                                                 document_id,
  223.                                                 relevance,
  224.                                                 documents_.at(document_id).rating
  225.                                         });
  226.         }
  227.         return matched_documents;
  228.     }
  229. };
  230.  
  231. void PrintMatchDocumentResult(int document_id, const vector<string>& words, DocumentStatus status) {
  232.     cout << "{ "s
  233.          << "document_id = "s << document_id << ", "s
  234.          << "status = "s << static_cast<int>(status) << ", "s
  235.          << "words ="s;
  236.     for (const string& word : words) {
  237.         cout << ' ' << word;
  238.     }
  239.     cout << "}"s << endl;
  240. }
  241.  
  242. int main() {
  243.     SearchServer search_server;
  244.     search_server.SetStopWords("и в на"s);
  245.  
  246.     search_server.AddDocument(0, "белый кот и модный ошейник"s,        DocumentStatus::ACTUAL, {8, -3});
  247.     search_server.AddDocument(1, "пушистый кот пушистый хвост"s,       DocumentStatus::ACTUAL, {7, 2, 7});
  248.     search_server.AddDocument(2, "ухоженный пёс выразительные глаза"s, DocumentStatus::ACTUAL, {5, -12, 2, 1});
  249.     search_server.AddDocument(3, "ухоженный скворец евгений"s,         DocumentStatus::BANNED, {9});
  250.  
  251.     const int document_count = search_server.GetDocumentCount();
  252.     for (int document_id = 0; document_id < document_count; ++document_id) {
  253.         const auto [words, status] = search_server.MatchDocument("пушистый кот"s, document_id);
  254.         PrintMatchDocumentResult(document_id, words, status);
  255.     }
  256. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement