Advertisement
force1987

#!@*&

Nov 24th, 2022 (edited)
695
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 12.46 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  13.  
  14. string ReadLine() {
  15.     string s;
  16.     getline(cin, s);
  17.     return s;
  18. }
  19.  
  20. int ReadLineWithNumber() {
  21.     int result;
  22.     cin >> result;
  23.     ReadLine();
  24.     return result;
  25. }
  26. bool IsValidChar(const char& symbol) {
  27.         return symbol >= '\0' && symbol < ' ';
  28. }
  29. vector<string> SplitIntoWords(const string& text) {
  30.     vector<string> words;
  31.     string word;
  32.     for (const char c : text) {
  33.         if (c == ' ') {
  34.             if (!word.empty()) {
  35.                 words.push_back(word);
  36.                 word.clear();
  37.             }
  38.         }
  39.         else if (IsValidChar(c)) {
  40.             words.clear();
  41.             return words;
  42.         }
  43.         else {
  44.             word += c;
  45.         }
  46.     }
  47.     if (!word.empty()) {
  48.         words.push_back(word);
  49.     }
  50.  
  51.     return words;
  52. }
  53.  
  54. struct Document {
  55.     Document() = default;
  56.  
  57.     Document(int id, double relevance, int rating)
  58.         : id(id)
  59.         , relevance(relevance)
  60.         , rating(rating) {
  61.     }
  62.  
  63.     int id = 0;
  64.     double relevance = 0.0;
  65.     int rating = 0;
  66. };
  67.  
  68. template <typename StringContainer>
  69. set<string> MakeUniqueNonEmptyStrings(const StringContainer& strings) {
  70.     set<string> non_empty_strings;
  71.     for (const string& str : strings) {
  72.         if (!str.empty()) {
  73.             non_empty_strings.insert(str);
  74.         }
  75.     }
  76.     return non_empty_strings;
  77. }
  78.  
  79. enum class DocumentStatus {
  80.     ACTUAL,
  81.     IRRELEVANT,
  82.     BANNED,
  83.     REMOVED,
  84. };
  85.  
  86. class SearchServer {
  87. public:
  88.     // Defines an invalid document id
  89.         // You can refer to this constant as SearchServer::INVALID_DOCUMENT_ID
  90.     inline static constexpr int INVALID_DOCUMENT_ID = -1;
  91.     template <typename StringContainer>
  92.     explicit SearchServer(const StringContainer& stop_words)
  93.         : stop_words_(MakeUniqueNonEmptyStrings(stop_words)) {
  94.         counter = 0;
  95.     }
  96.  
  97.     explicit SearchServer(const string& stop_words_text)
  98.         : SearchServer(
  99.             SplitIntoWords(stop_words_text))  // Invoke delegating constructor from string container
  100.     {
  101.     }
  102.  
  103.     [[nodiscard]] bool AddDocument(int document_id, const string& document, DocumentStatus status,
  104.         const vector<int>& ratings) {
  105.         if (document_id < 0)
  106.             return false;
  107.         if (documents_.find(document_id) == documents_.end()) {
  108.             const vector<string> words = SplitIntoWordsNoStop(document);
  109.             const double inv_word_count = 1.0 / words.size();
  110.             for (const string& word : words) {
  111.                 if (!IsValidWord(word))
  112.                     return false;
  113.                 word_to_document_freqs_[word][document_id] += inv_word_count;
  114.             }
  115.             documents_.emplace(document_id, DocumentData{ ComputeAverageRating(ratings), status ,counter++ });
  116.             return true;
  117.         }
  118.         else {
  119.             return false;
  120.         }
  121.     }
  122.  
  123.     template <typename DocumentPredicate>
  124.     [[nodiscard]] bool FindTopDocuments(const string& raw_query,
  125.         DocumentPredicate document_predicate, vector<Document>& result) const {
  126.         const Query query = ParseQuery(raw_query);
  127.         if (query.plus_words.empty())
  128.             return false;
  129.         result = FindAllDocuments(query, document_predicate);
  130.         if (result.empty())
  131.             return false;
  132.         sort(result.begin(), result.end(),
  133.             [](const Document& lhs, const Document& rhs) {
  134.                 if (abs(lhs.relevance - rhs.relevance) < 1e-6) {
  135.                     return lhs.rating > rhs.rating;
  136.                 }
  137.                 else {
  138.                     return lhs.relevance > rhs.relevance;
  139.                 }
  140.             });
  141.         if (result.size() > MAX_RESULT_DOCUMENT_COUNT) {
  142.             result.resize(MAX_RESULT_DOCUMENT_COUNT);
  143.         }
  144.         return true;
  145.     }
  146.  
  147.     [[nodiscard]] bool FindTopDocuments(const string& raw_query, DocumentStatus status, vector<Document>& result) const {
  148.         return FindTopDocuments(
  149.             raw_query, [status](int document_id, DocumentStatus document_status, int rating) {
  150.                 return document_status == status;
  151.             }, result);
  152.     }
  153.  
  154.     [[nodiscard]] bool FindTopDocuments(const string& raw_query, vector<Document>& result) const {
  155.         return FindTopDocuments(raw_query, DocumentStatus::ACTUAL, result);
  156.     }
  157.  
  158.     int GetDocumentCount() const {
  159.         return static_cast<int>(documents_.size());
  160.     }
  161.  
  162.     [[nodiscard]] bool MatchDocument(const string& raw_query,
  163.         int document_id, tuple<vector<string>, DocumentStatus>& result) const {
  164.         const Query query = ParseQuery(raw_query);
  165.         if (query.plus_words.empty())
  166.             return false;
  167.         vector<string> matched_words;
  168.         for (const string& word : query.plus_words) {
  169.             if (!IsValidWord(word))
  170.                 return false;
  171.             if (word_to_document_freqs_.count(word) == 0) {
  172.                 continue;
  173.             }
  174.             if (word_to_document_freqs_.at(word).count(document_id)) {
  175.                 matched_words.push_back(word);
  176.             }
  177.         }
  178.         for (const string& word : query.minus_words) {
  179.             if (!IsValidWord(word))
  180.                 return false;
  181.             if (word_to_document_freqs_.count(word) == 0) {
  182.                 continue;
  183.             }
  184.             if (word_to_document_freqs_.at(word).count(document_id)) {
  185.                 matched_words.clear();
  186.                 break;
  187.             }
  188.         }
  189.         result = make_tuple(matched_words, documents_.at(document_id).status);
  190.         return true;
  191.     }
  192.  
  193.     int GetDocumentId(int index) const {
  194.         for (const auto& [id, data] : documents_) {
  195.             if (data.index == index)
  196.                 return id;
  197.         }
  198.         return SearchServer::INVALID_DOCUMENT_ID;
  199.     }
  200.  
  201. private:
  202.     struct DocumentData {
  203.         int rating;
  204.         DocumentStatus status;
  205.         int index;
  206.     };
  207.     const set<string> stop_words_;
  208.     map<string, map<int, double>> word_to_document_freqs_;
  209.     map<int, DocumentData> documents_;
  210.     int counter;
  211.  
  212.     bool IsStopWord(const string& word) const {
  213.         return stop_words_.count(word) > 0;
  214.     }
  215.  
  216.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  217.         vector<string> words;
  218.         for (const string& word : SplitIntoWords(text)) {
  219.             if (!IsStopWord(word)) {
  220.                 words.push_back(word);
  221.             }
  222.         }
  223.         return words;
  224.     }
  225.  
  226.     static int ComputeAverageRating(const vector<int>& ratings) {
  227.         if (ratings.empty()) {
  228.             return 0;
  229.         }
  230.         int rating_sum = 0;
  231.         for (const int rating : ratings) {
  232.             rating_sum += rating;
  233.         }
  234.         return rating_sum / static_cast<int>(ratings.size());
  235.     }
  236.  
  237.     struct QueryWord {
  238.         string data;
  239.         bool is_minus;
  240.         bool is_stop;
  241.     };
  242.  
  243.     QueryWord ParseQueryWord(string text) const {
  244.         bool is_minus = false;
  245.         // Word shouldn't be empty
  246.         while (text[0] == '-') {
  247.             if (text.size() > 1) {
  248.                 is_minus = true;
  249.                 text = text.substr(1);
  250.             }
  251.             else {
  252.                 return{ "",is_minus,IsStopWord(text) };
  253.             }
  254.         }
  255.         return { text, is_minus, IsStopWord(text) };
  256.     }
  257.  
  258.     struct Query {
  259.         set<string> plus_words;
  260.         set<string> minus_words;
  261.     };
  262.  
  263.     Query ParseQuery(const string& text) const {
  264.         Query query;
  265.         for (const string& word : SplitIntoWords(text)) {
  266.             if (!IsValidWord(word))
  267.                 return query;
  268.             const QueryWord query_word = ParseQueryWord(word);
  269.             if (query_word.data != "") {
  270.                 if (!query_word.is_stop) {
  271.                     if (query_word.is_minus) {
  272.                         query.minus_words.insert(query_word.data);
  273.                     }
  274.                     else {
  275.                         query.plus_words.insert(query_word.data);
  276.                     }
  277.                 }
  278.             }
  279.             else {
  280.                 query.plus_words.clear();
  281.                 return query;
  282.             }
  283.         }
  284.         return query;
  285.     }
  286.  
  287.     // Existence required
  288.     double ComputeWordInverseDocumentFreq(const string& word) const {
  289.         return log(GetDocumentCount() * 1.0 / word_to_document_freqs_.at(word).size());
  290.     }
  291.  
  292.     template <typename DocumentPredicate>
  293.     vector<Document> FindAllDocuments(const Query& query,
  294.         DocumentPredicate document_predicate) const {
  295.         map<int, double> document_to_relevance;
  296.         for (const string& word : query.plus_words) {
  297.             if (!IsValidWord(word))
  298.                 return {};
  299.             if (word_to_document_freqs_.count(word) == 0) {
  300.                 continue;
  301.             }
  302.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  303.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  304.                 const auto& document_data = documents_.at(document_id);
  305.                 if (document_predicate(document_id, document_data.status, document_data.rating)) {
  306.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  307.                 }
  308.             }
  309.         }
  310.  
  311.         for (const string& word : query.minus_words) {
  312.             if (!IsValidWord(word))
  313.                 return {};
  314.             if (word_to_document_freqs_.count(word) == 0) {
  315.                 continue;
  316.             }
  317.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  318.                 document_to_relevance.erase(document_id);
  319.             }
  320.         }
  321.  
  322.         vector<Document> matched_documents;
  323.         for (const auto [document_id, relevance] : document_to_relevance) {
  324.             matched_documents.push_back(
  325.                 { document_id, relevance, documents_.at(document_id).rating });
  326.         }
  327.         return matched_documents;
  328.     }
  329.  
  330.     static bool IsValidWord(const string& word) {
  331.         // A valid word must not contain special characters
  332.         return none_of(word.begin(), word.end(), [](char c) {
  333.             return c >= '\0' && c < ' ';
  334.             });
  335.     }
  336. };
  337.  
  338. // ==================== для примера =========================
  339.  
  340. void PrintDocument(const Document& document) {
  341.     cout << "{ "s
  342.         << "document_id = "s << document.id << ", "s
  343.         << "relevance = "s << document.relevance << ", "s
  344.         << "rating = "s << document.rating << " }"s << endl;
  345. }
  346. int main() {
  347.     setlocale(LC_ALL, "rus");
  348.     SearchServer search_server("и в на"s);
  349.     // Явно игнорируем результат метода AddDocument, чтобы избежать предупреждения
  350.     // о неиспользуемом результате его вызова
  351.     (void)search_server.AddDocument(1, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, { 7, 2, 7 });
  352.     /*if (!search_server.AddDocument(1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 })) {
  353.         cout << "Документ не был добавлен, так как его id совпадает с уже имеющимся"s << endl;
  354.     }
  355.     if (!search_server.AddDocument(-1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, { 1, 2 })) {
  356.         cout << "Документ не был добавлен, так как его id отрицательный"s << endl;
  357.     }
  358.     if (!search_server.AddDocument(3, "большой пёс скво\x12рец"s, DocumentStatus::ACTUAL, { 1, 3, 2 })) {
  359.         cout << "Документ не был добавлен, так как содержит спецсимволы"s << endl;
  360.     }*/
  361.     vector<Document> documents;
  362.     /*if (search_server.FindTopDocuments("--пушистый"s, documents)) {
  363.         for (const Document& document : documents) {
  364.             PrintDocument(document);
  365.         }
  366.     }
  367.     else {
  368.         cout << "Ошибка в поисковом запросе"s << endl;
  369.     }*/
  370.     if (!search_server.FindTopDocuments("на", documents)) {
  371.         cout << "Работает"<<endl;
  372.     }
  373.     if (!search_server.FindTopDocuments(char(4)+"кот"s+char(10), documents)) {
  374.         cout << "Работает" << endl;
  375.     }
  376. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement