Advertisement
chevengur

СПРИНТ № 4 | Обработка ошибок. Исключения | Урок 3: Применяем класс optional

Dec 17th, 2023
1,047
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 11.93 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9. #include <optional>
  10.  
  11. using namespace std;
  12.  
  13. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  14.  
  15. string ReadLine() {
  16.     string s;
  17.     getline(cin, s);
  18.     return s;
  19. }
  20.  
  21. int ReadLineWithNumber() {
  22.     int result;
  23.     cin >> result;
  24.     ReadLine();
  25.     return result;
  26. }
  27.  
  28. vector<string> SplitIntoWords(const string& text) {
  29.     vector<string> words;
  30.     string word;
  31.     for (const char c : text) {
  32.         if (c == ' ') {
  33.             if (!word.empty()) {
  34.                 words.push_back(word);
  35.                 word.clear();
  36.             }
  37.         } else {
  38.             word += c;
  39.         }
  40.     }
  41.     if (!word.empty()) {
  42.         words.push_back(word);
  43.     }
  44.  
  45.     return words;
  46. }
  47.  
  48. struct Document {
  49.     Document() = default;
  50.  
  51.     Document(int id, double relevance, int rating)
  52.         : id(id)
  53.         , relevance(relevance)
  54.         , rating(rating) {
  55.     }
  56.  
  57.     int id = 0;
  58.     double relevance = 0.0;
  59.     int rating = 0;
  60. };
  61.  
  62. template <typename StringContainer>
  63. set<string> MakeUniqueNonEmptyStrings(const StringContainer& strings) {
  64.     set<string> non_empty_strings;
  65.     for (const string& str : strings) {
  66.         if (!str.empty()) {
  67.             non_empty_strings.insert(str);
  68.         }
  69.     }
  70.     return non_empty_strings;
  71. }
  72.  
  73. enum class DocumentStatus {
  74.     ACTUAL,
  75.     IRRELEVANT,
  76.     BANNED,
  77.     REMOVED,
  78. };
  79.  
  80. class SearchServer {
  81. public:
  82.  
  83.     inline static constexpr int INVALID_DOCUMENT_ID = -1;
  84.  
  85.     template <typename StringContainer>
  86.     explicit SearchServer(const StringContainer& stop_words)
  87.         : stop_words_(MakeUniqueNonEmptyStrings(stop_words)) {
  88.     }
  89.  
  90.     explicit SearchServer(const string& stop_words_text)
  91.         : SearchServer(
  92.             SplitIntoWords(stop_words_text))  // Invoke delegating constructor from string container
  93.     {
  94.     }
  95.  
  96.     bool AddDocument(int document_id, const string& document, DocumentStatus status,
  97.                                    const vector<int>& ratings) {
  98.         if (document_id < 0 || documents_.count(document_id) || IsValidWord(document)==false) {
  99.             return false;
  100.         }else{
  101.             const vector<string> words = SplitIntoWordsNoStop(document);
  102.             const double inv_word_count = 1.0 / words.size();
  103.             for (const string& word : words) {
  104.                 word_to_document_freqs_[word][document_id] += inv_word_count;
  105.             }
  106.             documents_.emplace(document_id, DocumentData{ComputeAverageRating(ratings), status});
  107.             document_ids.push_back(document_id);
  108.             return true;
  109.         }
  110.     }
  111.  
  112.     template <typename DocumentPredicate>
  113.     optional<vector<Document>> FindTopDocuments(const string& raw_query,
  114.                                         DocumentPredicate document_predicate) const {
  115.         if(IsValidQuery(raw_query)==false){
  116.             return nullopt;
  117.         }else{
  118.             optional<vector<Document>> result;
  119.             const Query query = ParseQuery(raw_query);
  120.             auto matched_documents = FindAllDocuments(query, document_predicate);
  121.             sort(matched_documents.begin(), matched_documents.end(),
  122.                  [](const Document& lhs, const Document& rhs) {
  123.                      if (abs(lhs.relevance - rhs.relevance) < 1e-6) {
  124.                          return lhs.rating > rhs.rating;
  125.                      } else {
  126.                          return lhs.relevance > rhs.relevance;
  127.                      }
  128.                  });
  129.             if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  130.                 matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  131.             }
  132.             result = matched_documents;
  133.             return result;
  134.         }
  135.     }
  136.  
  137.     optional<vector<Document>> FindTopDocuments(const string& raw_query, DocumentStatus status) const {
  138.         if(IsValidQuery(raw_query)==false) {
  139.             return nullopt;
  140.         }else{
  141.             return FindTopDocuments(
  142.                 raw_query, [status](int document_id, DocumentStatus document_status, int rating) {
  143.                     return document_status == status;
  144.                 });
  145.         }
  146.     }
  147.  
  148.     optional<vector<Document>> FindTopDocuments(const string& raw_query) const {
  149.         if(IsValidQuery(raw_query)==false) {
  150.             return nullopt;
  151.         }else{
  152.             return FindTopDocuments(raw_query, DocumentStatus::ACTUAL);
  153.         }
  154.     }
  155.  
  156.     int GetDocumentCount() const {
  157.         return documents_.size();
  158.     }
  159.  
  160.     optional<tuple<vector<string>, DocumentStatus>> MatchDocument(const string& raw_query,
  161.                                      int document_id) const {
  162.         if(IsValidQuery(raw_query)==false){
  163.             return nullopt;
  164.         }else{
  165.             const Query query = ParseQuery(raw_query);
  166.             vector<string> matched_words;
  167.             for (const string& word : query.plus_words) {
  168.                 if (word_to_document_freqs_.count(word) == 0) {
  169.                     continue;
  170.                 }
  171.                 if (word_to_document_freqs_.at(word).count(document_id)) {
  172.                     matched_words.push_back(word);
  173.                 }
  174.             }
  175.             for (const string& word : query.minus_words) {
  176.                 if (word_to_document_freqs_.count(word) == 0) {
  177.                     continue;
  178.                 }
  179.                 if (word_to_document_freqs_.at(word).count(document_id)) {
  180.                     matched_words.clear();
  181.                     break;
  182.                 }
  183.             }
  184.             auto result = tuple{matched_words, documents_.at(document_id).status};
  185.             return result;
  186.         }
  187.     }
  188.  
  189.     int GetDocumentId(const int index) const {
  190.         if(index<0 || !(index<GetDocumentCount())){
  191.             return SearchServer::INVALID_DOCUMENT_ID;
  192.         }
  193.         return document_ids[index];
  194.     }
  195.  
  196. private:
  197.     struct DocumentData {
  198.         int rating;
  199.         DocumentStatus status;
  200.     };
  201.     const set<string> stop_words_;
  202.     map<string, map<int, double>> word_to_document_freqs_;
  203.     map<int, DocumentData> documents_;
  204.     vector<int> document_ids;
  205.  
  206.     bool IsStopWord(const string& word) const {
  207.         return stop_words_.count(word) > 0;
  208.     }
  209.  
  210.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  211.         vector<string> words;
  212.         for (const string& word : SplitIntoWords(text)) {
  213.             if (!IsStopWord(word)) {
  214.                 words.push_back(word);
  215.             }
  216.         }
  217.         return words;
  218.     }
  219.  
  220.     static int ComputeAverageRating(const vector<int>& ratings) {
  221.         if (ratings.empty()) {
  222.             return 0;
  223.         }
  224.         int rating_sum = 0;
  225.         for (const int rating : ratings) {
  226.             rating_sum += rating;
  227.         }
  228.         return rating_sum / static_cast<int>(ratings.size());
  229.     }
  230.  
  231.     struct QueryWord {
  232.         string data;
  233.         bool is_minus;
  234.         bool is_stop;
  235.     };
  236.  
  237.     QueryWord ParseQueryWord(string text) const {
  238.         bool is_minus = false;
  239.         QueryWord result;
  240.         // Word shouldn't be empty
  241.         if (text[0] == '-') {
  242.             is_minus = true;
  243.             text = text.substr(1);
  244.         }
  245.         result = {text, is_minus, IsStopWord(text)};
  246.         return result;
  247.     }
  248.  
  249.     struct Query {
  250.         set<string> plus_words;
  251.         set<string> minus_words;
  252.     };
  253.  
  254.     Query ParseQuery(const string& text) const {
  255.         Query query;
  256.         for (const string& word : SplitIntoWords(text)) {
  257.             const QueryWord query_word = ParseQueryWord(word);
  258.             if (!query_word.is_stop) {
  259.                 if (query_word.is_minus) {
  260.                     query.minus_words.insert(query_word.data);
  261.                 } else {
  262.                     query.plus_words.insert(query_word.data);
  263.                 }
  264.             }
  265.         }
  266.         return query;
  267.     }
  268.  
  269.     // Existence required
  270.     double ComputeWordInverseDocumentFreq(const string& word) const {
  271.         return log(GetDocumentCount() * 1.0 / word_to_document_freqs_.at(word).size());
  272.     }
  273.  
  274.     template <typename DocumentPredicate>
  275.     vector<Document> FindAllDocuments(const Query& query,
  276.                                       DocumentPredicate document_predicate) const {
  277.         map<int, double> document_to_relevance;
  278.         for (const string& word : query.plus_words) {
  279.             if (word_to_document_freqs_.count(word) == 0) {
  280.                 continue;
  281.             }
  282.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  283.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  284.                 const auto& document_data = documents_.at(document_id);
  285.                 if (document_predicate(document_id, document_data.status, document_data.rating)) {
  286.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  287.                 }
  288.             }
  289.         }
  290.  
  291.         for (const string& word : query.minus_words) {
  292.             if (word_to_document_freqs_.count(word) == 0) {
  293.                 continue;
  294.             }
  295.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  296.                 document_to_relevance.erase(document_id);
  297.             }
  298.         }
  299.  
  300.         vector<Document> matched_documents;
  301.         for (const auto [document_id, relevance] : document_to_relevance) {
  302.             matched_documents.push_back(
  303.                 {document_id, relevance, documents_.at(document_id).rating});
  304.         }
  305.         return matched_documents;
  306.     }
  307.  
  308.     static bool IsValidWord(const string& word) {
  309.         return none_of(word.begin(), word.end(), [](char c) {
  310.             return c >= '\0' && c < ' ';
  311.         });
  312.     }
  313.  
  314.     static bool IsValidQuery(const string& raw_query) {
  315.         if(IsValidWord(raw_query)==false) {
  316.             return false;
  317.         }
  318.         for (int i = 0; i < raw_query.size(); ++i) {
  319.             if (raw_query[i] == '-' || raw_query[raw_query.size()-1]=='-') {
  320.                 if (raw_query[i + 1] == '-' || raw_query[i + 1] == ' ') {
  321.                     return false;
  322.                 }
  323.             }
  324.         }
  325.         return true;
  326.     }
  327. };
  328.  
  329. void PrintDocument(const Document& document) {
  330.     cout << "{ "s
  331.          << "document_id = "s << document.id << ", "s
  332.          << "relevance = "s << document.relevance << ", "s
  333.          << "rating = "s << document.rating << " }"s << endl;
  334. }
  335. int main() {
  336.     SearchServer search_server("и в на"s);
  337.     // Явно игнорируем результат метода AddDocument, чтобы избежать предупреждения
  338.     // о неиспользуемом результате его вызова
  339.     (void) search_server.AddDocument(1, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, {7, 2, 7});
  340.     if (!search_server.AddDocument(1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, {1, 2})) {
  341.         cout << "Документ не был добавлен, так как его id совпадает с уже имеющимся"s << endl;
  342.     }
  343.     if (!search_server.AddDocument(-1, "пушистый пёс и модный ошейник"s, DocumentStatus::ACTUAL, {1, 2})) {
  344.         cout << "Документ не был добавлен, так как его id отрицательный"s << endl;
  345.     }
  346.     if (!search_server.AddDocument(3, "большой пёс скво\x12рец"s, DocumentStatus::ACTUAL, {1, 3, 2})) {
  347.         cout << "Документ не был добавлен, так как содержит спецсимволы"s << endl;
  348.     }
  349.     if (const auto documents = search_server.FindTopDocuments("--пушистый"s)) {
  350.         for (const Document& document : *documents) {
  351.             PrintDocument(document);
  352.         }
  353.     } else {
  354.         cout << "Ошибка в поисковом запросе"s << endl;
  355.     }
  356. }
  357.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement