Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- public static void AnalyzeFolder(string dirpath, string xpath, form1 form, RichTextBox richTextBox)
- {
- //vygenerování polí pro výsledek a počet výsledků
- ArrayList vysledky = new ArrayList();
- ArrayList pocty = new ArrayList();
- pocty.Add(0);
- vysledky.Add("Dokument neobsahuje nic podle zadaných kritérií (XPATH)");
- DirectoryInfo dir = new DirectoryInfo(dirpath);
- FileInfo[] fi = dir.GetFiles("*.html");
- foreach (FileInfo file in fi)
- {
- //složka načtena, budeme zjišťovat co je obsah podle nadpisu h2
- HtmlAgilityPack.HtmlDocument dokument = new HtmlAgilityPack.HtmlDocument();
- dokument.Load(file.FullName, System.Text.Encoding.GetEncoding(28592)); //načte dokument se správným kódováním (volby.cz compatible)
- if (dokument.DocumentNode != null)
- {
- HtmlNode node = dokument.DocumentNode.SelectSingleNode(xpath);
- string vysledek = node.InnerHtml.ToString();
- int i=0;
- bool nalezeno = false;
- foreach(string zaznam in vysledky)
- {
- if (zaznam.Contains(vysledek)) { nalezeno = true; break; } //prochází záznamy dokud nenajde shodu - pokud ji najde změní proměnnou nalezeno a přeruší cyklus
- else
- {
- i++;
- }
- }
- if (!nalezeno)
- {
- vysledky.Add(vysledek); //přidá nový výsledek do pole
- pocty.Add(1);
- }
- else { pocty[i] = 1 + Convert.ToInt32(pocty[i].ToString()); i++;} //inkrementuje počet nalezených výsledků
- }
- else
- {
- pocty[0] = 1 + Convert.ToInt32(pocty[0].ToString());
- }
- }
- for (int z = 0; z < vysledky.Count; z++)
- {
- richTextBox.AppendText(vysledky[z] + " -nalezeno: " + pocty[z] + "*");
- }
- }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement