Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- <?php
- error_reporting("E_WARNING");
- // Utilisation en ligne de commande : "php gen_stats.php" éventuellement avec "| more"
- // $liste = array("janvier","fevrier","mars","avril","mai","juin");
- // $liste = array("avril");
- $liste = array("juin19","juillet19","aout19","septembre19","octobre19","novembre19","decembre19","janvier","fevrier","mars","avril","mai","juin");
- $handle_out = fopen("out.csv", "a");
- foreach ($liste as $mois) {
- echo "".$mois.".log"."\r\n";
- $str_file = file_get_contents($mois.".log");
- foreach (explode("\n", $str_file) as $line) {
- // Prend que les lignes d'Hugo ↓ && prend PAS les actions ↓ && prend PAS l'HRP ↓
- if ((strpos($line,"Hugo§r") != null || strpos($line,"Huggo§r") != null) && strpos($line,"*") == null && strpos($line,"(") == null) {
- // echo $line."\r\n"; /// Décommenter ceci pour voir à quoi ressemblent les lignes traitées - penser à commenter le reste pour pas traiter
- // Casse les lignes pour extraire les mots
- foreach (explode(" ",str_replace(array(",", ".", ";", ":", "/", "?", "!", "-", "°", "[", "]", "(", ")", "<", ">", "§r", "§9", "§2", "§8", "*"), " ", $line)) as $mot) {
- if (!is_numeric($mot)) $stats[strtolower($mot)]++;
- }
- }
- }
- // On vire les trucs trop communs :
- unset(
- $stats["hugo"],
- $stats["huggo"],
- $stats["thread"],
- $stats["client"],
- $stats["main"],
- $stats["chat"],
- $stats["info"],
- $stats["dit"],
- $stats["bas"],
- $stats["chuchote"]
- );
- //////// Décommenter ceci pour avoir par exemple les stats de n'importe quel mot pris isolément, affiché dans la console (penser à commenter l'écriture de out.csv pour éviter de créer un fichier)
- // echo $mois." Merveilleux : ".$stats["merveilleux"]. "\r\n";
- // echo $mois." Formidable : ".$stats["formidable"]. "\r\n";
- // echo "\r\n";
- // tri et out.csv --- Penser à del out.csv avant chaque test
- arsort($stats);
- $out = array_slice($stats,0,150); // Nombre de mots dont on fait les statistiques (moins deux à cause d'un décalage, faire attention lors du traitement excel)
- foreach ($out as $key => $val) {
- // echo $key . " : " . $val . "\r\n"; /// Décommenter ceci pour afficher dans la console (php gen_stats.php | more) les stats brutes IMPORTANT pour gérer correctement les décalages dans le csv - penser à commenter l'output
- $keys = $keys . ";" . $key;
- $vals = $vals . ";" . $val;
- }
- fputs($handle_out, $mois." ;".utf8_encode($keys) . "\r\n");
- fputs($handle_out, $mois." ;".utf8_encode($vals) . "\r\n");
- unset($out,$stats, $keys, $vals); //ràz pour le fichier suivant
- }
- fclose($handle_out);
- ?>
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement