Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- ## Определим самые часто встречающиеся первые буквы
- include 'w.php';
- $Cw = count($w);
- $FirstL = array(
- 'a' => 0, 'b' => 0, 'c' => 0, 'd' => 0, 'e' => 0, 'f' => 0, 'g' => 0, 'h' => 0, 'i' => 0, 'j' => 0, 'k' => 0, 'l' => 0, 'm' => 0, 'n' => 0, 'o' => 0, 'p' => 0, 'q' => 0, 'r' => 0, 's' => 0, 't' => 0, 'u' => 0, 'v' => 0, 'w' => 0, 'x' => 0, 'y' => 0, 'z' => 0
- );
- for ($i = 0; $i < $Cw; $i++) {
- foreach ($FirstL as $key => $value) {
- //echo "Ключ: $key; Значение: $value<br />\n";
- if(preg_match("/^$key/ismu", $w[$i])){
- $FirstL[$key]++;
- }
- }
- }
- $BurSort = array(
- 'a' => 0, 'b' => 0, 'c' => 0, 'd' => 0, 'e' => 0, 'f' => 0, 'g' => 0, 'h' => 0, 'i' => 0, 'j' => 0, 'k' => 0, 'l' => 0, 'm' => 0, 'n' => 0, 'o' => 0, 'p' => 0, 'q' => 0, 'r' => 0, 's' => 0, 't' => 0, 'u' => 0, 'v' => 0, 'w' => 0, 'x' => 0, 'y' => 0, 'z' => 0
- );
- foreach ($FirstL as $key => $value) {
- $percent = $value / $Cw * 100;
- echo "$key - $percent<br>";
- $BurSort[$key] = $percent;
- }
- echo "<br><br>";
- arsort($BurSort);
- foreach ($BurSort as $key => $val) {
- echo "$key = $val<br>";
- }
- ## Поиск биграмм из 2 одинаковых (неудачно, все есть)
- $Letters = array(
- 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z'
- );
- for ($j = 0; $j < count($Letters); $j++) {
- $match = 0;
- for ($i = 0; $i < count($w); $i++) {
- if(preg_match("/{$Letters[$j]}{$Letters[$j]}/ism", $w[$i])){
- $match++;
- }
- }
- if($match == 0) { echo "$Letters[$j]"; }
- }
- ## Вывод статистики по количеству букв в словах
- $StrlenArr = array(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0);
- for ($i = 0; $i < count($w); $i++) {
- $s = strlen($w[$i]);
- if($s == 1){ $StrlenArr[$s]++; }
- if($s == 2){ $StrlenArr[$s]++; }
- if($s == 3){ $StrlenArr[$s]++; }
- if($s == 4){ $StrlenArr[$s]++; }
- if($s == 5){ $StrlenArr[$s]++; }
- if($s == 6){ $StrlenArr[$s]++; }
- if($s == 7){ $StrlenArr[$s]++; }
- if($s == 8){ $StrlenArr[$s]++; }
- if($s == 9){ $StrlenArr[$s]++; }
- if($s == 10){ $StrlenArr[$s]++; }
- if($s == 11){ $StrlenArr[$s]++; }
- if($s == 12){ $StrlenArr[$s]++; }
- if($s == 13){ $StrlenArr[$s]++; }
- if($s == 14){ $StrlenArr[$s]++; }
- if($s == 15){ $StrlenArr[$s]++; }
- if($s == 16){ $StrlenArr[$s]++; }
- if($s == 17){ $StrlenArr[$s]++; }
- if($s == 18){ $StrlenArr[$s]++; }
- if($s == 19){ $StrlenArr[$s]++; }
- if($s == 20){ $StrlenArr[$s]++; }
- if($s == 21){ $StrlenArr[$s]++; }
- if($s == 22){ $StrlenArr[$s]++; }
- if($s == 23){ $StrlenArr[$s]++; }
- if($s == 24){ $StrlenArr[$s]++; }
- if($s == 25){ $StrlenArr[$s]++; }
- if($s == 26){ $StrlenArr[$s]++; }
- if($s == 27){ $StrlenArr[$s]++; }
- if($s == 28){ $StrlenArr[$s]++; }
- if($s == 29){ $StrlenArr[$s]++; }
- if($s == 30){ $StrlenArr[$s]++; }
- if($s == 31){ $StrlenArr[$s]++; }
- if($s == 32){ $StrlenArr[$s]++; }
- if($s == 33){ $StrlenArr[$s]++; }
- if($s == 34){ $StrlenArr[$s]++; }
- if($s == 35){ $StrlenArr[$s]++; }
- if($s == 36){ $StrlenArr[$s]++; }
- if($s == 37){ $StrlenArr[$s]++; }
- if($s == 38){ $StrlenArr[$s]++; }
- if($s == 39){ $StrlenArr[$s]++; }
- if($s == 40){ $StrlenArr[$s]++; }
- if($s == 41){ $StrlenArr[$s]++; }
- if($s == 42){ $StrlenArr[$s]++; }
- if($s == 43){ $StrlenArr[$s]++; }
- if($s == 44){ $StrlenArr[$s]++; }
- if($s == 45){ $StrlenArr[$s]++; }
- if($s == 46){ $StrlenArr[$s]++; }
- if($s == 47){ $StrlenArr[$s]++; }
- if($s == 48){ $StrlenArr[$s]++; }
- if($s == 49){ $StrlenArr[$s]++; }
- if($s == 50){ $StrlenArr[$s]++; }
- }
- for ($i = 0; $i < count($StrlenArr); $i++) {
- if($StrlenArr[$i] != 0){
- echo "$i - {$StrlenArr[$i]}<br>";
- }
- }
- ## Подсчёт буква - апостроф вариантов (есть все)
- for ($i = 0; $i < count($w); $i++) {
- foreach ($FirstL as $key => $value) {
- if(preg_match("/$key\'/ism", $w[$i])){
- $FirstL[$key]++;
- }
- }
- }
- foreach ($FirstL as $key => $value) {
- if($value == 0){
- echo "$key => $value<br>";
- }
- }
- // поиск апострофов которые не на предпоследнем месте
- for ($i = 0; $i < count($w); $i++) {
- $long = strlen($w[$i]);
- $pos = strripos($w[$i], "'");
- $d = '';
- $d = $long - $pos;
- if($pos !== false && $d != 2){
- echo "$long - $pos - {$w[$i]}<br>";
- }
- }
- ### Поиск последовательностей гласных в словах
- $j = 0;
- $StrlenArr = array(0,0,0,0,0,0,0);
- // замена гласных на цифры count($w)
- for ($i = 0; $i < count($w); $i++) {
- $k = $w[$i];
- $l = strlen($w[$i]);
- if($l == 5){ // Поиск гласных только в словах с 5 символами
- $j++;
- $w[$i] = preg_replace("/a/i", '1', $w[$i]);
- $w[$i] = preg_replace("/e/i", '2', $w[$i]);
- $w[$i] = preg_replace("/i/i", '3', $w[$i]);
- $w[$i] = preg_replace("/o/i", '4', $w[$i]);
- $w[$i] = preg_replace("/u/i", '5', $w[$i]);
- $w[$i] = preg_replace("/y/i", '6', $w[$i]);
- preg_match("/[0-9]{2,}/i", $w[$i], $glas);
- if(!empty($glas[0])){
- $s = strlen($glas[0]);
- if($s == 1){ $StrlenArr[$s]++; }
- if($s == 2){ $StrlenArr[$s]++; }
- if($s == 3){ $StrlenArr[$s]++; }
- if($s == 4){ $StrlenArr[$s]++; } // echo "$k<br>";
- if($s == 5){ $StrlenArr[$s]++; }
- if($s == 6){ $StrlenArr[$s]++; }
- if($s == 7){ $StrlenArr[$s]++; }
- //echo $w[$i].' - '.$s."<br>";
- }
- }
- }
- echo "j = $j<br>";
- for ($i = 0; $i < count($StrlenArr); $i++) {
- if($StrlenArr[$i] != 0){
- echo "$i - $StrlenArr[$i]<br>";
- }
- }
- ### Сгенерировать ассоциативный массив
- $m1 = array('one', 'two', 'three');
- $m2 = array();
- for ($j = 0; $j < count($m1); $j++) {
- $ready = array("$m1[$j]"=>0);
- $m2[] = $ready;
- }
- ### Представить все возможные комбинации из набора символов
- $b1 = array(1,2,3);
- $barr = array();
- for ($j = 0; $j < count($b1); $j++) {
- for ($i = 0; $i < count($b1); $i++) {
- for ($k = 0; $k < count($b1); $k++) {
- $barr[] = $b1[$j].$b1[$i].$b1[$k];
- }
- }
- }
- ### Код для поиска триграмм-невозможностей (по 2 за раз) и предоставления их в виде строки
- $barr = array();
- $zad = array();
- for ($i = 0; $i < count($L); $i++) {
- for ($j = 0; $j < count($L); $j++) {
- //$barr[] = $L[$j].$L[$i].'i';
- $barr[] = 'j'.$L[$j].$L[$i];
- $zad[] = $L[$j].$L[$i].'j';
- }
- }
- for ($j = 0; $j < count($barr); $j++) {
- if(preg_match("/[bcdfghjklmnpqrstvwxz]{3}/ism", $barr[$j])){unset($barr[$j]);}
- }
- sort($barr);
- // Ищем триграммы невозможные
- for ($j = 0; $j < count($barr); $j++) {
- $match = 0;
- for ($i = 0; $i < count($w); $i++) {
- if(preg_match("/$barr[$j]/ism", $w[$i])){
- $match++;
- }
- }
- if($match == 0){ echo '|'.$barr[$j]; }
- }
- echo '<br><br><br>';
- // Ищем триграммы невозможные
- for ($j = 0; $j < count($zad); $j++) {
- $match = 0;
- for ($i = 0; $i < count($w); $i++) {
- if(preg_match("/$zad[$j]/ism", $w[$i])){
- $match++;
- }
- }
- if($match == 0){ echo $zad[$j].'|'; }
- }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement