Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- \documentclass[a5paper,12pt,openbib]{report}
- \usepackage{amsmath}
- \usepackage[utf8]{inputenc}
- \usepackage[english,russian]{babel}
- \usepackage{amsfonts}
- \usepackage{amsfonts,amssymb}
- \usepackage{amssymb}
- \usepackage{latexsym}
- \usepackage{euscript}
- \usepackage{enumerate}
- \usepackage{graphics}
- \usepackage[dvips]{graphicx}
- \usepackage{geometry}
- \usepackage{wrapfig}
- \geometry{verbose,a5paper,tmargin=1.75cm,bmargin=2.1cm,lmargin=1.75cm,rmargin=1.75cm}
- \righthyphenmin=2
- \begin{document}
- \clubpenalty=10000
- \widowpenalty=10000
- \begin{center}{
- \bf
- Математическое моделирование распространённых орфографических ошибок
- с помощью регулярных выражений на материале математических образовательных ресурсов в сети <<Интернет>>
- } \\
- {\it Н.Н.Авдеев } \\ {\it К.В.Шевелева } \\
- (Воронеж; {\it nickkolok@mail.ru};{\it ksyusha.shevelyova@yandex.ru})
- \end{center}
- \addcontentsline{toc}{section}{Авдеев Н.Н., Шевелева К.В.}
- \setcounter{table}{0}
- В настоящее время Интернет играет большую роль в образовании и самообразовании современных школьников и студентов [1].
- С другой стороны, серьёзную обеспокоенность научного сообщества вызывает грамотность интернет-ресурсов [2],
- ведь, как известно, если читать тексты с ошибками, то непроизвольно запоминается неправильное написание слов.
- Мы заинтересовались данной проблемой и провели междисциплинарное исследование, посвящённое изучению этой темы.
- Анализ
- Нами был проведён анализ грамотности текстов на материале наиболее популярных математических сайтов по двум категориям:
- авторские монотексты (АМТ), т.е. тексты, написанные преимущественно одним человеком: справочники, статьи и т.д.,
- и пользовательский контент (UGC, англ. user-generated content), т.е. комментарии и форумы.
- Суммарная мощность корпуса составила примерно $3{,}5\cdot 10^7$ словоупотреблений (СУ).
- Для анализа использовалась программа для ЭВМ, описанная в [3], с доработками.
- Анализ проводился регулярными выражениями и охватывает преимущественно орфографию,
- не учитывая взаимосвязь слов в предложении и пунктуацию.
- Анализ проводился в два этапа: при первичном сканировании текстов были вручную проанализированы словоупотребления,
- не найденные в словарях, доступных программе,
- с целью пополнения базы сигнатур ошибок и локального словаря программы преимущественно
- математическими терминами и фамилиями известных математиков.
- Затем было проведено повторное сканирование и получены следующие результаты:
- \begin{table}[h]
- \caption{\label{tab:amt}Результаты для АМТ.}
- \begin{center}
- \begin{tabular}{|c|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{СУ} & \textbf{Кол-во} & \textbf{Кол-во ошибок} \\
- & & \textbf{ошибок} & \textbf{на 1000 СУ} \\
- \hline
- \textbf{matematikalegko.ru} & 172600 & 64 & 0,3708 \\
- \textbf{ru.math.wikia.com} & 218560 & 21 & 0,0960 \\
- \textbf{ru.onlinemschool.com} & 386192 & 21 & 0,0544 \\
- \textbf{cleverstudents.ru} & 383231 & 15 & 0,0391 \\
- \textbf{mathprofi.ru} & 439965 & 15 & 0,03409 \\
- \textbf{hijos.ru} & 257596 & 8 & 0,03105 \\
- \textbf{nuru.ru} & 18575 & 1 & 0,05383 \\
- \textbf{1cov-edu.ru} & 67923 & 0 & 0 \\
- \textbf{algebraclass.ru} & 47989 & 0 & 0 \\
- \textbf{ru.solverbook.com} & 35917 & 0 & 0 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \begin{table}[h]
- \caption{\label{tab:ugc}Результаты для UGC.}
- \begin{center}
- \begin{tabular}{|c|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{Словоупотреблений} & \textbf{Количество ошибок} & \textbf{Количество ошибок на 1000 СУ} \\
- \hline
- \textbf{cyberforum} & 16262844 & 23750 & 1,4604 \\
- \textbf{dxdy} & 16420866 & 18455 & 1,1238 \\
- \textbf{forum.exponenta.ru} & 715414 & 2597 & 3,63 \\
- \textbf{hijos.ru (комментарии)} & 189817 & 131 & 0,6901 \\
- \textbf{matematikalegko.ru (комментарии)} & 27625 & 19 & 0,6877 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- (не знаю нужно ли оно)Наиболее характерными ошибками являются:
- ЕСЛИ НУЖНО,ТО ТАБЛИЦА
- \begin{table}[h!]
- \caption{\label{tab:amt_error}Популярные ошибки в АМТ.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{№} & \textbf{Ошибка} & \textbf{Количество} \\
- \hline
- 1 & & \\
- 2 & & \\
- 3 & & \\
- 4 & & \\
- 5 & & \\
- 6 & & \\
- 7 & & \\
- 8 & & \\
- 9 & & \\
- 10 & & \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \begin{table}[h]
- \caption{\label{tab:ugc_error}Популярные ошибки в UGC.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{№} & \textbf{Ошибка} & \textbf{Количество} \\
- \hline
- 1 & & \\
- 2 & & \\
- 3 & & \\
- 4 & & \\
- 5 & & \\
- 6 & & \\
- 7 & & \\
- 8 & & \\
- 9 & & \\
- 10 & & \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- Для того, чтобы наше исследование приобрело практическое значение,
- мы отправили отчёт об ошибках администраторам всех анализируемых нами сайтов и получили отклик.
- Создатели и администраторы интернет-ресурсов были благодарны нам за такой эффективный анализ,
- исправили ошибки и опечатки на своих сайтах, а также поделились своим мнением, чего ещё не хватает в нашей программе.
- После этого мы вновь провели анализ по тому же алгоритму.
- Сравнительный анализ показателей количества ошибок на 1000 словоупотреблений по двум исследованиям прилагаем ниже:
- \begin{table}[h]
- \caption{\label{tab:amt_new}Сравнение результатов для АМТ.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{Октябрь} & \textbf{Декабрь} \\
- \hline
- \textbf{matematikalegko.ru} & 0,3708 & 0 \\
- \textbf{ru.math.wikia.com} & 0,0960 & 0 \\
- \textbf{ru.onlinemschool.com} & 0,0544 & 0 \\
- \textbf{cleverstudents.ru} & 0,0391 & 0 \\
- \textbf{mathprofi.ru} & 0,03409 & 0 \\
- \textbf{hijos.ru} & 0,03105 & 0 \\
- \textbf{nuru.ru} & 0,05383 & 0 \\
- \textbf{1cov-edu.ru} & 0 & 0 \\
- \textbf{algebraclass.ru} & 0 & 0 \\
- \textbf{ru.solverbook.com} & 0 & 0 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \begin{table}[h!]
- \caption{\label{tab:ugc_new}Сравнение результатов для UGC.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{Октябрь} & \textbf{Декабрь} \\
- \hline
- \textbf{cyberforum.ru} & 1,4604 & 0 \\
- \textbf{dxdy.ru} & 1,1238 & 0 \\
- \textbf{forum.exponenta.ru} & 3,63 & 0 \\
- \textbf{hijos.ru (комментарии)} & 0,6901 & 0 \\
- \textbf{matematikalegko.ru (комментарии)} & 0,6877 & 0 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \smallskip \centerline{\bf Литература}\nopagebreak
- 1. {\it Каменкова, Н.Г. } Использование интернет-технологий при организации изучения курса «математика и информатика» ЗДЕСЬ НЕ ПОНЯЛА КАК ОФОРМИТЬ,ХЭЛП
- 2. {\it Сон, Л.П.} Интернет-коммуникация и проблема грамотности
- индивида АНАЛОГИЧНО
- 3. {\it Авдеев, Н.Н.} Программа анализа грамотности интернет-СМИ АНАЛОГИЧНО
- 4. {\it Авдеев, Н.Н.; Шевелева К.В.} Анализ орфографической грамотности
- математических образовательных ресурсов в сети «Интернет» АНАЛОГИЧНО
- \setcounter{table}{0}
- \end{document}
- RAW Paste Data
- \documentclass[a5paper,12pt,openbib]{report}
- \usepackage{amsmath}
- \usepackage[utf8]{inputenc}
- \usepackage[english,russian]{babel}
- \usepackage{amsfonts}
- \usepackage{amsfonts,amssymb}
- \usepackage{amssymb}
- \usepackage{latexsym}
- \usepackage{euscript}
- \usepackage{enumerate}
- \usepackage{graphics}
- \usepackage[dvips]{graphicx}
- \usepackage{geometry}
- \usepackage{wrapfig}
- \geometry{verbose,a5paper,tmargin=1.75cm,bmargin=2.1cm,lmargin=1.75cm,rmargin=1.75cm}
- \righthyphenmin=2
- \begin{document}
- \clubpenalty=10000
- \widowpenalty=10000
- \begin{center}{
- \bf
- Математическое моделирование распространённых орфографических ошибок
- с помощью регулярных выражений на материале математических образовательных ресурсов в сети <<Интернет>>
- } \\
- {\it Н.Н.Авдеев } \\ {\it К.В.Шевелева } \\
- (Воронеж; {\it nickkolok@mail.ru};{\it ksyusha.shevelyova@yandex.ru})
- \end{center}
- \addcontentsline{toc}{section}{Авдеев Н.Н., Шевелева К.В.}
- \setcounter{table}{0}
- В настоящее время Интернет играет большую роль в образовании и самообразовании современных школьников и студентов [1].
- С другой стороны, серьёзную обеспокоенность научного сообщества вызывает грамотность интернет-ресурсов [2],
- ведь, как известно, если читать тексты с ошибками, то непроизвольно запоминается неправильное написание слов.
- Мы заинтересовались данной проблемой и провели междисциплинарное исследование, посвящённое изучению этой темы.
- Анализ
- Нами был проведён анализ грамотности текстов на материале наиболее популярных математических сайтов по двум категориям:
- авторские монотексты (АМТ), т.е. тексты, написанные преимущественно одним человеком: справочники, статьи и т.д.,
- и пользовательский контент (UGC, англ. user-generated content), т.е. комментарии и форумы.
- Суммарная мощность корпуса составила примерно $3{,}5\cdot 10^7$ словоупотреблений (СУ).
- Для анализа использовалась программа для ЭВМ, описанная в [3], с доработками.
- Анализ проводился регулярными выражениями и охватывает преимущественно орфографию,
- не учитывая взаимосвязь слов в предложении и пунктуацию.
- Анализ проводился в два этапа: при первичном сканировании текстов были вручную проанализированы словоупотребления,
- не найденные в словарях, доступных программе,
- с целью пополнения базы сигнатур ошибок и локального словаря программы преимущественно
- математическими терминами и фамилиями известных математиков.
- Затем было проведено повторное сканирование и получены следующие результаты:
- \begin{table}[h]
- \caption{\label{tab:amt}Результаты для АМТ.}
- \begin{center}
- \begin{tabular}{|c|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{СУ} & \textbf{Кол-во} & \textbf{Кол-во ошибок} \\
- & & \textbf{ошибок} & \textbf{на 1000 СУ} \\
- \hline
- \textbf{matematikalegko.ru} & 172600 & 64 & 0,3708 \\
- \textbf{ru.math.wikia.com} & 218560 & 21 & 0,0960 \\
- \textbf{ru.onlinemschool.com} & 386192 & 21 & 0,0544 \\
- \textbf{cleverstudents.ru} & 383231 & 15 & 0,0391 \\
- \textbf{mathprofi.ru} & 439965 & 15 & 0,03409 \\
- \textbf{hijos.ru} & 257596 & 8 & 0,03105 \\
- \textbf{nuru.ru} & 18575 & 1 & 0,05383 \\
- \textbf{1cov-edu.ru} & 67923 & 0 & 0 \\
- \textbf{algebraclass.ru} & 47989 & 0 & 0 \\
- \textbf{ru.solverbook.com} & 35917 & 0 & 0 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \begin{table}[h]
- \caption{\label{tab:ugc}Результаты для UGC.}
- \begin{center}
- \begin{tabular}{|c|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{Словоупотреблений} & \textbf{Количество ошибок} & \textbf{Количество ошибок на 1000 СУ} \\
- \hline
- \textbf{cyberforum} & 16262844 & 23750 & 1,4604 \\
- \textbf{dxdy} & 16420866 & 18455 & 1,1238 \\
- \textbf{forum.exponenta.ru} & 715414 & 2597 & 3,63 \\
- \textbf{hijos.ru (комментарии)} & 189817 & 131 & 0,6901 \\
- \textbf{matematikalegko.ru (комментарии)} & 27625 & 19 & 0,6877 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- (не знаю нужно ли оно)Наиболее характерными ошибками являются:
- ЕСЛИ НУЖНО,ТО ТАБЛИЦА
- \begin{table}[h!]
- \caption{\label{tab:amt_error}Популярные ошибки в АМТ.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{№} & \textbf{Ошибка} & \textbf{Количество} \\
- \hline
- 1 & По сути & 14 \\
- 2 & В общем & 13 \\
- 3 & В виду & 11 \\
- 4 & Истолковано & 9 \\
- 5 & По порядку & 5 \\
- 6 & То есть & 4 \\
- 7 & Комментарии & 4 \\
- 8 & Рассчитывать & 4 \\
- 9 & В общем-то & 3 \\
- 10 & Всё равно & 3 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \begin{table}[h]
- \caption{\label{tab:ugc_error}Популярные ошибки в UGC.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{№} & \textbf{Ошибка} & \textbf{Количество} \\
- \hline
- 1 & В виду & 2238 \\
- 2 & Наверное & 1419 \\
- 3 & В общем & 1223 \\
- 4 & То есть & 901 \\
- 5 & -нибудь & 862 \\
- 6 & Во-первых & 625 \\
- 7 & Вообще & 403 \\
- 8 & Хотя бы & 385 \\
- 9 & Сейчас & 330 \\
- 10 & Прийти & 253 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- Для того, чтобы наше исследование приобрело практическое значение,
- мы отправили отчёт об ошибках администраторам всех анализируемых нами сайтов и получили отклик.
- Создатели и администраторы интернет-ресурсов были благодарны нам за такой эффективный анализ,
- исправили ошибки и опечатки на своих сайтах, а также поделились своим мнением, чего ещё не хватает в нашей программе.
- После этого мы вновь провели анализ по тому же алгоритму.
- Сравнительный анализ показателей количества ошибок на 1000 словоупотреблений по двум исследованиям прилагаем ниже:
- \begin{table}[h]
- \caption{\label{tab:amt_new}Сравнение результатов для АМТ.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{Октябрь} & \textbf{Декабрь} \\
- \hline
- \textbf{matematikalegko.ru} & 0,3708 & 0 \\
- \textbf{ru.math.wikia.com} & 0,0960 & 0 \\
- \textbf{ru.onlinemschool.com} & 0,0544 & 0 \\
- \textbf{cleverstudents.ru} & 0,0391 & 0 \\
- \textbf{mathprofi.ru} & 0,03409 & 0 \\
- \textbf{hijos.ru} & 0,03105 & 0 \\
- \textbf{nuru.ru} & 0,05383 & 0 \\
- \textbf{1cov-edu.ru} & 0 & 0 \\
- \textbf{algebraclass.ru} & 0 & 0 \\
- \textbf{ru.solverbook.com} & 0 & 0 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \begin{table}[h!]
- \caption{\label{tab:ugc_new}Сравнение результатов для UGC.}
- \begin{center}
- \begin{tabular}{|c|c|c|}
- \hline
- \textbf{Сайт} & \textbf{Октябрь} & \textbf{Декабрь} \\
- \hline
- \textbf{cyberforum.ru} & 1,4604 & 0 \\
- \textbf{dxdy.ru} & 1,1238 & 0 \\
- \textbf{forum.exponenta.ru} & 3,63 & 0 \\
- \textbf{hijos.ru (комментарии)} & 0,6901 & 0 \\
- \textbf{matematikalegko.ru (комментарии)} & 0,6877 & 0 \\
- \hline
- \end{tabular}
- \end{center}
- \end{table}
- \smallskip \centerline{\bf Литература}\nopagebreak
- 1. {\it Каменкова, Н.Г. } Использование интернет-технологий при организации изучения курса «математика и информатика» ЗДЕСЬ НЕ ПОНЯЛА КАК ОФОРМИТЬ,ХЭЛП
- 2. {\it Сон, Л.П.} Интернет-коммуникация и проблема грамотности
- индивида АНАЛОГИЧНО
- 3. {\it Авдеев, Н.Н.} Программа анализа грамотности интернет-СМИ АНАЛОГИЧНО
- 4. {\it Авдеев, Н.Н.; Шевелева К.В.} Анализ орфографической грамотности
- математических образовательных ресурсов в сети «Интернет» АНАЛОГИЧНО
- \setcounter{table}{0}
- \end{document}
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement