Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- % Me estoy viendo el primer vídeo del pirata para dominar LaTeX. Podré hacerlo, debo hacerlo. Tengo que hacer un montón de cosas, para acabar lo que me estoy planteando, apuntaré aquí los capítulos completados;
- % - Capítulo 1: COMPLETADO.
- % - Capítulo 1.5: COMPLETADO.
- % - Capítulo 2: Latex me está dando demasiados putos problemas. Voy por el minuto 35:00.¡Ser estricto con los tiempo!
- \documentclass[11pt]{article}
- \usepackage[margin=1in]{geometry}
- \usepackage{amsfonts, amsmath, amssymb}
- \usepackage[none]{hyphenat}
- \usepackage[spanish]{babel}
- \usepackage{fancyhdr}
- \usepackage{graphicx}
- \usepackage{float}
- % \usepackage[utf8]{inputenc}
- % \usepackage{multirow}
- \usepackage{eurosym}
- \usepackage{tikz,pgfplots}
- \usepackage{apacite}
- \setlength{\parskip}{1mm}
- \pagestyle{fancy}
- \fancyhead{}
- \fancyfoot{}
- \fancyhead[L]{\slshape} \MakeUppercase{}
- \fancyhead[R]{\slshape}
- \fancyfoot[C]{\thepage}
- %\renewcommand{\headrulewith}{0pt}
- \renewcommand{\footrulewidth}{0pt}
- \parindent 0ex
- \begin{document}
- \begin{titlepage}
- \begin{center}
- \vspace*{1cm}
- \Large{\textbf{BI Estudios Matemáticos NM}}\\
- \Large{\textbf{Evaluación interna}}\\
- \vfill
- \line(1,0){450}\\[1mm]
- \huge{\textbf{¿Existe alguna relación entre el número de trabajadores y el salario de dichos trabajos en España?}}\\[3mm]
- %\Large{\textbf{- This is a sample subtitle -}}\\[1mm]
- \line(1,0){450}\\
- \vfill
- %By Student Name\\
- %Candidate \#\\
- %\today \\
- Mayo 2020
- \end{center}
- \end{titlepage}
- \section{Declaración de intenciones}
- Mi objetivo es descubrir si la demanda o poca oferta de trabajos en España incrementa el salario de dicho trabajo. Estoy interesado en este trabajo porque me gustaría saber de una manera más certera el salario de cada trabajo en España y analizar a futuro si factores como la cantidad de trabajadores condiciona el salario de dicho trabajo.
- Para recolectar todos los datos y controlar las variables, estaré solo recolectando datos acerca de los 19 trabajos con mayor salario en España. Estaré también utilizando datos sobre la cantidad total de trabajadores activos en cada trabajo correspondiente. Obtendré esta información primariamente de internet.
- Primero, para descubrir si hay una relación entre el número de trabajadores y el salario de dichos trabajos en España realizaré un diagrama de dispersión para tratar de ver si hay alguna relación. Más tarde, hallaré el coeficiente de correlación de Pearson para tratar de observar con mayor exactitud la correlación entre estas dos variables. Por último utilizaré la evaluación de hipótesis nula, usando la prueba de chi-cuadrado. Con este último procedimiento tendré una certeza acerca de si estas dos variables son independientes, o si por el contrario se condicionan la una a la otra.
- \section{Plan de investigación}
- Esta investigación examinará la relación entre el salario neto medio de un trabajo y su cantidad de trabajadores en 2019. El paso inicial para esta investigación es buscar datos acerca del salario neto medio de dichos trabajos escogidos y la cantidad actual de trabajadores en las respectivas ocupaciones. Los datos serán recogidos de Forbes, de diversas páginas webs y de instituciones públicas fiables como puede ser el Instituto Nacional de Estadística (INE). Los datos serán en base a la cantidad de trabajos y salarios en España. Se estarán comentando las observaciones y las conclusiones presentes en cada apartado de la investigación. Por ejemplo, la cantidad de datos recolectada será justificada en el apartado de Información y mediciones.
- Para procesar los datos, primero se realizará un diagrama de dispersión que me ayudará a observar visualmente si existe algún tipo de relación. El coeficiente de correlación de Pearson se utilizará y calculará a mano, como herramienta matemática para dar una mayor certeza acerca de la relación entre las dos variables. Por último la evaluación de la hipótesis confirmará las observaciones que se encontraron a lo largo de los demás resultados matemáticos. También se precisará el uso de otros procedimientos matemáticos que no se utilizaron finalmente en la investigación. Sobre la base de los resultados de la investigación, se formará una conclusión. Finalmente, se realizará una pequeña discusión de validez, una bibliografía y un apéndice; donde se citarán los sitios de dónde se ha extraído información y tablas justificando algunos resultados obtenidos respectivamente.
- \section{Información y mediciones}
- \begin{table}[H]
- \begin{center}
- \begin{tabular}{|l|c|}
- \hline
- Trabajos & Salario neto medio al año (\euro) 2019 \\
- \hline \hline
- Comercial Inmobiliario & 42685 \\ \hline
- Comercial venta directa & 43535 \\ \hline
- Director financiero & 45586 \\ \hline
- Director de empresa & 49445 \\ \hline
- Manager Industrial & 50000 \\ \hline
- Director comercial & 52000 \\ \hline
- Ortodoncista & 52798 \\ \hline
- Director informático & 53396 \\ \hline
- Odontólogo & 54748 \\ \hline
- Director de proyectos de ingeniería & 70000 \\ \hline
- Radiólogo & 75000 \\ \hline
- Asesores financieros & 80000 \\ \hline
- Juez & 100000 \\ \hline
- CEO & 130000 \\ \hline
- Registrador de la propiedad & 150000 \\ \hline
- Notario & 160000 \\ \hline
- Cirujano & 170000 \\ \hline
- Agentes de futbolistas & 180000 \\ \hline
- Piloto de avión & 200000 \\ \hline
- \end{tabular}
- \caption{Los 20 trabajos mejor pagados} % Más tarde puede que tenga que poner la fuente del cuadro
- \label{tabla:trabajos - salario neto 2019}% De momento en label voy a poner el (-) aunque no estoy del todo seguro. Ya se verá más adelante que pasa.
- \end{center}
- \end{table}
- Antes de continuar es importante mencionar varios factores. Por un lado, estos sueldos son medios y en cualquier profesión, dependiendo de la empresa, las cantidades se pueden incrementar hasta en 30.000 \euro. También cabe destacar que a partir de los asesores financieros, los sueldos empiezan a ser altos, debido a duras oposiciones que deben pasar los candidatos o bien por su posición en una determinada empresa. Los agentes de futbolista, pueden llegar a cobrar mucho más dependiendo de las transacciones que haga y a que jugador esté asesorando. Estas variables mencionadas no son tomadas en cuenta a lo largo del análisis. También es importante comentar que no se tomarán en cuenta los factores externos presentes, pasados o futuros como puede ser el ejemplo del comercial inmobiliario, que se espera que sus sueldos sigan bajando a lo largo de este año 2020. Las cantidades son salarios netos.
- \begin{table}[H]
- \begin{center}
- \begin{tabular}{|l|c|}
- \hline
- Trabajos & Cantidad de Trabajadores/población activa 2019 \\
- \hline \hline
- Comercial Inmobiliario & 146534 \\ \hline
- Comercial venta directa & 230656 \\ \hline
- Director financiero & 10565 \\ \hline
- Director de empresa & 130301\\ \hline
- Manager Industrial & 30464 \\ \hline
- Director comercial & 25387 \\ \hline
- Ortodoncista & 5348 \\ \hline
- Director informático & 36743\\ \hline
- Odontólogo & 12337 \\ \hline
- Director de proyectos de ingeniería & 23354 \\ \hline
- Radiólogo & 9563 \\ \hline
- Asesores financieros & 13538 \\ \hline
- Juez & 5337 \\ \hline
- CEO & 10568 \\ \hline
- Registrador de la propiedad & 1112 \\ \hline
- Notario & 3021 \\ \hline
- Cirujano & 12358 \\ \hline
- Agentes de futbolistas & 7536 \\ \hline
- Piloto de avión & 6433 \\ \hline
- \end{tabular}
- \caption{Cantidad de trabajadores en España 2019}
- \label{tabla:trabajos - cantidad de trabajadores/población activa}
- \end{center}
- \end{table}
- Terminando la recolección de datos, considero que los datos son lo suficientemente específicos para proceder a utilizar las herramientas matemáticas que darán lugar a una conclusión. Antes de empezar el procesamiento de los datos y su respectivo análisis, es conveniente mencionar que la cantidad de trabajadores se ajusta al trabajo específico que se está estudiando. Un ejemplo sería la cantidad de informáticos y la cantidad de directivos en el departamento de informática, algo que cambia drásticamente tanto el número de trabajadores como el salario medio de cada trabajo. Estos datos me han resultado difíciles de encontrar ya que había muchas redirecciones dentro de páginas web e instituciones públicas. No he añadido un mayor volumen de datos porque a partir del comercial inmobiliario los trabajos con menor sueldo neto conllevan más factores adicionales que hacen más difícil determinar un salario medio y su respectiva cantidad total de trabajadores, además de no aportar un sueldo significativo para mi investigación.
- \section{Procesamiento de datos y análisis}
- \subsection{Diagrama de dispersión}
- El diagrama de dispersión me permitirá ver visualmente si hay una tendencia en los resultados; también permitirá el trazado de una línea de mejor ajuste si es apropiado.
- \begin{tikzpicture}
- \begin{axis}
- [
- xlabel={Salario neto medio al año (\euro)},
- ylabel={Cantidad de trabajadores},
- ylabel near ticks,
- xticklabel style={/pgf/number format/fixed},
- yticklabel style={/pgf/number format/fixed},
- scaled x ticks = false,
- scaled y ticks = false,
- scatter/classes={a={mark=o,draw=black}}
- ]
- \addplot[
- scatter,
- only marks,
- scatter src=explicit symbolic
- ]
- table[meta=label] {
- x y label
- 42685 146534 a
- 43535 230656 a
- 45586 10565 a
- 49445 130301 a
- 50000 30464 a
- 52000 25387 a
- 52798 5348 a
- 53396 36743 a
- 54748 12337 a
- 70000 23354 a
- 75000 9563 a
- 80000 13568 a
- 100000 5337 a
- 130000 10568 a
- 150000 1112 a
- 160000 3021 a
- 170000 12358 a
- 180000 7536 a
- 200000 6433 a
- };
- \end{axis}
- \end{tikzpicture}
- Visualmente, no parece haber una tendencia. En la gráfica se puede ver una correlación pero no se asemeja a ser lineal. Este diagrama se podría tratar en cambio de una línea exponencial en decrecimiento. Aún así, la fuerza de la relación será explorada con mayor precisión por la ecuación de regresión y la prueba de la hipótesis. Considero que los datos se dispersan de esta manera debido a que determinados trabajos como jefe de empresas no son trabajos aplicables, es decir, no son trabajos como ortodoncistas o asesores financieros, ocupaciones que pueden ser realizadas nada más acabar la carrera. Lo mismo pasa con los trabajos que requieren una oposición. En cambio, los directores de los diferentes sectores son trabajos que se ganan a lo largo de los años y se consiguen a través de la experiencia entre otros factores. Es por esto que considero que la correlación en los diagramas de dispersión no es tan clara y puede que incluso afecte a la conclusión del presente trabajo.
- \subsection{Coeficiente de correlación}
- Como mi intención es hallar la fuerza de la relación entre el salario medio neto y la cantidad de trabajadores, encontraré el coeficiente de correlación de Pearson. Esto dará una indicación de si existe una fuerte o débil relación lineal entre dos factores. Si parece que existe, encontraré una ‘línea de mejor ajuste’ a partir de la cual puedo predecir los resultados.
- Dado que no tengo el valor Sxy, usaré la fórmula del coeficiente de correlación siguiente, permitiendo que x sea el salario neto medio al año e y la cantidad de trabajadores/población activa: \medskip
- $\frac{\sum xy - n\overline{xy}}{\sqrt{\sum x^2 - n\bar{x}^2} \sqrt{\sum y^2 - n\bar{y}^2}}$
- \medskip
- Usando la calculadora gráfica TI-84 Plus CE-T, pulso stat, flecha derecha, 2: 2-Var Stats, y obtengo los siguientes resultados:
- $\overline{x} \approx 92589,11; \overline{y}\approx 37957,11; \sum x^2 \approx 2,15 \times 10^{11}; \sum y^2 \approx 9,61 \times 10^{10}; \sum xy \approx 3,97 \times 10^{10}; n = 19$
- \medskip
- $\frac{\sum xy - n\overline{xy}}{\sqrt{\sum x^2 - n\bar{x}^2} \sqrt{\sum y^2 - n\bar{y}^2}}$
- \begin{flushleft}
- $\approx \frac{3,97 \times 10^{10} - 19 \times 92589,11 \times 37957,11}{\sqrt{2,15 \times 10^{11} - 19 \times 92589,11^2}\sqrt{9,61 \times 10^{10} - 19 \times 37957,11^2}}$
- \end{flushleft}
- \begin{flushleft}
- $\approx \frac{-2,7 \times 10^{10}}{228293,4 \times 262156,25}$
- \end{flushleft}
- \begin{flushleft}
- $\approx - 0,45$
- \end{flushleft}
- $r^2 \approx 0,2$
- Estos valores son aproximados porque he redondeado cada uno de los resultados a dos cifras decimales. Mi calculadora en cambio me proporciona el valor exacto de la correlación que sería para $r^2 = 0,2031348311$ y $r = -0,4507048159$. Es por esto que utilizaré los valores provenientes de la calculadora.Estos datos son también más acertados porque consiguen hallar el valor de regresión sin necesidad de aproximaciones. En este caso, el valor de $r^2$ o coeficiente de determinación representa que solo un $2\%$ de la variación en la variable dependiente (número de personas que realizan un trabajo), pueden ser explicadas por la variación en la variable independiente (salario neto medio de cada trabajo).
- Esto es una correlación extremadamente débil, por lo tanto la ecuación de regresión lineal no es apropiada.
- \subsection{Evaluación de la hipótesis}
- Aunque ha lo largo de esta evaluación interna he calculado los cuartiles para establecer unos límites a la hora de realizar la prueba del $\chi^2$ , he considerado más apropiado el organizar la matriz con el número de datos que son más pequeños y más grandes que la media por parte de las dos variables. Esto quiere decir que la media que se hace parte de la base de que el número de total de datos es 38.
- \begin{itemize}
- \item[]Salario neto: El valor combinado de todos los salarios netos es 1759193, y hay 38 datos diferentes, $\therefore$
- $\frac{1759193}{38} \approx 46294,55$
- \end{itemize}
- \begin{itemize}
- \item[]El promedio es 46294,55 aproximando a 2 cifras decimales, y es por ello que dividiré mis dos grupos en:
- \begin{enumerate}
- \item[-] Por debajo del promedio ($<46294,55$)
- \item[-] Por encima del promedio ($>46294,55$)
- \end{enumerate}
- \end{itemize}
- \begin{itemize}
- \item[]Cantidad de trabajadores: El valor combinado de la cantidad total de trabajadores es 721185, y hay 38 datos diferentes, $\therefore\frac{721185}{38}\approx 18978,55$
- \end{itemize}
- \begin{itemize}
- \item[]El promedio es 18.978,55 aproximando a dos cifras decimales, y es por ello que dividiré mis dos grupos en:
- \begin{enumerate}
- \item[-] Por debajo del promedio ($<18978,55$)
- \item[-] Por encima del promedio ($>18978,55$)
- \end{enumerate}
- \end{itemize}
- Como resultado, mi hipótesis para el salario neto y la cantidad total de trabajadores es:
- \begin{itemize}
- \item[]-
- $H_0$ (hipótesis nula): el salario neto es independiente de la cantidad de trabajadores \\
- - $H_1$ (hipótesis alternativa): el salario neto es dependiente de la cantidad de trabajadores
- \end{itemize}
- En caso de que el cálculo de $\chi^2$ sea mayor que el valor crítico, descartaremos la hipótesis nula y aceptaremos la hipótesis alternativa.
- \newpage Matriz observada:
- \begin{table}[H]
- \begin{tabular}{l|c|c|c|l}
- \cline{2-4}
- & \begin{tabular}[c]{@{}l@{}}Por debajo de la \\ media (salario neto)\end{tabular} & \begin{tabular}[c]{@{}l@{}}Por encima de la \\ media (salario neto)\end{tabular} & Total & \\ \cline{1-4}
- \multicolumn{1}{|l|}{\begin{tabular}[c]{@{}l@{}}Por debajo de la\\ media (cantidad de \\ trabajadores)\end{tabular}} & 1 & 11 & 12 & \\ \cline{1-4}
- \multicolumn{1}{|l|}{\begin{tabular}[c]{@{}l@{}}Por encima de la\\ media (cantidad de \\ trabajadores)\end{tabular}} & 2 & 5 & 7 & \\ \cline{1-4}
- \multicolumn{1}{|l|}{Total} & 3 & 16 & 19 & \\ \cline{1-4}
- \end{tabular}
- \end{table}\medskip
- Matriz esperada:
- \begin{table}[H]
- \begin{tabular}{ccccc}
- \cline{2-4}
- \multicolumn{1}{l|}{} & \multicolumn{1}{l|}{\begin{tabular}[c]{@{}l@{}}Por debajo de la\\ media (salario neto)\end{tabular}} & \multicolumn{1}{l|}{\begin{tabular}[c]{@{}l@{}}Por encima de la \\ media (salario neto)\end{tabular}} &
- \multicolumn{1}{l|}{Total} & \\ \cline{1-4}
- \multicolumn{1}{|l}{\begin{tabular}[c]{@{}l@{}}Por debajo de la\\ media (cantidad de\\ trabajadores)\end{tabular}} & \multicolumn{1}{|c}{$\frac{12\times 3}{19}\approx 1.89$} & \multicolumn{1}{|c|}{$\frac{3\times 7}{19}\approx 1.11$} & \multicolumn{1}{c|}{12} & \\ \cline{1-4}
- \multicolumn{1}{|l}{\begin{tabular}[c]{@{}l@{}}Por encima de la \\ media (cantidad de \\ trabajadores)\end{tabular}} & \multicolumn{1}{|c}{$\frac{16 \times 12}{19}\approx 10.11$} & \multicolumn{1}{|c|}{$\frac{16\times 7}{19}\approx 5.89$} & \multicolumn{1}{c|}{7} & \\ \cline{1-4}
- \multicolumn{1}{|l}{Total} & \multicolumn{1}{|c}{3} & \multicolumn{1}{|c|}{16} & \multicolumn{1}{c|}{19} & \\ \cline{1-4}
- & & & &
- \end{tabular}
- \end{table}
- %cuando termine esta tabla, me faltaría la bibliografía e indirectamente la tabla de contenidos para finalizar el proyecto. De esta manera también me faltaría por hacer las referencias a las tablas (de donde saco la información etc.)
- Cálculos $\chi^2$:
- \begin{table}[H]
- \begin{tabular}{|c|c|c|c|c|}
- \hline
- $f_o$ & $f_e$ & $f_o - f_e$ & $(f_o - f_e)^2$ & $\frac{{f_o - f_e}^2}{f_e}$ \\ \hline
- 1 & 1.89 & -0.89 & 0.7921 & $\approx 0.4191$ \\ \hline
- 2 & 1.11 & 0.89 & 0.7921 & $\approx 0.7136$ \\ \hline
- 11 & 10.11 & 0.89 & 0.7921 & $\approx 0.0783$ \\ \hline
- 5 & 5.89 & 0.89 & 0.7921 & $\approx 0.1345$ \\ \hline
- \end{tabular}
- \end{table}
- Total: 1.3455 (5 cifras significativas)\medskip
- Para hallar el grado de libertad, utilizamos la ecuación $v = (f-1)(c-1)$, donde r = número de filas y c = número de columnas; en este caso $v = (2-1)(2-1) \therefore$ el grado de libertad es 1. Al probar la hipótesis a un nivel de significación del 5\%,el valor crítico es 3.8414, y el cálculo de $\chi^2$ es menor que el valor crítico. Esto significa que rechazamos la hipótesis alternativa y aceptamos la hipótesis nula que sostiene que el salario neto y la cantidad de trabajadores son independientes. Me esperaba este resultado ya que habiendo calculado el coeficiente de correlación el resultado era extremadamente bajo, mostrando una relación muy débil. Además, no había una tendencia clara en el diagrama de dispersión. Las conclusiones que se extraen de la evaluación de la hipótesis, el coeficiente de correlación y el diagrama de dispersión es que no hay ninguna relación entre el salario neto medio y la cantidad de puestos que hay en ese trabajo.
- \section{Conclusión}
- Siendo sinceros me resultó curioso la conclusión de mi proyecto. No me esperaba que tuvieran tan poca relación estas dos variables. A medida que veía los resultados también me dí cuenta de que a la hora de determinar el salario medio de una profesión hay que tomar en consideración muchos más factores. Pensándolo detenidamente, hay trabajos dónde no hay mucha cantidad de gente ocupando el cargo y que no cobran mucho, como puede ser el caso de los alcantarilleros. También es cierto que por ejemplo el salario medio de un futbolista será bajo, ya que aunque haya miles de jugadores que son millonarios, hay millones que son mileuristas. Es por esto, que se tienen que tomar en cuenta muchos factores a la hora de decidir si hay una verdadera relación entre estas dos variables. Las herramientas matemáticas muestran una consistencia en los resultados mostrando la nula relación que hay entre los datos.
- El diagrama de dispersión me permitió observar visualmente la escasa relación que había. El coeficiente de correlación de Pearson resultaba en un valor muy bajo que no permitía realizar una recta de regresión pertinente. Realmente, fue aquí cuando me di cuenta de que parecía realmente que no habría relación entre las dos variables. La evaluación de hipótesis certificó la insignificante relación que había y eso que se tomó un valor de significación del 5\%. Aunque el resultado es que no hay una correlación, considero que esta afirmación no se debe tener en cuenta de una manera rigurosa. Con esto quiero decir, que para ver si realmente hay una correlación entre estos dos factores, es preciso conseguir todos los datos de todos los trabajos, tener en cuenta datos cuantitativos y cualitativos de cada trabajo y sueldo y utilizar más procesos matemáticos. Pese a ello, me atrevería a decir que tampoco se podría certificar una relación ya que también se necesitarían las circunstancias y resultados de cada individuo, lo cual es extremadamente difícil de cuantificar hoy en día.
- \section{Discusión de validez}
- Aunque los datos son casi en su totalidad seguros, se recalca que no se han tomado en cuenta diversos agentes que pueden afectar drásticamente los resultados. Un ejemplo podría ser la economía y como las etapas de esta sin duda afectan a algunos sectores. Tampoco se ha tenido en consideración intervalos de tiempo más largos que un año, que podrían haber dado una visión panorámica acerca de las fluctuaciones en la cantidad de trabajadores y el salario medio, algo que podría haber sido muy valioso para la investigación.
- Como una extensión para este proyecto, y para reducir las limitaciones discutidas, sería interesante que se realizara una búsqueda primaria de datos realizada por estadísticos profesionales que almacenara una cantidad significativa de datos durante 5 años. Además de esto, se podrían recolectar datos acerca de la economía y cómo esta ha afectado a diferentes sectores. Aunque estaría todavía lejos de mostrar un resultado certificado, la cantidad de datos sería razonable como para ser tomada en consideración.
- \pagebreak
- \bibliography{bibiliografía.bib}
- \bibliographystyle{apacite}
- \end{document}
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement