Guest User

Untitled

a guest
Sep 13th, 2018
225
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Latex 5.07 KB | None | 0 0
  1. \documentclass[12pt,a4paper]{article}
  2. \usepackage[utf8]{inputenc}
  3. \usepackage[spanish]{babel}
  4. \usepackage{amsmath}
  5. \usepackage{amsfonts}
  6. \usepackage{amssymb}
  7. \usepackage{graphicx}
  8. \author{Diego Francisco Valenzuela Iturra}
  9. \title{}
  10. \date{}
  11.  
  12. \usepackage{fancyhdr}
  13. \pagestyle{fancy}
  14.  
  15. \fancyhead[RO,LE]{Universidad de Chile.\\ Prof. Rodrigo Assar.}
  16. \fancyhead[LO,RE]{Facultad de Ciencias Físicas y Matemáticas.\\ \textbf{MA-3403 Probabilidades y Estadística.}}
  17. \fancyfoot[LO,CE]{Diego Valenzuela Iturra.}
  18. \fancyfoot[RO,CE]{ACP.}
  19.  
  20.  
  21. \renewcommand{\headrulewidth}{0.6pt}
  22. \renewcommand{\footrulewidth}{0.4pt}
  23.  
  24. \setlength{\headheight}{40pt}
  25.  
  26. %El comando \newpage fuerza un cambio de página, y los comandos \nolinebreak y \nopagebreak previenen un cambio de línea o página donde tú no lo deseas.
  27. % Letra caligráfica ejemplo  $\cal F $(x) es una función continua
  28.  
  29. \begin{document}
  30.  
  31.  
  32.  
  33. Es una técnica proveniente del análisis exploratorio de datos cuyo objetivo es la síntesis de información o reducción de la dimensión (número de variables).
  34.  
  35. El objetivo es construir un pequeño número de nuevas variables o componentes, en as cuales se concentre la mayor cantidad de información.
  36.  
  37. Las componentes son calculadas como una combinación lineal de las variables originales (además serán además linealmente independientes)
  38.  
  39. Dicho de otra manera se busca un espacio tal que la proyección ortogonal de la nube de puntos sobre este espacio tengan una varianza máxima -- permite el estudio de relaciones, clases, etc
  40. \\
  41. \\
  42. En el espacio de los individuos:
  43.  
  44. Se supone que las variables están centradas y reducidas, se usa la matriz de covarianzas V, notar que esto equivale a usar la matriz de correlaciones R.
  45.  
  46. Las filas de X son el espacio de los individuos $\in \mathbb R^m$, podemos considerarlos como una nube de puntos cuyo orígen se ubica en el centro de masa de la misma.
  47.  
  48. El objetivo del método será describir a los individuos de una manera sintética.
  49. \\
  50. \\
  51.  
  52. En la k-ésima etapa del método se calcula el eje $\vec D_k$ que pasa por el origen para el cual la dispersión de la nube de puntos sea máxima $\Rightarrow \vec D_k$ pasa lo más cerca posible de la nube de puntos $\Rightarrow \hat D_k$ es ortogonal a $\hat D_r~\forall r<k$ construidos en las etapas $1,2,\dots,k-1$, luego $\hat D_k$ es el vector propio asociado al k-ésimo valor propio más grande de la matriz V.
  53.  
  54.  
  55.  
  56.  
  57.  
  58.  
  59.  
  60.  
  61.  
  62.  
  63.  
  64.  
  65.  
  66.  
  67.  
  68.  
  69.  
  70. \newpage
  71. \tableofcontents %indice
  72.  
  73. \newpage
  74. \section{Introducción}
  75.  
  76. El método ACP construye una transformación lineal que escoje un nuevo sistema de coordenadas para representar el conjunto original de datos multivariados. Es una técnica que se emplea en análisis de grandes volúmenes de datos y para la construcción de modelos predictivos, busca retener las caracteristicas del conjunto de datos que más contribuyen a su variabilidad usando una menor cantidad de variables, también es usado para la creación de índices que resultan de combinar un conjunto de variables entre sí (por ejemplo un índice que mida la salud en relación a características físicas de un población, etc.)
  77.  
  78. \newpage
  79. \section{Marco Teórico}
  80.  
  81. \subsection{Descripción general del método}
  82.  
  83. Sea $X$ una tabla de datos como sigue:
  84.  
  85. $$
  86. X=
  87. \left[
  88. \begin{array}{clcr}
  89. x_{11} & x_{12} & \cdots & x_{1n} \\
  90. x_{21} & x_{22} & \cdots & x_{2n} \\
  91. \vdots  & \vdots  & \ddots & \vdots \\
  92. x_{m1} & x_{m2} & \cdots & x_{mn}
  93. \end{array}
  94. \right]
  95. \in \mathcal M_{nm}(\mathbb R)
  96. $$
  97. o bien,
  98. $$
  99. X = \left[ \vec X^1 \mid \vec X^2 \mid \cdots \mid \vec X^m \right]
  100. $$
  101. donde $\vec X^j$ es el j-ésimo vector columna o j-ésima variable de la tabla de datos, para $j=1,2,\dots,m$. Notar que el i-ésimo vector fila de la matriz de datos describe al i-ésimo individuo en relación a las $m$ variables.
  102. \\
  103. Se define la k-ésima componente principal o variable sintética, como la combinación lineal de las variables originales dada por:
  104. $$
  105. \vec C^k = X \vec a^k
  106. $$
  107. o equivalentemente
  108. $$
  109. \vec C^k = a_{k1}\vec X^1 + \cdots + a_{kj}\vec X^j + \cdots + a_{km}\vec X^m = \sum_{j=1}^m a_{kj}\vec X^j
  110. $$
  111. con $\vec a^k$ el k-ésimo factor:
  112. $$
  113. \vec a^k=
  114. \left(
  115. \begin{array}{clcr}
  116. a_{k1} \\
  117. a_{k2} \\
  118. \vdots \\
  119. a_{km}
  120. \end{array}
  121. \right)
  122. \in \mathbb R^m
  123. $$
  124. "Los factores $a_{kj}$ constituyen un sistema de pesos para las $m$ variables, las cuales indican cuanto aporta cada varable a la construcción de la componente." \footnote{Según el libro "Minería de Datos", Capítlo 2: Análisis en Componentes Principales (ACP); del Dr. Oldemar Rodríguez Rojas.}
  125. Para evitar posibles problemas relacionados con las escalas de medición de los datos se impone la siguiente restricción:
  126. $$
  127. \sum_{j=1}^m (a_{kj})^2 = 1
  128. $$
  129.  
  130. \subsection{Definiciones}
  131. \subsection{Restricciones}
  132. \subsection{Desarrollo algebráico}
  133. \subsection{Algoritmo}
  134.  
  135. \newpage
  136. \section{Aplicación}
  137.  
  138. \subsection{Ejemplo resuelto}
  139.  
  140. \newpage
  141. \section{Comentarios y conclusiones}
  142.  
  143. \subsection{Características}
  144. \subsection{Beneficios}
  145. \subsection{Aplicación}
  146.  
  147. \newpage
  148.  
  149. \end{document}
Add Comment
Please, Sign In to add comment