Guest User

Untitled

a guest
Jul 28th, 2016
55
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.01 KB | None | 0 0
  1. import numpy as np
  2. import pandas as pd
  3. Location1 = r'C:Users...close_prices.csv'
  4. df = pd.read_csv(Location1)
  5. from sklearn.decomposition import PCA
  6. X = df.drop('date', 1)
  7. pca = PCA(n_components=10)
  8. pca.fit(X)
  9. print(pca.explained_variance_ratio_)
  10. # первая компонента объясняет больше всего вариации признаков (цены 30-ти компаний)
  11. # теперь применяю преобразование к исходным данным
  12. X1 = pca.transform(X)
  13. X1
  14. Out[7]:
  15. array([[-50.90240358, -17.63167724, -7.7360209 , ..., 3.55657041,
  16. -5.82197358, -1.72604005],
  17. [-52.84690919, -19.14690749, -7.27254551, ..., 3.43259929,
  18. -5.63318106, -2.0122316 ],
  19. X1.shape
  20. # (374, 10)
  21. # необходимо взять первую компоненту и рассчитать коэфициент корреляции Пирсона для Индекса Доу Джонса размерностью (374, 1) => я беру (374, 1)
  22. X11 = X1[:,[0]]
  23. X11.shape
  24. # (374,1)
Add Comment
Please, Sign In to add comment