web-dev-qa-db-fra.com

Analyse des principaux composants à l'aide de pandas dataframe

Comment puis-je calculer l'analyse des composants principaux à partir de données dans une trame de données pandas?

42
user3362813

La plupart des objets sklearn fonctionnent avec les cadres de données pandas très bien, est-ce que quelque chose comme ça fonctionnerait pour vous?

import pandas as pd
import numpy as np
from sklearn.decomposition import PCA

df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10)))

pca = PCA(n_components=5)
pca.fit(df)

Vous pouvez accéder aux composants eux-mêmes avec

pca.components_ 
71
Akavall