본문 바로가기

통계 소프트웨어

python으로 상관행렬 시각화

728x90

Python에서 다변량 데이터에서 각 변수 쌍 사이의 관계를 시각화하는 기능을 수행하는 코드를 작성하기 위해서는 matplotlib, seaborn, pandas 같은 라이브러리를 활용할 수 있습니다. 여기서는 seabornpairplot 함수를 이용하여 시각화를 생성할 수 있는 예제 코드를 제공하겠습니다.

Python 코드 예제

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 준비 (예시 데이터셋 로드)
iris = sns.load_dataset('iris')

# 시각화 함수 작성 및 실행
def plot_pairs_panel(df):
    sns.pairplot(df, diag_kind='kde', markers="+",
                 plot_kws={'alpha': 0.6, 's': 80, 'edgecolor': 'k'},
                 height=2)
    plt.show()

# 함수 테스트 및 시각화
plot_pairs_panel(iris)

 

이 코드는 seaborn 라이브러리의 pairplot 함수를 사용하여 iris 데이터셋의 다변량 시각화를 수행합니다. 여기서 diag_kind='kde'는 대각선에 커널 밀도 추정 그래프를, markers="+"는 산점도의 마커 모양을 설정하고, plot_kws는 산점도의 스타일을 설정하는 데 사용됩니다.