728x90
Seaborn 라이브러리는 데이터 시각화를 위해 여러 가지 내장 데이터 세트를 제공합니다. 이 데이터 세트들은 다양한 시각화 기법과 상관관계 분석, 통계적 모델링 연습 등을 위해 사용될 수 있습니다. Seaborn의 내장 데이터 세트 중 몇 가지를 예로 들고 각각의 특징을 설명하겠습니다.
tips
: 음식점에서 팁을 얼마나 받았는지에 대한 데이터를 포함하고 있으며, 식사 비용, 시간, 성별, 흡연 유무 등의 변수를 포함합니다. 이 데이터는 팁의 크기에 영향을 미치는 요소들을 분석하는 데 유용합니다.iris
: 아이리스(붓꽃)의 종을 분류하기 위해 사용되는 데이터 세트로, 꽃잎(petal)과 꽃받침(sepal)의 길이와 너비 정보를 포함합니다. 이 데이터는 분류 문제와 데이터 시각화 기술을 연습하는 데 자주 사용됩니다.titanic
: 타이타닉 호의 승객 정보를 포함하는 데이터 세트로, 생존 여부, 객실 등급, 성별, 나이 등의 변수를 포함합니다. 생존율 분석이나 범주형 데이터 시각화 연습에 적합합니다.diamonds
: 5만 개 이상의 다이아몬드에 대한 가격과 다이아몬드의 물리적 특성(컷, 색상, 명도, 가중치 등)을 포함합니다. 이 데이터는 연속적인 수치 데이터와 범주형 데이터의 상관관계를 분석하는 데 유용합니다.flights
: 1949년부터 1960년까지의 월별 항공 여행 승객 수를 포함하는 데이터 세트로, 시계열 데이터 분석 및 시각화에 사용될 수 있습니다.
이러한 데이터들은 Seaborn 라이브러리를 사용하여 쉽게 로드할 수 있습니다. 예를 들어, tips
데이터 세트를 로드하려면 다음과 같은 코드를 사용할 수 있습니다:
import seaborn as sns
# 'tips' 데이터 세트 로드
tips = sns.load_dataset('tips')
'통계 소프트웨어' 카테고리의 다른 글
sm.OLS - 다중회귀분석 python 구현 (0) | 2024.03.11 |
---|---|
python으로 상관행렬 시각화 (0) | 2024.03.11 |
넘파이와 판다스를 활용해 결측치 생성 함수 구현하기 (0) | 2024.03.08 |
Python vs R (0) | 2024.01.26 |
R, JAMOVI, SPSS의 차이 (0) | 2024.01.26 |