반응형
boxplot(상자그림)을 시각화한다.
1. boxplot 설명
상자그림은 아래와 같다.
가운데 박스는 맨아래 가로선부터 1분위, 2분위, 3분위를 나타낸다.
아래 선(minimum observation)은 (1분위-1.5*QR)~(1분위) 값 중 가장 작은값,
위쪽 선(maximum observation)은 (3분위)~(3분위+1.5*QR) 값 중 가장 큰 값을 나타낸다.
그 외의 값은 outlier라고 하여 점으로 표시한다.
2. 코드
dataframe.boxplot(column='{분석할 att}', grid=True, figsize=(12,5))
#grid:격자표시
<example>
raw_fe.columns
- 1개
raw_fe.boxplot(column='count', grid=True, figsize=(12,5))
plt.ylim(0,1000)
- 2개
raw_fe.boxplot(column='registered', by='season', grid=True, figsize=(12,5))
plt.ylim(0,1000)
- 여러개
# 휴일일때 시간별 count의 분포
raw_fe[raw_fe.holiday == 1].boxplot(column='count', by='Hour', grid=True, figsize=(12,5))
plt.show()
반응형