카테고리 없음

boxplot(상자그림) 시각화하기

씩씩한 IT블로그 2020. 12. 18. 11:58
반응형

boxplot(상자그림)을 시각화한다.

1. boxplot 설명

상자그림은 아래와 같다.

가운데 박스는 맨아래 가로선부터 1분위, 2분위, 3분위를 나타낸다.

아래 선(minimum observation)은 (1분위-1.5*QR)~(1분위) 값 중 가장 작은값,

위쪽 선(maximum observation)은 (3분위)~(3분위+1.5*QR) 값 중 가장 큰 값을 나타낸다.

그 외의 값은 outlier라고 하여 점으로 표시한다.

 

2. 코드

dataframe.boxplot(column='{분석할 att}', grid=True, figsize=(12,5))

#grid:격자표시

 

<example>

raw_fe.columns

 

- 1개

raw_fe.boxplot(column='count', grid=True, figsize=(12,5))
plt.ylim(0,1000)

 

- 2개

raw_fe.boxplot(column='registered', by='season', grid=True, figsize=(12,5))
plt.ylim(0,1000)

 

- 여러개

# 휴일일때 시간별 count의 분포
raw_fe[raw_fe.holiday == 1].boxplot(column='count', by='Hour', grid=True, figsize=(12,5))

plt.show()

반응형