lesson1Title

lesson2Title

lesson3Title

lesson4Title

lesson5Title

lesson6Title

lesson7Title

lesson8Title

lesson9Title

lesson10Title

lesson11Title

lesson12Title

pythonDataAnalysisAdvancedChapter2Title

pythonDataAnalysisAdvancedChapter1Title

pythonDataAnalysisAdvancedChapter3Title

lesson13Title

lesson14Title

lesson15Title

pythonDataAnalysisAdvancedChapter4Title

# 분포 플롯 (histplot, kdeplot)

데이터 분포를 시각화하면 데이터가 어떻게 퍼져 있는지 확인하고, 패턴을 파악하거나 잠재적 이상치를 탐지하는 데 도움이 됩니다.

Seaborn은 이를 위해 두 가지 주요 함수를 제공합니다.

- `histplot()`: 데이터의 **빈도 분포** 시각화  
- `kdeplot()`: 데이터의 **추정 확률 밀도**를 곡선으로 시각화  

<br/>

## Histplot: 빈도 분포 시각화

`histplot()`은 각 구간(bin)마다 데이터가 몇 개 포함되는지 보여주는 히스토그램을 생성합니다.

```python title="기본 히스토그램"
import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")
sns.histplot(data=tips, x="total_bill")
plt.title("총 결제 금액 분포")
plt.show()
```

* `x`: 시각화할 변수 지정
* X축 구간(bin)별로 데이터 개수 집계
* 막대 높이: 해당 구간에 포함된 관측치 개수

<br/>

## KDEplot: 밀도 추정 시각화

KDE는 커널 밀도 추정(Kernel Density Estimate)의 약자입니다.

커널 밀도 추정은 데이터의 분포를 추정하는 통계적 기법으로, 데이터가 어떻게 분포되어 있는지 시각화하는 데 사용됩니다.

`kdeplot()`은 데이터의 추정 확률 밀도를 부드러운 곡선으로 표현합니다.

```python title="기본 KDE 플롯"
sns.kdeplot(data=tips, x="total_bill")
plt.title("총 결제 금액 KDE")
plt.show()
```


<br/>

## 히스토그램과 KDE 결합하기

`kde=True` 옵션을 사용하면 하나의 `histplot()`에서 두 가지를 동시에 표시할 수 있습니다.

```python title="KDE가 오버레이된 히스토그램"
sns.histplot(data=tips, x="total_bill", kde=True)
plt.title("총 결제 금액 분포(KDE 포함)")
plt.show()
```

Seaborn의 `kdeplot()` 함수는 데이터의 추정 확률 밀도를 나타내는 부드러운 곡선을 표시하는 데 사용됩니다. 즉, 히스토그램을 부드럽게 하여 추세를 더 명확하게 보여줍니다. 연속형 데이터의 분포를 시각화하는 데 적합하며, 추가적인 문맥을 위해 히스토그램 위에 겹쳐서 표시할 수도 있습니다.

### Seaborn에서 히스토그램을 부드럽게 한 곡선으로 시각화할 때 사용하는 함수는 무엇인가요?