Distance Map 2

2025.12.16 TIL (본캠프, 42일차)

오늘은 어제 배운 클러스터링을 실습하였다.어제 배운 개념들이 실제로 어떻게 작동하는지 눈으로 확인할 수 있었다. 코드 한 줄 한 줄의 의미가 중요하지만, 처음이기에 외우는것보다 나는 각 단계가 어떤 의미인지 이해하려고 했다. 데이터 준비먼저 필요한 라이브러리들을 import했다.표준화, PCA, K-Means, 시각화 등 어제 배운 모든 기법들이 라이브러리로 준비되어 있었다.(복붙이 아니라 직접 입력하는게 핵심)신기했던 건 yellowbrick이라는 라이브러리인데, 이건 K값을 자동으로 추천해주는 Elbow Method를 구현하는 것이였다. 데이터를 로드한 후, 먼저 결측치를 확인했다. 이제 이건 기본이다. 비지도학습에서는 피처 선택이 중요하다클러스터링에 사용할 컬럼을 지정하는 부분이 있었다:featur..

카테고리 없음 2025.12.16

2025.12.15 TIL (본캠프, 41일차)

지난주 지도학습에 이어 오늘은 비지도학습을 학습하였다.지금까지는 데이터 분석을 통해 "정답이 있는" 결과를 찾는 학습을 하였다면, 오늘은 "정답이 없는" 패턴을 찾는것을 배운것이다. 클러스터링이란?????강의 초반에 받은 설명이 정말 와닿았다.현업에서 데이터분석가는 방대한 고객 DB를 받는다.그 속에는 수백만 개의 고객 정보가 있는데, 우리는 이 고객들을 어떻게 묶을 것인가?구독자와 미구독자로? (이미 정답이 있음 - 분류)아니면 고객들의 특성에 따라 자연스러운 그룹을 찾아볼까? (정답이 없음 - 클러스터링)클러스터링은 정답 없이 데이터 자체에서 의미 있는 그룹을 찾아내는 것이다.지금까지 배운 분류(Classification)와 다른 점:분류: "이 고객은 구독할 것인가?" (Yes/No 정해짐)클러스..

카테고리 없음 2025.12.15