6주차가 시작되었다. 지난 주의 데이터 전처리와 분석/시각화를 진행했다.
지난주 매핑 미완료 문제를 완전히 해결했다.
최종 매핑 결과:
- 매핑 완료: 3,154,257개 ✓
- 매핑 안된 행: 18,764개 ✗
매핑 실패 원인 분석
매핑되지 않은 데이터를 분석한 결과, 특정 패턴을 발견했다:
- 대문자로 표기된 값들
- 챔피언 이름과 유사하지만 다른 값들 (LuxInferno, Luxlight, LuxWoodland 등)
결정: 제거
정확한 원인을 파악하기 어렵고, 분석에 방해가 될 수 있어 매핑되지 않은 18,764개 행을 과감하게 제거했다.
이것은 약 0.6%의 데이터 손실이며, 전체 분석에는 큰 영향을 주지 않는다.
메타데이터 매핑 후 기본 분석을 진행했다.
분석 항목:
- 챔피언 사용 빈도 (Top 10)
- 어떤 챔피언들이 가장 많이 선택되는가?
- 챔피언 평균 순위
- 각 챔피언을 사용했을 때의 평균 최종 순위
- 사용 빈도 vs 평균 순위
- 인기도와 성능의 관계를 분석
기초 분석 결과를 시각화하는 단계다.
현재까지 시각화한 내용:
- 챔피언 사용 빈도 (Top 10) 바 차트
진행 예정:
- 챔피언 평균 순위 시각화
- 인기도와 성능의 상관관계 표현
26일차를 마무리하며...
메타데이터 매핑부터 기초분석, 시각화까지 데이터 분석의 전체 프로세스를 진행하고 있다.
이제 분석 결과를 통해 TFT 게임의 메타와 챔피언 성능에 대한 인사이트를 도출할 수 있게 되었다.
이번주 목표는는 분석 결과를 완성하고 팀과 공유하는 단계가 될 것이다.