Clary K의 N차원 Ax 언저리 탐험

  • 홈
  • 태그
  • 방명록

이상값탐지 1

[데이터전처리] Outlier(이상치/이상값/특이값/특이치 등) 탐지 방법(detection method) : 1. IQR 방식 with 파이썬

데이터 내에서 이상값을 탐지하는 강력한 방법 중 하나로 탐색적 데이터 분석(EDA)의 선구자인 John Tukey가 개발한 이상치 검출 IQR (사 분위 범위) 방법이 있다. 역사가 오래된 전통적인 방법이다. 이 방법이 고안된 시대는 수작업으로 계산하고 플로팅도 하는 시대였기 때문에 대체적으로 데이터셋은 일반적으로 작았으며 데이터가 말해주고 있는 이야기 자체를 이해하는 데에 중점을 두었다고 한다. John Tukey가 기여한 박스플롯(box-and-whisker 플롯이라고 불리기도 함)을 본 적이 있다면 이 방법이 실제로 작동하는 것을 본 것이나 다름없다 :) IQR Method란? 박스플롯 그래프는 사 분위수(데이터를 동일한 사이즈의 4개 그룹으로 나누는 기준 점)를 사용하여 데이터의 모양을 표시한다...

AI & 빅데이터/데이터 주물럭( + feature engineering) 2020.10.28
1
더보기
프로필사진

EDA & 데이터 시각화 관련 블로그입니다 :) 네이버에서 판다스 분석 관련 블로그를 운영중이에요! blog.naver.com/youji4ever

  • 분류 전체보기 (6)
    • 데이터 시각화 (1)
      • 시각화 인사이트 (0)
      • 파이썬 plotly & dash (0)
      • 파이썬 ggplot2 & plotnine (0)
      • 파이썬 matplotlib & seaborn (0)
      • EDA : 데이터 탐색 노트북 (1)
    • AI & 빅데이터 (4)
      • 데이터 주물럭( + feature engineer.. (4)
      • 머신러닝 주물럭 (0)

Tag

IQR, 이상치, 이상값, 이상치 탐지, 이상값 탐지, 파이썬, outlier detection, Z-score, pandas_visual_analysis, 이상값탐지, DBCSAN, python, Isolation Forest, 판다스, Outlier, 판다스비주얼어날리시스, Standard-score, 이상치탐지, 데이터시각화, EDA시각화,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Clary K's 네이버 블로그 (판다스 분석)

Copyright © Kakao Corp. All rights reserved.

  • Clary K's 판다스 데이터 분석

티스토리툴바