Clary K의 N차원 Ax 언저리 탐험

  • 홈
  • 태그
  • 방명록

Isolation Forest 1

[데이터전처리] Outlier(이상치/이상값/특이값/특이치 등) 탐지 방법(detection method) : 3. Isolation Forest 알고리즘 with 파이썬

Isolation Forest는 앙상블 의사 결정 트리 기반 모델에 속하는 비지도 학습 알고리즘으로 의사 결정 트리를 기반으로 구축되었다. 이 방식은 먼저 올린 IQR이나 Z-score 방식 외 주요 인기있는 이상 감지 알고리즘과는 많이 다르다. 다른 다수의 방식들은 데이터의 정상 영역을 찾는 것을 시도한 다음 정상 영역이라고 정의한 영역 외부의 모든 항목이 이상치 또는 비정상인지를 식별한다. Isolation Forest 알고리즘 개념 그러나 Isolation Forest 방법은 다르게 작동한다. 데이터에 Isolation Forest 알고리즘을 적용하면 이상값들이 일반 지점에 비해 나머지 샘플에서 분리(격리)되는 경향이 있다. 그래서 각 데이터 포인트에 점수를 부여하여 정상적인 관측값과 영역을 프로파..

AI & 빅데이터/데이터 주물럭( + feature engineering) 2020.11.20
1
더보기
프로필사진

EDA & 데이터 시각화 관련 블로그입니다 :) 네이버에서 판다스 분석 관련 블로그를 운영중이에요! blog.naver.com/youji4ever

  • 분류 전체보기 (6)
    • 데이터 시각화 (1)
      • 시각화 인사이트 (0)
      • 파이썬 plotly & dash (0)
      • 파이썬 ggplot2 & plotnine (0)
      • 파이썬 matplotlib & seaborn (0)
      • EDA : 데이터 탐색 노트북 (1)
    • AI & 빅데이터 (4)
      • 데이터 주물럭( + feature engineer.. (4)
      • 머신러닝 주물럭 (0)

Tag

Standard-score, 이상값 탐지, IQR, 판다스비주얼어날리시스, outlier detection, pandas_visual_analysis, 이상치, 파이썬, DBCSAN, 데이터시각화, 이상값탐지, 판다스, python, 이상치 탐지, Z-score, 이상값, 이상치탐지, EDA시각화, Isolation Forest, Outlier,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Clary K's 네이버 블로그 (판다스 분석)

Copyright © Kakao Corp. All rights reserved.

  • Clary K's 판다스 데이터 분석

티스토리툴바