Clary K의 N차원 Ax 언저리 탐험

  • 홈
  • 태그
  • 방명록

clustering 1

[데이터전처리] Outlier(이상치/이상값/특이값/특이치 등) 탐지 방법(detection method) : 4. DBSCAN 알고리즘 with 파이썬

그동안 데이터전처리 관련 포스팅을 아주 오랫동안 쉬었다가 오랜만에 작성을 해본다. 지난번에 포스팅 한 이상치 처리 시리즈는 모두 일변량 이상치 감지에 관한 것이었고, 오늘부터는 이변량과 다변량 이상치 감지에 관한 포스팅으로 작성하려고 한다. 그리하여 다변량 분석에 속하는 첫번째 이상치 감지 알고리즘은 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)에 관한 것이다. 이 알고리즘은 클러스터에 속하지 않는 점을 이상값으로 식별하는 클러스터링 알고리즘인 K-Means의 대안으로 사용하기도 한다. 클러스터 수를 미리 지정할 필요가 없다는 점을 제외하면 K-Means와 같다. 클러스터링은 유사한 데이터 포인트들이 그룹화되는 방식으로 데이터 포..

AI & 빅데이터/데이터 주물럭( + feature engineering) 2021.03.11
1
더보기
프로필사진

EDA & 데이터 시각화 관련 블로그입니다 :) 네이버에서 판다스 분석 관련 블로그를 운영중이에요! blog.naver.com/youji4ever

  • 분류 전체보기 (6)
    • 데이터 시각화 (1)
      • 시각화 인사이트 (0)
      • 파이썬 plotly & dash (0)
      • 파이썬 ggplot2 & plotnine (0)
      • 파이썬 matplotlib & seaborn (0)
      • EDA : 데이터 탐색 노트북 (1)
    • AI & 빅데이터 (4)
      • 데이터 주물럭( + feature engineer.. (4)
      • 머신러닝 주물럭 (0)

Tag

이상값, Standard-score, python, Z-score, 이상값 탐지, 파이썬, 이상치탐지, IQR, EDA시각화, DBCSAN, Isolation Forest, 이상치 탐지, outlier detection, Outlier, pandas_visual_analysis, 이상치, 데이터시각화, 이상값탐지, 판다스비주얼어날리시스, 판다스,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Clary K's 네이버 블로그 (판다스 분석)

Copyright © Kakao Corp. All rights reserved.

  • Clary K's 판다스 데이터 분석

티스토리툴바