Clary K의 N차원 Ax 언저리 탐험

  • 홈
  • 태그
  • 방명록

Z-score 1

[데이터전처리] Outlier(이상치/이상값/특이값/특이치 등) 탐지 방법(detection method) : 2. Z-score 방식 with

이상치 탐지 두번째 시간은 Z-score 방식에 대해서 알아본다. Z-score는 통계에서 중요한 개념이고, 다른 이름으로 Standard-score라고도 한다. 이 방법은 변수에 가우스 분포가 취하고 있다는 가정으로 시작하고, 관측치가 평균에서 벗어난 표준 편차의 수를 나타낸다. 포인트 그룹의 평균 및 표준 편차와의 관계 측면에서 데이터 포인트를 설명하는 방법이라고 볼 수 있다. 이 score는 데이터 값이 평균보다 큰지 작은지를 확인할 수 있게 해주고, 평균 포인트에서 얼마나 떨어져 있는지를 이해할 수 있도록 도움을 주는데, 보다 구체적으로 Z-score는 데이터 포인트가 평균에서 얼마나 떨어져 있는지를 나타내고 있다. Z score = (x -mean) / std. deviation 다음과 같이 추..

AI & 빅데이터/데이터 주물럭( + feature engineering) 2020.11.08
1
더보기
프로필사진

EDA & 데이터 시각화 관련 블로그입니다 :) 네이버에서 판다스 분석 관련 블로그를 운영중이에요! blog.naver.com/youji4ever

  • 분류 전체보기 (6)
    • 데이터 시각화 (1)
      • 시각화 인사이트 (0)
      • 파이썬 plotly & dash (0)
      • 파이썬 ggplot2 & plotnine (0)
      • 파이썬 matplotlib & seaborn (0)
      • EDA : 데이터 탐색 노트북 (1)
    • AI & 빅데이터 (4)
      • 데이터 주물럭( + feature engineer.. (4)
      • 머신러닝 주물럭 (0)

Tag

판다스, Isolation Forest, Standard-score, python, Outlier, 판다스비주얼어날리시스, 이상치, IQR, Z-score, 이상값, 이상값탐지, 데이터시각화, outlier detection, 이상값 탐지, pandas_visual_analysis, EDA시각화, DBCSAN, 이상치탐지, 이상치 탐지, 파이썬,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Clary K's 네이버 블로그 (판다스 분석)

Copyright © Kakao Corp. All rights reserved.

  • Clary K's 판다스 데이터 분석

티스토리툴바