-
상관분석, 상관계수 rStatistics/통계 및 실습 2022. 11. 8. 15:30
상관분석
- 두 변수 사이에서 어떤 선형적 linear 관계, 상관관계를 갖고 있는 지를 분석하는 방법
- 두 변수 간의 관계를 상관 계수 r 로 표현한다.
- 두 변수간의 연관 정도, 상관 정도를 표현, 인과관계 표현 X ☞ 두 변수 간의 인과관계는 회귀분석
선형성 Linear
- 두 변수 X와 Y의 관게를 선의 형태 및 1차 함수의 형태로 나타나는 성질
분석 방법
- 단순 상관분석 : 두 변수가 얼마나 강한 상관 관계가 있는지 분석
- 다중 상관분석 : 2개 이상의 변수간 관계의 강도를 측정하는 분석
피어슨 상관 계수 r ( Pearson Correlation coeffcient ; Pearson's r )
r = X와 Y가 함께 변하는 정도 / X와 Y가 각각 변하는 정도
X와 Y의 값이 완전 동일하면 r = + 1
X와 Y의 값이 전혀 다르면 r = 0
X와 Y의 값이 반대방향으로 동일하면 r = - 1
피어슨 상관계수의 결정 계수 r²
- 결정계수는 추정한 선형 모형이 적합한지를 측정하는 척도
- 상관 계수 r 의 값이 - 1 ~ r ~ 1 사이의 값을 가지므로 r² 값은 0 ~ 1 사이의 값을 가짐
비모수 검정방법
스피어만 상관 계수 (Spearman Rank)
- 두 변수의 순위의 통계적 의존성을 측정하는 측정방법
- 변수 값이 범주형 데이터인 서열척도인 경우 순위를 이용하여 구한 상관계수
- 변수 간 연관관계를 밝혀주며, 표본의 크기가 작을 때 용이함
켄달 타우 상관계수 (Kendall Tau)
- 스피어만 순위 상관계수와 비슷한 개념
- 단조성을 판단하기 위해 사용
- 샘플 사이즈가 작거나, 데이터의 동률이 높을 때 유용하게 사용
선형성을 구성하고, 정규성을 만족하는 상관분석에서는 스피어만 상관 계수
정규성을 만족하지 않고, 서열척도로 측정된 상관분석에서는 피어슨 상관 계수, 켄달 상관계수
더보기참고문헌
조성호 저, 「쉽게 배우는 운영체제」, 한빛아카데미, 2018, 616p
https://bioinformaticsandme.tistory.com/58
https://ko.wikipedia.org/wiki/%EC%83%81%EA%B4%80_%EB%B6%84%EC%84%9D
http://www.rfdh.com/bas_rf/begin/linear.htm
https://ko.wikipedia.org/wiki/%EC%84%A0%ED%98%95%EC%84%B1
https://ko.wikipedia.org/wiki/%EA%B2%B0%EC%A0%95%EA%B3%84%EC%88%98
https://lunch-box.tistory.com/110
⊙ 이 글은 개인 공부를 목적으로 작성된 글입니다.
⊙ 내용에 대한 오류나 피드백 감사히 받고 있습니다 !
반응형'Statistics > 통계 및 실습' 카테고리의 다른 글
t 검정 / t - Test (0) 2022.12.22 카이제곱분석, 교차분석, Fisher's exact Test (0) 2022.11.14 가설검정 - 귀무가설 / 대립가설 (0) 2022.10.20 통계 분석 기법의 선택 (0) 2022.10.20 정규분포와 표준정규분포, Z 표준점수 (0) 2022.10.20