본문 바로가기

버츄얼유튜버

R-21. 선형회귀분석

연속형 독립변수가 연속형 종속변수에 영향 미치는지 파악하기 위함.

즉, 독립->종속의 영향관계가 성립되는지가 중요

 

예)

요인 비표준화계수(회귀계수) 표준오차 표준화계수 T-값 p
공부시간 3.432 0.854 0.654 4.015 0
지능지수 1.343 0.832 0.321 1.1614 0.213
pow(R,2) = 0.754, F=43.132, P=0.000

회귀계수= 공부시간이 1 변할때 종속변수인 성적이 변하는 정도, 즉 공부시간 1 증가시, 성적이 3.432증가

표준오차= 위의 계수값은, 표본에서 얻어진 것이므로, 모집단을 다르게 할 때 계수가 달라지는 정도

검정통계량 = 차이or영향(=계수)/오차 = T값 = 영향이 오차에 비해 얼마나 큰가?

영향이 전혀 없다는 귀무가설이 있다 할 때, 오차의 2배 정도면 95%신뢰구간에서 그 설을 채택하는데,

T값은 4로, 4배 차이나므로 채택하지 않는다.

 

종속변수에 미치는 영향요인(독립변수)가 2개 이상일 경우, 다중회귀분석을 활용

종속변수에 대한 독립변수들 간의 영향력 크기 파악이 필요

EX) 가족력, 술담배 등 다른 변수가 동일한 상황에서, BMI가 변할 때 혈관지수는?

 

일반적으론 최소제곱선 활용

 

결정계수(설명력) - 추정된 회귀식이 종속변수를 얼마나 설명하는가?

독립변수가 종속변수를 설명, 예측하는데에 얼마나 기여했는지 보여주는 지수, 0~1 사이의 값으로 표현됨

SSR = Sum of Squared(Regression)

SSE = Sum of Squared(Error)

SSR + SSE = SST(Total), 전체에 비해서 맞은 게 몇개?

pow(R,2) = SSR/SST

pow(R,2) = SSR/SST = 2716.130/5030/000 = 0.739

직선에 의해 예측되는 건 31.03원인데 실제 판매가가 25원인 경우, 맞은부분 -30.97이고, 틀린부분 -6.03dlek.

이런 걸 다 제곱해서 더하면, 각각 3716.130(맞은 것), 1313.870(틀린거)가 되며, 

둘을 더해서 3716으로 나누면 0.739가 나온다.

'버츄얼유튜버' 카테고리의 다른 글

공학수학 2.푸리에급수 유도  (0) 2021.11.28
R-23. 더미회귀분석  (0) 2021.11.28
R-19. 상관관계분석 개념&원리  (0) 2021.11.27
공학수학2 1.푸리에해석기초  (0) 2021.11.27
수학 & 전자처리 공부 링크  (2) 2021.11.24