연속형 독립변수가 연속형 종속변수에 영향 미치는지 파악하기 위함.
즉, 독립->종속의 영향관계가 성립되는지가 중요
예)
요인 | 비표준화계수(회귀계수) | 표준오차 | 표준화계수 | T-값 | p |
공부시간 | 3.432 | 0.854 | 0.654 | 4.015 | 0 |
지능지수 | 1.343 | 0.832 | 0.321 | 1.1614 | 0.213 |
pow(R,2) = 0.754, F=43.132, P=0.000 |
회귀계수= 공부시간이 1 변할때 종속변수인 성적이 변하는 정도, 즉 공부시간 1 증가시, 성적이 3.432증가
표준오차= 위의 계수값은, 표본에서 얻어진 것이므로, 모집단을 다르게 할 때 계수가 달라지는 정도
검정통계량 = 차이or영향(=계수)/오차 = T값 = 영향이 오차에 비해 얼마나 큰가?
영향이 전혀 없다는 귀무가설이 있다 할 때, 오차의 2배 정도면 95%신뢰구간에서 그 설을 채택하는데,
T값은 4로, 4배 차이나므로 채택하지 않는다.
종속변수에 미치는 영향요인(독립변수)가 2개 이상일 경우, 다중회귀분석을 활용
종속변수에 대한 독립변수들 간의 영향력 크기 파악이 필요
EX) 가족력, 술담배 등 다른 변수가 동일한 상황에서, BMI가 변할 때 혈관지수는?
일반적으론 최소제곱선 활용
결정계수(설명력) - 추정된 회귀식이 종속변수를 얼마나 설명하는가?
독립변수가 종속변수를 설명, 예측하는데에 얼마나 기여했는지 보여주는 지수, 0~1 사이의 값으로 표현됨
SSR = Sum of Squared(Regression)
SSE = Sum of Squared(Error)
SSR + SSE = SST(Total), 전체에 비해서 맞은 게 몇개?
pow(R,2) = SSR/SST
pow(R,2) = SSR/SST = 2716.130/5030/000 = 0.739
직선에 의해 예측되는 건 31.03원인데 실제 판매가가 25원인 경우, 맞은부분 -30.97이고, 틀린부분 -6.03dlek.
이런 걸 다 제곱해서 더하면, 각각 3716.130(맞은 것), 1313.870(틀린거)가 되며,
둘을 더해서 3716으로 나누면 0.739가 나온다.
'버츄얼유튜버' 카테고리의 다른 글
공학수학 2.푸리에급수 유도 (0) | 2021.11.28 |
---|---|
R-23. 더미회귀분석 (0) | 2021.11.28 |
R-19. 상관관계분석 개념&원리 (0) | 2021.11.27 |
공학수학2 1.푸리에해석기초 (0) | 2021.11.27 |
수학 & 전자처리 공부 링크 (2) | 2021.11.24 |