버츄얼유튜버

R-23. 더미회귀분석

두원공대88학번뚜뚜 2021. 11. 28. 19:00

선형회귀분석은 독립&종속변수가 연속형 자료임을 가정.

근데 종속변수에 영향을 미치는 주요 독립변수가 범주형자료라면?

더미변수는, 코딩된 숫자의 의미는 없애고, 특정 범주에 해당되는지 여부로 변환.

ex) 혈당치에 흡연의 유무, 가족력 유무

 

더미변수를 만들기

어떤 집단을 0으로, 어떤 집단을 1로 할 것인가?

더미변수를 몇 개 만들어야 하는가? 집단수-1개.

ex) 성별: 남자이나, 아니냐 2개.

연령: 20대, 30대, 40대 3개. 즉 10대는 000, 20대는 100, 30대는 010, 40대는 001로 표시 가능.

 

더미회귀분석과정

1) 변수 기준집단 설정 ex)성별:남자, 연령:10대, 소득:상

2) 각 하부집단의 더미변수 생성

3) 모든 하부집단을 독립변수에 투입

4) 하부집단 중 기준집단(가령 남자 1개, 혹은 연령 1개) 염두하고, 종속변수에 미치는 영향 해석