[데이터마이닝] 3강. R에서 회귀모형 함수 정리
데이터마이닝 03강 | 회귀모형 R 함수와 실습 완전 정리 이번 시간에는 데이터마이닝 분석을 R로 수행할 때 꼭 알아야 할 주요 함수를 정리합니다.선형회귀, 로지스틱회귀, 모형 선택, 예측까지 실전에서 바로 활용 가능한 R 함수 문법과 옵션을 자세히 알려드리겠습니다. R에서 회귀모형 함수 정리 선형회귀모형 함수 lm() 데이터에서 선형회귀모형을 적합할 때 사용하는 함수입니다. 1…
데이터마이닝 03강 | 회귀모형 R 함수와 실습 완전 정리 이번 시간에는 데이터마이닝 분석을 R로 수행할 때 꼭 알아야 할 주요 함수를 정리합니다.선형회귀, 로지스틱회귀, 모형 선택, 예측까지 실전에서 바로 활용 가능한 R 함수 문법과 옵션을 자세히 알려드리겠습니다. R에서 회귀모형 함수 정리 선형회귀모형 함수 lm() 데이터에서 선형회귀모형을 적합할 때 사용하는 함수입니다. 1…
회귀진단이란? 회귀분석에서는 모형과 가정이 잘 설정되었는지 확인하는 과정이 필요합니다.이걸 회귀진단(Regression Diagnostics)이라고 합니다. 모형진단 : 회귀모형이나 가정에 문제점이 있는지 확인 자료진단 : 개별 데이터가 회귀모형에 어떤 영향을 주는지 점검 총괄분석을 하고 끝내는 게 아니라, 반드시 회귀진단을 통해모형의 적합성을 검토해야 신뢰성 있는 결과를 얻을 수 있습니다. 구분 총괄분석 회귀진단 목적 회귀모형 전체…
변수선택이란 무엇인가? 회귀분석에서는 여러 개의 설명변수 중 어떤 변수를 회귀모형에 포함시킬지 결정해야 합니다.이 과정을 변수선택(Variable Selection)이라고 부릅니다. 복잡한 모형보다는 간결한 모형이 해석이 쉬우며,쓸데없는 변수가 많으면 분석 결과의 신뢰성과 안정성이 떨어질 수 있습니다. 다중공선성(Multicollinearity) 문제 다중공선성이란 설명변수들 사이에 높은 상관관계가 있어회귀계수의 해석이 불안정해지는 현상입니다. 다중공선성 확인 방법 설명변수들 간 상관계수 확인…
회귀분석이란 무엇인가요? 우리 주변에서는 어떤 현상이 다른 현상에 영향을 주는 경우가 많습니다.예를 들어 국민소득이 증가하면 자동차 보유 대수도 증가하거나, 광고비를 많이 지출할수록 매출이 증가하는 현상처럼 말입니다. 이렇게 두 변수 간의 관계를 알아보고, 그 관계를 수학적인 식으로 표현하는 통계 분석 기법을 회귀분석(Regression Analysis)이라고 합니다. 용어 정리 설명변수 (X) : 다른…