태그 R프로그래밍

[데이터마이닝] 1강. 데이터마이닝 기초 개념

데이터마이닝이란? 데이터마이닝이란 무엇인가요? 데이터마이닝(data mining)은 대량의 데이터 속에서 의미 있는 패턴이나 규칙을 찾아내어 유용한 지식을 얻는 과정을 말합니다.최근 데이터가 급격히 많아지면서, 단순히 데이터를 저장하는 것에 그치지 않고, 데이터를 분석하여 가치를 창출하는 일이 매우 중요해졌습니다. 예를 들어, 수천 명 고객의 구매 기록 속에서 ‘이 고객은 신제품을 좋아하는구나’라는 사실을 찾아내는 것도 데이터마이닝입니다.…

[회귀분석] 4강. 표준화된 중회귀분석과 변수선택법 완전 정리

표준화된 중회귀분석이란? 일반 중회귀모형에서는 독립변수마다 단위가 다르기 때문에기울기(회귀계수)를 단순 비교하는 것이 어렵습니다. 이를 해결하기 위해 각 변수의 단위를 제거하고 표준화하는 방법이 표준화 회귀분석입니다. 표준화 회귀계수 표준화된 회귀계수는 독립변수의 영향력을 상대적으로 비교할 때 유용하게 활용됩니다.값이 클수록 반응변수에 미치는 영향이 크다는 뜻입니다. R 코드 예시 결과 :X1의 영향력이 X2보다 크다는 것을 확인할…

[회귀모형] 3강. 2개 이상의 변수를 사용하는 회귀분석

중회귀모형이란? 중회귀모형(Multiple Linear Regression Model)은반응변수(종속변수)의 변화를 설명하기 위해 **2개 이상의 설명변수(독립변수)**를 사용하는 선형회귀모형입니다. 예를 들어, 상점의 총 판매액을 예측하려 할 때 인테리어비 상점 크기 두 개의 독립변수를 함께 고려하여 매출을 예측하는 것이 중회귀모형입니다. 중회귀모형 수식 표현   Y=β0+β1X1+β2X2+ϵY = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon YY :…

[회귀모형] 2강. 추정, 검정, 가중회귀

단순회귀모형의 기본 가정 회귀분석을 제대로 하기 위해서는 몇 가지 기본적인 가정을 충족해야 합니다.이는 분석 결과의 신뢰성을 확보하기 위해 꼭 필요한 과정입니다. 선형성(Linearity) : 설명변수 X와 반응변수 Y는 선형 관계를 가져야 한다 등분산성(Equal Variance) : 오차의 분산이 일정해야 한다 독립성(Independence) : 오차끼리는 서로 독립이어야 한다 정규성(Normality) : 오차항은 정규분포를 따라야 한다…

[회귀모형] 1강. 초보자도 이해하는 단순회귀모형 기초 정리

회귀분석이란 무엇인가요? 우리 주변에서는 어떤 현상이 다른 현상에 영향을 주는 경우가 많습니다.예를 들어 국민소득이 증가하면 자동차 보유 대수도 증가하거나, 광고비를 많이 지출할수록 매출이 증가하는 현상처럼 말입니다. 이렇게 두 변수 간의 관계를 알아보고, 그 관계를 수학적인 식으로 표현하는 통계 분석 기법을 회귀분석(Regression Analysis)이라고 합니다.   용어 정리 설명변수 (X) : 다른…