태그 R데이터분석

[R 시계열분석 기초] ACVF, ACF, PACF 개념 완전 정복

시계열 데이터에서 왜 필요한가? 시계열 데이터는 시간의 흐름에 따라 기록된 데이터입니다. 이 데이터를 분석할 때 중요한 건 과거 값이 현재나 미래 값에 영향을 주는지 확인하는 것이죠. 이걸 확인하려면 서로 시간 간격(lag)이 있는 값들끼리 얼마나 관련이 있는지 알아야 하는데, 그걸 측정하는 게 바로 자기공분산함수(ACVF) 자기상관함수(ACF)   자기공분산함수(Autocovariance Function, ACVF) 정의 시간차(시차)…

[데이터마이닝] 7강. 배깅, 부스팅, 랜덤포레스트 R 함수 총정리

데이터마이닝 07강 | 배깅, 부스팅, 랜덤포레스트 R 함수 총정리 이번 강의에서는 앙상블 모형 분석을 위한 R 함수 사용법을 정리합니다.특히 배깅, 부스팅, 랜덤포레스트 각각의 R 함수와 옵션을 상세하게 설명합니다. 배깅과 부스팅 R 함수 bagging() 함수 배깅 앙상블을 생성하는 함수 1 bagging(formula, data, mfinal=100, control) cs formula : 분석공식 data : 훈련 데이터 mfinal :…

[데이터마이닝] 3강. R에서 회귀모형 함수 정리

데이터마이닝 03강 | 회귀모형 R 함수와 실습 완전 정리 이번 시간에는 데이터마이닝 분석을 R로 수행할 때 꼭 알아야 할 주요 함수를 정리합니다.선형회귀, 로지스틱회귀, 모형 선택, 예측까지 실전에서 바로 활용 가능한 R 함수 문법과 옵션을 자세히 알려드리겠습니다. R에서 회귀모형 함수 정리 선형회귀모형 함수 lm() 데이터에서 선형회귀모형을 적합할 때 사용하는 함수입니다. 1…

[데이터마이닝] 2강. 선형회귀, 로지스틱회귀

데이터마이닝 회귀모형 기초와 실습 — 선형회귀, 로지스틱회귀 회귀모형이란? 회귀모형은 입력변수(X)와 결과값(Y) 사이의 관계를 수학적으로 표현해주는 모형입니다.데이터 분석에서 결과를 예측하거나 변수 간 관계를 설명할 때 활용됩니다. 선형회귀모형 (Linear Regression) 공식과 개념   Yi=β0+β1Xi1+β2Xi2+⋯+βpXip+ϵiY_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \cdots + \beta_p X_{ip} + \epsilon_i ​ β0\beta_0 :…

[데이터마이닝] 1강. 데이터마이닝 기초 개념

데이터마이닝이란? 데이터마이닝이란 무엇인가요? 데이터마이닝(data mining)은 대량의 데이터 속에서 의미 있는 패턴이나 규칙을 찾아내어 유용한 지식을 얻는 과정을 말합니다.최근 데이터가 급격히 많아지면서, 단순히 데이터를 저장하는 것에 그치지 않고, 데이터를 분석하여 가치를 창출하는 일이 매우 중요해졌습니다. 예를 들어, 수천 명 고객의 구매 기록 속에서 ‘이 고객은 신제품을 좋아하는구나’라는 사실을 찾아내는 것도 데이터마이닝입니다.…

[회귀모형] 2강. 추정, 검정, 가중회귀

단순회귀모형의 기본 가정 회귀분석을 제대로 하기 위해서는 몇 가지 기본적인 가정을 충족해야 합니다.이는 분석 결과의 신뢰성을 확보하기 위해 꼭 필요한 과정입니다. 선형성(Linearity) : 설명변수 X와 반응변수 Y는 선형 관계를 가져야 한다 등분산성(Equal Variance) : 오차의 분산이 일정해야 한다 독립성(Independence) : 오차끼리는 서로 독립이어야 한다 정규성(Normality) : 오차항은 정규분포를 따라야 한다…