sott

sott

[데이터처리와활용] 1강. 관계형 데이터베이스 기초

관계형 데이터베이스 기초 — 완전 쉬운 데이터베이스 입문 데이터베이스란 무엇인가? 우리 주변에는 수많은 정보가 있습니다. 쇼핑몰에선 상품정보, 학교에선 학생정보, 은행에선 계좌정보가 있죠.이처럼 서로 연관된 대량의 데이터를 체계적으로 모아두고, 필요할 때 쉽게 꺼내 쓸 수 있게 정리해둔 저장소를 바로 데이터베이스(Database)라고 부릅니다. 데이터베이스 관리 시스템(DBMS) 단순히 정보를 모아두는 것만으론 부족합니다. 빠르게 찾고,…

[회귀모형] 12강. 로그선형모형과 과대산포, 준가능도 쉽게 정리

로그선형모형(Log-linear Model)이란? 반응변수가 개수(count) 자료일 때 주로 사용하는 일반화선형모형(GLM)의 일종입니다. 포아송 분포를 가정하고, 로그연결함수(log link function)를 사용하여 모형을 구성합니다. GLM 구성요소 반응변수 : Y∼Poisson(μ)Y \sim \text{Poisson}(\mu) 선형예측자 : η=β0+β1×1+⋯+βpxp 연결함수 : η=log⁡μ \eta = \log \mu 로그선형모형의 해석 승법모형 (Multiplicative Model) μ=exp⁡(β0+β1×1+⋯ )\mu = \exp(\beta_0 + \beta_1 x_1 + \cdots) eβie^{\beta_i}…

[회귀모형] 11강. 승산비, 상대위험도, 다항로짓모형 쉽게 정리

승산(Odds)과 승산비(Odds Ratio)란? 2×2 분할표의 확률 구조 질병 발생 질병 미발생 위험인자 노출 π1 1−π1 비노출 π0 1−π0 승산(Odds)   Oddsi=πi1−πi\text{Odds}_i = \frac{\pi_i}{1 – \pi_i} ​​ 승산비(Odds Ratio)   OR=Odds1Odds0=π1(1−π0)π0(1−π1)OR = \frac{\text{Odds}_1}{\text{Odds}_0} = \frac{\pi_1(1-\pi_0)}{\pi_0(1-\pi_1)} ​ 해석 OR = 2 → 노출군의 질병발생 승산이 비노출군의 2배   상대위험도(Relative Risk)   RR=π1π0RR…

[회귀모형] 10강. 일반화선형모형(GLM) 해석과 진단법 쉽게 정리

로지스틱 회귀모형 복습 반응변수가 성공/실패(1/0) 이항형 자료일 때 사용하는 GLM의 대표적인 모형이 로지스틱 회귀입니다.   log⁡(π(x)1−π(x))=β0+β1x\log \left( \frac{\pi(x)}{1-\pi(x)} \right) = \beta_0 + \beta_1 x   여기서 π(x) : 성공확률 β1\beta_1 : X가 1 증가할 때 로그-승산의 변화량 eβ1e^{\beta_1} : 승산비(odds ratio) 로지스틱 함수와 해석 π(x)=eβ0+β1×1+eβ0+β1x\pi(x) = \frac{e^{\beta_0 + \beta_1 x}}{1+e^{\beta_0…

[회귀모형] 9강. 일반화선형모형(GLM) 쉽게 정리

일반화선형모형(GLM)란? 기존 선형회귀모형의 한계를 극복하기 위해,반응변수의 분포가 정규분포 외에도 이항분포, 포아송분포, 감마분포 등을 따르는 상황에서 쓸 수 있도록 확장한 회귀모형입니다. Nelder & Wedderburn (1972) 이론에 기반. GLM 구성요소 3가지 1️⃣ 반응변수의 분포 정규, 이항, 포아송, 감마 등 지수족 분포 2️⃣ 선형예측자 (η) 설명변수의 선형결합   η=β0+β1×1+⋯+βpxp\eta = \beta_0 + \beta_1…

[회귀모형] 8강. 오차의 등분산성, 선형성, 정규성, 변수변환

회귀모형 진단이란? 회귀분석을 하면 결과만 보는 게 아니라,모형이 제대로 설정되었는지, 가정이 충족됐는지 확인하는 과정이 필요합니다.이를 모형진단(Regression Diagnostics)이라고 합니다. 회귀모형의 기본 가정 1️⃣ 오차의 등분산성 : X 값과 관계없이 Y의 분산은 일정2️⃣ 선형성 : Y와 X 사이 선형 관계3️⃣ 오차의 정규성 : 오차항이 정규분포를 따른다 이 세 가지가 지켜지지 않으면, 분석…

[회귀분석] 7강. 회귀분석 진단법과 특이값, 영향관측값 완전 정리

회귀진단이란? 회귀분석에서는 모형과 가정이 잘 설정되었는지 확인하는 과정이 필요합니다.이걸 회귀진단(Regression Diagnostics)이라고 합니다. 모형진단 : 회귀모형이나 가정에 문제점이 있는지 확인 자료진단 : 개별 데이터가 회귀모형에 어떤 영향을 주는지 점검 총괄분석을 하고 끝내는 게 아니라, 반드시 회귀진단을 통해모형의 적합성을 검토해야 신뢰성 있는 결과를 얻을 수 있습니다. 구분 총괄분석 회귀진단 목적 회귀모형 전체…

[회귀모형] 6강. 다항회귀와 가변수 회귀모형 완전 정리

다항회귀모형(Polynomial Regression)이란? 일반적인 회귀분석은 독립변수와 종속변수 간 직선 관계를 가정하지만현실에서는 곡선 형태로 관계를 나타내는 경우도 많습니다. 이때 사용하는 것이 다항회귀모형입니다. 다항회귀 공식 설명변수가 1개인 2차 다항회귀식:   Y=β0+β1X+β2X2+ϵY = \beta_0 + \beta_1 X + \beta_2 X^2 + \epsilon   설명변수가 2개인 2차 다항회귀식:   Y=β0+β1X1+β2X2+β3X12+β4X22+β5X1X2+ϵY = \beta_0 + \beta_1 X_1…

[회귀모형] 5강. 회귀분석에서 변수선택과 다중공선성 쉽게 정리

변수선택이란 무엇인가? 회귀분석에서는 여러 개의 설명변수 중 어떤 변수를 회귀모형에 포함시킬지 결정해야 합니다.이 과정을 변수선택(Variable Selection)이라고 부릅니다. 복잡한 모형보다는 간결한 모형이 해석이 쉬우며,쓸데없는 변수가 많으면 분석 결과의 신뢰성과 안정성이 떨어질 수 있습니다. 다중공선성(Multicollinearity) 문제 다중공선성이란 설명변수들 사이에 높은 상관관계가 있어회귀계수의 해석이 불안정해지는 현상입니다. 다중공선성 확인 방법 설명변수들 간 상관계수 확인…

[회귀분석] 4강. 표준화된 중회귀분석과 변수선택법 완전 정리

표준화된 중회귀분석이란? 일반 중회귀모형에서는 독립변수마다 단위가 다르기 때문에기울기(회귀계수)를 단순 비교하는 것이 어렵습니다. 이를 해결하기 위해 각 변수의 단위를 제거하고 표준화하는 방법이 표준화 회귀분석입니다. 표준화 회귀계수 표준화된 회귀계수는 독립변수의 영향력을 상대적으로 비교할 때 유용하게 활용됩니다.값이 클수록 반응변수에 미치는 영향이 크다는 뜻입니다. R 코드 예시 결과 :X1의 영향력이 X2보다 크다는 것을 확인할…

[회귀모형] 3강. 2개 이상의 변수를 사용하는 회귀분석

중회귀모형이란? 중회귀모형(Multiple Linear Regression Model)은반응변수(종속변수)의 변화를 설명하기 위해 **2개 이상의 설명변수(독립변수)**를 사용하는 선형회귀모형입니다. 예를 들어, 상점의 총 판매액을 예측하려 할 때 인테리어비 상점 크기 두 개의 독립변수를 함께 고려하여 매출을 예측하는 것이 중회귀모형입니다. 중회귀모형 수식 표현   Y=β0+β1X1+β2X2+ϵY = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon YY :…

[회귀모형] 2강. 추정, 검정, 가중회귀

단순회귀모형의 기본 가정 회귀분석을 제대로 하기 위해서는 몇 가지 기본적인 가정을 충족해야 합니다.이는 분석 결과의 신뢰성을 확보하기 위해 꼭 필요한 과정입니다. 선형성(Linearity) : 설명변수 X와 반응변수 Y는 선형 관계를 가져야 한다 등분산성(Equal Variance) : 오차의 분산이 일정해야 한다 독립성(Independence) : 오차끼리는 서로 독립이어야 한다 정규성(Normality) : 오차항은 정규분포를 따라야 한다…

[회귀모형] 1강. 초보자도 이해하는 단순회귀모형 기초 정리

회귀분석이란 무엇인가요? 우리 주변에서는 어떤 현상이 다른 현상에 영향을 주는 경우가 많습니다.예를 들어 국민소득이 증가하면 자동차 보유 대수도 증가하거나, 광고비를 많이 지출할수록 매출이 증가하는 현상처럼 말입니다. 이렇게 두 변수 간의 관계를 알아보고, 그 관계를 수학적인 식으로 표현하는 통계 분석 기법을 회귀분석(Regression Analysis)이라고 합니다.   용어 정리 설명변수 (X) : 다른…

금융기초이론 총정리 : 필수 금융지식과 최근 금융이슈 한눈에

금융기초이론 정리 마지막으로, 지금까지 배운 내용을 깔끔하게 정리하고 금융을 이해하는 데 꼭 필요한 기초 이론을 짚어봅시다. 1️⃣ 금리 이론금리란 돈을 빌리거나 맡겼을 때 발생하는 이자율입니다.금리가 오르면 대출이 줄고 저축이 늘고, 금리가 내리면 소비와 대출이 증가합니다.금리 변동은 경기와 물가, 투자, 환율에도 직간접적인 영향을 미칩니다. 2️⃣ 환율 이론환율은 자국 통화와 외국 통화의…

핀테크와 AI금융서비스 총정리 : 신기술이 바꾸는 금융생활

금융, 이제 기술과 한몸이 되다 예전엔 은행에 가서 통장을 만들고 창구에서 현금을 찾던 시절이 있었습니다.하지만 이제는 스마트폰으로 계좌를 개설하고, 투자도 앱으로, 보험 가입도 온라인으로 가능합니다. 이처럼 금융과 IT 기술이 융합된 것을 핀테크(FinTech)라고 부릅니다.기술의 발달이 금융환경을 완전히 바꿔버렸고, 이제 금융거래는 빠르고 간편하게 변했습니다. 핀테크(FinTech)란 무엇인가? 핀테크(FinTech)는 금융(Finance)과 기술(Technology)의 합성어입니다.즉, 기존의 금융서비스에…

금융소비자 보호법 총정리 : 사기 예방과 피해 대처법

금융소비자란 누구인가? 금융소비자라 하면 거창하게 들릴 수 있지만 사실은 금융상품이나 서비스를 이용하는 우리 모두를 말합니다.은행에 예금 통장을 만들거나, 카드로 결제하고, 보험을 가입하고, 대출을 받거나, 주식을 매매하는 사람 모두가 금융소비자입니다. 금융은 눈에 보이지 않는 상품이 많고, 내용이 복잡하며, 전문지식이 필요합니다. 그래서 일반 소비자는 상품에 대한 정보를 충분히 알지 못하고, 불리한 거래를…

사회초년생, 대학생을 위한 재무설계 완전정리

재무설계란 무엇인가? 재무설계, 말만 들어도 뭔가 전문적인 느낌이죠?간단히 말하면 자신의 인생 목표와 재정 상황을 분석해, 돈을 언제 얼마씩, 어떻게 관리하고 운용할지 설계하는 과정입니다. 우리가 인생에서 경험하는 크고 작은 일 — 대학 졸업, 취업, 결혼, 내 집 마련, 자녀 교육, 노후 생활 — 이런 것들을 실현하려면 돈이 필요합니다. 그런데 소득과 지출은…

20대부터 시작하는 연금설계와 노후 대비 재테크

노후 준비, 왜 중요한가? 지금은 젊고 건강해서 잘 실감이 안 날지 몰라도, 인생은 깁니다.평균 수명이 85세를 넘어선 요즘, 대학을 졸업하고 사회생활을 시작해도 은퇴 이후 30~40년을 살아야 하는 시대입니다. 문제는 그 긴 시간을 소득 없이 생활비와 의료비를 감당하며 살아야 한다는 것입니다. 가장 큰 위험은 노후 빈곤입니다. 소득이 끊기고, 의료비 부담은 커지는데…

리스크관리와 보험 필수 가이드 : 보험상품과 가입 요령

리스크란 무엇인가? 우리가 살아가다 보면 항상 예상치 못한 사건이 발생하기 마련입니다. 교통사고를 당하거나, 병원비가 갑자기 필요하거나, 실직을 당하거나, 화재나 자연재해 같은 일도 일어날 수 있습니다. 이렇게 미래에 발생할 수 있는 불확실한 위험을 경제용어로 리스크(Risk)라고 합니다. 리스크는 피할 수 없는 인생의 변수입니다. 누구도 미래를 예측할 수 없기 때문이죠. 중요한 건 이…

부채관리 전략 : 고금리 대출부터 신용불량 피하는 법

부채란 무엇인가? 부채란 쉽게 말해 지금 내가 갚아야 하는 빚입니다. 돈을 빌린 만큼 미래에 갚아야 할 의무가 있는 걸 의미합니다. 보통 우리는 은행 대출, 카드 할부금, 카드론, 학자금 대출, 캐피탈 할부금, 핸드폰 할부금 같은 형태로 부채를 지게 됩니다. 부채는 한편으론 꼭 나쁜 것만은 아닙니다. 적절하게 활용하면 필요한 자금을 미리 마련해…

신용관리의 모든 것 : 신용점수 올리는 법과 신용불량 피하기

신용이란 무엇인가? 금융거래에서 가장 중요한 요소 중 하나가 바로 신용입니다. 신용이란 쉽게 말해, ‘돈을 갚을 능력과 의지가 있는지에 대한 사회적 평가’를 말합니다. 우리가 은행에서 대출을 받을 때, 신용카드를 발급받을 때, 심지어 핸드폰 할부로 구매할 때도 이 ‘신용’을 기준으로 심사가 이루어집니다. 신용이 높으면 대출도 잘 되고, 금리도 더 유리하며, 각종 금융서비스를…

다양한 투자 상품과 투자 유의사항

투자상품이 이렇게 많다고? 사람들이 투자라고 하면 대부분 주식이나 부동산, 요즘은 코인 정도만 떠올리는 경우가 많은데, 사실 금융투자 상품은 정말 다양한 종류가 존재합니다. 각각의 상품은 수익률, 리스크, 투자 방식, 거래 구조가 다 달라서 자신의 투자성향과 목적에 따라 적절히 선택하는 게 중요합니다. 특히 금융시장엔 예금보다 높은 수익을 기대할 수 있는 상품도 많지만,…

금융투자 기초 : 투자 수익률과 리스크 총정리

투자란 무엇인가? 흔히 ‘투자’라고 하면 주식이나 부동산, 코인 같은 걸 떠올리기 쉽습니다. 물론 이것도 맞는 말이지요. 하지만 금융에서는 이보다 더 폭넓은 의미로 현재의 자금을 어떤 자산에 투입해서 미래에 더 많은 돈을 얻으려는 행위를 투자라고 합니다. 쉽게 말해, 지금 돈을 쓰지 않고 주식이나 채권, 펀드, 예금 등에 넣어두면 시간이 지나면서 이자나…

저축 완전 정복: 돈의 시간가치와 복리 이해하기

저축, 왜 중요할까? 우리 인생은 예상치 못한 일투성입니다. 갑자기 휴대폰이 고장날 수도 있고, 병원비가 필요할 수도 있고, 여행을 떠나고 싶을 수도 있습니다. 그런데 이런 상황을 모두 월급날 받는 돈으로 해결하기란 쉽지 않죠. 그래서 바로 저축이 필요한 겁니다. 저축은 단순히 돈을 안 쓰고 모아두는 게 아닙니다. 현재 소비를 줄이고, 미래를 위해…

금융상품, 금융시장, 금융회사의 모든 것

금융상품이란 무엇인가? 금융상품이라는 건 쉽게 말하면, 돈을 예치하거나 빌리거나 굴릴 수 있는 상품을 의미합니다. 우리가 은행이나 증권사, 보험사에서 가입하는 예금, 적금, 펀드, 주식, 보험 같은 것들이 모두 금융상품이죠. 금융상품의 가장 큰 특징은 자산을 불리거나 위험을 대비하거나 소비를 지연시킬 수 있다는 점입니다. 예를 들어, 일정 금액을 은행에 저축해서 이자를 받거나, 주식을…

금융의 기본 개념과 주요 금융지표 완벽 이해

금융은 왜 중요한가? 우리가 살아오면서 돈과 전혀 관련이 없는 일은 거의 없다고 해도 과언이 아닐겁니다. 친구와 밥을 먹고 각자 송금하는 일부터, 아르바이트 급여를 통장으로 받는 일, 투자 앱으로 주식을 사거나 예금을 가입하는 일까지 모두 금융과 연결되어 있습니다. 특히 요즘은 디지털 금융이 발달해서 핸드폰으로 결제하고, 주식을 사고, 해외송금까지 몇 번의 터치로…

3사분위수란? 개념부터 공식, 예제까지 쉽게 정리!

데이터 분석이나 통계 공부를 하다 보면 사분위수(Quartile)라는 개념을 자주 접하게 됩니다. 오늘은 그중에서도 3사분위수(3rd Quartile)가 무엇인지, 어떻게 계산하는지 예제를 통해 쉽고 자세하게 정리해보겠습니다. 3사분위수란? 3사분위수는 데이터를 오름차순으로 정렬했을 때, 75%의 데이터가 그 값 이하에 위치하는 점입니다. 쉽게 말해, 데이터를 네 등분했을 때 상위 25%를 제외한 값의 경계점이라고 할 수 있어요.…

개강전 파이썬 벼락치기 입문기 4

VS Code에서 주피터 노트북을 사용하던 중 input().split()을 실행하니 안 된다! input()조차 안 된다! 이럴 때에는 역시 나의 구세주 챗GPT! 으음… 챗GPT는 실패했고 블로그 현자의 도움을 받기로 했다. 원인도 모르겠고 해결 방법의 이유도 모르겠지만 일단 하란 대로 따라 해본다. 1번의 코드를 실행해 보니 잘 실행이 되었다. 아래 코드 삽입은 Color Scripter…

개강전 파이썬 벼락치기 입문기 3

VS Code 작업환경은 나같은 왕초보가 문법 찌끄레기 배울때는 너무 번거로워… 아나콘다의 스파이더가 R Studio랑 비슷해서 그런지 손이 더 잘 가서 다른 방법이 없나 여기저기 뒤져봤다. Jupyter Notebook 은 테마 설정이 안되서 손이 안갔었는데 VS Code에서 실행이 가능하다고 하길래 바로 진행했다. Jupyter Notebook은 파이썬을 기반으로 한 웹 기반의 대화형 플랫폼이다. 별도의…

개강전 파이썬 벼락치기 입문기 2

네? 파이썬에는 가장 중요한 파이썬 Run 단축키가 설정되어 있지 않다구요? F5인줄 알았는데 알고보니 이 단축키는 Run Python이 아니고 Start debugging 단축키였다. 어쩐지 보고 있는 유튜브 동영상과는 다르게 F5를 눌러서 실행하면 뭐가 많이 길더라니… 이 둘의 차이점이 뭘까 궁금해서 챗 gpt님께 여쭈어 보았다. 겉멋이 잔뜩 든 나는 기능 습득 전에 단축키…

개강전 파이썬 벼락치기 입문기 1

방송대 2학기 개강이 일주일 남았다. 지난 학기에 직대딩의 생활을 만만하게 보다가 피똥쌌기 때문에 방학동안 예습을 해야지 생각을 했었다. 생각만 했었다… 일주일 남은 지금 이 순간 벼락치기를 결심하고 한큐에 끝낼 수 있는 유튜브 인강을 찾기 시작했다. 추천이 많은 나도코딩님의 6시간 파이썬 입문 강의로 결정. 파이썬 설치까지는 꿀인데 IDLE 결정을 아직도 못했다.…

사출 성형의 수지 종류와 특성

사출 성형의 기초와 주요 플라스틱 수지(Resin) 총정리 안녕하세요! 오늘은 제조 현장의 핵심 기술인 사출 성형의 개념부터, 실무에서 가장 많이 쓰이는 6가지 주요 수지(ABS, PA, PC, PS, PP, PET)의 특징과 성형 조건까지 상세히 알아보겠습니다. 1. 사출 성형(Injection Molding) 개요 사출 성형이란? 플라스틱 소재에 열을 가해 녹인(용융) 상태에서 정해진 틀(금형) 안으로 주입하고,…

RStudio 설정과 유용한 단축키

R사용시 알아두면 좋은 내용 1) 윈도우 사용자 이름은 “영어”로 설정한다. 2) 설치 경로에 한글이 있으면 안된다. 3) R설치 파일 실행 시 관리자 모드로 실행해야 한다. 4) One drive, drop box 는 사용 권장하지 않는다. 5) Github R program, Rstudio, rtools 설치 R 버전이 4.0.0 이상이 되면서 rtools40이 필요하게 되었다. R…