본문 바로가기

프로그래밍

(3)
Logistic Regression (로지스틱 회귀) 💛Logistic Function 🤍 아래 그림과 같이 S-커브 함수를 나타냄 실제 많은 자연, 사회 현상에는 특정 변수에 대한 확률 값이 선형이 아닌 S-커브 형태를 따르는 경우가 많음. 🤍x값으로 어떤 값이든 받을 수가 있지만 출력 결과(y)는 항상 0에서 1 사이 값이 됨. 🤍누적분포함수(cumulative distribution function) 요건을 충족 🤍시그모이드 함수라고 명명하기도 함 💛승산(odds) 🤍임의의 사건 A가 발생하지 않을 확률 대비 일어날 확률의 비율 🤍P(A)가 1에 가까울 수록 승산은 커지고 반대로 P(A)가 이라면 승산은 0 🤍로지스틱 함수를 이용해서 분류문제를 해결할 수 있다. 글, 그림 출처 : https://github.com/sejongresearch/2022...
다중선형회귀 (Multiple Linear Regression) 🟧다중선형회귀 란 ? : 수치형 설명변수 X와 연속형 숫자로 이뤄진 종속변수 Y간의 관계를 선형으로 가정하고 이를 가장 잘 표현할 수 있는 회귀계수를 데이터로부터 추정하는 모델. -예시 : 주택크기(설명변수 1개)와 주택가격(연속형 종속변수)의 관계를 나타내는 직선을 찾는 문제. 💛설명변수로 인해서 종속변수는 영향을 받아 변하게 된다. -설명사진 넣기 🟧 회귀 계수 결정법 🔵Direct Solution -선형회귀의 계수들은 실제값과 모델 예측값의 차이, 오차제곱합을 최소로 하는 값을 회귀계수로 선정 -최적의 계수들은 회귀 계수에 대해 미분한 식을 0으로 놓고 풀면 명시적인 해를 구할 수 있음. 즉 x와 y데이터만으로 회귀 계수를 구할 수 있음. 🔵Numerical search -경사하강법(gradient..
K-Nearst Neighbors (KNN) _K-최근접 이웃 🟩 지도 학습의 대표적인 머신 러닝 방법 🟡 분류 (classification) -분류는 미리 정의된, 가능성 있는 여러 클래스 레이블(class label) 중 하나를 예측하는 것 -두 개로만 나뉘는 이진 분류(Binary Classification)와 셋 이상의 클래스로 분류하는 다중 분류(multiclass classification)로 나뉜다. -분류예시 : 얼굴 인식, 숫자 판별 (MNIST) 🟡 회귀(regression) -연속적인 숫자 또는 부동소수점수 (실수)를 예측하는 것 -회귀예시: 주식 가격을 예측하며 수익을 내는 알고리즘 등 KNN이란 ? : 게으른 학습(lazy learner) 또는 사례중심학습(instance-based learning) *게으른 학습: 알고리즘은 훈련 데이터에서..