머신러닝과 빅데이터 분석/Machine Learning(지도학습)4 분류 분석 2 1. 앙상블 모델 여러 개의 분류기를 생성하고 그 예측을 결합하여 보다 정확한 최종 예측을 도출하는 기법을 앙상블(Ensemble) 모델이라고 한다. 이미지, 영상, 음성, 자연어 등 비정형 데이터의 분류는 딥러닝 모델이 뛰어난 성적을 얻고 있지만, 대부분의 정형 데이터 분류에는 앙상블 모델이 뛰어난 성능을 나타내고 있다. 대표적으로 랜덤 포레스트, 그레디언트 부스팅(GBM) 등이 있으며, 사용하기 쉬울 뿐만 아니라 성능 역시 뛰어난다. 1-1. 앙상블의 유형 1) 배깅(Bagging) 배깅(Bagging)은 부트스트랩 집계(Bootstrap Aggregating)의 줄임말로, 여러 개의 부트스트랩을 집계하는 알고리즘이다. 배깅의 가장 큰 특징은 복원 추출을 활용한다는 점이다. 원본 데이터로부터 복원 추.. 머신러닝과 빅데이터 분석/Machine Learning(지도학습) 2024. 3. 15. 분류 분석(분류 모델) 1. 분류의 개요 머신러닝은 인공지능 분야 중 하나로, 데이터를 이용하여 패턴을 학습하고 예측하는 기술이다. 이 중에서 분류모델은 데이터를 특정 카테고리나 그룹으로 분류하는 모델이다. 2. 분류모델의 개념 분류모델은 데이터를 분류하는 모델로, 입력 데이터에 대해 사전에 정해진 카테고리에 속하는지 여부를 판단한다. 지도학습에서는 미리 정해진 레이블(label) 정보를 이용하여 모델을 학습시키고, 새로운 데이터가 들어오면 해당 데이터를 분류한다. 반면, 비지도학습에서는 레이블 정보 없이 데이터의 패턴을 파악하여 그룹을 형성하거나 이상치를 찾아낸다. 3. 분류모델의 종류 3-1. 의사결정나무(Decision Tree) 1) 데이터를 분할하여 트리 구조로 표현하는 모델 2) 각 노드에서는 데이터를 가장 잘 분류.. 머신러닝과 빅데이터 분석/Machine Learning(지도학습) 2024. 3. 12. 회귀분석 1. 회귀 모델 1-1. 선형 회귀 모델 선형 회귀 모델(Linear Regression Model)은 종속 변수와 독립 변수 간의 선형 관계를 모델링하는 회귀 분석 알고리즘dl다. 종속 변수는 예측하고자 하는 변수이며, 독립 변수는 종속 변수를 설명하는 변수다. 선형 회귀 모델은 가장 간단하면서도 널리 사용되는 회귀 모델 중 하나이다. 이 모델은 종속 변수와 독립 변수 간의 선형 관계를 가정하고, 이 관계를 표현하는 최적의 회귀 계수를 찾아내는 것이 핵심이다. 선형 회귀 모델은 보통 최소 제곱법(Least Square Method)이나 경사 하강법(Gradient Descent Method)을 사용하여 회귀 계수를 추정한다. 최소 제곱법은 회귀 직선과 실제 데이터 간의 거리(오차)를 최소화하는 회귀 계.. 머신러닝과 빅데이터 분석/Machine Learning(지도학습) 2024. 3. 12. 머신러닝 1. 머신러닝의 정의 머신러닝은 데이터를 통해 컴퓨터가 스스로 학습하고 예측하는 인공지능 분야다. 머신러닝은 데이터 마이닝, 통계학, 최적화, 인공 신경망 등 다양한 분야에서 발전해 왔다. 머신러닝의 목적은 데이터를 활용하여 예측, 분류, 패턴 인식 등 다양한 작업을 수행하고, 인간의 판단을 대신하여 의사결정을 내리는 것이다. 2. 머신러닝 유형 2-1. 지도학습 지도 학습은 입력 데이터와 출력 데이터를 함께 학습하여, 새로운 입력 데이터가 주어졌을 때 정확한 출력을 예측하는 방법이다. 대표적인 지도 학습 알고리즘으로는 회귀(Regression)와 분류(Classification)가 있다. 회귀는 입력 데이터와 출력 데이터 간의 선형 또는 비선형 관계를 학습하여 연속적인 출력 값이 필요한 문제에 적용된다.. 머신러닝과 빅데이터 분석/Machine Learning(지도학습) 2024. 3. 11. 이전 1 다음 728x90