1️⃣ AI, ML, DL의 차이
구분설명
| AI (인공지능) | 인간의 사고를 모방하는 기술. 규칙 기반 시스템부터 최신 딥러닝 모델까지 포함. |
| ML (머신러닝) | AI의 하위 분야로, 데이터를 이용해 패턴을 학습하고 예측하는 기술. 지도학습, 비지도학습, 강화학습 포함. |
| DL (딥러닝) | 머신러닝의 하위 분야. 다층 신경망(Neural Network) 을 이용한 학습 기법. 데이터가 많을수록 성능이 향상됨. |
✔ 머신러닝(ML)은 사람이 직접 특징을 추출해야 하지만, 딥러닝(DL)은 신경망이 자동으로 특징을 학습
2️⃣ 머신러닝의 종류
구분설명
| 지도 학습 (Supervised Learning) | 정답(라벨)을 알고 있는 데이터로 학습. 예측 및 분류 문제에 사용. |
| 비지도 학습 (Unsupervised Learning) | 정답(라벨)이 없는 데이터로 학습. 데이터의 패턴을 찾아 군집(Clustering) 및 차원 축소 수행. |
| 강화 학습 (Reinforcement Learning) | 보상과 벌을 이용하여 최적의 행동을 학습하는 방식. 게임 AI, 로봇 제어 등에 활용. |
3️⃣ 신경망과 퍼셉트론(Perceptron)
📌 신경세포와 퍼셉트론
- 인공 뉴런(Perceptron) 은 생물학적 신경세포(Neuron) 를 모방하여 개발됨.
- 여러 뉴런이 연결되어 신경망(Neural Network) 을 형성하면 딥러닝 모델이 됨.
📌 퍼셉트론 구조
입력층(Input Layer) → 가중치(Weight) & 바이어스(Bias) → 활성화 함수(Activation Function) → 출력층(Output Layer)
✔ 활성화 함수(Activation Function)는 입력값을 비선형 변환하여 신경망이 복잡한 문제를 해결할 수 있도록 돕는 역할.
4️⃣ XOR 문제와 다층 신경망(MLP, Multi-Layer Perceptron)
📌 퍼셉트론의 한계
- 단층 퍼셉트론(Single Layer Perceptron)은 선형 분리 가능한 문제만 해결 가능.
- XOR 문제(비선형 문제)는 단층 퍼셉트론으로 해결할 수 없음.
📌 다층 신경망 (MLP, Multi-Layer Perceptron)
- 은닉층(Hidden Layer) 을 추가하여 XOR 문제 해결 가능.
- 구조: 입력층(Input Layer) → 은닉층(Hidden Layer) → 출력층(Output Layer)
- 신경망이 깊어질수록 더 복잡한 패턴을 학습할 수 있음.
5️⃣ 신경망 학습과 오류 역전파 (Backpropagation)
📌 신경망 학습 과정
- 순전파 (Forward Propagation)
- 입력 데이터를 신경망을 통해 전달하여 예측값 출력.
- 손실 함수(Loss Function) 계산 (예측값과 실제값의 차이를 측정).
- 역전파 (Backpropagation)
- 손실을 최소화하기 위해 가중치(Weight)와 바이어스(Bias)를 조정.
- 체인 룰(Chain Rule)을 이용하여 미분(Gradient) 을 계산.
- 경사 하강법(Gradient Descent) 또는 Adam 옵티마이저를 사용하여 최적화 수행.
6️⃣ 기울기 소실(Vanishing Gradient) 문제와 해결 방법
📌 문제 발생 원인
- 신경망이 깊어질수록 역전파 과정에서 기울기(Gradient) 가 점점 작아져 학습이 제대로 진행되지 않는 현상.
- 주로 시그모이드(Sigmoid)나 Tanh 활성화 함수에서 발생.
📌 해결 방법
✅ ReLU(Rectified Linear Unit) 활성화 함수 사용
- f(x) = max(0, x) 형태로, 기울기 소실 문제를 완화함.
✅ 가중치 초기화 방법 개선 - Xavier 초기화, He 초기화 등을 사용하여 적절한 가중치를 설정.
✅ Batch Normalization 사용 - 학습 과정에서 입력 데이터를 정규화하여 기울기 소실을 방지.
📌 최종 요약
✔ AI(인공지능) → 인간의 사고를 모방하는 기술 (머신러닝 & 딥러닝 포함)
✔ ML(머신러닝) → 데이터를 기반으로 학습하는 기술 (지도학습, 비지도학습, 강화학습)
✔ DL(딥러닝) → 신경망(Neural Network)을 활용하는 머신러닝 기법, 복잡한 패턴 학습 가능
✔ 퍼셉트론(Perceptron) → 인공 신경망의 기본 단위
✔ XOR 문제 해결을 위해 다층 신경망(MLP) 필요
✔ 오류 역전파(Backpropagation)로 가중치 업데이트
✔ 기울기 소실(Vanishing Gradient) 문제 해결을 위해 ReLU, 가중치 초기화, Batch Normalization 사용
🎯 딥러닝의 핵심은 신경망을 구성하고 학습을 최적화하는 것! 🚀
'인공지능' 카테고리의 다른 글
| 이진 분류(Binary Classification) 모델 정리 (0) | 2025.03.21 |
|---|---|
| 선형 회귀 (Linear Regression) (0) | 2025.03.21 |
| 예측 함수, 손실 함수, 비용 함수, 분류 및 활성화 함수 정리 (0) | 2025.03.20 |
| 합성 함수, 수치 미분, 경사 하강법 정리 (0) | 2025.03.20 |
| 파이토치 (0) | 2025.03.20 |