본문 바로가기
인공지능

AI, 머신러닝, 딥러닝 개요 및 핵심 개념 정리

by 3in9u 2025. 3. 20.

1️⃣ AI, ML, DL의 차이

구분설명
AI (인공지능) 인간의 사고를 모방하는 기술. 규칙 기반 시스템부터 최신 딥러닝 모델까지 포함.
ML (머신러닝) AI의 하위 분야로, 데이터를 이용해 패턴을 학습하고 예측하는 기술. 지도학습, 비지도학습, 강화학습 포함.
DL (딥러닝) 머신러닝의 하위 분야. 다층 신경망(Neural Network) 을 이용한 학습 기법. 데이터가 많을수록 성능이 향상됨.

머신러닝(ML)은 사람이 직접 특징을 추출해야 하지만, 딥러닝(DL)은 신경망이 자동으로 특징을 학습


2️⃣ 머신러닝의 종류

구분설명
지도 학습 (Supervised Learning) 정답(라벨)을 알고 있는 데이터로 학습. 예측 및 분류 문제에 사용.
비지도 학습 (Unsupervised Learning) 정답(라벨)이 없는 데이터로 학습. 데이터의 패턴을 찾아 군집(Clustering) 및 차원 축소 수행.
강화 학습 (Reinforcement Learning) 보상과 벌을 이용하여 최적의 행동을 학습하는 방식. 게임 AI, 로봇 제어 등에 활용.

3️⃣ 신경망과 퍼셉트론(Perceptron)

📌 신경세포와 퍼셉트론

  • 인공 뉴런(Perceptron)생물학적 신경세포(Neuron) 를 모방하여 개발됨.
  • 여러 뉴런이 연결되어 신경망(Neural Network) 을 형성하면 딥러닝 모델이 됨.

📌 퍼셉트론 구조

입력층(Input Layer) → 가중치(Weight) & 바이어스(Bias)활성화 함수(Activation Function) → 출력층(Output Layer)

✔ 활성화 함수(Activation Function)는 입력값을 비선형 변환하여 신경망이 복잡한 문제를 해결할 수 있도록 돕는 역할.


4️⃣ XOR 문제와 다층 신경망(MLP, Multi-Layer Perceptron)

📌 퍼셉트론의 한계

  • 단층 퍼셉트론(Single Layer Perceptron)은 선형 분리 가능한 문제만 해결 가능.
  • XOR 문제(비선형 문제)는 단층 퍼셉트론으로 해결할 수 없음.

📌 다층 신경망 (MLP, Multi-Layer Perceptron)

  • 은닉층(Hidden Layer) 을 추가하여 XOR 문제 해결 가능.
  • 구조: 입력층(Input Layer) → 은닉층(Hidden Layer) → 출력층(Output Layer)
  • 신경망이 깊어질수록 더 복잡한 패턴을 학습할 수 있음.

5️⃣ 신경망 학습과 오류 역전파 (Backpropagation)

📌 신경망 학습 과정

  1. 순전파 (Forward Propagation)
    • 입력 데이터를 신경망을 통해 전달하여 예측값 출력.
    • 손실 함수(Loss Function) 계산 (예측값과 실제값의 차이를 측정).
  2. 역전파 (Backpropagation)
    • 손실을 최소화하기 위해 가중치(Weight)와 바이어스(Bias)를 조정.
    • 체인 룰(Chain Rule)을 이용하여 미분(Gradient) 을 계산.
    • 경사 하강법(Gradient Descent) 또는 Adam 옵티마이저를 사용하여 최적화 수행.

6️⃣ 기울기 소실(Vanishing Gradient) 문제와 해결 방법

📌 문제 발생 원인

  • 신경망이 깊어질수록 역전파 과정에서 기울기(Gradient) 가 점점 작아져 학습이 제대로 진행되지 않는 현상.
  • 주로 시그모이드(Sigmoid)나 Tanh 활성화 함수에서 발생.

📌 해결 방법

ReLU(Rectified Linear Unit) 활성화 함수 사용

  • f(x) = max(0, x) 형태로, 기울기 소실 문제를 완화함.
    가중치 초기화 방법 개선
  • Xavier 초기화, He 초기화 등을 사용하여 적절한 가중치를 설정.
    Batch Normalization 사용
  • 학습 과정에서 입력 데이터를 정규화하여 기울기 소실을 방지.

📌 최종 요약

AI(인공지능) → 인간의 사고를 모방하는 기술 (머신러닝 & 딥러닝 포함)
ML(머신러닝) → 데이터를 기반으로 학습하는 기술 (지도학습, 비지도학습, 강화학습)
DL(딥러닝)신경망(Neural Network)을 활용하는 머신러닝 기법, 복잡한 패턴 학습 가능

퍼셉트론(Perceptron) → 인공 신경망의 기본 단위
XOR 문제 해결을 위해 다층 신경망(MLP) 필요
오류 역전파(Backpropagation)로 가중치 업데이트
기울기 소실(Vanishing Gradient) 문제 해결을 위해 ReLU, 가중치 초기화, Batch Normalization 사용

🎯 딥러닝의 핵심은 신경망을 구성하고 학습을 최적화하는 것! 🚀