인공지능(AI, Artificial Intelligence)
정의
•
인간의 지능으로 할 수 있는 사고, 학습, 자기 개발 등 컴퓨터가 대체할 수 있도록 하는 방법을 연구하는 분야
2016년도 까지의 역사
•
인공지능 태동기
◦
1943년 워런 매 컬리와 월터 피츠는 최초로 뇌의 누런 개념을 발표
◦
1950년에는 앨런 튜링이 인공지능이 사람과 같은 지능을 가졌는지 테스트할 수 있는 유명한 튜링 테스트를 발표
•
인공지능 1차 황금기
◦
1957년 프랑크 로젠블라트가 로지스틱 회귀의 초기 버전으로 볼 수 있는 퍼셉트론을 발표했습니다.
•
인공지능 겨울기
◦
컴퓨터 성능의 한계로 인해 간단한 문제를 해결하는 것에 그치자 인공지능에 대한 연구와 투자가 크게 감소함.
•
인공지능 2차 황금기
◦
컴퓨터 성능 향상과 알고리즘의 발전으로 스마트팩토리, 자동차, 유튜브, 넷플릭스 등 다양한 분야에서 사용되고 있다.
인공지능(AI), 머신러닝(ML), 딥러닝(DL) 포함 관계
머신러닝(Machine Learning)
머신러닝 정의
•
데이터 학습 기반의 인공지능 분야
•
기계에게 어떻게 동작할지 일일이 코드로 명시하지 않고 데이터를 이용해 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 인공지능의 한 분야
머신러닝 시스템 워크플로우
•
수집
•
점검 및 탐색
•
전처리 및 정제
•
모델링 및 훈련
•
평가
•
배포
◦
테스트 데이터를 통해 모델 학습 평가를 진행
평가가 좋지 않으면, 다시 머신러닝 학습을 진행한다.
◦
적절한 머신러닝 알고리즘을 선택 및 전처리가 완료된 데이터를 이용하여 머신러닝 학습을 진행하는 단계
◦
머신러닝 학습에 알맞게 데이터 정제 및 전처리를 하는 과정
◦
수집된 데이터의 구조, 노이즈 등 파악
탐색적 데이터 분석(EDA; Exploratory Data Analysis) 단계라고도 한다.
◦
머신러닝 학습에 필요한 데이터 수집
◦
성공적으로 훈련이 된 것으로 판단된다면, 완성된 모델을 서비스에 적용하기 위해여 운영 배포를 진행한다.
머신러닝 학습 작동방식
Loss score를 최소화하는 Parameters를 찾는 과정
머신러닝 알고리즘 분류
지도학습
모델에 주입하는 데이터에 입력값(특성)과 출력값(정답)을 같이 넣어 학습시키는 방식
•
타겟 데이터에 따른 학습 종류
◦
분류 : 클래스가 적은 - 바이너리 학습이 잘 됌 (가능하면 전처리로 클래스 개수를 줄여서 학습)
◦
회귀 : 클래스가 무한대 - 학습이 잘 안됌
분류
예측
비지도학습
모델에 입력값(특성)만 넣어 학습시키는 방식
군집
차원축소
연관규칙
강화학습
모델에 학습결과에 따라 보상 또는 벌점을 주어 가장 큰 보상을 받는 방향으로 학습을 시키는 방식
머신러닝 기본용어
•
Feature
◦
독립변수, 설명변수
◦
학습데이터의 특성
•
Label, Target, Class
◦
종속변수
◦
정답 데이터
•
Parameter
◦
모델이 학습과정에서 업데이트하는 파라미터
•
Hyper parameter
◦
사용자가 직접 세팅해주는 파라미터
•
Loss
◦
손실
◦
정답값과 예측값의 오차를 표현하는 지표
•
Metric
◦
평가 지표
◦
모델의 성능을 평가할 때, 사용하는 지표
1. Feature (특징 또는 입력 변수)
•
정의
◦
Feature는 모델이 예측을 수행하기 위해 사용하는 입력 변수들
◦
데이터셋에서 각 열은 보통 하나의 Feature를 나타낸다.
•
역할
◦
Feature는 모델이 학습할 때 참고하는 데이터 포인트의 속성들
◦
예를 들어, 주택 가격을 예측하는 모델에서는 면적, 방의 개수, 위치 등이 Feature가 될 수 있다.
•
예시:
◦
주택 가격 예측: 면적, 방 개수, 건축 연도
◦
학생 성적 예측: 공부 시간, 출석률, 과제 점수
•
형태
◦
일반적으로 X로 표기
◦
데이터셋에서 여러 개의 Feature가 있을 수 있다.
2. Target (목표 변수 또는 출력 변수)
•
정의
◦
Target은 모델이 예측하려는 값 또는 출력 변수
◦
데이터셋에서 이 변수는 모델이 학습하는 동안 예측의 정답으로 사용
•
역할
◦
Target은 모델이 최종적으로 예측해야 하는 값을 표시
◦
Target이 있다면 모델이 이 값을 예측하도록 학습하게 됨.
•
예시:
◦
주택 가격 예측: 주택 가격
◦
학생 성적 예측: 기말 시험 점수
•
형태
◦
일반적으로 y로 표기
◦
하나의 Target 변수만 존재할 수도 있고, 여러 개의 Target 변수가 있을 수도 있다.