3. 자료처리/빅데이터분석

데이터마이닝 알고리즘

SWExpert 2022. 11. 2. 00:36

I. 데이터마이닝 알고리즘

-. 대규모로 저장된 데이터 안에서 숨겨져 있는 가치있는 정보를 추출하는 절차 및 방법

II. 데이터 마이닝 기능과 알고리즘 종류

기능 알고리즘 설명
연관분석
(association)
Apriori 알고리즘 아이템의 출현 빈도를 기반으로 각 데이터 간의 연관관계를 탐색
분류
(classification)
K-NN (k-nearest neighbor) 특징 공간 내 K개의 가장 가까운 데이터의 값으로 구분
의사결정 트리 (Decision Tree) 특정 기준에 따라 데이터를 구분하는 모델
Random Forest 작은 의사결정 트리들의 합
SVM (Support Vector Machine) 데이터를 최소 마진으로 두 클래스로 분류하는 초평면을 찾는 알고리즘
군집분석
(clustering)
k-means 알고리즘 분포된 데이터를 K개 만큼 군집하기 위해 중심점의 반복 지정을 통해 거리기반 학습 및 군집하는 기법
EM 알고리즘
( Expectation Maximization)
잠재변수에 의존하는 확률모형에서 최대 가능도나 최대 사후 확률을 갖는 매개변수를 찾는 반복적 알고리즘
계층적 군집화 기술
(Hierarchical Clustering)
계층적 트리 모형을 이용해 개별 객체들을 순차적, 계층적으로 통합하여 군집화를 수행하는 알고리즘
순차패턴
(sequential pattern)
Sequential Pattern Analysis 데이터들 속에서 어떤 순차 관계가 들어있는 패턴을 찾아 순차 관계성을 추출하는 알고리즘
예측
(forecasting)
시계열 분석 어떤 현상에 대해 시간의 흐름에 따라 기록된 데이터를 바탕으로 미래 변화에 대한 추세를 분석하는 기법
회귀분석 규명된 함수식을 이용하여 설명변수들의 변화로부터 종속변수의 변화를 예측하는 분석 알고리즘
사례기반추론
(case-base reasoning)
과거의 사례 결과를 바탕으로 새로운 사례의 유사도를  측정하여 결과를 예측하는 기법

'3. 자료처리 > 빅데이터분석' 카테고리의 다른 글

하둡(Hadoop) 에코 시스템  (0) 2022.11.01
마이데이터  (0) 2022.11.01
OLAP(Online Analytical Processing)  (0) 2022.09.18
Data Mining  (0) 2022.07.13