I. 데이터마이닝 알고리즘
-. 대규모로 저장된 데이터 안에서 숨겨져 있는 가치있는 정보를 추출하는 절차 및 방법
II. 데이터 마이닝 기능과 알고리즘 종류
기능 | 알고리즘 | 설명 |
연관분석 (association) |
Apriori 알고리즘 | 아이템의 출현 빈도를 기반으로 각 데이터 간의 연관관계를 탐색 |
분류 (classification) |
K-NN (k-nearest neighbor) | 특징 공간 내 K개의 가장 가까운 데이터의 값으로 구분 |
의사결정 트리 (Decision Tree) | 특정 기준에 따라 데이터를 구분하는 모델 | |
Random Forest | 작은 의사결정 트리들의 합 | |
SVM (Support Vector Machine) | 데이터를 최소 마진으로 두 클래스로 분류하는 초평면을 찾는 알고리즘 | |
군집분석 (clustering) |
k-means 알고리즘 | 분포된 데이터를 K개 만큼 군집하기 위해 중심점의 반복 지정을 통해 거리기반 학습 및 군집하는 기법 |
EM 알고리즘 ( Expectation Maximization) |
잠재변수에 의존하는 확률모형에서 최대 가능도나 최대 사후 확률을 갖는 매개변수를 찾는 반복적 알고리즘 | |
계층적 군집화 기술 (Hierarchical Clustering) |
계층적 트리 모형을 이용해 개별 객체들을 순차적, 계층적으로 통합하여 군집화를 수행하는 알고리즘 | |
순차패턴 (sequential pattern) |
Sequential Pattern Analysis | 데이터들 속에서 어떤 순차 관계가 들어있는 패턴을 찾아 순차 관계성을 추출하는 알고리즘 |
예측 (forecasting) |
시계열 분석 | 어떤 현상에 대해 시간의 흐름에 따라 기록된 데이터를 바탕으로 미래 변화에 대한 추세를 분석하는 기법 |
회귀분석 | 규명된 함수식을 이용하여 설명변수들의 변화로부터 종속변수의 변화를 예측하는 분석 알고리즘 | |
사례기반추론 (case-base reasoning) |
과거의 사례 결과를 바탕으로 새로운 사례의 유사도를 측정하여 결과를 예측하는 기법 |
'3. 자료처리 > 빅데이터분석' 카테고리의 다른 글
하둡(Hadoop) 에코 시스템 (0) | 2022.11.01 |
---|---|
마이데이터 (0) | 2022.11.01 |
OLAP(Online Analytical Processing) (0) | 2022.09.18 |
Data Mining (0) | 2022.07.13 |