6. 최신기술, 법규 및 정책 7

의사결정트리

I. 데이터 분류 예측 기법, 의사결정트리 -. 의사결정 규칙 과정을 트리 구조로 단계별 도표화하여 분류 또는 예측을수행하는 통계분석 기법 -. 각 데이터들이 가진 속성들로부터 분할 기준 속성을 판별하고, 분할 기준 속성에 따라 트리 형태로 모델링하는 분류예측 모델 -. 의사결정트리는 분류와 회귀 모두 가능 구분 특징 설명 장점 결과해석용이 직관적인 해석 가능 주요 변수의 분리기준 제시 비모수적 모델 통계 모델에 요구되는 가정에 자유로움(예: 정규성 독립성, 등분산성) 변수간 상호작용 변수간의 상호작용을 고려하며 선형, 비선형 관계 탐색 가능 단점 비안정성 데이터 수가 적을 경우 특히 불안정 과대적합 발생률 높음(가지치기 필요) 선형성 미흡 전체적인 선형관계 파악 미흡 비연속성 분리 시 연속형 변수를 구..

K means 알고리즘

I. K-Means 알고리즘 -. 입력값으로 k를 취하고 군집 내 유사성은 높게, 군집간 유사성은 낮게 되도록 n개의 객체집합을 k개의 군집으로 군집하는 기법 -. 주어진 데이터를 사전에 정의된 k개의 클러스터로 묶는 알고리즘 -. 각 개체의 동질성을 거리를 이용해 측정하여 동질성이 높은 (서로 비슷한) 대상 군집을 판별하고 군집에 속한 개체들의 동질성과 서로 다른 군집에 속한 개체 간의 이질성을 규명하는 분석 방법 -. 중심값을 선정하고 중심값과 다른 데이터 간의 거리를 이용하여 분류를 수행하는 버지도 학습 -. 군집 별 중심값에서 중심과의 거리를 기반으로 데이터를 분류하는 비계층적 군집 기법의 종류 -. 특징: Data 중심, 거리기반의 분류법, 데이터군 양자화, 속도 및 구현 특징 설명 Data중심..

교차검증(Cross Validation)

I. 교차검증(Cross Validation) -. 머신러닝/딥러닝 평가에 필수적으로 사용되는 방법으로 데이터를 통한 모델을 설계한 후 모델을 검증하는 단계 -. 모델을 추정하는데 사용되지 않았던 새로운 데이터를 예측하는 일반화 능력을 테스트하는 방법 II. 교차검증 절차 및 알고리즘 가. 교차검증 절차 -교차검증은 성능 효율성으로 데이터마이닝, 기계학습 등 통계적 모델 평가 기법으로 널리 사용됨 나. 교차 검증 기본 알고리즘 Hold Out Method: Training Set으로 훈련하고 빼놓았던 Validation Set으로 검증하는 기본 기법 Sebset을 Resampling하는 방법에 따라 다양한 기법이 존재함 III. 교차검증 대표적 기법 분류 기법 설명 Exhaustive CV Leave-p..

중심성 평가

I. 중심성 평가 -. 네트워크 노드들 간 연계된 빈도와 거리를 측정하여 해당 노드가 네트워크 중심에 위치하는 정도를 표현한 지표 -. 그래프 이론 기반 네트워크 중심은 그래프, 꼭지점 혹은 노트의 상대적 중요성을 나타내는 척도 - 네트워크 중심성 분석의 의미 구분 의미 설명 중심성 자체적 의미 정보 획득의 거점 정보 획득과 자원 흐름에서 빠른 시간에 필요한 양을 확보할 가능성이 높다는 것을 의미 위치적 중요성 정보와 자원에 대한 속도와 양의 측면에서 유리한 위치에 있음을 의미 접촉 기회 확대 정보와 자원에 대한 접촉 가능성이 높으므로 기회가 확대됨 중심성 유형별 의미 연결성 네트워크에서 노드들과 직접 연결되어 있는 링크의 수를 의미 매개성 네트워크에서 노드간의 중개인 역할 또는 문지기와 같이 어떤 경로..

ISO/IEC 25000(SQuaRE)

I. 품질 평가 방안에 대한 표준, ISO/IEC 25000(SQuaRE)의 개요 - SW 개발 공정 각 단계에서 산출되는 제품이 사용자 요구를 만족하는지를 검증하기 위해 품질 측정과 평가를 위한 모델, 측정기법 평가방안에 대한 국제 표준 -. Software product quality requirements and evaluation -. 배경: SW 제품 품질 모델(ISO 9126), SW 품질 평가지침(ISO 14598), SW 패키지 제품품질 및 시험(ISO 12119)를 하나로 통일 여러 표준 문서가 산재되어 있어 혼란 야기 품질요구 명세부터 품질 판정까지 일관된 표준 지침서 필요 II. ISO 25000의 구성 및 구성항목 가. ISO 25000의 구성 나. ISO 25000의 구성항목 구성..

공공소프트웨어 사업영향평가제도

I. SW 산업생태계 평가 및 개선, 공공소프트웨어 사업영향평가제도 개념 -. 국가기관 등에서 소프트웨어 사업의 예산편성, 발주, 소프트웨어 배포 및 서비스 제공을 추진하는 경우 민간 소프트웨어 시장침해 등 소프트웨어 산업 생태계에 미치는 영향을 검토하여 사전 조정하는 소프트웨어 영향 평가제도에 대한 가이드를 개발 및 보급하는 제도 -. 공공과 민간 간 불필요한 경쟁 및 SW 산업 위축을 방지하기 위해 공공정보화 사업의 기획 단계에서 민간 시장 침해 등 SW 산업 생태계에 미치는 영향을 평가하여 개선 의견을 제시하는 제도 -법적근거: 소프트웨어진흥법 제 43조, 시행령 35조,36조, 37조, 소프트웨어 사업 계약 및 관리감도에 관한 지침 제5조, 6조 -필요성: 정부 민간 SW 사업 중복, 민간업체 도..

신경망(Neural Network) 분석

I. 인간두뇌 세포를 모방한 의사결정 및 상황판단 기술, 신경망 분석의 개요 가. 신경망 분석의 정의 - 인간두뇌 세포를 모방한 개념으로 뉴런들의 상호작용하고 경험을 통해 배우는 생물학적 활동을 반복적인 학습과정으로 모형화하는 분석 기법 - 기계학습 그리고 인지과학에서의 인공신경망은 생물학의 신경망(동물의 중추신경계, 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘 - 인공신경망은 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 나. 신경망 분석의 특징 특징 설명 학습 연결하중을 조절하여 기존의 데이터나 경험을 학습 분류/군집화 잡음(noise)이 포함되거나 훈련되지 않은 입력 패턴에 대해 비슷한 패턴에 대해 비슷한 부류로 분류 병렬처리 본..