본문 바로가기

Machine learning12

결정트리(Decision Tree) Decision Tree 결정트리 (Decision Tree) 는 흥미있는 아이템을 분류하거나 평가하기 위한 절차를 그래픽으로 표현한 것이다. 예를들면, 환자의 증상이 주어졌을 때, 가능성 있는 진단명을 결정하고 치료 방법을 추천하기 위해 사용될 수 있다. 즉 축적해 놓은 자료로부터 환자의 증상에서 간염이라는 진단을 얻고 그래서 사망할 가능성을 예상하기 위해 decision tree 를 사용할 수 있다. 그것은 class 를 나타내는 문자나 수치로 해당 영역의 요소에 해당 범위의 요소를 매핑하여 기능을 표현한다. tree 의 내부 node 에서, 소수의 가능한 출력을 내는 하나의 테스트를 찾는다. 각 테스트의 결과에 따라 나누어서, 알고자하는 아이템과 같은 class 문자나 수치를 포함하는 잎 (leaf.. 2012. 5. 30.
기계학습의 파라다임(bias, 귀납편향) 2 결정 트리를 이용한 분류 기법 분류 기법은 데이터 마이닝에서 가장 많이 쓰이는 기법 중의 하나로써 과거에 있던 데이터베이스로부터 클래스의 속성이 미리 알려진 트레이닝 셋을 분석해서 각 클래스에 대한 정확한 표현이나, 모델을 개발해서 미래를 예측하는 것에 목적이 있다. 결정 트리에 기반한 분류기는 다른 분류 기법과 비교해 볼 때 상대적으로 빠르고 간단하며 이해하기 쉬운 분류 규칙으로 전환이 쉽다는 장점을 가진다. 결정 트리는 내부노드와 리프노드, 가지(branch)로 이루어진 구조를 가지고 있다. 내부노드는 데이터 속성에 대한 테스트를 나타내고 노드와 노드 사이의 테스트에 대해 속성이 가질 수 있는 값들을 가리킨다. 리프노드는 최종적으로 각 레코드가 분류되는 클래스를 나타낸다. 데 이터 마이닝에서는 데.. 2012. 5. 30.
supervised learning 과 unsupervised learning 그리고 semi- * 알고리즘 유형 > 교사학습(지도학습) - Supervised Learning은 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계학습(Machine Learning)의 한 방법이다. 훈련 데이터는 일반적으로 입력 객체에 대한 속성을 벡터 형태로 포함하고 있으며 각각의 벡터에 대해 원하는 결과가 무엇인지 표시되어 있다. 이렇게 유추된 함수 중 연속적인 값을 출력하는 것을 회귀분석(Regression)이라 하고 주어진 입력 벡터가 어떤 종류의 값인지 표식하는 것을 분류(Classification)라 한다. - 지도 학습기(Supervised Learner)가 하는 작업은 훈련 데이터로부터 주어진 데이터에 대해 예측하고자 하는 값을 올바로 추측해내는 것이다. 이 목표를 달성하기.. 2012. 5. 30.
기계학습(machine learning) 이란? 기계학습이란? 기계학습(machine learning)이란 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다. 인공지능관점에서 기계학습 분야를 본다면, 인간이 학습(learning)을 할 수 있기 때문에 자신의 지식을 계속적으로 확장시켜 나갈 수 있는 지적 능력을 구현하고자 하는 시도이다.만일 컴퓨터가 이와 같은 학습능력을 가질 수 있다면 지능을 가진 인간과 유사한 적응력을 가질 수 있게 될 것이다. AI에서 학습을 “프로그램을 하나의 문제를 수행한 후에 그 추론과정에서 얻은 경험을 바탕으로 시스템의 지식을 수정 및 보완하여, 다음에 그 문제나 또는 비슷한 문제를 수행할 때에는 처음보다 더 효율적이고 효과적으로 문제를 해결할 수 있는 적응성”이라고 정의한다. .. 2012. 5. 30.