본문 바로가기
Machine learning

기계학습(machine learning) 이란?

by ciwhiz 2012. 5. 30.

기계학습이란?

기계학습(machine learning)이란 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다.

인공지능관점에서 기계학습 분야를 본다면, 인간이 학습(learning)을 할 수 있기 때문에 자신의 지식을 계속적으로 확장시켜 나갈 수 있는 지적 능력을 구현하고자 하는 시도이다.만일 컴퓨터가 이와 같은 학습능력을 가질 수 있다면 지능을 가진 인간과 유사한 적응력을 가질 수 있게 될 것이다.

AI에서 학습을 프로그램을 하나의 문제를 수행한 후에 그 추론과정에서 얻은 경험을 바탕으로 시스템의 지식을 수정 및 보완하여, 다음에 그 문제나 또는 비슷한 문제를 수행할 때에는 처음보다 더 효율적이고 효과적으로 문제를 해결할 수 있는 적응성이라고 정의한다.

 

1980년대 이후 기계학습(machine learning)의 연구가 활발하게 전개된 이유를 네 가지로 풀어 본다면

첫째. 학습절차를 잘 이해하면 전문가 시스템 구성의 자동화를 촉진시킬 수 있고, 그 결과로 AI를 급속도로 발전시킬 수 있으리라고 기대하기 때문이다.

둘째. 이론적 요구 때문이라고도 한다. 전문가 시스템들은 과학을 할 때 필수적으로 요구되는 이론의 일반성을 결여하고 있으므로 이를 보완하기 위한 것이었다. AI가 문제해결이나 탐색분야에서 발견한 일반원리와 유사한 일반성을 기계학습의 영역에서도 취하고자 한 것이다.

셋째. 인간의 학습절차를 모델화하려는 것이다. 이것은 인간의 정보처리 시스템의 다양한 특색을 설명할 수 있는 한 방도가 될 것이다. 인간의 학습절차를 깊이 이해하면 우리의 교육 개선에도 크게 공헌할 것이다. 기계학습과 인간학습의 비교연구는 이런 점에서도 우리의 지대한 관심사가 아닐 수 없다.

넷째. 기계학습의 문제는 지식표현과 추리의 경우에서처럼 인식론적인 철학 문제들만이 아니라 문제해결, 정리증명, 유추추리, 비단조추리, 자연언어처리, 화법인지, 비전, 로봇, 기획, 게임 실행, 패턴 인지, 전문가 시스템 등 AI의 모든 분야에 관련되어 있다.

그리하여 오늘날 기계학습은 AI전반에 관련된 핵심문제로서 연구되고 있다.

 

놀라운 모순은 컴퓨터가 배우기는 아주 쉽기도 하고 아주 어렵기도 하다는 사실이다. 이 이유는 두 가지 다른 유형의 학습이 있기 때문이다. 컴퓨터에게는 너무 쉬운 반복에 의한 학습(Learning by Rote)과 너무 어려운 인지학습(Cognitive Learning)이 있다. 이 점에서, 여러 가지 다른 유형의 학습 유추에 의한 학습, (example)에 의한 학습 등등 이 있다고 제안하고 싶을지도 모른다. 그러나 이런 것들은 그것에 의해 지식이 습득될 수 있는 방법을 말하는 것이지, 학습이 일어나게 하는 실제 매커니즘을 말하는 것은 아니다.

 

 

* 알고리즘 유형

> 교사학습(지도학습)

- Supervised Learning은 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계학습(Machine Learning)의 한 방법이다. 훈련 데이터는 일반적으로 입력 객체에 대한 속성을 벡터 형태로 포함하고 있으며 각각의 벡터에 대해 원하는 결과가 무엇인지 표시되어 있다. 이렇게 유추된 함수 중 연속적인 값을 출력하는 것을 회귀분석(Regression)이라 하고 주어진 입력 벡터가 어떤 종류의 값인지 표식하는 것을 분류(Classification)라 한다.

- 지도 학습기(Supervised Learner)가 하는 작업은 훈련 데이터로부터 주어진 데이터에 대해 예측하고자 하는 값을 올바로 추측해내는 것이다. 이 목표를 달성하기 위해서는 학습기가 알맞은방법을 통하여 기존의 훈련 데이터로부터 나타나지 않던 상황까지도 일반화하여 처리할 수 있어야 한다. 사람과 동물에 대응하는 심리학으로는 개념학습(Concept Learning)을 예로 들 수 있다.

- Supervised Learning을 이용한 알고리즘

. 서포트 벡터 머신(support vector machine)

. 은닉 마르코프 모델(Hidden Markov model)

. 회귀 분석(Regression)

. 신경망(Neural network)

. 나이브 메이즈 분류(Naïve Bayes Classification)

> 비교사학습(자율학습)

- Unsupervised Learning은 데이터가 어떻게 구성되었는지를 알아내는 문제의 범주에 속한다. 이 방법은 지도학습(Supervised Learning) 혹은 강화학습(Reinforcement Learning)과는 달리 입력값에 대한 목표치가 주어지지 않는다.

- 자율 학습은 통계의 밀도 추정(Density Estimation)과 깊은 연관이 있다. 이러한 자율 학습은 데이터의 주요 특징을 요약하고 설명할 수 있다.

- 자율학습의 예로는 클러스터링(Clustering) 기계학습을 들 수 있다. 또 다른 하나의 예로는 독립 성분 분석(Independent Component Analysis)이 있다.

> 반 교사학습(준 지도학습)

- Semi-Supervised Learning이란 기계학습의 한 범주로 목표값이 표시된 데이터와 표시되지 않은 데이터를 모두 훈련에 사용하는 것을 말한다. 대게의 경우 이러한 방법에 사용되는 훈련 데이터는 목표값이 표시된 데이터가 적고 표시되지 않은 데이터를 많이 갖고 있다. 이러한 준 지도 학습은 목표값이 충분히 표시된 훈련 데이터를 사용하는 지도학습과 목표값이 표시되지 않은 훈련 데이터를 사용하는 자율학습 사이에 위치한다. 많은 기계 학습 연구자들이 목표값이 없는 데이터에 적은 양의 목표값을 포함한 데이터를 사용할 경우 학습 정확도에 있어서 상당히 좋아짐을 확인하였다. 이러한 훈련 방법이 사용되는 이유는 목표값을 포함한 데이터를 얻기 위해서는 훈련된 사람의 손을 거쳐야 하기 때문이고 그 비용이 감당할 수 없을만큼 클 수 있기 때문이다. 따라서 그러한 경우 준 지도 학습을 사용하여 결과를 향상 시킬 수 있다.

- 이러한 준 지도 학습의 예로는 상호 훈련을 들 수 있다. 이것은 두개 이상의 학습기 각각이 예제를 통해 훈련되는 방법이며 학습기가 사용하는 예제의 특성은 각각 다르며 독립적이다.

- 그 이외의 접근으로는 특징점과 목표값의 결합 분포를 모델링 하는 것이다. 목표값이 없는 데이터에 대해서는 목표값을 '잃어버린 데이터' 로 처리한다. 이러한 방법에서는 예측 최대화 알고리즘(EM 알고리즘)을 모델의 우도 (수학)(likelihood)를 최대화 하기 위해 사용한다.

> 강화학습

- 어떤 환경을 탐색하는 에이전트가 현재의 상태를 인식하여 어떤 행동을 취한다. 그러면 그 에이전트는 환경으로부터 포상을 얻게 된다. 포상은 양수와 음수 둘 다 가능하다. 강화 학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화 하는 일련의 행동으로 정의되는 정책를 찾는 방법이다.

- 환경은 일반적으로 유한상태 마르코프 결정 프로세스(MDP)로 표현할 수 있다. 이런 관점에서 강화 학습 알고리즘은 동적 계획법과 깊은 연관이 있다. MDP에서 상태 전이 확률(state transition probabilities)와 포상은 확률에 따른 값일 수도 있고, 이미 결정되어 있는 값일 수도 있다.

- 강화 학습이 원하지 않는 행동을 명시적으로 수정하는 지도 학습과 다른 점은 온라인 수행에 중심을 두고 있다는 점이다. 강화 학습은 아직 조사되지 않는 영역을 탐험하는 것과 이미 알고 있는 지식을 이용하는 것의 균형을 잡는 것이다. 이 탐험과 이용 사이에 있는 트레이드오프는 Multi-armed bandit과 같은 문제에서 알아 볼 수 있다.

 

 

* 기계학습 주제

> 선수 지식

- 베이즈 이론

> 모형화

- 인공 신경망

- 결정 트리

- 유전 알고리즘 (Genetic Algorithm)

- 유전자 프로그래밍

- 가우스 과정 회귀

- 선형 분별 분석

- K 근접 이웃

- 퍼셉트론

- 방사 기저 함수 네트워크

- 서포트 벡터 머신 (support vector machine)

 

> 모수 추정 알고리즘

- 동적 프로그래밍

- 예측 최대화 알고리즘(EM 알고리즘)

> 생성 모형을 이용한 확률 분포 함수의 모형화

- 베이즈 네트워크와 마르코프 임의장을 포함한 그래프 모형

> 근사 추론 기법

- 몬테 카를로 방법

 

=========================================================================================================

 

Machine Learning

 인간은 학습 (Learning) 할 수 있기 때문에 자신의 지식을 계속적으로 확장시켜 나갈 수 있다. 이러한 지적능력은 인간을 다른 생물과 구별시키는 아주 중요한 요소들 중의 하나이다. machine learning 은 궁극적으로 인간의 이러한 학습능력을 구현하고자 하는 시도이다 ........ 인간의 가장 두드러진 특징은 새로운 것을 배우고 변화하는 환경에 적응할 수 있는 학습능력을 가지고 있다는 것이다 만일 컴퓨터도 이와같은 학습능력을 가질 수 있다면 지능을 가진 인간과 유사한 적응력을 가질 수 있게 될 것이다. AI 에서는 학습을 '프로그램을 하나의 문제를 수행한 후에 그 추론과정에서 얻은 경험을 바탕으로 시스템의 지식을 수정 및 보완하여, 다음에 그 문제나 또는 비슷한 문제를 수행할 때에는 처음보다 더 효율적이고 효과적으로 문제를 해결할 수 있는 적응성' 이라고 정의한다. 과연 컴퓨터가 배우는 능력을 갖출 수 있느냐에 대해서는 논란이 많이 있다. 학습에서는 새로운 지식의 습득과 새로운 정보의 추론이 중요하므로, 컴퓨터는 단순히 자료를 인식하는 것만이 아니라, 새로운 정보를 통하여 자신의 경험으로부터 얻은 지식을 수정하고 보다 정확한 지식으로 개선해 나가는 능력을 갖추어야 한다.

term    paper   site   lab   history   demo

1980년대 이후 기계학습 (machine learning) 의 연구가 활기있게 전개된 까닭은 우선 네 가지로 풀이될 수 있다. 첫째는 학습절차를 잘 이해하면 전문가 시스템 구성의 자동화를 촉진시킬 수 있고, 그 결과로 AI 을 급속도로 발전시킬 수 있으리라고 기대하기 때문이다. 둘째는 이론적 요구 때문이라고도 한다. 전문가 시스템들은 과학을 할 때 필수적으로 요구되는 이론의 일반성을 결여하고 있으므로 이를 보완하기 위한 것이었다. AI 가 문제해결이나 탐색분야에서 발견한 일반원리와 유사한 일반성을 기계학습의 영역에서도 취하고자 한 것이다. 셋째는 인간의 학습절차를 모델화하려는 것이다. 이것은 인간의 정보처리 시스템의 다양한 특색을 설명할 수 있는 한 방도가 될 것이다. 인간의 학습절차를 깊이 이해하면 우리의 교육 개선에도 크게 공헌할 것이다. 기계학습과 인간학습의 비교연구는 이런 점에서도 우리의 지대한 관심사가 아닐 수 없다. 넷째로 기계학습의 문제는 지식표현과 추리의 경우에서처럼 인식론적인 철학문제들에만 아니라, 문제해결, 정리증명, 유추추리, 비단조추리, 자연언어처리, 화법인지, 비전, 로봇, 기획, 게임 실행, 패턴 인지, 전문가 시스템 등 AI 의 모든 분야에 관련되어 있다. 그리하여 오늘날 기계학습은 AI 전반에 관련된 핵심문제로서 연구되고 있다 .............. (이초식 1993)

Machine Learning 을 구현하는 방법은 신경망 (Neural Network), 데이타마이닝 (Data Mining), 의사결정 트리 (Decision Tree), 유전알고리즘 (Genetic Algorithm), 사례기반 추론 (Case Based Reasoning), 패턴 인식 (Pattern Recognition), 강화 학습 (Reinforcement learning) 등등이 포함된다.

Machine learning 은 경험을 통해서 자동적으로 컴퓨터 알고리즘을 발전시키는 것에 관한 연구이다. 엄청난 데이터에서 일반적인 규칙을 발견하는 데이터마이닝 프로그램에서부터, 자동적으로 사용자의 관심사항을 배우게 되는 정보 filtering system 까지 그 응용은 광범위하다.

놀라운 모순은, 컴퓨터가 배우기는 아주 쉽기도 하고 아주 어렵기도 하다는 사실이다. 이 이유는 두가지 다른 유형의 학습 : 컴퓨터에게는 너무 쉬운 반복에 의한 학습 (Learning by Rote) 과 너무 어려운 인지학습 (Cognitive Learning) 이 있기 때문이다. 이 점에서, 여러 가지 다른 유형의 학습 - 유추에 의한 학습, 예에 의한 학습, 관찰에 의한 학습 등등 - 이 있다고 제안하고 싶을지도 모른다. 그러나, 이런 것들은 그것에 의해 지식이 습득될 수 있는 방법을 말하는 것이지, 학습이 일어나게 하는 실제 메커니즘을 말하는 것은 아니다.

 

 

1. 인공지능의 등장배경과 연구동향

오늘날의 컴퓨터관련 학문과 산업은 인간의 지능이 필요한 모든 분야에 사용하기 위해 인간두뇌의 영역으로 그 범위를 확장해가고 있으며 더 나아가 인간과 유사한 지능을 가진 첨단 컴퓨터 이론과 그 응용에 대해 많은 관심을 가지고 있다. 이런 관심으로부터 출발한 학문이 '인공지능'이다.

기 계가 인간의 지적활동을 대신하도록 하는데 관심을 갖고 있는 인공지능은 1956년 미국의 Dartmouth 대학에서 열명의 과학자가 모여 인공지능에 대한 모임을 가진 것이 그 시초라고 할 수 있다. 이 모임에서 인공지능(Artificial Intelligence)이라는 용어가 처음으로 사용되었다. 인공지능에 관한 연구는 1950년대부터 미국의 대학들을 중심으로 시작되었는데, 초기에는 주로 게임이나 서로 다른 언어들간의 번역, 수학적 정리의 증명 등의 작업을 기계를 통해 수행하는 실험적인 성격이 강했다. 1960년대에는 인공지능 기법을 이용하여 실세계문제에 적용하는 전문가시스템에 관한 연구가 활발히 진행되었다. 또한 이 시대는 인공지능과 경쟁관계에 있던 신경망에 대한 연구가 한창 훌륭한 결과를 내는 전성기였으며 반면에 인공지능에 관련된 연구는 크게 위축된 시기이다. 그러나 1960년에 민스키의 "퍼셉트론즈"가 발표된 이후로 인공지능과 라이벌 관계에 있던 신경망에 관한 연구는 급격하게 시들해졌고 다시 인공지능에 관한 연구가 활기를 띠게 되었다.

1970년대에 접어들면서 인공지능에 대한 연구는 비약적으로 발전하여 여러가지 테크닉과 알고리즘들이 개발되었다. 1980년대에는 여러가지 실용적인 전문가시스템이 개발되었으며, 그 이후로는 인공지능의 이론보다는 응용에 관한 연구가 진행되고 있다. 오늘날 인공지능 분야에서의 관심분야는 매우 광범위하며, 거의 전 분야에서 지능적인 처리가 요구되고 있다. 즉, 자연어 처리에서 서로 다른 언어들간의 기계적인 번역, 기계추론과 계획 및 자동컴퓨터 프로그램 시스템, 인공지능 시스템의 개발을 편리하게 해주는 하드웨어의 소프트웨어에 관한 연구, 컴퓨터를 통한 의학진단 시스템 등이 연구되고 있다. 여러 응용분야의 전문가시스템도 계속적으로 개발, 발전되고 있다.

2. 신경망 (Neural Network)

신 경망 모델에 관한 연구는 1943년 워렌 맥컬럭(Warren McCulloch)과 월터 피트(Walter Pitss)로부터 시작되었다. 맥컬럭과 피츠의 모델은 네트워크 내의 단순한 요소들의 연결을 통하여 무한한 컴퓨팅 능력을 가진다는 점에서 매우 고무적이었다. 이들의 모델은 인간 두뇌에 관한 최초의 논리적 모델링이라는 점에서 그 중요성이 매우 크며, 따라서 이 맥컬럭과 피츠의 모델이 신경망 이론의 효시로 여겨지고 있다. 그 이후 1949년에는 캐나다의 심리학자 도널드 헵(Donald Hebb)이 두 뉴런 사이의 연결강도를 조정할 수 있는 학습규칙을 발표하였으며, 프랭크 로젠블럿(Frank Rosenblatt)은 1957년에 '퍼셉트론'이라는 최초의 신경망 모델을 발표하였다. 이 모델은 처음 소개되었을 때 상당한 센세이션을 불러일으켰으며 여러 분야에 걸쳐 큰 영향을 끼쳤다.

이 퍼셉트론 모델은 당시에 매우 가능성이 큰 연구로 여겨졌으나 그후 여러가지 문제점들이 제시되었다. 민스키와 파퍼트가 '퍼셉트론즈'라는 저서를 통해 퍼셉트론 모델을 수학적으로 철저히 분석하여 그 모델을 단점들을 밝혀내고 난 후에는 신경망에 관련된 연구는 약 20년간 침체의 길을 걷게 된다.

그 이후 인공지능에 관한 연구가 진행되다라 퍼셉트론의 문제점을 극복하여 네트워크 구성시 한 개의 계층을 더 추가해 구성한 다층 퍼셉트론의 개념이 등장하면서 신경망 연구에 관한 새로운 계기를 마련하였다. 즉, 은닉층(Hidden Layer)과 백프로퍼게이션(Back Propagation) 학습 알고리즘을 이용함으로써 선형분리 문제 뿐만 아니라 여러가지 문제점들을 해결할 수 있게 된 것이다.

신경망에 관한 연구는 그림에서 보는 바와 같이 자연의 법칙을 규명하고자 하는 여러가지 학문들과 연계되어 있다. 즉, 두뇌이론, 신경생리학, 신경병리학 등의 연구를 통해 인간 두뇌가 정보를 저장하고 관리하는 방법들을 연구함으로써 신경망 구현에 필요한 기반지식들을 추출해 내며, 수학을 통해 인공 신경망 모델의 증명과정을 거칠 수 있게 된다. 또한 심리학, 논리학, 언어학, 철학 등의 학문을 통해 인간 두뇌활동에 관한 보다 폭넓은 연구과제가 주어질 수 있으며 마지막으로 정보과학과 컴퓨터 과학을 통해 연구된 모델을 시뮬레이션하고 실험과 검증을 거쳐 그 효과의 측정을 가능하게 한다. 현재의 자연과학은 자체적으로도 지속적인 발전을 거듭하고 있지만, 관련된 여러 학문들과의 연계를 통하여 보다 비약적인 발전을 이룩할 것이다. 특히 신경망 연구에 있어서는 학문간의 연계연구가 필요하다.

3. 전문가시스템 (Expert System)

전문가시스템이란 특정 분야에서 인간 전문가와 같은 수준의 지능과 경험을 가진 컴퓨터 시스템을 일컫는 말이다. 즉, 전문가가 가지고 있는 지식들을 정리하여 시스템에 입력시켜 지식베이스로 축적하여 사용자가 질문을 하면 추론기구가 지식베이스를 하용하여 추론을 하고 그 결과를 사용자에게 전해주는 과정을 거친다. 이는 인공지능 기법을 이용한 대표적인 응용이라고 볼 수 있으며, 현재까지 수많은 전문가시스템들이 개발되었으며 지금도 계속해서 개발되고 있다.

최초의 전문가 시스템은 1965년에 파이겐바움(Feigenbaum)이 개발한 덴드럴(Dendral)이라는 시스템으로서 이는 분자의 구조를 추정하는 시스템이었다. 그후 의학진단용 전문가시스템인 마이신(Mycin)을 비롯하여 광물탐사에 쓰이는 프로스펙터(Prospector), 음성이해의 가능성을 보여주기 위해 개발된 허세이(Hersay) 등 여러가지 전문가시스템들이 개발되었다. 현재 우리나라에도 전문가시스템학회 및 관련학회들이 계속 설립되어 이와 관련된 연구가 활기를 띠고 있으며, 여러 대학과 연구소에서 인공지능 연구와 더불어 전문가시스템의 개발을 위한 연구가 진행되고 있다.

4. 지식베이스 시스템 (Knowledge-base System)

인공지능을 구현하기 위한 방법론으로는 지식베이스가 사용된다. 지식베이스는 지식을 표현하고, 표현된 지식을 저장하고 관리하기 위한 기능을 가진다는 점에서 종래의 데이터베이스와는 다르다. 지식에는 시스템 구성자가 입력시키는 지식인 일반적인 지식과, 경험적인 지식으로서 경험을 통해서만 얻을 수 있는 특정 전문분야에 한정된 지식이 있다. 지식베이스는 추론엔진과 더불어 지식베이스 시스템에서 가장 핵심적인 역할을 담당한다. 컴퓨터는 이 주어진 문제들에 대하여 지식베이스에 근거하여 추론엔진을 통하여 정확한 추론을 하게 된다. 사용자와는 사용자 인터페이스를 통하여, 전문가와는 지식획득 기구를 통하여 외부적으로 연결을 가질 수 있다. 인공지능 프로그램을 전체집합이라고 할 때 지식베이스 시스템은 그것의 부분집합이며, 그 가운데서 특정한 부분집합이 바로 전문가시스템이라고 할 수 있다.

5. 퍼지이론 (Fuzzy Theory)

애 매함을 효과적으로 표현하고 실생활에 적용하고자 하는 방법론 중의 하나가 퍼지이론이다. 이의 효과적인 적용을 통하여 보다 정교한 지능적인 시스템의 구현이 가능해질 것으로 예상된다. 퍼지에 관한 체계적인 이론은 1965년 로피 자데(Lotfi Zadeh) 교수에 의해 처음으로 정립되었다. 하지만 그 때 당시에는 사람들에게 관심을 끌지 못하다가 1980년 초반에 던(Dunn)의 퍼지분할(Fuzzy Partition) 이론을 통하여 패턴 분류에 유용한 모델이 입증되었고, 이것은 1984년 미국의 사우스 캐롤라이나 대학 전산학과의 제임스 베즈엑(James Bezdek)에 의한 퍼지-c-means 알고리즘으로 체계화되었다. 그 후에 퍼지개념은 일본으로 들어가 실생활에 쓰이는 가전제품 등에 응용하기 위한 연구가 계속되었으며 우리나라에도 1980년대말부터 이를 활용하기 위한 연구가 진행되고 있다. 이 퍼지이론에 관한 연구는 퍼지제어, 퍼지 데이터베이스, 퍼지 신경망, 퍼지 전문가시스템, 퍼지 패턴인식, 퍼지 영상인식 , 퍼지추론 등 관련 분야를 섭렵하여 연구가 계속되어야 할 것이다. 인간의 지식정보처리는 어느 특정한 지식 표현 방법에 국한되지는 않는다. 퍼지, 신경망, 인공지능 등의 기법들은 각각의 고유한 장점들을 가지고 있다. 이들을 효과적으로 결합하여 보다 지능적인 지식의 처리가 가능해지고 있으며, 이에 대한 연구도 가속화되고 있다.

6. 기타 관련연구

1) 자연어 처리 (Natural Language Processing)

자 연어처리는 인공지능 연구의 초기단계에서부터 주요 관심의 대상이었다. 자연어 처리의 심화와 응용은 자연어의 이해와 기계번역을 들 수 있다. 자연어 이해는 지능적인 인터페이스나 문헌의 요약 또는 상황의 이해에 관한 분야이고, 기계번역은 컴퓨터를 통하여 서로 다른 언어들을 번역하는 것이다. 효과적인 자연어 처리를 위해서는 해당언어에 대한 정확한 문장의 분석, 즉 구문적인 분석과 의미적인 해석 능력이 필요하다. 효과적인 자연어 처리는 인간과 컴퓨터 사이의 원활한 인터페이스를 위해서는 필수적이므로 지능적인 자연어 처리에 거는 기대감은 매우 크다.

2) 패턴인식 (Pattern Recognition)

패턴인식이란 용어는 1960년대 초반에 처음으로 사용되었는데, 원래는 문자의 인식, 일기예보, 음성인식 등의 형태를 검출하는 의미로 쓰였다. 패턴인식의 보다 의욕적인 목표로는 생물학적 감각기능과 유사한 인공적인 인지(perception)를 구현하는 것이다. 패턴인식이란 패턴공간(Pattern Space)에서 클래스 멤버쉽 공간(Class Membership Space)으로의 매핑과정을 말한다. 즉, 외부로부터 획득된 데이터로부터 중요한 특징들을 추출하고, 그에 따라 가장 가까운 표준 패턴(template)을 골라 분류하여 최종적인 결정출력을 내게 된다. 시간적, 공간적 데이터에 대한 패턴인식의 신경망적인 접근에 있어서 가장 중요한 이슈는 어떻게 인식할 수 있느냐는 점과 패턴의 시간적인 정보를 어떻게 저장하느냐 하는 것, 그리고 움직이는 물체에 대한 실시간 처리에 관한 것이다. 현재 문자인식과 영상인식에 관한 연구가 진행되고 있으나 아직 그 수준은 상당히 제한된 수준이며 앞으로 이에 대한 연구는 계속될 것이다.

3) 에이전트 시스템 (Agent System)

에이전트란 사용자를 대신해서 사용자가 원하는 작업을 자동적으로 해결하여 주는 소프트웨어를 말한다. 즉, 특정목적에 대하여 사용자를 대신하여 작업을 수행하는 자율적 프로세스이며, 독자적으로 존재하지 않고 어떤 환경의 일부이거나 그 안에서 동작하게 된다. 초창기에는 인공지능에서 연구되어져 왔으나 현재는 독자적인 학문으로 발전하고 있다. 인공지능과 분리된 것은 분산 협동처리(Distributed Cooperative Processing)와 에이전트간 통신 개념이 등장하면서부터라고 할 수 있다. 90년대 들어오면서 에이전트에 관심과 필요성이 증대되었는데 가장 큰 이유는 인터넷 이용에 따른 사용자의 다양한 정보요구 때문이다. 학문적으로 가장 활발한 연구가 진행되는 분야는 멀티에이전트 개발이다. 멀티에이전트란 하나의 에이전트로 해결하지 못하는 복잡한 문제의 해결을 위하여 여러 에이전트간의 협동을 통해 작업을 수행하는 에이전트를 말한다. 멀티에이전트에는 조정에이전트(Coordinator Agent)라는 중재자를 통해 메시지를 전달하고 각 에이전트의 제어를 수행하게 된다. 그밖에 에이전트의 연구분야로는 에이전트간 통신언어, 에이전트 언어, 에이전트 구조 등에 관한 연구가 학문적으로는 계속 진행중이다. 에이전트 기술은 전자상거래, 이동컴퓨팅 등에서 활발히 응용, 연구되고 있다.

4) 데이터마이닝 기법 (Data Mining)

데 이터마이닝이란 대량의 데이타로부터 쉽게 드러나지 않는 유용한 정보들을 추출하는 과정을 말한다. 여기서 정보는 묵시적이고 잘 알려져 있지 않지만 잠재적으로 활용가치가 있는 정보를 말한다. 다시말해 데이타마이닝이란 기업이 보유하고 있는 일일 거래자료, 고객자료, 상품자료, 마케팅 활동의 피드백 자료와 기타 외부자료를 포함하여 사용가능한 데이타를 기반으로 숨겨진 지식, 기대하지 못했던 패턴, 새로운 법칙과 관계를 발견하고 이를 실제 경영의 의사결정 등을 위한 정보로 활용하고자 하는 것이다. 정보를 찾아내는 방법은 어떤 특정 기법과 그 기술 자체만을 의미하는 것이 아니고, 비즈니스 문제를 이해하고 이러한 문제를 해결하기 위하여 정보기술을 적용하는 포괄적인 과정을 의미한다. 즉 유용한 정보의 추출을 위한 방법론이라고 할 수 있다. 따라서 데이터마이닝을 효율적으로 수행하기 위하여 시계열분석 등 각종 통계기법과 데이터베이스 기술 뿐만 아니라 산업공학, 신경망, 인공지능, 전문가시스템, 퍼지논리, 패턴인식, 기계적 학습(Machine Learning), 불확실성 추론(Reasonging with Incertainty), 정보검색에 이르기까지 각종 정보기술과 기법들을 사용하게 된다. 또한 경영전략, 마케팅 기법 등의 최신 경영기법들의 이용도 필요하다. 이러한 데이터마이닝을 통하여 거대한 데이터베이스에 숨어있는 전략적인 정보를 발견할 수 있으며 이러한 정보는 주요 비즈니스 프로세스 개선의 가장 원초적인 단계에서 사용될 수 있다.