1.1 머신러닝 소개
머신러닝이란 무엇일가요? 한마디로 정의할 수 있습니다 "데이터를 이용해서 정의되지 않은 패턴을 컴퓨터로 학습하여 결과를 만들어내는 학문 분야"
머신러닝은 3가지가 합쳐져서 만들어진 분야입니다.
1. 데이터 : 머신러닝은 알고리즘이 아닌 데이터 학습을 통해 실행 동작이 바뀝니다.
2. 패턴인식 : 사용자가 일일히 정해놓은 패턴이 아닌 데이터를 보고 패턴을 추립니다.
3. 컴퓨터를 이용한 계산 : 응용수학이나 통계학과 달리 머신러닝은 단순히 수학적인 모델의 구축이나 증명에만 그치는 것이 아니라 실제 데이터에 대해 계산해서 결과를 만들어낸다는 점에서 전산학의 한 분야로 볼 수 있다.
1.2 머신러닝을 이해하는 데 필요한 배경지식
- 수학(선형대수, 미분, 통계 확률)
- 프로그래밍
1.3 머신러닝 발전사
- 고전적 인공지능 시대
인공지능을 판별하는 튜링 테스트 : 기계가 인간과 얼마나 비슷하게 대화하는지를 기준으로 기계의 지능을 판별하는 테스트입니다.
-신경망 시대
퍼셉트론이라는 기초적인 신경망이 개발되었습니다. 이를 여러개 묶어 복잡한 신경망을 구성하면 입력과 출력을 굉장히 유연하게 연결할 수 있었다. 하지만 그 시대에는 구할 수 있는 데이터가 굉장이 한정적이라 신경망 선능이 생각보다 신통치 않았고, 기초 이론의 부족으로 한정적인 패턴만 학습이 가능했습니다. --> '인공지능의 겨울'
-통계학적 머신러닝 시대
1990년대에 들어 통계학을 전산학과 접목시켜 대규모 데이터에서 패턴을 찾는 시도가 기존에 비해 진일보된 성과를 냈습니다. 기존의 방법과 가장 큰 차이점은 데이터에 훨씬 더 중요한 비중을 두었다는 것입니다. 이 시기에 머신러닝이라는 용어가 등장 했으며, 차후에 딥러닝이 나온 이후 이런 통계학에 중심을 둔 기법들을 통계학적 머신러닝이라고 부르게 됩니다.
-빅데이터 시대
통계학적 머신러닝은 웹에서 쏟아지는 데이터 대용량 저장창지, 분산 처리 기술과 결합하여 엄청난 시너지를 만들었습니다. 빅데이터라는 용어가 2010년대부터 유행했는데, 빅데이터 시대에는 기존보다 더 큰 데이터를 분석하기 위해 기존보다 훨씬 더 큰 규모의 머신러닝 시스템을 만들게 되고 그 덕택에 성능도 더욱 좋아지게 됩니다.
'머신러닝' 카테고리의 다른 글
[머신러닝] 6개 assay에 대한 모델을 한번에 만들기 위해 for문 안에 모델 fit 함수를 쓰고 score를 예측하면 수월하게 실행이 안된다. (0) | 2019.07.01 |
---|