본문 바로가기

전체 글166

Week07 Representation Learning and Deep Learning One-Hot Representation - 표현하고 싶은 데이터의 위치에 1을 부여하고 나머지에는 0을 부여하는 방식 - 예전 AI에 주로 쓰였던 방식 예전에는 어떤 물체를 정의할 때 전문가들이 정의한 속성들에 의해 물체를 정의하였다. 앞으로는 전문가가 정의하는 것이 아니라 컴퓨터가 스스로 물체를 정의하는 속성들을 학습한다. 어떻게 DNN은 사물의 특징을 스스로 파악할 수 있을까? Latent Variable Deep Neural Network의 핵심 Essence of Modern Machine Learning Hidden Variable x와 h를 아래와 같이 가정 x 실세계에 존재하는 관측 가능한 것 h 이 세상에 존재하지 않는 가상의 값 간접적으로 추측만 가능 무엇이든 될 수 있는 값 이러한 영.. 2020. 6. 7.
Week05 Principal Components Analysis Demension Reduction 우리가 세상에서 얻는 데이터들은 수 많은 component들로 이루어진 vector로 나타낼 수 있다. 고차원으로 이루어진 데이터를 처리하는데에는 많은 자원과 시간이 필요하다. 그러므로 우리는 어떻게 고차원의 데이터를 저차원의 데이터로 변환할 수 있는지에 중점을 두고 살펴볼 것이다. Feature Selection - 고차원의 데이터 중에서 데이터를 표현할 때 중요한 feature를 뽑아 그 값을 그대로 사용하는 방법 Feature Projection - 고차원의 데이터를 어떠한 수학적 방법을 통하여 다른 차원으로 transform 시키는 방법 - demension reduction의 대표적인 방법 Principal Components Analysis(PCA) PCA를.. 2020. 6. 6.
Week04 Clustering Clustering 사용이유 데이터가 주어졌을 때 어떻게 이루어졌는지 알아보는 방법 중 하나로서 몇 가지의 속성으로 이루어져 있는지, 계층은 어떻게 나누어져 있는지 등을 파악할 수 있다. Clustering Analysis 데이터가 주어졌을 때 유사한 데이터들끼리 그룹을 지어주는 것 어떠한 데이터가 주어졌을 때 이를 유사한지 유사하지 않은지는 정답이 없다. (나누는 사람 마음) Partitional Clustering 하나의 데이터는 무조건 하나의 cluster에 매핑시키는 방식의 clustering Hierarchical Clustering Partitional clustering과 다르게 하나의 데이터가 다른 cluster에도 속하게 하는 방식의 clustering 예) 나는 대전광역시에 속해있는 사.. 2020. 6. 5.
Week03 Distance metric Distance Metric의 사용이유 지난 포스트에서 우리는 데이터들을 수학으로 바꾸어서 생각한다고 하였다. 데이터를 수학으로 바꾼다는 것은 숫자로 바꾼다는 것을 의미하기도 한다. 이런 상황에서 데이터를 구분하기 위해 Distance Metrics를 사용한다. Distance 거리란 무엇일까? 당연하게도 어떤 지점으로부터 다른 지점까지의 길이이다. 하지만 아래와 같이 사람에 따라 필요한 거리가 다를 수 있다. 서울에서 부산까지의 직선거리 서울에서 부산까지의 자동차 거리 서울에서 부산까지의 자전거 거리 Distance Metric Manhattan distance Taxicab distance 라고도 불린다. 한 지점에서 다른 지점까지의 x거리의 합과 y거리의 합을 더한 거리 Euclidean Dista.. 2020. 6. 2.