빅데이터-기초1

기초이론 공부

Featured image

🎤 프로젝트 소개

빅데이터 기초이론 학습

🎤 빅데이터 기초이론

빅 데이터

빅데이터란 기존 데이터베이스 관리도구의 능력을 넘어서는 대량의 정형 또는 심지어 데이터베이스 형태가 아닌 비정형의 데이터 집합조차 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다.

데이터 마이닝

데이터 마이닝은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 것이다.

기법

Clustering

Applications of Clustering

Clustering Algorithms

클러스터링 알고리즘은 크게 중심 기반 알고리즘과 밀도 기반 알고리즘으로 나눌 수 있다.

K-means Clustering

중심 기반 알고리즘 이며 평균점을 계산하여 계속 Assign 한 후 더 이상 변화가 없으면 멈춘다.

Hierarchical Clustering

Hierarchical Clustering Algorithms

Density-Based Clustering Algorithms

밀도 기반 클러스터링으로써 특정한 분포를 따르는 데이터에 유용하다.

기존의 중심 기반 클러스터링 알고리즘인 k0means clustering과 비교할 때 다음과 같은 장단점을 갖고 있다