document clustering

·AI/Concepts
클러스터링이란 범주 구조를 생성하는 통계적 기법입니다. 동일 그룹에 속하는 개체들은 결속력이 강하고, 다른 그룹에 속하는 개체들은 결속력이 약합니다. classfication과 차이점 : 클러스터 그룹이 알려져 있지 않습니다. 클러스터링 기법의 분류 분류하기전, 각 문서들에 대해 matrix 연산을 진행해야 합니다. 계층적 구조와 비계층적 구조로 나뉠 수 있습니다. 응집 vs 분할 방식으로 나눌 수 있습니다. Distribution-based(분포 기반) vs density-based(밀집 기반) cluster의 분포를 중요시 한다면 각 cluster들의 크기가 일정합니다. cluster의 밀집도를 중요시 한다면 DBSCAN과 같은 방식을 사용할 수 있습니다. 이러한 방식은 불규칙을 처리가능 하며, No..
Shine_sunho
'document clustering' 태그의 글 목록