Clustering

·AI/Concepts
클러스터링이란 범주 구조를 생성하는 통계적 기법입니다. 동일 그룹에 속하는 개체들은 결속력이 강하고, 다른 그룹에 속하는 개체들은 결속력이 약합니다. classfication과 차이점 : 클러스터 그룹이 알려져 있지 않습니다. 클러스터링 기법의 분류 분류하기전, 각 문서들에 대해 matrix 연산을 진행해야 합니다. 계층적 구조와 비계층적 구조로 나뉠 수 있습니다. 응집 vs 분할 방식으로 나눌 수 있습니다. Distribution-based(분포 기반) vs density-based(밀집 기반) cluster의 분포를 중요시 한다면 각 cluster들의 크기가 일정합니다. cluster의 밀집도를 중요시 한다면 DBSCAN과 같은 방식을 사용할 수 있습니다. 이러한 방식은 불규칙을 처리가능 하며, No..
·AI/AI Project
MBTI Personality Types 500 Dataset ~100K preprocessed records of posts and personality types www.kaggle.com 본 프로젝트는 Kaggle에 있는 MBTI dataset을 사용하여 colab환경에서 진행했습니다. from google.colab import drive drive.mount('/content/drive') Mounted at /content/drive %cd /content/drive/MyDrive/텍스트마이닝_기말과제 /content/drive/MyDrive/텍스트마이닝_기말과제 !ls 'MBTI 500.csv' svm_classifier.pkl 텍스트마..
Shine_sunho
'Clustering' 태그의 글 목록