MachineLearning(2)
-
K-평균 알고리즘(K-means Clustering algorithm) 실습
1. 데이터 설정하기 :가장 먼저 데이터 프레임(Data Frame)을 형성한다. from sklearn.cluster import KMeans import numpy as np import pandas as pd import seaborn as sb import matplotlib.pyplot as plt %matplotlib inline df = pd.DataFrame(columns=['x', 'y']) df.loc[0] = [2, 3] df.loc[1] = [2, 11] df.loc[2] = [2, 18] df.loc[3] = [4, 5] df.loc[4] = [4, 7] df.loc[5] = [5, 3] df.loc[6] = [5, 15] df.loc[7] = [6, 6] df.loc[8] = [..
2020.12.14 -
K-평균 알고리즘(K-means Clustering algorithm) 개념
클러스터링(Clustering) : 여러 개의 데이터가 있을 때 데이터를 군집화하는 것 비슷한 데이터끼리 묶으면 관리하기가 쉽다는 장점이 있다. ex) 학원을 운영한다고 했을 때 학생을 고급반/중급반/초급반 으로 나누어 적절히 분류한다. -> 이렇게 적절히 분류한다면 데이터를 활용할 방안이 많다. (클러스터링 기법은 적용할 사례가 매우 많다는 특징) K-means 알고리즘은 대표적인 비지도학습(Unsupervised Learning) 알고리즘이다. -클러스터링을 수행할 데이터의 주제를 결정한다. (수학 학원에서 학생들의 성적에 따라 반을 구분하기) -얼마나 많은 클러스터를 만들지 고민해야 한다. (고급반, 중급반, 초급반,,,) -데이터 준비 (데이터가 정확할수록 유리하다.) -클러스터링을 수행하기 위한..
2020.12.14