구글 검색 naive bayes R
library(MASS)
mu1<-c(1,1) #공간상의 1,1을 중심으로 자료가 분포
sig1<-matrix(c(1,0.5,0.5,1),ncol=2) #분산1 , 공분산0.5
X1<-mvrnorm(20,mu1,sig1)
mu2<-c(-1,-1)
sig2<-matrix(c(1,0.5,0.5,1),ncol=2)
X2<-mvrnorm(20,mu2,sig1)
Y1<-c(rep(1,16),rep(0,4))
Y2<-c(rep(1,4),rep(0,16))
Data<-cbind(c(Y1,Y2), rbind(X1,X2) )
X<-Data[,-1]
Y<-Data[,1]
my.lda<-function(x,Y,X){
X1<-X[Y==1,]
X0<-X[Y==0,] #메트리스
Y1<-Y[Y==1] #벡터니까 뒤에 컴마 붙이지 않음
Y0<-Y[Y==0]
hat.Mu1<-colMeans(X1) #Y가1인행만 추출 ==는 T,F
hat.Mu0<-colMeans(X0)
temp<-t(t(X1)-hat.Mu1)
hat.sig1<-t(temp)%*%temp/(length(Y1)-1)
temp<-t(t(X0)-hat.Mu0)
hat.sig0<-t(temp)%*%temp/(length(Y0)-1)
hat.sig.inv<-solve((hat.sig1+hat.sig0)/2) #solve 역행렬 구하는 함수, 존재하지 않으면 에러
hat.pi1<-sum(Y==1)/length(Y)
hat.pi0<-1-hat.pi1
}
t(t(X1)-mat.mu1)
sweep # 메트리스와 벡터, 로와컬럼 방향으로 벡터에 대해 연산을 해줌?
t(X)%*%A-B+log(hat.pi1/hat.pi0)
A<-hat.sig.inv%*%(hat.Mu1-hat.Mu0)
B<-t(hat.Mu1)%*%
'프로그래밍, 통계학 > R(데이터마이닝)' 카테고리의 다른 글
14.5.1 데이터마이닝 (0) | 2014.05.01 |
---|---|
14.4.29.화 (0) | 2014.04.29 |
14.4.15 (0) | 2014.04.15 |
4.10 데이터마이닝 (0) | 2014.04.10 |
데이터마이닝 팀과제설명, 로지스틱회귀 (0) | 2014.04.08 |