201301.ch3.r.mining.eng.hwp


14.4.17.마이닝실습



구글 검색 naive bayes R


library(MASS)


mu1<-c(1,1)           #공간상의 1,1을 중심으로 자료가 분포

sig1<-matrix(c(1,0.5,0.5,1),ncol=2)  #분산1 , 공분산0.5

X1<-mvrnorm(20,mu1,sig1)



mu2<-c(-1,-1)          

sig2<-matrix(c(1,0.5,0.5,1),ncol=2) 

X2<-mvrnorm(20,mu2,sig1)



Y1<-c(rep(1,16),rep(0,4))

Y2<-c(rep(1,4),rep(0,16))



Data<-cbind(c(Y1,Y2), rbind(X1,X2)  )



X<-Data[,-1]

Y<-Data[,1]


my.lda<-function(x,Y,X){

X1<-X[Y==1,]

X0<-X[Y==0,]  #메트리스

Y1<-Y[Y==1]   #벡터니까 뒤에 컴마 붙이지 않음

Y0<-Y[Y==0]   


hat.Mu1<-colMeans(X1) #Y가1인행만 추출 ==는 T,F         

hat.Mu0<-colMeans(X0)      


temp<-t(t(X1)-hat.Mu1)

hat.sig1<-t(temp)%*%temp/(length(Y1)-1)


temp<-t(t(X0)-hat.Mu0)

hat.sig0<-t(temp)%*%temp/(length(Y0)-1)


hat.sig.inv<-solve((hat.sig1+hat.sig0)/2) #solve 역행렬 구하는 함수, 존재하지 않으면 에러


hat.pi1<-sum(Y==1)/length(Y)

hat.pi0<-1-hat.pi1






}




t(t(X1)-mat.mu1)



sweep # 메트리스와 벡터, 로와컬럼 방향으로 벡터에 대해 연산을 해줌?



t(X)%*%A-B+log(hat.pi1/hat.pi0)


A<-hat.sig.inv%*%(hat.Mu1-hat.Mu0)

B<-t(hat.Mu1)%*%


'프로그래밍, 통계학 > R(데이터마이닝)' 카테고리의 다른 글

14.5.1 데이터마이닝  (0) 2014.05.01
14.4.29.화  (0) 2014.04.29
14.4.15  (0) 2014.04.15
4.10 데이터마이닝  (0) 2014.04.10
데이터마이닝 팀과제설명, 로지스틱회귀  (0) 2014.04.08
블로그 이미지

테시리

,