###2015.01.07.수

 

#6장
# 이론>함수>프로그램!
# 어떤 분포인지 이해해야한다
# 각 분포마다 확률변수의 의미 이해 > 알맞은 함수사용


# p.179 그림그리기 plot
x<-seq(-3,3, length=100)
plot(x, dnorm(x), type='l', main="Normal Distribution")
plot(dnorm,-3,3,main="Normal Distribution")

##plot(dnorm,~부터,~까지)

 

#p.180
x<-seq(-3,3, length=100)
plot(x, dnorm(x,mean=1,sd=0.5), type='l', ylab="")
plot(function(x) dnorm(x,mean=1,sd=0.5), -3,3, ylab="")

#P.181 , 누적분포 > 낮은쪽부터
pnorm(0, mean=0, sd=1)
pnorm(-1.96,mean=0,sd=1)
pnorm(1.96,,mean=0,sd=1,lower.tail=FALSE)

 

#p.182
pnorm(1.645)
integrate(dnorm,-Inf,1.645)

plot(pnorm,-3,3)

plot(function(x) pnorm(x,mean=1,sd=0.5),-3,3)

mtext(expression(paste("Cumulatiove Distribution of" ~N(1,0.5^2


qnorm(0.5)
qnorm( pnorm(1))
c(qnorm(0.025), qnorm(0.975) )

#qnorm과 pnormㅇ은 역관계?

 

#p.183

x<-rnorm(1000,0,1)
hist(x, freq=FALSE, col="red")
curve(dnorm,-3,3,add=TRUE, lwd=2, col="blue")
curve(dnorm,-3,3, col="blue")
#add=TRUE 앞에거 위에 그리기?


hist(x, freq=F, col="red")
hist(x, freq=T, col="red")
#freq=FALSE 상대빈도, 각빈도/총빈도

 

#예시) 건국대학교 남학생의 키 ,평균 175, 표준편차 10

# 170에서 180은 몇 퍼센트 인가?

 

pnorm(180, mean=175,sd=10)-pnorm(170,mean=175,sd=10)

[1] 0.3829249

 

# 180이상일 확률


1-pnorm(180,175,10)
pnorm(180,mean=175,sd=10,lower.tail=FALSE)

 

#p.184 6.2.2 지수분포

#어떤 특정 사건이 일어날 때 까지 걸리는 시간

 

 

plot( function(x) dexp(x,rate=3), 0, 4, ylab="")
plot( function(x) dexp(x,rate=2), 0, 4, add=TRUE,col="red",lty=2)
plot(dexp,0,4,add=TRUE,col="blue",lty=3)
legend("topright",c("Exp(1)","Exp(2)","Exp(3)"), col=c("blue","red","black"),lty=c(3,2,1),cex=1.2,lwd=2,bty="n")

#p.185 예제
#은행 창구 대기시간 오후1 시즘 평균 5분, lambda=1/5
#5분이상 확률?
pexp(5, rate=1/5, lower.tail=FALSE)
[1] 0.3678794

#5분에서 10분 사이 확률?
pexp(10,rate=1/5)-pexp(5,rate=1/5)
[1] 0.2325442


#p.186 6.2.3 균등분포 (각자 해보기)


#p.187 6.2.4 t-분포
#꼬리가 두껍다

 

#예제) 건국대 남학생 키 정규분포, 평균175, 표준편차10
# 샘플크기 n=100명 확률표본 (추출가능한표본 100명, 100, 100,100...)

# 표본의 평균이 174에서 176일 확률 P(174<=xbar<=176)

# X~N(175,10^2) ~ Xbar~N(175,1^2) #시험문제 나오면 표본평균의 분포 적기

pnorm(176, mean=175, sd=1) - pnorm(174, mean=175, sd=1)
[1] 0.6826895

 

#예제) 건국대 남학생 키 정규분포, 평균175, 표준편차10

# 샘플크기 n=100명 확률표본 (추출가능한표본 100명, 100, 100,100...)
# 표본의 평균이 174에서 176일 확률 P(174<=xbar<=176)

 

# X~N(175,10^2) ~ Xbar~N(175,1^2) #시험문제 나오면 표본평균의 분포 적기

pt(1,99 ) - pt(-1,99 )    #1에서-1:표준화 , 99:자유도

 

#p.188 6.3.1 이항분포

 

#예제) 추신수 안타 확률 p=0.4, 각 시행 독립, 다섯번 타석에 들어섰을 때(시행횟수 n=5),

# 2번 안타칠 확률은? (성공횟수 x=2인 확률은?)  >> 이항분포

dbinom(2, size=5, prob=0.4)
 
# 2번 이상일 확률을 구하시오
dbinom(0, size=5, prob=0.4)+dbinom(1, size=5, prob=0.4)
1- ( dbinom(0, size=5, prob=0.4)+dbinom(1, size=5, prob=0.4) )
pbinom(1, size=5,prob=0.4, lower.tail=FALSE) 
## pbinom( 1 << 1주의, 이산형에서는 <,> 등호가 들어가지 않는다, 연속형은 <=,>= 등호 들어감?

 

#p.191 이항분포의 정규근사
#X~B(n,p) >> n이 커지면 >> X~N(np,np(1-p))

 

#예제) X~B(100, 1/6)
#P(X<=180)=?
pbinom(180, size=1000, prob=1/6)
pnorm( 180, mean=1000*(1/6), sd= sqrt(1000*1/6*5/6) )

 

#더 근사시키기 위해서 연속성 수정( 이항분포는 이산, 정규분포는 연속)
#P(X<=180)=?
pbinom(180, size=1000, prob=1/6)
#이항분포의 정규근사할 때 연속성 수정 +1/2(0.5)
#=가 들어가면 덜포함, =가 없으면 더 포함
#=가들어가면 +0.5, =가 없으면 -0.5
pnorm( 180.5, mean=1000*(1/6), sd= sqrt(1000*1/6*5/6) )
#시험문제에선 연속성 수정할 것!
# P(X>179.5) , P(X>=180.5)

 

#p.193 6.3.2 포아송 분포
#lambda=평균성공횟수

 

#예시) 계절학기 수업을 듣기위해 집에서 버스를 12시 부터 1시 사이에 평균 여섯대 온다. lambda=6
#어느날 12시 부터 1시 사이에 30분동안 2대 올 확률은? >> lambda=3 , 30분이 단위시간

dpois(2,lambda=3)
[1] 0.2240418

 

#3대 이상일 확률은?
ppois(2, lambda=3, lower.tail=FALSE) # 2는 포함하지 않음, 3부터 카운트

 

#p.194 6.3.3 초기하분포
# 52장 중 에이스 4장,  7장 중에 4장 있을 확률? x=4, m=4, n=48, k=7
dhyper(4,4,48,7)

 

#기하분포
#함수
#dgeom
#pgeom
#qgeom
#rgeom
#mgeom

 

#예시) 추신수가 5번째 만에 비로소 안타를 쳤다.
dgeom(5,prob=0.4)

 

 

#음이항 다음시간
#
3*0.5^4

dnbinom(2,3,0.5)

 

 

 

program1.R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

블로그 이미지

테시리

,