$d$为显性基因,$r$为隐性基因,父母为都为$rd$,求4个孩子里有3个呈显性的概率。
Solution: If we assume that each child is equally likely to inherit either of two genes from each parent, the probabilities that the child of two hybrid parents will have $dd, rr, rd$ pairs of genes are, respectively $(1/4, 1/4, 1/2)$, Hence, because an offspring will have the outward appearance of the dominant gene if its gene pair is either $dd, \text{ or } rd$, it follows that the number of such children is binomially distributed with parameters $(4, 3/4)$.(注意到单个元素具有显性这种属性的概率需要计算,不是直接知道。)
二项分布其实给出了概率空间里,$n$个(不相交的)子集的概率情况,一般问题中要求的具有某个属性个子集可以表达成这$n$个子集的并。
2) 区间上的均匀分布:随机变量的值落到某个子区间的概率等于这个子区间的长度占全部区间的比例。
3) 正态分布:密度函数可以吸收$x$的线性变换而不改变形式 $$f(x)=\frac{1}{\sqrt{2\pi}\sigma} \exp{ \left( -\frac{1}{2} \left( \frac{x-\mu}{\sigma} \right)^2 \right) }$$
4) 随机变量$X$的函数$g(X)$的期望计算的时候只能把$g$做到积分$E(X)=\int_{-\infty}^{\infty}xf(x)dx$里面的$x$上,不能作用在$E(X)$的结果上。 $$E(g(X))=\int_{-\infty}^{\infty}g(x)f(x)dx$$ moment是$g(X)=X^n$。
Var是$g(X)=(X-m)^2, m=E(X)$。
二维的时候 $$E(g(X, Y))=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}g(x, y)f(x, y)dxdy$$ 但是如果$g$是线性函数,显然可以和积分交换,所以期望具有线性。
5) 分布函数$F(a)$接受的参数是一个界限$a$,联合分布函数$F(a, b)$接受的参数是两个界限$a, b$。得单个分布的方法是另一个界限传入$+\infty$,例如 $$F_X(a)=F(a, +\infty)$$ 联合密度是$p(x, y)=P(X=x, Y=y)$,要得单个r.v.的方法是对另一个求和 $$p_X(x)=\sum_{y}p(x,y)$$ 连续的时候是对另一个积分 $$f_X(x)=\int_{-\infty}^{\infty}f(x,y)dy$$ 一个例子
6) 现实中期望是容易得到的参数,只要对r.v.做很多实验,求平均值就可以了。有些不等式给出了概率空间某些集合的概率的估计是期望的函数。
7) 利用indicator函数
indicator的特点是期望等于取值1的概率 $$E(I)=P(I=1)=1-P(I=0)$$ 并且这个r.v. indicator的平方的期望不变 $$E(I^2)=1^2\cdot P(I=1) + 0^2\cdot P(I=0)$$
25种优惠券,被选中的机会均等,求随机取10张优惠券里面优惠券种类的期望。
概率空间里的元素$\omega$为10张优惠券的组合,考虑集合$A_i=\{\omega | \omega \text{ contains type $i$ coupon }\}$,定义$I_i$为$A_i$的indicator,问题中的r.v. 可以表达成$X(\omega)=\sum_iI_i(\omega)$,由期望的线性 $$E(x)=E(\sum_iI_i)=\sum_iE(I_i)=\sum_i[1-\left(\frac{24}{25}\right)^{10}]=25[1-\left(\frac{24}{25}\right)^{10}]$$ 利用条件,概率空间里的元素是set,r.v是set的一个内部的一个计数,计数可以分解成indicator。
8) 密度函数,分布函数表达的都是r.v.某个逆像的概率测度,r.v.独立的定义是任何逆像作为概率空间的子集是独立的。子集独立定义用到其交集的概率,而联合分布其实是定义了逆像的交集的概率。
独立r.v.实际上对应了概率空间内部的一个乘积分解,原空间实际上可以表达成两个概率空间的乘积。
一个随机变量对应了概率空间的一个维度(测量样本的一个属性),测很多个属性,里面独立的对应了概率空间内部的乘积结构。
9) 概率和组合:
i) 如果问题中的组合有$N$种可能,每种组合的概率是相等的,也就是$p=\frac{1}{N}$,那么要求其中某些组合的集合的概率,1.直接计数,算满足条件的组合有个数$M$,概率是$\frac{M}{N}$。2.已知每个组合的概率是$p=\frac{1}{N}$,满足条件的组合有$M$种,简单的把$M$个组合的概率加起来就得到结果,$M\frac{1}{N}$.
ii) 有时候满足要求的组合的概率并不相等,这时候要单独计算每种组合的概率和个数,最后做加法。比如抛硬币,出现正面结束,求抛的次数小于5的概率。
iii) 还有满足条件的元素可以分成多组,每组内部的元素概率相等,不同组的元素的概率不同。计算方法和ii类似,组内计数,的组的概率,整个组构成的子集的概率,然后所有的组相加,例如后面的比赛的例子。
10) 概率,和式,积分
和式以及积分,分成两部分,第一是变量可以取值的范围,或者下标可以取值的范围,第二部分是刚才约束的变量的函数,这个函数取遍所有的可能不重复的值求和。
两个部分可以独立的变化,只要不改变实际的范围或者函数的取值。
11) Conditioning 用indicator可以把一个集合的概率$P$和它的indicator的r.v.的期望联系起来(进一步,它们的条件期望和条件概率也相等),期望可以用条件期望的方法计算。例子,假设$X,Y$是两个独立的r.v.,计算$P\{X < Y\}$ $$P\{X < Y\}=\int_{-\infty}^{\infty}P\{ X < Y|Y=y \}f_Y(y)dy$$ 等式右边的积分是期望带来的。
No comments:
Post a Comment