文章目录
- 一、统计基础
- 二、概率
- 三、计数原理
- 四、随机变量
高中数学基础-统计和概率
一、统计基础
- 总体、个体:所有元素称为总体,其中一个元素称为个体
- 普查、抽查:所有元素都检查一遍称为普查,对部分样本进行抽取检查称为抽查,抽样中的元素称为样本,抽样的总数称为样本量
- 放回和不放回:抽查时是否放回,是两种策略,样本比较多那就不放回(不然影响效率),样本比较少就放回(不然抽几次就没了);摇骰子、抽签、随机数是放回的,结果可以重复;抽奖、彩票是不放回的;
- 平均值:总体有总体平均数(或者叫平均值),样本有样本平均数;平均数可以表示为 x ˉ \bar{x} xˉ
- 分层抽样:总体A中的数据并不均匀,聚集抱团在不同区域,每一个子总体,可以称为层,那么采用分层抽样,某层的样本总数为B,需要抽取的样本数为C,那么该层的抽样样本为 S = B A C S=\frac{B}{A}C S=ABC;
- 数据来源:抽样实际调查;做实验记录数据;观察客观规律的数据,如下雨天数;查询公开数据、论文等;
- 数据和频率:统计出数据以后,可以根据数据的占比,绘制频率分布表、频率分布直方图;反应不同数据范围的分布频率
- 频率分布表:最大值和最小值的差为极差A,假设组距为B,那么组数为 C = A B C=\frac{A}{B} C=BA,可以根据实际情况调整B来控制C的大小,然后制作表格,分组从最小值D开始 [ D , D + B ] , [ D + B , D + 2 B ] . . . [D, D+B],[D+B, D+2B]... [D,D+B],[D+B,D+2B]...,每一个分组确定对应的频数、频率(频率=频数/样本量)
- 频率分布直方图:类似于频率分布表,只不过分组作为x轴(柱子的底就是组距),频率/组距作为y轴,如此每一个柱子的面积=频率,所有柱子的面积之和等于1
- 百分位:如果样本总量100,那么排序后,取第80、81位AB, C = A + B 2 C=\frac{A+B}{2} C=2A+B就是第80分位数,意味着有80%数据小于C;第p分位数P表示有p%数据小于P
- 离散程度:已知平均数 x ˉ \bar{x} xˉ,求和每一项和平均数的差的平方,再除以样本数,得到方差反映了各项值和平均数的趋紧关系;方差 T = 1 n ∑ i = 1 n ( x i − x ˉ ) 2 T=\frac{1}{n}\sum_{i=1}^n{(x_i-\bar{x})^2} T=n1∑i=1n(xi−xˉ)2;方差的单位是单位的平方,标准差 t = T t=\sqrt{T} t=T进行单位还原
二、概率
- 随机试验:有一些事件是随机发生的,那么称为随机试验
- 样本点:随机试验所有可能的每一个结果称为样本点,所有样本点集合称为样本空间Ω;如果一个实验的样本空间有限,称为有限样本空间
- 随机事件:样本空间E的一个子集就是随机事件(简称事件)如果这个子集只有一个元素,那么称为基本事件(ABC…)如果一次实验,一个基本事件的样本点出现,那么称为事件A发生,样本空间Ω必然发生,空集不包含样本点表示不可能发生
- 事件包含:如果事件A发生则B发生,那么B包含A;如果AB相互包含,那么A=B
- 事件并集:如果事件A发生,事件B至少有一个样本发生,那么AB有并集;
- 事件交集:如果事件A发生,事件B也发生,那么AB有交集;
- 事件互斥:如果事件A发生,事件B不可能发生,那么AB没有交集;
- 事件对立:一次实验,要么事件A 发生或者事件B发生,那么AB对立;A并B=Ω
- 古典概型:样本有限,每一个样本发生概率相等,称为古典概型;
- 概率:样本A发生的概率称为P(A),概率反映了事件发生的可能性大小;假设样本空间Ω有n个样本点,满足事件A的样本点有k个,那么 P ( A ) = k n = n ( A ) n ( Ω ) P(A)=\frac{k}{n}=\frac{n(A)}{n(Ω)} P(A)=nk=n(Ω)n(A),用 n ( A ) n(A) n(A)格式快速表示样本点数
- 概率性质1:一般对于事件A有 P ( A ) > = 0 P(A)>=0 P(A)>=0, P ( Ω ) = 1 P(Ω)=1 P(Ω)=1, P ( ∅ ) = 0 P(∅)=0 P(∅)=0
- 概率性质2:事件互斥,那么对于两个互斥事件, P ( A ∪ B ) = P ( A ) + P ( B ) P(A∪B)=P(A)+P(B) P(A∪B)=P(A)+P(B)
- 概率性质3:事件对立,两个对立事件, P ( A ) + P ( B ) = 1 = > P ( A ) = 1 − P ( B ) P(A)+P(B)=1=>P(A)=1-P(B) P(A)+P(B)=1=>P(A)=1−P(B)
- 概率性质4:事件包含,如果A包含B,那么 P ( A ) > = P ( B ) P(A)>=P(B) P(A)>=P(B)
- 概率性质5:对于任意两个事件满足 P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A∪B)=P(A)+P(B)-P(AB) P(A∪B)=P(A)+P(B)−P(AB),一般来说主要针对AB存在交集的情况,如果没有交集那么P(AB)=0,就变成了对立事件
- 事件独立性:对于两个独立事件AB,两个事件之间互不影响,那么 P ( A B ) = P ( A ) ∗ P ( B ) P(AB)=P(A)*P(B) P(AB)=P(A)∗P(B),P(AB)代表事件样本空间的交集
- 频率和概率:一个实验中的事件S发生的次数A,总实验次数N,频率为 B = A N B=\frac{A}{N} B=NA,经过实验发现,N越大,B趋向于概率P(S);也就是说实验验证得到的频率,可以用来反映概率;
包含
并集
交集
互斥
对立
三、计数原理
- 分类加法:想要完成一件事情,假设总方案数为N,可以对方案进行分类,分类1有m个方案、分类2有n个方案,那么总方案 N = m + n N=m+n N=m+n
- 分步乘法:想要完成一件事情,如果分两步,第一步有m个方案,第一步有n个方案,那么总方案 N = m ∗ n N=m*n N=m∗n
- 排列数:在n个元素中取出m个元素,并且排成一行(具有顺序性、方向性),那么方案数为 A n m = n ∗ ( n − 1 ) ∗ ( n − 2 ) ∗ . . . ∗ ( n − m + 1 ) A_n^m=n*(n-1)*(n-2)*...*(n-m+1) Anm=n∗(n−1)∗(n−2)∗...∗(n−m+1)(在数轴上a到b,如果包含a,总数=b-a+1;如果只算b和a之间的差,差=b-a);
- 全排列公式:如果将n个元素全部排列,那么 A n n = n ∗ ( n − 1 ) ∗ ( n − 2 ) ∗ . . . ∗ 3 ∗ 2 ∗ 1 A_n^n=n*(n-1)*(n-2)*...*3*2*1 Ann=n∗(n−1)∗(n−2)∗...∗3∗2∗1,称为全排列;正整数1到n的连乘,称为阶乘,所以 A n n = n ! A_n^n=n! Ann=n!
- 排列公式变形:乘以余项 T = ( n − m ) ∗ . . . ∗ 3 ∗ 2 ∗ 1 = ( n − m ) ! T=(n-m)*...*3*2*1=(n-m)! T=(n−m)∗...∗3∗2∗1=(n−m)!,补全分子, A n m = n ∗ ( n − 1 ) ∗ ( n − 2 ) ∗ . . . ∗ ( n − m + 1 ) = > A n m = n ∗ ( n − 1 ) ∗ ( n − 2 ) ∗ . . . ∗ ( n − m + 1 ) ∗ T T = n ! T = n ! ( n − m ) ! A_n^m=n*(n-1)*(n-2)*...*(n-m+1)=>A_n^m=\frac{n*(n-1)*(n-2)*...*(n-m+1)*T}{T}=\frac{n!}{T}=\frac{n!}{(n-m)!} Anm=n∗(n−1)∗(n−2)∗...∗(n−m+1)=>Anm=Tn∗(n−1)∗(n−2)∗...∗(n−m+1)∗T=Tn!=(n−m)!n!
- 案例1:0-9的10个数字可以组成多少个没有重复数字的三位数?分两步,第一步首位不能是0,取一个数字,有 T 1 = A 9 1 T_1=A_9^1 T1=A91,第二步剩下9个数字取出2个,有 T 2 = A 9 2 T_2=A_9^2 T2=A92,那么总方案 N = T 1 ∗ T 2 = A 9 1 ∗ A 9 2 = 648 N=T_1*T_2=A_9^1*A_9^2=648 N=T1∗T2=A91∗A92=648
- 组合数:从n个元素中取出m个元素,不具备顺序性,规定 C n m C_n^m Cnm是组合数;如果在组合数上乘以m的排列 A m m A_m^m Amm,就会让组合数具备顺序性 C n m ∗ A m m = A n m C_n^m*A_m^m=A_n^m Cnm∗Amm=Anm,一般来说根据排列数来求组合数 C n m = A n m A m m = n ∗ ( n − 1 ) ∗ ( n − 2 ) ∗ . . . ∗ ( n − m + 1 ) m ! C_n^m=\frac{A_n^m}{A_m^m}=\frac{n*(n-1)*(n-2)*...*(n-m+1)}{m!} Cnm=AmmAnm=m!n∗(n−1)∗(n−2)∗...∗(n−m+1)(原始定义,m比较小的时候适用),可以推导出 C n m = n ! m ! ( n − m ) ! C_n^m=\frac{n!}{m!(n-m)!} Cnm=m!(n−m)!n!(适合在m相对n比较大时候,进行阶乘约分);其实顺序性 R = A m m = m ! R=A_m^m=m! R=Amm=m!是排列数和组合数的差别
- 二项式定理: ( a + b ) n (a+b)^n (a+b)n最后的总项数为 n n n,相当于做了n次二选一,每一项都格式为 a n − k b k a^{n-k}b^k an−kbk(习惯规定b的次方为k,也可以指数互换),那么每一项的系数表示从n个元素中取k个b,二项式系数可以表示为 C n k C_n^k Cnk,公式 ( a + b ) n = C n 0 a n b 0 + C n 1 a n − 1 b 1 + C n 2 a n − 2 b 2 + . . . + C n n a 0 b n (a+b)^n=C_n^0a^nb^0+C_n^1a^{n-1}b^1+C_n^2a^{n-2}b^2+...+C_n^na^0b^n (a+b)n=Cn0anb0+Cn1an−1b1+Cn2an−2b2+...+Cnna0bn,其中任意一项的通式为 C n k a n − k b k C_n^ka^{n-k}b^k Cnkan−kbk
- 特殊二项式:令a=1, ( 1 + b ) n = C n 0 + C n 1 b + C n 2 b 2 + . . . + C n n b n (1+b)^n=C_n^0+C_n^1b+C_n^2b^2+...+C_n^nb^n (1+b)n=Cn0+Cn1b+Cn2b2+...+Cnnbn
- 二项式系数趋势: k < n + 1 2 k<\frac{n+1}{2} k<2n+1时随着k增大 C n k C_n^k Cnk递增,超过则开始递减,曲线在 k = n + 1 2 k=\frac{n+1}{2} k=2n+1对称
- 二项式系数总和: ( a + b ) n (a+b)^n (a+b)n如果a=1、b=1,那么 ( a + b ) n = ( 1 + 1 ) n = 2 n = C n 0 + C n 1 + C n 2 + . . . + C n n (a+b)^n=(1+1)^n=2^n=C_n^0+C_n^1+C_n^2+...+C_n^n (a+b)n=(1+1)n=2n=Cn0+Cn1+Cn2+...+Cnn,表明二项式系数总和等于 2 n 2^n 2n
四、随机变量
- 条件概率:假设事件A事件B是交集,那么 P ( A B ) P(AB) P(AB)表示交集发生的概率, P ( A B ) P ( A ) \frac{P(AB)}{P(A)} P(A)P(AB)代表A发生的情况下B发生的概率,记作 P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)=\frac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB);
- 概率乘法:事件交集状态,可以得到变形 P ( A B ) = P ( A ) P ( B ∣ A ) P(AB)=P(A)P(B|A) P(AB)=P(A)P(B∣A);如果事件相互独立, P ( B ∣ A ) = P ( A B ) P ( A ) = P ( A ) P ( B ) P ( A ) = P ( B ) P(B|A)=\frac{P(AB)}{P(A)}=\frac{P(A)P(B)}{P(A)}=P(B) P(B∣A)=P(A)P(AB)=P(A)P(A)P(B)=P(B),那么替换到独立公式中 P ( A B ) = P ( A ) P ( B ) = P ( A ) P ( B ∣ A ) P(AB)=P(A)P(B)=P(A)P(B|A) P(AB)=P(A)P(B)=P(A)P(B∣A),依然可以满足 P ( A B ) = P ( A ) P ( B ∣ A ) P(AB)=P(A)P(B|A) P(AB)=P(A)P(B∣A);如果A包含B,那么 P ( B ∣ A ) = 1 P(B|A)=1 P(B∣A)=1, P ( A B ) = P ( B ) ∗ 1 P(AB)=P(B)*1 P(AB)=P(B)∗1,依然满足概率乘法公式;一般来说条件概率在交集中应用最广泛
- 条件概率和概率性质:事件互斥,依然满足条件概率 P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) P(B∪C|A)=P(B|A)+P(C|A) P(B∪C∣A)=P(B∣A)+P(C∣A);事件对立依然满足, P ( B ˉ ∣ A ) = 1 − P ( B ∣ A ) P(\bar{B}|A)=1-P(B|A) P(Bˉ∣A)=1−P(B∣A)
- 全概率公式:如果第一步的多个方案是互斥事件,第二步事件B发生的概率,其中一个方案S后事件B发生的概率为 P ( S ) P ( B ∣ A S ) P(S)P(B|A_S) P(S)P(B∣AS),那么所有方案加起来 P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=\sum_{i=1}^nP(A_i)P(B|A_i) P(B)=∑i=1nP(Ai)P(B∣Ai);注意 P ( A i ) > 0 , P ( A 1 ) + P ( A 2 ) + . . + P ( A n ) = 1 P(A_i)>0, P(A_1)+P(A_2)+..+P(A_n)=1 P(Ai)>0,P(A1)+P(A2)+..+P(An)=1
- 贝叶斯公式:已知第二次事件发生全概率为 P ( B ) P(B) P(B),在事件B发生情况下,第一次第i个方案发生的概率为 T = P ( A i ∣ B ) = P ( A i ) P ( B ∣ A i ) P ( B ) T=P(A_i|B)=\frac{P(A_i)P(B|Ai)}{P(B)} T=P(Ai∣B)=P(B)P(Ai)P(B∣Ai)
- 换箱子问题:假设有123三个箱子,其中一个有奖品,主持人知道奖品在哪里,你选择了1,这个时候主持人打开了3号箱子是空的,这个时候你要不要换箱子?设 A 1 A 2 A 3 A_1A_2A_3 A1A2A3为奖品在123箱子的事件, B 1 B 2 B 3 B_1B_2B_3 B1B2B3为主持人打开3号箱子的事件,那么 P ( B 3 ) = P ( A 1 ) P ( B ∣ A 1 ) + P ( A 2 ) P ( B ∣ A 2 ) + P ( A i ) ∗ 0 = 1 3 ∗ 1 2 + 1 3 ∗ 1 = 1 2 P(B_3)=P(A_1)P(B|A_1)+P(A_2)P(B|A_2)+P(A_i)*0=\frac{1}{3}*\frac{1}{2}+\frac{1}{3}*1=\frac{1}{2} P(B3)=P(A1)P(B∣A1)+P(A2)P(B∣A2)+P(Ai)∗0=31∗21+31∗1=21,那么在主持人打开3号箱子的前提下,1号箱子是奖品的概率 P ( A 1 ∣ B 3 ) = P ( A 1 ) P ( B ∣ A 1 ) P ( B 3 ) = 1 3 P(A_1|B_3)=\frac{P(A_1)P(B|A_1)}{P(B_3)}=\frac{1}{3} P(A1∣B3)=P(B3)P(A1)P(B∣A1)=31,2号箱子是奖品的概率 P ( A 2 ∣ B 3 ) = P ( A 2 ) P ( B ∣ A 2 ) P ( B 3 ) = 2 3 P(A_2|B_3)=\frac{P(A_2)P(B|A_2)}{P(B_3)}=\frac{2}{3} P(A2∣B3)=P(B3)P(A2)P(B∣A2)=32,那么此时应该换成2号箱子;(还有一种简单思路,你选择了1中奖概率是 1 3 \frac{1}{3} 31,其余的23箱子当成整体,中奖概率是 2 3 \frac{2}{3} 32,23排除任何一个剩下那个概率自动继承 2 3 \frac{2}{3} 32)
- 离散型随机变量:假设实验的每个样本点对应一个实数值 ω ( X ) ω(X) ω(X)(对应规则自己定义),那么称X为随机变量,由于实数值 ω ( X ) ω(X) ω(X)的数量未知、不固定,总称为离散型随机变量;
- 随机变量X概率分布列:假设随机变量X取值为 x 1 , x 2 , x 3 . . . x n x_1,x_2,x_3...x_n x1,x2,x3...xn,那么发生的概率为 P ( X = x i ) P(X=x_i) P(X=xi),将 P ( X = x i ) P(X=x_i) P(X=xi)和X一一对应,每一列有两个值,就是X的概率分布列;如果X取值只有0、1,那么称为0-1分布(两点分布)
- 随机变量X期望:概率*目标值=期望的目标值,规定总期望 E ( X ) = ∑ i = 1 n x i P i E(X)=\sum_{i=1}^{n}x_iP_i E(X)=∑i=1nxiPi为X的均值或期望;根据方程式推导 E ( a X + b ) = a E ( X ) + b E(aX+b)=aE(X)+b E(aX+b)=aE(X)+b
- 随机变量X期望方差:在均值的基础上计算方差,可以反应样本数据的离散程度,方差 D ( X ) = ∑ i = 1 n ( x i − E ( X ) ) 2 P i = > ∑ i = 1 n x i 2 P i − 2 E ( X ) ∑ i = 1 n x i p i + E ( X ) 2 ∑ i = 1 n P i D(X)=\sum_{i=1}^{n}(x_i-E(X))^2P_i=>\sum_{i=1}^{n}x_i^2P_i-2E(X)\sum_{i=1}^{n}x_ip_i+E(X)^2\sum_{i=1}^{n}P_i D(X)=∑i=1n(xi−E(X))2Pi=>∑i=1nxi2Pi−2E(X)∑i=1nxipi+E(X)2∑i=1nPi,由于 ∑ i = 1 n x i p i = E ( X ) , ∑ i = 1 n P i = 1 \sum_{i=1}^{n}x_ip_i=E(X), \sum_{i=1}^{n}P_i=1 ∑i=1nxipi=E(X),∑i=1nPi=1,那么 D ( X ) = ∑ i = 1 n x i 2 P i − 2 E ( X ) 2 + E ( X ) 2 = ∑ i = 1 n x i 2 P i − E ( X ) 2 D(X)=\sum_{i=1}^{n}x_i^2P_i-2E(X)^2+E(X)^2=\sum_{i=1}^{n}x_i^2P_i-E(X)^2 D(X)=∑i=1nxi2Pi−2E(X)2+E(X)2=∑i=1nxi2Pi−E(X)2;标准差为 D ( X ) \sqrt{D(X)} D(X)
- 二项分布:一次实验的结果只有两种事件,每次实验相互独立,假设事件发生的概率为p,X表示成功发生的次数,总实验数为n,根据二项式定理,令 a = p 、 b = 1 − p a=p、b=1-p a=p、b=1−p,X的分布列为 P ( X = k ) C i = 1 n p k ( 1 − p ) n − k = [ p + ( 1 − p ) ] n P(X=k)C_{i=1}^np^k(1-p)^{n-k}=[p+(1-p)]^n P(X=k)Ci=1npk(1−p)n−k=[p+(1−p)]n,记作 X ∼ B ( n , p ) X \sim B(n,p) X∼B(n,p); E ( X ) = n p , D ( X ) = n p ( 1 − p ) E(X)=np,D(X)=np(1-p) E(X)=np,D(X)=np(1−p)
- 超几何分布:二项分布可以理解成放回模式,这样保证每次实验概率重置;如果不放回,前一次实验会影响后一次实验,这就是超几何分布。假设一批产品共N个,总次品有M个,现在不放回连续抽取n个样品,X表示抽到次品的个数,X的分布列 P ( X = k ) = C M k C N − M n − k C N n P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n} P(X=k)=CNnCMkCN−Mn−k; E ( X ) = n p E(X)=np E(X)=np
- 正态分布:样本对应的实数值 ω ( X ) ω(X) ω(X)连续,称为连续型随机变量,在直角坐标系中,X为x轴,频率/组距为y轴,绘制曲线 f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 f(x)=\frac{1}{σ\sqrt{2\pi}}e^{-\frac{(x-μ)^2}{2σ^2}} f(x)=σ2π1e−2σ2(x−μ)2, f ( x ) f(x) f(x)称为正态密度曲线,记作 X ∼ N ( μ , σ 2 ) X \sim N(μ,σ^2) X∼N(μ,σ2);当 μ = 1 , σ = 1 μ=1,σ=1 μ=1,σ=1时称为标准正态分布;函数曲线根据 x = μ x=μ x=μ对称, x = μ x=μ x=μ时达到峰值 1 σ 2 π \frac{1}{σ\sqrt{2\pi}} σ2π1; E ( X ) = μ , D ( X ) = σ 2 E(X)=μ,D(X)=σ^2 E(X)=μ,D(X)=σ2
- 正态分布X取值范围: x ∈ [ μ − σ , μ + σ ] x\in [μ-σ,μ+σ] x∈[μ−σ,μ+σ]的概率为0.6827, x ∈ [ μ − 2 σ , μ + 2 σ ] x\in [μ-2σ,μ+2σ] x∈[μ−2σ,μ+2σ]的概率为0.9545, x ∈ [ μ − σ , μ + σ ] x\in [μ-σ,μ+σ] x∈[μ−σ,μ+σ]的概率为0.9973,