生物统计视角看PopPK（2）：随机截距模型的收缩值以及收缩值的特点

前言：

在上篇案例中，我们通过“线性混合效应（Linear Mixed Effect）”操作对象构建除了一个随机截距模型，来说明他与PopPK的一些联系，我们知道提到混合效应模型，总是绕不开“收缩”这一概念，那此模型的收缩值该如何计算呢？

我不打算自己推导，直接拿来主义。

参考文献指出，随机截距的模型的收缩可以这样计算：

方差形式：

equation M18

标准差形式：

equation M19

引自：Shrinkage in Nonlinear Mixed-Effects Population Models: Quantification, Influencing Factors, and Impact

所以，通过公式可以很明显的看出，收缩值的大小与ω和σ的相对大小有关，ω比σ越大，收缩值越小，反之越大；他们相等的时候，收缩值是多少呢？

容易计算出来，

非常接近0.3，我想这就是所谓的经验性的要求收缩至小于0.3的要求的来源~！

通过类似的计算，可知，上篇文献中线性混合效应模型的收缩值为：21.4%

我们来看看ω和σ在不同相对大小下标准差版收缩至的情况：

可以看到：

当标准差版收缩≈30%，“个体间变异”的方差约等于 “个体内变异”的方差。

当标准差版收缩≈45%，“个体间变异”的方差约是 “个体内变异”的方差的一半。

当标准差版收缩≈16%，“个体间变异”的方差约是 “个体内变异”的方差的一倍。

当标准差版收缩≈68%，“个体间变异”的方差约是 “个体内变异”的方差的九分之一。

当标准差版收缩≈ 5%，“个体间变异”的方差约是 “个体内变异”的方差的九倍。

所以通篇说了这么多，有啥直观意义呢？

我们所收集数据质量的好坏，会直接影响我们可以识别出来的最小的个体间变异，
如果没有我们收集到的质量很烂，由于记录时间的偏差、分析方法的变差、服药时间记录的偏差等导致的个体内变异很高，这会导致我们很难识别出一些参数的个体间变异，导致我们模型建立过程很痛苦。
一般认为，参数的个体间变异是大于个体内变异的。
所以通常提到“收缩值>30%表明个体层面的信息不足”，翻译为大白话就是，你的数据分析得到的个体内变异太大了，识别不了比个体内变异更小的个体间变异的参数；所以，要么重新做实验获取更高质量的数据，要么放弃对这个个体间变异参数的估计。