Yongchao Fu

文献_定量药理学中的协变量建模_需要考虑的一般要点

付永超 / 2024-06-23


文献:定量药理学中协变量建模:需要考虑的一般要点

原文链接:https://ascpt.onlinelibrary.wiley.com/doi/10.1002/psp4.13115

原文作者:Kinjal Sanghavi, Jakob Ribbing, James A. Rogers, Mariam A. Ahmed, Mats O. Karlsson, Nick Holford, Estelle Chasseloup, Malidi Ahamadi, Kenneth G. Kowalski, Susan Cole, Essam Kerwash, Janet R. Wade, Chao Liu, Yaning Wang, Mirjam N. Trame, Hao Zhu, Justin J. Wilkins, for the ISoP Standards & Best Practices Committee

原文协议:CC BY-NC 4.0

译者注:主要由Edge浏览器自带的网页翻译功能翻译,译者额外校对了部分词汇的中文翻译比如“pharmacodynamics”在本文应翻译为“药效动力学”,而不是“药效学”。

抽象

对协变量和定量药理学模型参数之间的关系进行建模是定量药理学分析的核心特征。从协变量建模中获得的信息可用于剂量选择、剂量个体化或不同人群亚组的临床研究计划。定量药理学文献已经积累了与协变量建模相关的多种多样、复杂且不断发展的方法和解释指南。随着技术数量和复杂性的增加,对最新技术进行概述的需求已经出现。在本文中,国际定量药理学会(ISoP)标准和最佳实践委员会介绍了有关规划、执行、报告和解释协变量分析的最佳实践的观点,以指导学术、行业和监管环境中的定量药理学决策。

背景

协变量或预测变量通常用于定量药理模型中,以识别和描述可预测的变异性来源,从而改进模型拟合和/或基于模型的预测。患者的内在和外在变量通常用作协变量,以了解模型参数的受试者间变异性,例如药代动力学(PK)模型中的清除率(CL)和分布容积(V),偶尔也使用受试者内和残差变异。参数-协变量间存在关联本身并不一定意味着协变量和参数之间存在因果关系,但这种关联可用于生成关于因果关系的假设,并可能证实或反驳先前的因果的假设。通常需要外部的知识来确定关系在多大程度上可以被分配为因果关系或机制性解释。

根据应用领域的不同,某些公认的协变量值得例行考虑。在PK应用领域中,常见的预测因子包括身体的大小和组成,器官功能的成熟度,肝脏的标志物和肾功能,以及与基因型和伴随用药相关的代谢途径的差异。表 1 列出了在评估人体剂量调整需求时通常相关的协变量。

表 1. 用于预测人体剂量的常用协变量

协变量类型 协变量分布范围 与协变量范围对应的参数的变化倍数(参数) 评论
体型大小 0.5–250 kg总体重 100(清除率) 500(分布容积) 基于质量异速缩放到异速尺寸的理论
成熟度 月经后22至196周(产后3岁以下) 10(清除率) 经验性的S形幂函数
器官功能 10–150 mL/min(肌酐清除率) 10(清除率) 仅通过肌酐清除率的线性函数预测总清除率的一部分
基因型 纯合隐性、纯合显性 10(6-MP) 基因型效应通常比6MP示例小得多(例如,2倍)
合并用药 存在、不存在同时使用的药物(有时与剂量和时间相关) 2 胺碘酮抑制华法林清除,利福平诱导许多药物清除

注意:本表中提到的协变量占了患者间变异性的很大一部分。在考虑了表中的协变量的影响后,其他的协变量(如性别或种族)的影响可以忽略不计或不存在。

缩写:6-MP,6-巯基嘌呤。

在某些情况下,特定的协变量在特定的治疗领域中可能特别重要。例如,在肿瘤学中,已发现治疗性单克隆抗体的较高清除率与疾病严重程度的标志物相关,例如基线时体能状态不佳和基线白蛋白较低,并且有效治疗逆转疾病严重程度已被证明与清除率随时间推移而降低有关。关于药效动力学(PD)参数,协变量关系通常与S形暴露-反应曲线的特定参数相关,例如最大效应(Emax)和最大效应50%对应浓度(EC50),作为这些参数的预测因子考虑的协变量的具体选择取决于治疗领域、作用机制和要建模的结果。

就本文而言,作为预测因子的协变量要么是连续变量或要么是分类变量。连续变量(包括持续时间)是数值变量,理论上可以在上限和下限之间取无限数量的值。PK分析中通常感兴趣的连续性协变量的例子包括体重、年龄、白蛋白浓度和肌酐清除率(CLcr;时间是另一回事,但这是一个特例)。分类变量相反,其取值仅可包含有限数量的分类类别或不同组别(不同类别间可能存在或者不存在逻辑或大小次序)。分类性协变量的常见例子是性别和种族。

目标

与协变量选择、建模、呈现和解释相关的方法不断发展。随着这些方法的数量和复杂性的日益增长,有必要总结目前最先进的技术,并组织一套明确的要点以供考虑。本文的目的是提供这样的总结,涵盖与定量药理学中的协变量分析的计划、实施和解释相关的主题。这个总结为建模者提供了必要的比较和对比,以便建模者在方法论方面做出明智的、适合实际具体环境与背景的决策,并促进对结果的有效解释。这些对最佳实践的考虑在本质上必然是通用的,应强调的是,对于具体的分析,应始终将先验知识或机制理解与手头研究问题一起考虑。在整篇文章中,我们展示了补充材料 S1 中讨论的示例,这些示例使用几种不同的软件工具对茶碱PD数据集进行研究,以用于说明我们所讨论的概念。

对协变量分析进行计划

对协变量分析进行计划这件事情至少有两个目的。首先,与任何活动一样,充分的计划可以增加合理和有效地实现目标的可能性。其次,许多定量药理学分析的监管环境要求决策透明。众所周知,完全进行预先规定或许是不可能的,然而,预先规定的程度是评估给定发现的证据强度的关键决定因素,并可以作为客观性的替代品,防止潜在的偏见。

下面的章节描述了对协变量分析进行计划的不同方面,从而为协变量分析的预先说明提供了指导。

研究设计

在设计临床研究时,应尽可能考虑确保多个设计因素,比如足够的样本量、数据收集时间和协变量的足够分散,以便检测和描述重要的协变量效应。样本量尤其重要,因为它会严重影响识别效应的能力,特别是在效应微妙或多变的情况下。 通常,这些设计因素受制于药物开发阶段、研究人群和研究的纳入和排除标准。例如,为了评估肾功能损伤对药物消除的影响,研究应纳入涵盖相关人群中肾功能的全部分布的受试者。在评估药物-药物相互作用的场景下,设计因素,如联合用药的时间和选择适当的药物样本收集时间,这对于观察和量化任何效应都是至关重要。当涉及复杂的结果和模型时,可以使用临床试验模拟来确定足够的样本量。

协变量范围

术语“协变量范围”【译者注:“参数-协变量”关系搜索范围,即指定哪些参数上的哪些协变量的哪些函数形式进入搜索范围,假设2个参数(CL、V)、2个协变量(WT、AGE)、2种函数形式(线性、幂),则共存在2 x 2 x 2 =8种"参数-协变量"关系,在“协变量范围”这一步就是需要指定在这8种关系中,后续我们考察其中的哪些关系,比如可能最终的决策为基于采样点、感兴趣的问题等因素决定仅考察“CL与WT的幂函数”,“V与AGE的线性与幂函数”共3种"参数-协变量"关系作为后续搜索协变量关系的范围。】在本文中是指在对协变量分析进行计划阶段确定为感兴趣的所有候选协变量-参数关系的集合。因此,范围形式上可以被描述为,每种类型的模型参数的候选协变量和(协变量-参数关系的)函数形式的列表。可能有大量的潜在协变量可用于分析,此时建议明智地缩小协变量范围,以避免在参数估计(如协变量参数的不精确估计)、实现(如过多的运行时间)、统计或机制解释(如大量令人难以置信的协变量关系导致统计多重性和/或选择偏差问题)和报告(如非主要关注的协变量效应估计的列表,可以说是不必要的分心)方面出现问题。因此,我们描述了在协变量分析开始之前应该考虑的一些关键因素,如下所示:

除了上面列出的考虑因素外,在正式的协变量模型开发开始之前,有时会通过在探索性环境中使用参数的随机效应估计值对协变量的探索图以及广义加和模型(GAM)的方法限制在后续的正式协变量模型开发中的协变量的范围,尽管并且需要着重注意到是,这种方法可能是协变量剔除偏倚的来源。任何使用观测到的响应(如PK模型中的浓度)来细化与缩小协变量范围的做法都可能导致整体选择偏倚和多重比较问题,因此应尽量避免。假阳性协变量关系的概率随着先验筛查中包含的协变量数量的增加而增加。如果分析的消费者【译者注:此处用于代指模型分析结果的接受者、使用者】不知道筛选的程度,这可能会隐藏假阳性的真正风险。此外,图形筛选的主观性需要一个不太透明的决策路径,这可能会增加人们对“存在挑选有利数据行为(cherry-picking)”【译者注:英语典故:源于采摘樱桃或其他水果的一般经验。采摘水果的人在采摘时仅把好的水果挑出来采摘,其他人在仅看到采摘后的水果时,可能会误以为树上所有的水果都是好的。】的担忧,以获得支持预期结论的协变量模型。因此,基于图形和/或广义相加模型(GAM)筛选的协变量先验排除通常不适合于确证性分析。此外,这些方法有局限性,当数据不足以估计该参数时,模型参数的经验贝叶斯估计可能存在偏差,并向群体均值收缩,因此在使用这些方法时应谨慎。【译者注:本段主要表达的观点为:“参数-协变量”关系搜索范围的指定与缩小,应避免基于试验结束后获得的观测结果数据进行的(比如采样GAM法,或者是基于Eta对协变变量图的主观判断法),因为这些方法都可能导致选择偏倚等问题,更适宜的方法是基于实验设计因素(比如采样点设计、协变量分布、参数可识别性)、先验知识与机制因素(比如异速缩放、疾病状态)、感兴趣的问题因素(比如分析的目的是为了评价种族因素、DDI因素、肾功能损伤因素)等因素来去确定“参数-协变量”关系搜索范围;并且建议在确证性分析中最好遵循此建议,不是确证性的分析中可基于实际情况尽量遵循(因为实际情况中可能缺乏关于研究药物的足够的先验知识)】

协变量之间的相关性

一旦建立了初始的协变量范围,就应考虑协变量之间的相关性。只有在数据采集后才能对协变量相关性进行全面研究,因此不是严格意义上的计划活动。然而,基于协变量相关性这一因素的协变量范围的缩小——只要在不考虑“响应变量”的观测值的情况下进行——保持了预先规定说明的精神,即使在确证性的环境也是合适的。考虑公认的因果关系可以为协变量范围提供信息的基础。例如,肾功能对任何肾清除药物都有明显的直接因果关系,体型和身体成分对PK参数的影响也有很强的生物学和实验依据。相比之下,年龄只是时间流逝的标志,因此不能对身体结构和功能产生直接的因果关系,即使它可能与这些有关。因此,通常可以合理地假设年龄的影响是由体型、身体成分和肾功能等更明确的机制因果效应介导的。在这种情况下,在成年人中,将年龄排除在协变量范围之外通常是合理的。月经后年龄和出生后年龄是重要的协变量,不能用新生儿和婴儿的体型、身体成分和肾功能来解释。还应该注意的是,在CLcr的计算中包括协变量(例如年龄和性别)并不意味着其他涉及年龄和性别的协变量效应(例如无脂肪质量)应被视为与CLcr混淆,因此被排除在协变量范围之外。这是因为肾功能和身体成分对一个参数(如清除率)的影响在机制上是完全不同的。需要注意的是,当不考虑与年龄相关的其他基于机制的协变量(例如血浆蛋白结合)时,则可能会出现与年龄增加之间的潜在误导性关联。

包含具有相关性的协变量会导致参数估计的偏倚和不精确的问题。当两个具有相关性的协变量中的某一个协变量被认为在机制上是更合适的情况下,当是在采用逐步法进行协变量建模的背景下,在同一参数上对这两个协变量进行检验时,最终选择那个更具有机制效应的协变量的可能性会随着协变量间的相关性的增加而降低。同样的道理,在两个具有相关性的协变量都被包含在同一个参数上的情况下,协变量之间的相关性增加会导致这两个协变量效应系数估计值之间的相关性增加,从而导致这两个参数的估计值的不确定性增加。当先验信息不足以识别两个协变量中谁是更具机制性(解释性)的变量时,数据驱动的选择或许可能更好,前提是数据中有足够的信息用于这一目的;在这种情况下,这两个候选协变量都可以被包括在协变量范围内。最后,虽然不是协变量相关性的问题,但在非线性混合效应建模的背景下,当出现显著的收缩时,协变量效应的“掩蔽”问题本身会引起额外的担忧。例如,如果PK数据是在稀疏和/或次优采样时间收集的,KA参数和V参数的群体估计值可能高度相关;类似地,如果研究的剂量范围太窄而不能反映模型的PD成分,那么Emax和C50的群体估计值也可能高度相关。在这种情况下,在错误参数上选择正确协变量的风险会增加。允许对两个具有相关性的参数都进行协变量效应估计,可能会缓解这一问题,尽管模型的复杂性和参数的不精确性可能是这样做的代价。

当目标纯粹是预测性的并且不需要参数解释的时候,与具有相关性的协变量相关的问题可能不那么重要。只要协变量之间的相关性在未来数据中保持,包含具有相关性的预测变量通常不会导致有偏差的预测,并且参数不确定性的增加不一定会导致预测不确定性的增加(尽管在偏差和方差之间的权衡方面,纳入真正多余的预测因子总是有害的)。然而,这种预测性的合理性应该谨慎采用,因为基于样本人群(例如成人或健康的志愿者人群)构建的模型可能无法代表未来的人群(例如患者人群),因为假设的相关性将在未来的数据中保留。

可以用图形或数字方法研究协变量的相关性,通过计算连续协变量和二元协变量的两两相关系数进行(补充材料S1,第2.2节)。

协变量缺失数据

在临床数据分析中,常遇到协变量数据缺失。以适当的方式处理协变量缺失值对于避免参数估计的偏倚和不精确非常重要。在过去的几年中,已经有人提出了用于非线性混合效应模型的协变量缺失数据处理方法,如用人群中的中位数或最常见值替代、单次或多次填补、完整病例分析或列表缺失以及最大似然建模。类似地,已经根据缺失的根本原因提出了处理缺失分类协变量的方法(如完整病例分析、额外协变量的估计和几种混合模型方法)。固定随机效应模型(Fixed Random Effects Model, FREM)等方法已经成功地部分或完全抵消了协变量数据不完整带来的问题。近年来,人工神经网络和随机森林等机器学习方法也被用于缺失协变量的填补。无论选择哪种方法,从透明度的角度来看,重要的是在考虑分析之前,建立通用的方法论。

协变量-参数关系的函数形式

在分析进行计划阶段,我们常常缺乏充分的基础来完全有把握地预先设定所有参数-协变量关系的函数形式,即使是在所谓的“确证性”设置中。尽管如此,如果一个人记录了对特定函数形式的“事前的偏好(prior preference)”,等待可能支持或可能不支持该事前的偏好的诊断,则模型建立和相关决策的透明度得到了提高。在许多情况下,事前的偏好的是一个简单的惯例和/或数学上的便利。例如,线性函数形式有一个理想的性质,协变量值的变化会产生相关参数的成比例的增加或减少。某些函数形式预先是合理的,如应用异速缩放理论来描述CL和V参数与体重之间的关系。

在处理分类协变量时,经常会遇到低频类别。大多数情况下,这是通过与其他类别(通常是参考类别)结合来处理的。然而,在这样做时需要仔细考虑,因为它可能导致对协变量效应的偏倚估计,甚至无法识别罕见效应。在这种情况下,科学和临床判断以及先验知识同样是必不可少的。下一节将提供各种函数形式的数学规范。

协变量建模

连续协变量的一般考虑

对于连续协变量,如年龄和体重,可以使用线性、指数或幂函数来描述协变量与PK和PD参数之间的关系。函数形式的选择受到几个因素的影响,例如参数与连续协变量之间关系的定性形状(例如,线性、凹、凸和s型),以及协变量本身的分布(例如,如果协变量可以包含负值,则不适合使用幂模型)。

线性函数形式更容易解释,但可能要求协变量参数的参数空间适当地有界,以避免生理上不合理的结果(如参数的负值)。对于具有对数正态随机效应分布的参数(大多数PK和PD参数),由指数函数描述的协变量关系确保最终的PK或PD参数尊重适当的边界,而不管协变量值如何。对于幂关系,只要协变量值大于零,也是如此。无论函数形式如何,在考虑超出观测数据范围的外推时都应谨慎。在其他情况下,存在完善的经验关系,例如那些描述出生后2年内成熟对CL的影响。通常用于此目的的特殊s型Emax函数没有机械的理由,但当在怀孕年龄(值= 0)和成年期(值= 1)之间外推时,它确实产生了生物学上合理的值。在协变量关系是非线性的情况下,这种连续模型比那些应用线性样条或断点(一个例子是所谓的“曲棍球棒”模型)的经验模型更有优势。表2提供了数学方程,并总结了为关系选择最合适的函数形式的注意事项。

表2. 连续和分类协变量模型的函数形式综述。

函数形式 数学形式 解释 注意事项
连续
线性 $\small{ CovEff_{Pcov,i}=1+θ_{Pcov}·(cov_i-cov_{reference})}$ 线性形式很容易解释。协变量covi每单位变化会引起$CovEff_{Pcov,i}$的大小相对变化$θ_{Pcov}$。与本表中列出的其他连续函数一样,这种关系的形状描述了依赖于$θ_{Pcov}$估计的单调增加或减少。 可能需要对协变量系数的参数空间进行适当的限定,以避免出现生理上不合理的参数值(如负值)。【译者注:协变量效应与协变量线性线相关,特点是协变量值域与协变量效应的值域都为(-∞,+∞)】
指数 $\small{ CovEff_{Pcov,i}=exp(θ_{Pcov}·(cov_i-cov_{reference})))}$ 协变量$cov_i$每单位变化会引起log($CovEff_{Pcov,i}$)的大小相对变化$θ_{Pcov}$。这种关系的形状描述了依赖于$θ_{Pcov}$估计的单调增加或减少。 当参数和协变量之间的关系是非线性时适宜使用。适用于那些当取值为负值时是难以置信的那些生物参数。然而,与线性模型类似,生物反应通常是容量有限的,可能不会随着参数的变化而无限增加或减少,因此在估计时可能需要为协变量系数设置估计值的上限。【译者注:协变量效应对数变换后与协变量线性线相关,特点是协变量值域为(-∞,+∞),协变量效应的值域为(0,+∞)】
$\small{ CovEff_{Pcov,i}=(cov_i/cov_{reference}))^{θPcov}}$ 协变量$cov_i$每单位变化会引起log($CovEff_{Pcov,i}$)的大小相对变化$θ_{Pcov}$。【译者注:这里的描述显然是错误的因为这完全与“指数”形式一致,正确的应为“协变量log($cov_i$)每单位变化会引起log($CovEff_{Pcov,i}$)的大小相对变化$θ_{Pcov}$。”】 当参数和协变量之间的关系是非线性时使用。在同时存在负和正协变量值的情况下不允许。协变量值为零将强制参数为零。【译者注:协变量效应对数变换后与对数变换后的协变量线性线相关,特点是协变量值域与协变量效应的值域都为(0,+∞),(特殊情况下协变量值域为(-∞,+∞),但基本可以忽略)】
分类
普通线性 $\scriptsize{ CovEff_{Pcov,i}=\left\{\begin{array}{l}1 &&{当协变量值为参考值时;} \\ 1+θ_{Pcov1} &&{当协变量为水平1时; }\\1+θ_{Pcov2} &&{当协变量为水平2时; }\\1+θ_{Pcov3} &&{当协变量为水平3时; }\\...\end{array} \right.}$ 协变量$cov_i$的取值为非参考值的其他水平N处时,会引起$CovEff_{Pcov,i}$的大小相对变化$θ_{Pcov}$。 用于具有二分或更多分类水平的名义分类协变量
有序的线性 ${\scriptsize{ CovEff_{Pcov,i}=\left\{\begin{array}{l}1 &&{当协变量值为参考值时;} \\ 1+θ_{Pcov1} &&{当协变量为水平1时; }\\(1+θ_{Pcov1})\cdot(1+θ_{Pcov2}) &&{当协变量为水平2时; }\\(1+θ_{Pcov1})\cdot(1+θ_{Pcov2})\cdot(1+θ_{Pcov3}) &&{当协变量为水平3时; }\\...\end{array} \right.}} $ 协变量$cov_i$的取值为非参考值的其他水平N处时,会引起$CovEff_{Pcov,i}$的大小相对变化$θ_{Pcov}$(相对于水平N-1时)。 当需要保持有序关系时使用(例如,对于有序的分类变量) 有序分类协变量关系可能被限制为严格递增或严格递减,视情况而定

连续协变量可以被转换或“分箱(binned)”为分类形式。中位数、四分位数或四分位数边界通常用于此。然而,这种方法的一个主要缺点是在这种“粗化(coarsening )“过程中会丢失信息,因此通常不受欢迎。例如,美国食品和药物管理局建议使用回归方法来更好地估计肾功能对PK参数的影响,而不是使用对应于正常、轻度、中度和严重肾功能损害的分类变量。在开发了包含完整连续协变量的模型之后,可以在模拟阶段进行分类,以便理解这种转换引起的信息损失。

协变量值异常高或异常低(异常值)并不罕见,非正态分布(通常是重尾和/或偏斜)的值也不罕见。在这种情况下,极高或极低的值可能会不恰当地影响或扭曲协变量效应的估计。解决这一问题的一种常用技术是将协变量值“封顶”在某个截止值上,或者对分布进行变换,使其更“正态”(对数变换是最常用的)。协变量分布的图形化探索是确定这是否必要的有用方法。

连续关系的函数形式通常在以参考值对协变量进行居中(通过减法)或缩放(通过除法)之后应用,以便群体参数估计值将与这些参考协变量设置的参考值相对应。用于定标或居中的参考值可以是协变量离散度的中心值,例如中位数,也可以是标准的(通常接受的)参考值,例如重量为70 kg。然而,如果参考协变量值被选择在协变量分布的中间之外(例如,当拟合儿科数据时),这可能导致结构参数在参考值处的膨胀参数不精确和模型不稳定,从而导致估计问题和收敛困难。另一方面,使用居中的参考值可以帮助提高模型的稳定性,但可能会阻碍研究之间的比较。因此,选择使用标准参考值还是中心参考值取决于一个人的目标。应该注意的是,无论选择哪种方法,稳定的模型都应该收敛到协变量效应和目标函数的最小值的相同估计,因为似然不随参数的中心/缩放而变化。如果被广泛接受,标准参考值可以在协变量范围内使用,如果模型稳定(例如,用标准参考值和中心参考值拟合模型,并确认它们收敛到协变量影响和目标函数值[OFV]的同一组估计),则在协变量范围之外进行外推时可以谨慎使用。将同一模型应用于更新的数据集时,也可以使用标准参考值,这有助于简化比较。在其他情况下,中心值可用于估计目的,但在报告时,可计算具有任何感兴趣的协变量参考的参数值以供比较。居中(通过减法)法和缩放(通过除法)法更好地解释了参考值上的群体参数,并减少了参考值的固定效应估计与协变量效应之间的相关性,从而得到更稳定的估计。

分类协变量的一般考虑

分类协变量可以是二分类(2个类别)或多分类(3个或更多类别),可以是有序的或无序的。无序分类的一个例子是地理区域,而东部肿瘤合作组织功能评分是一个有序分类变量的例子,其中0、1或2的值,排序为0小于1小于2,代表个人的功能表现程度。在这种情况下,将它们视为有序的,比将它们作为无序类别进行测试或将它们组合起来更合适。表2给出了通常用于无序或有序分类协变量的典型数学形式。表2还给出了对每种形式的一些解释和注意事项。

对一个参数的多个协变量效应的组合进行建模

多个协变量对某一特定参数的影响通常用乘法形式或加法形式组合起来,分别如式1和式2所示

乘法形式

$$\begin{equation}TVP_i=\theta_{Ppop}\cdot\prod_{cov=1}^{Ncov}CovEff_{Pcov,i} \tag {1}\end{equation}$$

其中$CovEff_{Pcov,i}$为个体i中协变量(cov)导致的参数P的相乘变化。$θ_{Ppop}$为群体中参数P的群体参考值。$TVP_i$是包含所有协变量效应的个体i的参数的典型值。

加法形式

$$\begin{equation}TVP_i=\theta_{Ppop}\cdot\sum_{cov=1}^{Ncov}CovEff_{Pcov,i}\tag {2}\end{equation}$$

如果(结构)参数被限制为正值,乘法形式可能比加法形式更实用(有时也更合理和/或更机制)。另一方面,如果参数可能取正值或负值,例如logit概率、log-hazard或差值参数(例如血压的平均直立性变化),则乘法公式可能存在解释问题,因此可能首选加法形式参数化。在补充材料S2中,给出了一个由单个协变量效应相乘组合的协变量模型的例子。在补充材料S1第3.4节的说明性示例中,演示了不同函数形式的拟合方程和演示。

时变协变量的一般考虑

上述协变量可能随时间而变化,如新生儿和婴儿的体重、伴随药物的使用和器官成熟。时变协变量带来了一些挑战和复杂性:例如,协变量可能受到治疗的影响,如肾脏消除的抗生素(如万古霉素)引起的肾功能变化,或患者体能状态随时间的变化(如癌症或器官移植)。考虑协变量效应中与时间相关的变化,对于确保适当的剂量和暴露以及无偏倚地评估PD效应通常很重要。通常会使用协变量的基线值,但通常这种方法可能不能充分解释受试者内的变异性。例如,在一些患者中观察到“伊匹木单抗(ipilimumab)”的清除率随着时间的推移而降低,这被认为是临床状况改善的标志。评估白蛋白、体重和乳酸脱氢酶等随时间变化的标志物对癌症相关恶病质的影响,有助于进一步阐明时变CL的可能机制。Wälbhy等人描述了将时变协变量模型扩展到协变量模型的模型,其中协变量效应分为基线和基线差,和/或在协变量效应中估计个体间变异性参数时变协变量的复杂性值得我们在本文中进行更广泛的讨论,但重要的是不要忽视它。

协变量模型构建方法

协变量模型构建方法的选择通常由分析的目标和分析的背景(例如探索性或确认性)以及可用信息量驱动。最常用的协变量模型构建方法分为两类:筛选法和预先指定法。在筛选方法中,协变量的选择由分析数据集驱动,通常由先验知识建议的假定关系选择。有了足够的信息,筛选方法对于开发仅需要预测性的模型(例如用于临床试验的模拟)可能是适当和实用的。筛选方法,当应用于外部/先前的数据时,也可以作为预设方法的指导。相比之下,预先指定法通常可用于确证性分析,其中剂量调整的合理性(或缺乏剂量调整)是主要目标。证明实际没有协变量效应(例如与主要人口统计学特征相关的效应,如年龄、体重、性别和种族,以及常见疾病,如肾和肝功能损害)通常与检测实际存在的协变量效应一样重要。在这种方法的最佳应用中,甚至协变量关系的函数形式都是预先设定的,要么基于先验知识,要么基于筛选方法的先验应用,如图形探索或GAM(应用于外部/先验数据)。

还有一种方法混合使用了这两种方法,即利用关于常见协变量的先验知识(表1),并利用已建立的协变量模型和参数构建“基础”模型,然后可以使用筛选方法将其用作进一步构建协变量模型的基础。这种方法建立在成熟的科学基础上(例如,假设PK参数随体型大小而变化,婴儿成熟为成人,并且从CLcr中可以预测肾脏消除的药物清除率),然后可以对其他协变量进行更精细的探索,否则这些协变量将在随机效应噪声中丢失。根据协变量的机制相关性或探索性性质评估协变量也已在以下章节描述的逐步协变量模型(SCM+)构建方法中实施。

筛选法

逐步广义加和建模(Stepwise generalized additive modeling)

该方法使用广义加和模型对带有协变量的个体事后估计值进行回归。然后使用一个选择准则,通常是赤池信息准则(AIC),通过逐步的添加或删除来选择协变量关系。这种方法在高收缩的情况下,或者如果不是所有感兴趣的模型参数都包括随机效应的情况下可能是有问题的。请读者参阅补充材料S1的4.2部分以获得一个说明性的例子,尽管这种方法在实践中不常使用。

瓦尔德近似法(WAM, Wald approximation method)

Kowalski和Hutmacher提出了一种基于Wald近似法(WAM)的协变量模型构建方法。WAM根据完整模型估计值的协方差矩阵提供似然比的二次近似值。WAM协变量的选择包括获得完整模型(包含所有协变量的模型)的收敛,并使用排序Schwarz信息标准进行模型选择。与逐步过程相比,WAM通常需要更少的模型运行来识别最终简化模型,并提供一组相互竞争的精简模型。然而,WAM要求所有完整模型(包括所有要研究的协变量-参数关系)都可以在没有收敛问题的情况下进行估计,并且具有成功的协方差步骤,这可能具有挑战性。我们请读者参阅补充材料S1中的第4.3节,了解说明性示例和技术细节。同样,这种方法并不常用。

逐步协变量模型的建立与进展(Stepwise covariate model building and advances)

逐步协变量建模(SCM)包括根据统计量的值(例如p值或模型选择标准(例如AIC或贝叶斯信息标准))顺序地应用预定义规则来添加(正向选择)或移除(向后消除)协变量,是当前用于系统地选择协变量的最流行的方法之一。我们请读者参考补充材料S1中的第4.4节,以获得说明性示例和技术细节。对标准方法的扩展,例如Bootstrap SCM,允许评估SCM期间的选择偏差,识别所包括的协变量之间的相关性,以及评估协变量包含的I型错误率(假阳性协变量)。与传统的SCM相比,一阶和二阶线性化SCM可以在很小的计算时间内从大量的参数-协变量关系中识别出参数-协变量关系,并且在SCM运行时间很长的情况下很有用。最近引入了一种新方法,即用于基于相关性的逐步方法的条件抽样(COSSAC),该方法基于从条件分布中抽样的单个参数与协变量之间的统计检验。它已被证明可以加快SCM的进程。SCM工具包中的其他复杂技术,例如使用“自适应范围缩减”的SCM+和具有“阶段过滤”的SCM+,根据协变量的重要性对协变量进行分类,例如机理、结构或探索性,已被证明比传统的SCM方法更好地选择相关协变量。已经开发了Perl-speaks-NONMEM(PSN)等工具来自动化这个过程,允许顺序和并行地测试许多协变量关系和函数形式。随机逼近建模算法(SAMBA)是另一种新的方法,它是一种迭代过程,旨在通过确定在每一步改进模型组件的最佳方法来加速和优化建模过程。与医学的其他领域一样,机器学习算法也在探索用于协变量筛选的算法。随机森林、神经网络和支持向量回归等机器学习方法与传统的筛选方法进行了比较,发现在大数据集或运行时间较长的复杂模型的情况下,机器学习方法更有效。尽管这些进展很有希望,但在撰写本文时,这些新方法的经验相对有限。

最小绝对收缩和选择算法(The least absolute shrinkage and selection operator)

最小绝对收缩和选择算子(The least absolute shrinkage and selection operator, LASSO)是一种旨在优化协变量模型以获得良好预测性能的方法(包括协变量关系,在给定可用分析数据的情况下,它们有望提高预测性能的程度)。虽然它可能不是一种常用的方法,但在从小型数据集(少数受试者或调查小亚组,如稀有基因型)中选择协变量时,SCM难以使用时,这种方法已被证明很有用。使用交叉验证,LASSO方法的实现提供了协变量模型的评估,并且不需要用户指定p值进行选择。我们请读者参阅补充材料S1中的第4.5节,了解说明性示例和技术细节。LASSO算法已扩展到HyperLasso(它提出应用一个稍微更一般化的惩罚函数)和调整后的自适应Lasso(它可能在小数据集上表现更好)。

预先指定法

全固定效应模型

全固定效应模型已成为评价协变量效应的一种流行的预先指定法。在FFEM中,所有感兴趣的参数-协变量关系被同时估计,这与协变量选择算法形成鲜明对比,协变量选择算法评估模型空间内多个模型是否存在或不存在单个协变量效应的各种组合,目的是找到一个充分拟合数据的简约模型(协变量参数较少的模型)。与完整模型相比,这种简约模型可能降低了预测误差,因为完整模型可能具有一些协变量参数估计,这些参数估计本质上是对预测造成噪声的。相比之下,“全模型(full model)”方法(假设整个模型是稳定的)更适合于对单个协变量效应进行推断,因为它们为推断建立了一个固定的基线(只拟合一个“全模型(full model)”),而数据驱动的协变量选择方法导致最终模型中从“全模型(full model)”中去除了许多协变量关系,这表明对数据的了解比实际情况更多,并导致对标准误差的估计向下偏倚。尽管术语“全模型(full model)”通常被理解为指包括具有先前似是而非的所有关系的模型,但术语“饱和模型(saturated model)”可用于指这样的模型,在该模型中,无论是否可信,都估计范围内的所有协变量与所有参数的关系。“饱和模型(saturated model)”的使用减轻了由于模型错误指定而引起的参数偏差的风险,但由于要估计的参数的数量,这种方法并不总是实用的。全模型方法还考虑了数据简化步骤,以避免在相同的参数(如CL)上添加相关协变量,如体重和体重指数,从而避免模型不稳定性的问题,如本综述前面部分所讨论的。然而,使用FFEM方法的另一个潜在警告也可能发生在两个模型参数高度相关的情况下–在这种情况下,相同的协变量对两个都是相关的,但是估计的系数和精度将会有很大的不同,这取决于协变量效应是应用于两者之一还是两者。在这种情况下,可能最合适的做法是只将这种效应应用于其中一种,选择是由科学合理性和模型的目的驱动的。我们建议读者参考补充材料S1的3.3节,以了解FFEM拟合。

全随机效应模型

在FREM中,所有协变量都被视为多变量响应的组成部分。在多元随机效应分布中,所有协变量和所有感兴趣的参数之间的关系同时作为协方差进行估计。

估算所有参数-协变量关系是有好处的,而且与数据驱动的方法相比,计算成本通常很小。在软件(如PsN)中实现时,对所有模型参数估计所有协变量。例如,如果食物对吸收率的影响作为FREM的一部分被包括在内,那么它也将被包括在所有其他参数中,如分布容积,而不管它们在机制上是否合理,以尽量减少模型指定错误引起的偏差的可能性。FREM模型或许可以转换为FFEM模型,用于诊断、拟合优度以及在交流中表达所需的模拟和预测。我们建议读者参阅补充材料S1的4.6节,了解使用 PsN 实现的应用示例。

表3概述了最常用的协变量模型构建方法,并给出了每种方法的优势和挑战。

表3 协变量模型构建方法的关键特征

方法 关键特征
建立在已有知识的基础上 已建立的知识模型通过建立在已知的基础上鼓励发现新现象。例如,根据异速缩放原理,在基础模型中添加体重对CL和V参数的影响。这允许在调整已知的与体型的关联后,识别其他协变量的影响。 由于缺乏参数值的标准报告,因此很难确定已经建立了什么。
图解勘探法 简单易用。 快速概述模型中包含的协变量和参数之间的相关性。 仅对基础模型中包含个体间变异的模型参数进行评估。 基于可视化的主观判断。 取决于个体估计的质量。EBE在存在(>20%)收缩的情况下结果不可靠。 一次只能识别一个参数-协变量关系,例如单变量选择。 无法处理时变协变量。 不提供参数和协变量之间关系的显式函数表示,并且关系的形状受到收缩的影响。 不考虑协变量之间的相关性。
逐步广义加和建模法 简单易用。 提供参数-协变量关系的显式函数表示形式。 运行时间短。 协变量选择的稳定性可以使用 Bootstrap GAM 进行评估。 在软件(Xpose)中实现。 仅对基础模型中包含个体间变异的模型参数进行评估。 很大程度上取决于 EBE 的质量。协变量和函数形式的选择可能会受到收缩的影响,并且不会产生用于实现的最佳模型。 存在收缩的情况下会有选择偏差。 不处理时变协变量。 不处理跨参数相关性。
逐步协变量建模法 可处理群体模型中多个协变量的选择。 稳定的搜索方法(基于贪婪算法)。 可处理随时间变化的协变量。 允许在参数没有单独的随机效应的情况下研究参数的协变量。 不依赖于后验贝叶斯估计。 p 值是预先指定的,易于与他人交流。 已在软件 (PsN) 中实现。 除非使用线性化方法,否则非常耗时。 存在选择偏倚和预测性能降低。 允许在高度相关的协变量中进行选择,但在许多情况下无法区分。 较小的数据集可能会导致把握度低和预测性能差。 仅选择具有统计显著性的协变量。 当前数据的最终模型可能无法预测外部数据。 难以调整多次统计检验的 p 值。
最小绝对收缩和选择算子 提高预测性能,特别是对于小样本量。 如果研究许多协变量关系,则运行时间更短。 允许在参数没有单独随机效应的情况下研究参数的协变量。 可处理存在相关的协变量。 不依赖于后验贝叶斯估计。 无需为协变量选择指定 p 值。 在不稳定的模型上进行交叉验证具有挑战性。 不是为假设检验而设计的。 这种方法在定量药理学中的应用的经验很少。
瓦尔德近似法 与逐步过程相比,需要运行的模型更少。 可快速指示要纳入的候选协变量。 WAM 提供了一组相互竞争的精简模型,而逐步过程则导致单个精简模型。 需要具有协方差稳定的全模型。 全模型的条件不合理会导致似然面的不规则性和近似性差。 对参数化敏感。 经验有限。
预先指定法
全固定效应建模法 直接评估所有协变量关系。 提供固定的推理框架,避免标准误差的向下偏倚。 有助于评估临床相关性。 降低观测数据过拟合的风险。 正确的推理假设协变量关系可被正确捕获。 如果协变量作用于模型中的其他参数,则不成立。 预先选择相关协变量可能会导致遗漏重要的协变量关系。 如果预定义的完全型不稳定,则会有问题。 不是一个完全可预先指定的方法。
全随机效应建模法 协变量间存在相关性也没有问题。 在感兴趣的参数和协变量中,没有协变量-参数的关系被假设为零。 隐式处理缺失的数据。 协变量是真正可预先指定的。 在药品说明书级别选择协变量,而不是在建模级别选择协变量。 不存在协变量-参数的关系是被固定为零的,即使对特定参数进行操作在机制上是不可信的。 时变协变量很难处理。 说明和解释起来复杂。 与FFEM方法类似的局限性,只是存在相关性的协变量处理得很好,因此可以进行预先选择,并且该方法可以完全预先指定

缩写:CL,clearance,清除率;EBE,经验贝叶斯估计;FFEM,全固定效应模型;FREM:全随机效应模型;广义加性模型;LASSO,最小绝对收缩和选择算子;PsN Perl-speaks-NONMEM;逐步协变量模型;V,分布容积;WAM, Wald近似法。

协变量效应的模型诊断

评估数据中存在的协变量-参数关系是否被最终模型中表示的函数形式充分表征是很重要的。这可以通过绘制随机效应与协变量的关系图来实现;这些图应该显示出趋势的消除。在补充材料S1中描述的茶碱示例中,当与没有协变量的基本模型的经验贝叶斯估计(EBEs)绘制时,体重和年龄显示出趋势,而在包含协变量的全模型后,趋势被删除。在评估这种诊断时应该意识到,尽管算法的进步可以纠正EBE在估计效应大小和检验统计数据方面的偏差,但在这种显示中,向均值收缩的ή参数有可能掩盖协变量关系。

由感兴趣的协变量分层的视觉预测检查(VPC)对于说明协变量如何影响模型拟合也很有用。对于连续协变量,将连续协变量描述为自变量的VPC可以提供一种有用的方法来评估模型在不同协变量值下的适用性。对协变量效应的模型诊断应提供必要的程度,以便读者对模型对这些关系的表征产生适当的信心。为了便于向非专业读者的阐述,专家主要感兴趣的诊断图可能被降级到附录或补充材料。补充材料S1中的第5节提供了用于模型诊断的VPC示例。

协变量效应总结和报告

报告的一般原则

协变量结果的报告构成了关键的转折点,通过该转折点,从建模中收集的见解可能打开或关闭在药物开发、批准和临床使用中剂量个体化的战略决策的大门。因此,报告应该以一种有利于决策者理解的方式进行,他们中的许多人在建模方面不是专家,而同时应提供足够的细节来满足建模专家,他们可能希望在他们自己的未来模型或分析中确认或利用某些发现。

在报告时,模型参数应汇总到一个表格中,该表格(至少)提供参数估计和相关的不确定性度量(补充材料S1,第6节)。通常,协变量效应参数和主要参数(例如,在PK模型中的生物利用度、清除率和分布容积)都可以在单个表格中描述。理想情况下,应该在每个条目中包括一个带有简短文本的列来说明和解释(例如,随着年龄的增加,参数每年发生的变化)。通常的情况下,参数估计的某些变换后的形式(通常是其指数化值)将比参数本身更容易解释。关于变换后的(更易解释的)尺度的报告往往更易于支持报告中的讨论和结论,而报告用于似然值优化(或贝叶斯框架中的后验抽样)的尺度可能会促进可能无法访问数据和/或模型输出的定量药理学家将来使用模型。在许多情况下,其他定量药理学家可以使用补充材料来启用和促进该模型的使用;在报告正文中报告转换后的尺度可能更可取。应为协变量效应参数提供参数变换的函数形式,这些协变量效应参数在变换后的(例如,指数化)尺度上制成表格。在报告数值时,还应仔细选择参数尺度。例如,报告的每ng/mL浓度1.001的倍数几率调整给人的印象是药物浓度的影响可以忽略不计,但如果考虑在μg/mL量表上不同的干预措施,则应注意1.001^1000=2.7,对应于每增加μg/mL的事件发生几率变化2.7倍。

讨论解释参数变异性(EPV,explained parameter variability),即通过包含协变量效应来解释的参数变异性部分,可能有助于理解给定协变量-参数关系的重要性。预计特定参数的协变量纳入,将解释参数个体间变异的部分变异,从而增加响应的可预测性。因此,预计EPV将增加,不明原因的PV将减少。

模型开发和推理中的统计显著性

在协变量建模的背景下,统计显著性可能以两种可区分的方式出现:

  1. 参考一个包含给定参数-协变量关系的预指定模型,假设检验提供了一个关于该关系的有效统计推断框架。正如统计学界所强调的那样,基于置信区间(或贝叶斯语境中的可信区间)的推理框架通常比p值或具有统计显着性的评估更具信息量,并且更不容易被误解。尽管如此,当在预先指定的模型中适当使用时,零假设显著性检验可以提供推断协变量效应方向的有效手段。
  2. 作为协变量模型开发的一种技术(例如在逐步协变量建模中),假设检验(如似然比检验[LRT])仅为包括或排除协变量提供了合理的启发式算法,但不能为有效的统计推断提供基础。LRT是基于有和没有协变量关系的模型之间的最小OFV的差异。在NONMEM等常用软件工具中,采用了一阶和二阶近似模型,得到的ofv与给定模型的数据的负两倍对数似然(-2LL)近似成比例。在零假设下,我们假设较简单的协变量模型是正确的,两个嵌套模型之间的OFV(似然比[ΔOFV])的差异近似为χ2分布。由于较简单的模型可能会排除许多其他重要的协变量(除了其他潜在的模型错误指定和渐近逼近的缺陷),因此使用似然比检验获得的实际显著性水平往往与名义水平不同。事实上,人们注意到似然比检验的实际显著性水平是向上偏倚的。如前几节所讨论的,所有的筛选协变量模型构建技术都受到选择偏倚的影响,与统计显著性在确证性背景下具有的证据价值相比,“统计显著性”结果的证据价值降低了。选择偏倚在较高把握度的协变量(产生较强的效应)中通常不那么重要,但在效应较小或估计不太精确的情况下应牢记。

统计学意义和临床相关性

上述显著性检验的应用都没有提供任何推断协变量“没有影响”的依据。缺乏显著被应被正确地解释为“证明成立的证据不足(absence of evidence)”,而不是“有证据证明不成立(evidence of absence)”。最令人信服地证明协变量效应(实际)不存在的证据是,将协变量效应包括在模型中,并评估(通常通过置信区间)是否可以排除协变量效应的不可忽略值,如下所述。

“无效应”的原假设和相关p值的假设检验不能提供有关协变量效应大小的信息,因此不足以解决有关临床相关性的问题。然而,应该指出的是,这种担忧特别与“无效果”的假设检验有关。统计学意义和临床相关性的概念是不同的,但不需要分开应用。例如,当可以建立临床相关阈值θ时,H0:θ≥θ与H0:θ<θ*的统计检验可以得出有效的统计推断,即“效应的大小在统计上显著小于任何临床相关的效应”(如果零值被拒绝)或“不能排除临床相关范围内的效应”(如果零值未被拒绝)。虽然这种假设检验公式很少在定量药理学协变量分析中显式使用,但它通常通过将置信区间与参考线并列来隐式使用,这些参考线提供临床相关值和临床无关值之间的工作分界线。(这构成了对假设检验的隐式使用,因为置信区间可以反转以提供参数空间中每个参数的假设检验。

协变量的临床相关性通常是在需要根据协变量修改给药方案的情况下确定的。暴露差异 20% 的值已被广泛引用为不需要调整剂量的临床无关变化。该约定是从生物等效性背景中借来的,但已经提出了替代启发式方法,用于建立适合给定背景的实际等效区域。一旦定义了这样的区域,就会出现以下三种情况:

  1. 如果协变量效应的整个95%置信区间(或可信区间)位于临床相关区域内,则协变量关系具有临床相关性。这种协变量关系在统计上总是与null(“无效果”)值显著不同。
  2. 如果协变量效应的整个95%置信区间(或可信区间)位于临床无关区域内,则协变量关系不具有临床相关性。这种协变量关系可能与null(“无效果”)值在静态上显著不同,也可能没有显著差异。它可能与其他关系结合起来很重要。
  3. 如果协变量效应的95%置信区间(或可信区间)跨越临床相关和不相关的区域,则没有足够的信息来明确确定关系的临床相关性。这种协变量关系在统计上可能与null(“无影响”)值显著不同,也可能没有显著差异。如果排除了零值,则可以自信地推断出效应的方向,即使无法以足够的分辨率确定幅度。

预测性摘要

虽然回归系数对于具有正态分布误差的线性模型具有相当直接和直观的解释,但对于非线性混合效应模型来说并非如此,对于广义线性模型也不是这种情况。如果协变量应用于生理上可解释的参数(如CL),则该参数在各种协变量设置下的预测值将有助于解释。补充材料S1第6节提供了描述协变量效应的森林图示例。此外(尤其是当协变量对参数的影响具有不太明显的生理意义时),通过为暴露指标的预测值提供类似的图来增强解释,例如从零到无穷远的曲线下面积。因变量本身的预测值(例如药物浓度或PD效应)也可以在各种协变量设置中显示(例如,通过绘制具有不确定性的期望值与时间的关系图,使用分面来表示协变量值的条件)。

对于分类协变量,预测响应通常可以显示在协变量的每个水平上。对于连续协变量,协变量分布的百分位数通常会提供有用的参考点,用于评估模型预测值。

在单个协变量的多个值上生成预测时,并不总是清楚其他协变量和随机效应应如何纳入预测。一种常见的做法是将“参考受试者”的预测值(带置信区间)与可能称为“扰动参考受试者”的预测值(和置信区间)一起呈现,这些受试者具有相同的协变量,但其中一个协变量已更改为另一个水平。这种方法被认为是对偏回归系数的合理类比,至少在“所有其他协变量调整后”评估协变量的效应的意义上。尽管这种部分效应的优点是基本上在更易于解释的尺度上重新表达了回归系数,但人们应该考虑以这种方式得出的预测是否充分解决了感兴趣的研究问题。在其他条件相同的情况下(“其他条件相同”),回答有关外源性干预的问题可能是合理的(例如“如果我们保持其他条件相同并仅改变暴露会发生什么?”),但回答有关内源性风险因素的预测关联的问题可能非常不合理(例如“如果我们将体重恒定在70公斤,暴露水平会发生什么变化,但病人是4岁而不是65岁?出于这个原因,通常希望用具有不同协变量值的总体的平均值或分位数预测来补充其他条件相同的模拟。例如,可以生成预测参数或暴露图,以比较老年人(≥65 岁)和非老年人(< 65 岁)之间的预测,其中使用针对每个年龄类别的其他协变量的适当值。

FREM提供了一种可以实现这一目标的方法,即以所研究的协变量为条件,对其他协变量的条件分布进行平均。

协变量模型的使用:监管和患者视角

协变量分析已成功用于支持监管提交中的推荐剂量建议,表1中列出了可能需要/可能不需要剂量调整的最常见协变量。例如,“基于体重的剂量(weight-based dosing)“是由CL和体重的正异速生长关系的支持,而“平坦(flat)”剂量建议(所有受试者的同一剂量)可以通过在适当设计的具有足够把握度的研究中缺乏这种关系来证明是合理的。确定的协变量关系也被用于PK/PD分析,以提供有关有效性和安全性之间平衡的信息。PK和PK/PD分析的协变量关系也用于指导禁忌症、可能发生药物相互作用的情况的建议以及外推。在外推中使用协变量关系的一个例子,可以使用成人PK数据来预测儿科人群的剂量或暴露。外推在一个或几个儿科年龄范围内的PK/PD剂量范围研究或剂量发现研究中特别有用。

迄今为止,已发布的关于协变量调整的监管指南特别关注协变量在随机比较中的使用(https://www.fda.gov/media/123801/download)。在这种情况下,协变量调整主要是一个统计效率问题,因为随机化本身可以预期消除治疗组之间的大多数协变量不平衡。因此,随机比较本质上反映了治疗的因果效应,而不是因果混杂的伪影(除非随机化因随机化和结果之间同时发生的事件而无效;见https://www.fda.gov/media/108698/downloadg)。相比之下,定量药理学分析中感兴趣的关联通常对应于非随机比较(例如,高暴露与低暴露以及正常肾功能与肾功能受损)。因此,在定量药理学背景下,协变量调整不仅提供了统计效率的可选收益,而且从根本上是必要的,以减轻观察(非随机)数据的混杂风险。对于患者和临床医生来说,更重要的是在开始治疗时和在可能也有响应测量的随访期间使用协变量引导剂量。

一般而言,对协变量分析结果的信任源于对适当方法的透明使用,如上一节协变量分析进行计划阶段和协变量建模所述。特别是,监管机构和临床医生必须了解哪些协变量已根据哪些参数进行了评估,以便正确评估证据的强度。需要参数和协变量之间科学上合理的关系来做出药品说明书声明,这非常强调临床相关的协变量关系。

关于协变量范围,临床和监管关注的一个特定点是给定协变量准确表示临床状况(例如肝或肾功能损害)的程度。应该考虑协变量效应在科学上是否合理,以及它是否可能是另一个协变量的替代物。例如,通常使用Cockcroft-Gault方程估计CLcr或使用修改后“慢性肾脏病饮食改良研究(diet in renal disease, MDRD)”方程的估计GFR来定义肾功能。然而,在某些情况下,例如正在接受肾脏替代治疗的患者、急性肾功能衰竭、极端年龄、体型或肌肉质量、严重营养不良或肥胖、骨骼肌疾病或素食,使用这些方程可能无法准确反映肾功能损害的程度。在这些情况下,使用定时尿液收集(例如,24小时)或测量外源性滤过机的清除率计算的CLcr将更能反映肾小球滤过。此外,通常鼓励将肾功能建模为连续尺度上的协变量,而不是将肾功能分为正常肾功能或轻度、中度和重度肾功能损害。

监管机构明白,在许多情况下,协变量关系的不同函数形式可能会产生类似的预测,因为协变量变异范围是有限的,不允许这种区分。在这种情况下,可以进行敏感性分析,以验证不同函数形式的影响不会影响估计值。对检测到的协变量关系的监管评估也将关注是否有少数有影响力的受试者在推动检测到的关系。对于某些协变量效应参数,可以接受固定值(例如,重量对清除率和容积参数影响的基于理论的异速生长指数分别固定为3/4和1.0),但应提供固定值的理由。

从监管和患者的角度来看,需要同时对正面主张(例如,当检测到并量化给定协变量的影响时)和负面主张(例如,当断言给定人群不需要修改剂量时)都信任。因此,如上文“报告”部分所讨论的,与实际等效有关的考虑因素尤为重要。除非这种关系经过实际测试,否则决策者不太可能接受没有相关临床显著影响的主张。对于检测到的参数-协变量关系,决策者有兴趣了解效应的估计精度和估计效应的大小,以便向处方医生提出适当的建议。需要基于估计的效应的大小确定是否需要剂量调整。从监管的角度来看,PK暴露的两倍差异是仅根据PK数据来证明剂量调整的常用量级。然而,如果已经表征了PK/PD关系,并且允许酌情从有效性或安全性参数的角度看待协变量效应的大小,则可以更好地评估协变量效应的大小对PK参数的影响。

监管机构通常对协变量分析的所有方法和创新持开放态度,只要这些方法在科学上是合理的,并且描述得当。

总结和建议

考虑到所应用的技术、方法和工具非常广泛,以及发挥作用的数据集和群体的广泛多样性,很难为协变量模型的开发推荐一个“一刀切”的策略。通常会根据分析的目的和预期受众进行协变量分析,并报告结果。由于未能使用报告参数的标准,因此使得很难找到模型的共同特征,也很难以一致的方式使用协变量分析来发现新知识。

然而,协变量分析的几个方面(几乎)是所有方法所共有的。

清楚地记录预分析中先指定的方面和根据观察到的响应数据决定的方面,以便分析的消费者可以更好地评估与结果相关的证据强度。确保分析的技术方面(数据编码、函数形式、解释和推断)是完全合理的、有文档记录的,并受到质量控制。

偏离预先指定的方法时要透明,并提供这种偏离的理由。预先指定的定量药理学分析计划(PMAP)预先指定协变量、协变量选择算法和标准等,可以大大有助于确保这种透明度。然后,在编写报告时,可以参考PMAP,了解遵守预先规定的方法的程度,任何偏离PMAP的情况及其理由可以在报告的单独一节中加以记录。

利用先验知识、科学判断和基于机制的模型来克服因协变量不可避免的相关性(如大小、年龄和器官功能)而带来的挑战。在存在高度相关的协变量的情况下,可以通过关注机制上合理的关系来降低维数。在没有明显的机制优势的情况下,可以使用具有两个竞争协变量中每个变量的模型进行敏感性分析,以调查对预测的影响。

我们希望本文所介绍的内容能为分析师提供有用的基础,以便根据其具体情况选择最合适的方法。分析的目标通常应该为所使用的方法提供信息——没有一种方法是完美的,但有些方法比其他方法更适合某些任务。

论文资助资金声明

没有。

利益冲突声明

作者声明这项工作没有竞争利益。

披露声明

本稿件中表达的观点是作者的观点,不应被解释为美国食品和药物管理局的立场。

参考文献(中文翻译)

  1. Hutmacher MM, Kowalski KG. 定量药理学分析中的协变量选择:方法综述. Br J Clin Pharmacol. 2015; 79(1): 132-147.

  2. Glymour C, Zhang K, Spirtes P. 基于图形模型的因果发现方法综述. Front Genet. 2019; 10:524.

  3. Rogers JA, Maas H, Pitarch AP. 定量药理学家的因果推断简介. CPT: Pharm Syst Pharmacol. 2023; 12(1): 27-40.

  4. Germovsek E, Barker CIS, Sharland M, Standing JF. 儿科药代动力学中的清除率的缩放:所有模型都是错误的,哪些有用?. Br J Clin Pharmacol. 2017; 83(4): 777-790.

  5. Holford NH, Anderson BJ. 体型大小的异速缩放:科学理论和对正常脂肪量的扩展. Eur J Pharm Sci. 2017; 109: S59-S64.

  6. Anderson BJ, Holford NH. 了解剂量:儿童是小成人,新生儿是未成熟的儿童. Arch Dis Child. 2013; 98(9): 737-744.

  7. Rhodin MM, Anderson BJ, Peters AM, et al. 人类肾功能成熟:使用体重和经后年龄的定量描述. Pediatr Nephrol. 2009; 24(1): 67-76.

  8. Bosilkovska M, Walder B, Besson M, Daali Y, Desmeules J. 肝功能损害患者的镇痛药. Drugs. 2012; 72(12): 1645-1669.

  9. Matthews I, Kirkpatrick C, Holford N. 使用氨基糖苷类药物群体药代动力学模型进行靶标浓度干预的定量论证——参数变异性和预测性能. Br J Clin Pharmacol. 2004; 58(1): 8-19.

  10. Fukudo M, Ikemi Y, Togashi Y, et al. 厄洛替尼的群体药代动力学/药效动力学以及日本非小细胞肺癌患者血浆和脑脊液药物浓度的药物基因组学分析. Clin Pharmacokinet. 2013; 52(7): 593-609.

  11. Hesselink DA, van Gelder T, van Schaik RH, et al. 环孢菌素在肾和心脏移植受者中的群体药代动力学以及MDR-1、CYP3A4和CYP3A5基因中种族和遗传多态性的影响. Clin Pharmacol Ther. 2004; 76(6): 545-556.

  12. Dai HI, Vugmeyster Y, Mangal N. 表征免疫肿瘤学及其他领域治疗性单克隆抗体的暴露-反应关系:挑战、观点和前景. Clin Pharmacol Ther. 2020; 108(6): 1156-1170.

  13. Liu C, Yu J, Li H, et al. 纳武利尤单抗的时变清除率与疾病动力学的关联及其对暴露反应分析的影响. Clin Pharmacol Ther. 2017; 101(5): 657-666.

  14. Wang Y, Booth B, Rahman A, Kim G, Huang SM, Zineh I. 更深入地了解肿瘤药物开发中治疗性生物制剂的药代动力学和暴露-反应关系. Clin Pharmacol Ther. 2017; 101(5): 582-584.

  15. Li C, Wang B, Chen SC, et al. 恩美曲妥珠单抗在既往接受过曲妥珠单抗和紫杉烷治疗的HER2阳性晚期乳腺癌患者中的暴露反应分析. Cancer Chemother Pharmacol. 2017; 80(6): 1079-1090.

  16. Verotta D. 群体PK/PD模型中的协变量建模:一个开放性问题. Adv Pharmacoepidem Drug Safety. 2012; 1:006.

  17. Holford N. 群体PD分析. http://clinpharmacol.fmhs.auckland.ac.nz/teaching/medsci719/workshops/populationpd/

  18. Holford N, Black P, Couch R, Kennedy J, Briant R. 严重气道阻塞中的茶碱目标浓度-10或20mg/L?. Clin Pharmacokinet. 1993; 25(6): 495-505.

  19. Holford N, Hashimoto Y, Sheiner LB. 时间和茶碱浓度有助于解释急性气道阻塞后峰值流量的恢复. Clin Pharmacokinet. 1993; 25(6): 506-515.

  20. Ribbing J, Niclas Jonsson E. 群体药代动力学协变量模型的把握度、选择偏倚和预测性能. J Pharmacokinet Pharmacodyn. 2004; 31(2): 109-134.

  21. Kirkpatrick C, Duffull S, Begg E. 庆大霉素在957例肾功能不同的患者中的药代动力学,每日给药一次. Br J Clin Pharmacol. 1999; 47(6): 637-643.

  22. González-Sales M, Holford N, Bonnefois G, Desrochers J. 体型大小的分布宽广以及身体成分和成熟度的使用提高了异速缩放指数估计的可靠性. J Pharmacokinet Pharmacodyn. 2022; 49(2): 151-165.

  23. Holford N, Ma SC, Ploeger BA. 临床试验模拟:综述. Clin Pharmacol Ther. 2010; 88(2): 166-182.

  24. Hastie T, Tibshirani R. 广义加和模型. Stat Sci. 1986; 1(3): 297-310.

  25. Karlsson M, Savic R. 对模型诊断的诊断. Clin Pharmacol Ther. 2007; 82(1): 17-20.

  26. Bonate PL. 共线性对非线性混合效应模型中参数估计的影响. Pharm Res. 1999; 16(5): 709-717.

  27. McCune JS, Bemer MJ, Barrett JS, Scott Baker K, Gamis AS, Holford NHG. 婴儿到成人造血细胞移植受者中白消安:用于婴儿到成人初始剂量和贝叶斯剂量个体化预测的群体药代动力学模型. Clin Cancer Res. 2014; 20(3): 754-763.

  28. Anderson BJ, Holford NH. 药代动力学中基于机制的体型大小和成熟度概念. Annu Rev Pharmacol Toxicol. 2008; 48: 303-332.

  29. Chasseloup E, Yngman G, Karlsson MO. 协变量选择方法与相关协变量的比较:先验信息与数据信息,还是两者兼而有之?. J Pharmacokinet Pharmacodyn. 2020; 47(5): 485-492.

  30. Ivaturi VD, Hooker AC, Karlsson MO. 预先指定的协变量模型中的选择偏差. in Poster presented at 2011.

  31. Graham JW. 存在缺失数据的分析:使其在现实世界中发挥作用. Annu Rev Psychol. 2009; 60: 549-576.

  32. Johansson ÅM, Karlsson MO. 处理缺失协变量数据的方法比较. AAPS J. 2013; 15(4): 1232-1241.

  33. Schafer JL, Graham JW. 缺失的数据:我们对现有技术的看法. Psychol Methods. 2002; 7(2): 147-177.

  34. Keizer RJ, Zandvliet AS, Beijnen JH, Schellens JHM, Huitema ADR. 在群体药代动力学分析中处理缺失的分类协变量数据的方法的性能. AAPS J. 2012; 14(3): 601-611.

  35. Nyberg J, Jonsson EN, Karlsson MO, Häggström J. 缺少协变量数据的全随机效应建模方法的特性. Stat Med. 2023; 43(5): 817–1082.

  36. Bräm DS, Nahum U, Atkinson A, Koch G, Pfister M. 评估定量药理学中协变量数据插补的机器学习方法. CPT Pharm Syst Pharmacol. 2022; 11(12): 1638-1648.

  37. Janssen A, Bennis FC, Mathôt RA. 机器学习在定量药理学中的应用:最近实施的概述及其注意事项. Pharmaceutics. 2022; 14(9): 1814.

  38. Lagishetty CV, Duffull SB. 评估在群体药代动力学分析中处理低频滋扰协变量的方法. AAPS J. 2015; 17(6): 1388-1394.

  39. Bonate PL. 非线性混合效应模型:理论. In: Pharmacokinetic-Pharmacodynamic Model Simulation. 2nd ed. Springer; 2011: 233-301.

  40. Mould DR, Upton RN. 群体建模、模拟和基于模型的药物开发的基本概念-第2部分:药代动力学建模方法简介. CPT Pharmacometrics Syst Pharmacol. 2013; 2(4): 1-14.

  41. 美国食品药品监督管理局(FDA)关于肾功能受损患者的药代动力学的行业指南——研究设计、数据分析以及对剂量和标签的影响,草案,2020年3月。

  42. Holford N, Heo Y-A, Anderson B. 婴儿和成人的药代动力学标准. J Pharm Sci. 2013; 102(9): 2941-2952.

  43. Montgomery DC, Peck EA. 回归变量居中可以消除非必要的不良条件,从而减少参数估计中的方差膨胀. Introduction to Linear Regression Analysis. Wiley; 1982: 341.

  44. Ribbing J. 非线性混合效应模型中的协变量模型构建. Acta Universitatis Upsaliensis; 2007.

  45. Hirai T, Hanada K, Kanno A, Akashi M, Itoh T. 万古霉素肾毒性的危险因素和万古霉素治疗期间肾功能的时间过程. Eur J Clin Pharmacol. 2019; 75(6): 859-866.

  46. Tornatore KM, Reed KA, Venuto RC. 肾移植受者慢性免疫抑制期间甲基强的松龙药代动力学的重复评估. Ann Pharmacother. 1995; 29(2): 120-124.

  47. Sanghavi K, Zhang J, Zhao X, et al. 易普利姆玛单抗联合纳武利尤单抗治疗晚期实体瘤患者的群体药代动力学. CPT Pharmacometrics Syst Pharmacol. 2020; 9(1): 29-39.

  48. Wählby U, Thomson AH, Milligan PA, Karlsson MO. 群体药代动力学-药效动力学分析中的时变协变量模型. Br J Clin Pharmacol. 2004; 58(4): 367-377.

  49. Svensson RJ, Jonsson EN. 用于定量药理学的高效且相关的逐步协变量模型构建. CPT Pharmacometrics Syst Pharmacol. 2022; 11(9): 1210-1222.

  50. Mandema JW, Verotta D, Sheiner LB. 建立群体药代动力学药动力效学模型.I.协变量效应模型. J Pharmacokinet Biopharm. 1992; 20(5): 511-528.

  51. Wählby U. 群体药代动力学-药效动力学分析中协变量模型构建的方法学研究. Acta Universitatis Upsaliensis; 2002.

  52. Kowalski KG, Hutmacher MM. 使用Wald似然比检验对群体模型中的协变量进行有效筛选. J Pharmacokinet Pharmacodyn. 2001; 28(3): 253-275.

  53. Jonsson EN, Karlsson MO. 在NONMEM中自动构建协变量模型. Pharm Res. 1998; 15(9): 1463-1468.

  54. Keizer RJ, Khandelwal A, Hooker AC, Karlsson MO. 使用线性近似的逐步协变量建模的自举. Population Analysis Group in Europe; 2011.

  55. Khandelwal A, Harling K, Jonsson EN, Hooker AC, Karlsson MO. 一种在群体PK/PD模型中测试协变量的快速方法. AAPS J. 2011; 13(3): 464-472.

  56. Ayral G, Si Abdallah JF, Magnard C, Chauvin J. 一种基于无偏相关性检验的非线性混合效应模型协变量选择的新方法:COSSAC方法. CPT Pharmacometrics Syst Pharmacol. 2021; 10(4): 318-329.

  57. Prague M, Lavielle M. SAMBA:一种在非线性混合效应模型中快速自动构建模型的新方法. CPT Pharmacometrics Syst Pharmacol. 2022; 11(2): 161-172.

  58. Ribbing J, Nyberg J, Caster O, Jonsson EN. lasso——一种在非线性混合效应模型中构建预测协变量模型的新方法. J Pharmacokinet Pharmacodyn. 2007; 34(4): 485-517.

  59. Tibshirani R. 通过lasso进行回归收缩和选择:回顾. J R Stat Soc Series B Stat Methodology. 2011; 73(3): 273-282.

  60. Bertrand J, Balding DJ. 在非线性混合效应药代动力学模型中使用惩罚回归进行多单核苷酸多态性分析. Pharmacogenet Genomics. 2013; 23(3): 167-174.

  61. Haem E, Harling K, Ayatollahi SMT, Zare N, Karlsson MO. 调整自适应lasso,用于非线性混合效应药代动力学模型中的协变量模型构建. J Pharmacokinet Pharmacodyn. 2017; 44(1): 55-66.

  62. Gastonguay M. 全协变量模型作为依赖于统计显着性来推断协变量效应的方法的替代方案:方法回顾和42个案例研究.在2011年展出的海报中. in Poster presented at 2011.

  63. Karlsson MO. 基于参数和协变量协方差矩阵的全模型方法. in Abstr 2455. 2012.

  64. Yngman G, Bjugård Nyberg H, Nyberg J, Jonsson EN, Karlsson MO. 全随机效应模型简介. CPT Pharmacometrics Syst Pharmacol. 2022; 11(2): 149-160.

  65. Savic RM, Karlsson MO. 收缩在诊断经验贝叶斯估计中的重要性:问题和解决方案. AAPS J. 2009; 11(3): 558-569.

  66. Yuan M, Zhu Z, Yang Y, et al. 使用非线性混合效应模型对动态数据进行协变量分析的高效算法. Stat Methods Med Res. 2021; 30(1): 233-243.

  67. Karlsson MO, Holford N. 可视化预测检验教程. in abstr. 2008

  68. Ma G. 量化哮喘的肺功能进展. in Annual Meeting of the Population Approach Group in Europe. 2009.

  69. Hennig S, Karlsson MO. 协变量模型构建标准之间的一致性. J Pharmacokinet Pharmacodyn. 2014; 41(2): 109-125.

  70. Wasserstein RL, Lazar NA. ASA关于p值的声明:背景、过程和目的. Taylor & Francis; 2016: 129-133.

  71. Wählby U, Jonsson EN, Karlsson MO. 群体药代动力学-药效动力学分析中逐步协变量模型构建策略的比较. AAPS PharmSci. 2002; 4(4): 68-79.

  72. Sheiner LB, Beal SL. 关于具有扩展最小二乘参数估计值的置信区间的说明. J Pharmacokinet Biopharm. 1987; 15(1): 93-98.

  73. White DB, Walawander CA, Liu DY, Grasela TH. 使用NONMEM分析比较两个总体的假设检验的评估. J Pharmacokinet Biopharm. 1992; 20(3): 295-313.

  74. Lehmann EL, Romano JP, Casella G. 检验统计假设.第3卷.斯普林格;2005. Vol 3. Springer; 2005.

  75. Duffull SB, Wright DF, Winter HR. 解释群体药代动力学-药效动力学分析——临床观点. Br J Clin Pharmacol. 2011; 71(6): 807-814.

  76. Xu XS, Yuan M, Zhu H, et al. 群体药代动力学中的全协变量建模方法:了解基本假设检验和多重性的影响. Br J Clin Pharmacol. 2018; 84(7): 1525-1534.

  77. Kruschke JK. 拒绝或接受贝叶斯估计中的参数值. Adv Methods Pract Psychol Sci. 2018; 1(2): 270-280.

  78. Carlin JB, Wolfe R, Brown CH, Gelman A. 关于纵向二元结果的多层次模型的选择、解释和检查的案例研究. Biostatistics. 2001; 2(4): 397-416.

  79. Wickham H. 数据分析ggplot2. Springer; 2016: 189-201.

  80. Gelman A, Pardoe I. 具有非线性、交互作用和方差分量的模型的平均预测比较. Sociol Methodol. 2007; 37(1): 23-51.

  81. Relling MV, Gardner EE, Sandborn WJ, et al. 硫嘌呤甲基转移酶基因型和硫嘌呤剂量的临床药物遗传学实施联盟指南. Clin Pharmacol Ther. 2011; 89(3): 387-391.

  82. Xue L, Holford N, Ding XL, et al. S-和R-华法林的基于理论的药代动力学和药效动力学及其对国际标准化比值的影响:体型、组成和基因型对心脏手术患者的影响. Br J Clin Pharmacol. 2017; 83(4): 823-835.

参考文献(英文原文)

  1. Hutmacher MM, Kowalski KG. Covariate selection in pharmacometric analyses: a review of methods. Br J Clin Pharmacol. 2015; 79(1): 132-147.
  2. Glymour C, Zhang K, Spirtes P. Review of causal discovery methods based on graphical models. Front Genet. 2019; 10:524.
  3. Rogers JA, Maas H, Pitarch AP. An introduction to causal inference for pharmacometricians. CPT: Pharm Syst Pharmacol. 2023; 12(1): 27-40.
  4. Germovsek E, Barker CIS, Sharland M, Standing JF. Scaling clearance in paediatric pharmacokinetics: all models are wrong, which are useful? Br J Clin Pharmacol. 2017; 83(4): 777-790.
  5. Holford NH, Anderson BJ. Allometric size: the scientific theory and extension to normal fat mass. Eur J Pharm Sci. 2017; 109: S59-S64.
  6. Anderson BJ, Holford NH. Understanding dosing: children are small adults, neonates are immature children. Arch Dis Child. 2013; 98(9): 737-744.
  7. Rhodin MM, Anderson BJ, Peters AM, et al. Human renal function maturation: a quantitative description using weight and postmenstrual age. Pediatr Nephrol. 2009; 24(1): 67-76.
  8. Bosilkovska M, Walder B, Besson M, Daali Y, Desmeules J. Analgesics in patients with hepatic impairment. Drugs. 2012; 72(12): 1645-1669.
  9. Matthews I, Kirkpatrick C, Holford N. Quantitative justification for target concentration intervention–parameter variability and predictive performance using population pharmacokinetic models for aminoglycosides. Br J Clin Pharmacol. 2004; 58(1): 8-19.
  10. Fukudo M, Ikemi Y, Togashi Y, et al. Population pharmacokinetics/pharmacodynamics of erlotinib and pharmacogenomic analysis of plasma and cerebrospinal fluid drug concentrations in Japanese patients with non-small cell lung cancer. Clin Pharmacokinet. 2013; 52(7): 593-609.
  11. Hesselink DA, van Gelder T, van Schaik RH, et al. Population pharmacokinetics of cyclosporine in kidney and heart transplant recipients and the influence of ethnicity and genetic polymorphisms in the MDR-1, CYP3A4, and CYP3A5 genes. Clin Pharmacol Ther. 2004; 76(6): 545-556.
  12. Dai HI, Vugmeyster Y, Mangal N. Characterizing exposure-response relationship for therapeutic monoclonal antibodies in Immuno-oncology and beyond: challenges, perspectives, and prospects. Clin Pharmacol Ther. 2020; 108(6): 1156-1170.
  13. Liu C, Yu J, Li H, et al. Association of time-varying clearance of nivolumab with disease dynamics and its implications on exposure response analysis. Clin Pharmacol Ther. 2017; 101(5): 657-666.
  14. Wang Y, Booth B, Rahman A, Kim G, Huang SM, Zineh I. Toward greater insights on pharmacokinetics and exposure-response relationships for therapeutic biologics in oncology drug development. Clin Pharmacol Ther. 2017; 101(5): 582-584.
  15. Li C, Wang B, Chen SC, et al. Exposure–response analyses of trastuzumab emtansine in patients with HER2-positive advanced breast cancer previously treated with trastuzumab and a taxane. Cancer Chemother Pharmacol. 2017; 80(6): 1079-1090.
  16. Verotta D. Covariate modeling in population PK/PD models: an open problem. Adv Pharmacoepidem Drug Safety. 2012; 1:006.
  17. Holford N. Population PD Analysis. http://clinpharmacol.fmhs.auckland.ac.nz/teaching/medsci719/workshops/populationpd/
  18. Holford N, Black P, Couch R, Kennedy J, Briant R. Theophylline target concentration in severe airways obstruction—10 or 20 mg/L? Clin Pharmacokinet. 1993; 25(6): 495-505.
  19. Holford N, Hashimoto Y, Sheiner LB. Time and theophylline concentration help explain the recovery of peak flow following acute airways obstruction. Clin Pharmacokinet. 1993; 25(6): 506-515.
  20. Ribbing J, Niclas Jonsson E. Power, selection bias and predictive performance of the population pharmacokinetic covariate model. J Pharmacokinet Pharmacodyn. 2004; 31(2): 109-134.
  21. Kirkpatrick C, Duffull S, Begg E. Pharmacokinetics of gentamicin in 957 patients with varying renal function dosed once daily. Br J Clin Pharmacol. 1999; 47(6): 637-643.
  22. González-Sales M, Holford N, Bonnefois G, Desrochers J. Wide size dispersion and use of body composition and maturation improves the reliability of allometric exponent estimates. J Pharmacokinet Pharmacodyn. 2022; 49(2): 151-165.
  23. Holford N, Ma SC, Ploeger BA. Clinical trial simulation: a review. Clin Pharmacol Ther. 2010; 88(2): 166-182.
  24. Hastie T, Tibshirani R. Generalized additive models. Stat Sci. 1986; 1(3): 297-310.
  25. Karlsson M, Savic R. Diagnosing model diagnostics. Clin Pharmacol Ther. 2007; 82(1): 17-20.
  26. Bonate PL. The effect of collinearity on parameter estimates in nonlinear mixed effect models. Pharm Res. 1999; 16(5): 709-717.
  27. McCune JS, Bemer MJ, Barrett JS, Scott Baker K, Gamis AS, Holford NHG. Busulfan in infant to adult hematopoietic cell transplant recipients: a population pharmacokinetic model for initial and Bayesian dose PersonalizationBusulfan dose prediction in infants to adults. Clin Cancer Res. 2014; 20(3): 754-763.
  28. Anderson BJ, Holford NH. Mechanism-based concepts of size and maturity in pharmacokinetics. Annu Rev Pharmacol Toxicol. 2008; 48: 303-332.
  29. Chasseloup E, Yngman G, Karlsson MO. Comparison of covariate selection methods with correlated covariates: prior information versus data information, or a mixture of both? J Pharmacokinet Pharmacodyn. 2020; 47(5): 485-492.
  30. Ivaturi VD, Hooker AC, Karlsson MO. Selection Bias in Pre-Specified Covariate Models. in Poster presented at 2011.
  31. Graham JW. Missing data analysis: making it work in the real world. Annu Rev Psychol. 2009; 60: 549-576.
  32. Johansson ÅM, Karlsson MO. Comparison of methods for handling missing covariate data. AAPS J. 2013; 15(4): 1232-1241.
  33. Schafer JL, Graham JW. Missing data: our view of the state of the art. Psychol Methods. 2002; 7(2): 147-177.
  34. Keizer RJ, Zandvliet AS, Beijnen JH, Schellens JHM, Huitema ADR. Performance of methods for handling missing categorical covariate data in population pharmacokinetic analyses. AAPS J. 2012; 14(3): 601-611.
  35. Nyberg J, Jonsson EN, Karlsson MO, Häggström J. Properties of the full random-effect modeling approach with missing covariate data. Stat Med. 2023; 43(5): 817–1082.
  36. Bräm DS, Nahum U, Atkinson A, Koch G, Pfister M. Evaluation of machine learning methods for covariate data imputation in pharmacometrics. CPT Pharm Syst Pharmacol. 2022; 11(12): 1638-1648.
  37. Janssen A, Bennis FC, Mathôt RA. Adoption of machine learning in pharmacometrics: an overview of recent implementations and their considerations. Pharmaceutics. 2022; 14(9): 1814.
  38. Lagishetty CV, Duffull SB. Evaluation of approaches to deal with low-frequency nuisance covariates in population pharmacokinetic analyses. AAPS J. 2015; 17(6): 1388-1394.
  39. Bonate PL. Nonlinear mixed effects models: theory. In: Pharmacokinetic-Pharmacodynamic Model Simulation. 2nd ed. Springer; 2011: 233-301.
  40. Mould DR, Upton RN. Basic concepts in population modeling, simulation, and model-based drug development—part 2: introduction to pharmacokinetic modeling methods. CPT Pharmacometrics Syst Pharmacol. 2013; 2(4): 1-14.
  41. Food and Drug Administration guidance for industry, pharmacokinetics in patients with impaired renal function—study design, data analysis, and impact on dosing and labeling, draft, March 2020.
  42. Holford N, Heo Y-A, Anderson B. A pharmacokinetic standard for babies and adults. J Pharm Sci. 2013; 102(9): 2941-2952.
  43. Montgomery DC, Peck EA. Centering the regressors can remove non-essential ill-conditioning thereby reducing variance inflation in the parameter estimates. Introduction to Linear Regression Analysis. Wiley; 1982: 341.
  44. Ribbing J. Covariate Model Building in Nonlinear Mixed Effects Models. Acta Universitatis Upsaliensis; 2007.
  45. Hirai T, Hanada K, Kanno A, Akashi M, Itoh T. Risk factors for vancomycin nephrotoxicity and time course of renal function during vancomycin treatment. Eur J Clin Pharmacol. 2019; 75(6): 859-866.
  46. Tornatore KM, Reed KA, Venuto RC. Repeated assessment of methylprednisolone pharmacokinetics during chronic immunosuppression in renal transplant recipients. Ann Pharmacother. 1995; 29(2): 120-124.
  47. Sanghavi K, Zhang J, Zhao X, et al. Population pharmacokinetics of Ipilimumab in combination with Nivolumab in patients with advanced solid tumors. CPT Pharmacometrics Syst Pharmacol. 2020; 9(1): 29-39.
  48. Wählby U, Thomson AH, Milligan PA, Karlsson MO. Models for time-varying covariates in population pharmacokinetic-pharmacodynamic analysis. Br J Clin Pharmacol. 2004; 58(4): 367-377.
  49. Svensson RJ, Jonsson EN. Efficient and relevant stepwise covariate model building for pharmacometrics. CPT Pharmacometrics Syst Pharmacol. 2022; 11(9): 1210-1222.
  50. Mandema JW, Verotta D, Sheiner LB. Building population pharmacokinetic pharmacodynamic models. I. Models for covariate effects. J Pharmacokinet Biopharm. 1992; 20(5): 511-528.
  51. Wählby U. Methodological Studies on Covariate Model Building in Population Pharmacokinetic-Pharmacodynamic Analysis. Acta Universitatis Upsaliensis; 2002.
  52. Kowalski KG, Hutmacher MM. Efficient screening of covariates in population models using Wald’s approximation to the likelihood ratio test. J Pharmacokinet Pharmacodyn. 2001; 28(3): 253-275.
  53. Jonsson EN, Karlsson MO. Automated covariate model building within NONMEM. Pharm Res. 1998; 15(9): 1463-1468.
  54. Keizer RJ, Khandelwal A, Hooker AC, Karlsson MO. The bootstrap of stepwise covariate modeling using linear approximations. Population Analysis Group in Europe; 2011.
  55. Khandelwal A, Harling K, Jonsson EN, Hooker AC, Karlsson MO. A fast method for testing covariates in population PK/PD models. AAPS J. 2011; 13(3): 464-472.
  56. Ayral G, Si Abdallah JF, Magnard C, Chauvin J. A novel method based on unbiased correlations tests for covariate selection in nonlinear mixed effects models: the COSSAC approach. CPT Pharmacometrics Syst Pharmacol. 2021; 10(4): 318-329.
  57. Prague M, Lavielle M. SAMBA: a novel method for fast automatic model building in nonlinear mixed-effects models. CPT Pharmacometrics Syst Pharmacol. 2022; 11(2): 161-172.
  58. Ribbing J, Nyberg J, Caster O, Jonsson EN. The lasso—a novel method for predictive covariate model building in nonlinear mixed effects models. J Pharmacokinet Pharmacodyn. 2007; 34(4): 485-517.
  59. Tibshirani R. Regression shrinkage and selection via the lasso: a retrospective. J R Stat Soc Series B Stat Methodology. 2011; 73(3): 273-282.
  60. Bertrand J, Balding DJ. Multiple single nucleotide polymorphism analysis using penalized regression in nonlinear mixed-effect pharmacokinetic models. Pharmacogenet Genomics. 2013; 23(3): 167-174.
  61. Haem E, Harling K, Ayatollahi SMT, Zare N, Karlsson MO. Adjusted adaptive lasso for covariate model-building in nonlinear mixed-effect pharmacokinetic models. J Pharmacokinet Pharmacodyn. 2017; 44(1): 55-66.
  62. Gastonguay M. Full covariate models as an alternative to methods relying on statistical significance for inferences about covariate effects: a review of methodology and 42 case studies. in Poster presented at 2011.
  63. Karlsson MO. A full model approach based on the covariance matrix of parameters and covariates. in Abstr 2455. 2012.
  64. Yngman G, Bjugård Nyberg H, Nyberg J, Jonsson EN, Karlsson MO. An introduction to the full random effects model. CPT Pharmacometrics Syst Pharmacol. 2022; 11(2): 149-160.
  65. Savic RM, Karlsson MO. Importance of shrinkage in empirical bayes estimates for diagnostics: problems and solutions. AAPS J. 2009; 11(3): 558-569.
  66. Yuan M, Zhu Z, Yang Y, et al. Efficient algorithms for covariate analysis with dynamic data using nonlinear mixed-effects model. Stat Methods Med Res. 2021; 30(1): 233-243.
  67. Karlsson MO, Holford N. A tutorial on visual predictive checks. in abstr. 2008.
  68. Ma G. Quantifying lung function progression in asthma. in Annual Meeting of the Population Approach Group in Europe. 2009.
  69. Hennig S, Karlsson MO. Concordance between criteria for covariate model building. J Pharmacokinet Pharmacodyn. 2014; 41(2): 109-125.
  70. Wasserstein RL, Lazar NA. The ASA Statement on p-values: Context, Process, and Purpose. Taylor & Francis; 2016: 129-133.
  71. Wählby U, Jonsson EN, Karlsson MO. Comparison of stepwise covariate model building strategies in population pharmacokinetic-pharmacodynamic analysis. AAPS PharmSci. 2002; 4(4): 68-79.
  72. Sheiner LB, Beal SL. A note on confidence intervals with extended least squares parameter estimates. J Pharmacokinet Biopharm. 1987; 15(1): 93-98.
  73. White DB, Walawander CA, Liu DY, Grasela TH. Evaluation of hypothesis testing for comparing two populations using NONMEM analysis. J Pharmacokinet Biopharm. 1992; 20(3): 295-313.
  74. Lehmann EL, Romano JP, Casella G. Testing statistical hypotheses. Vol 3. Springer; 2005.
  75. Duffull SB, Wright DF, Winter HR. Interpreting population pharmacokinetic-pharmacodynamic analyses–a clinical viewpoint. Br J Clin Pharmacol. 2011; 71(6): 807-814.
  76. Xu XS, Yuan M, Zhu H, et al. Full covariate modelling approach in population pharmacokinetics: understanding the underlying hypothesis tests and implications of multiplicity. Br J Clin Pharmacol. 2018; 84(7): 1525-1534.
  77. Kruschke JK. Rejecting or accepting parameter values in Bayesian estimation. Adv Methods Pract Psychol Sci. 2018; 1(2): 270-280.
  78. Carlin JB, Wolfe R, Brown CH, Gelman A. A case study on the choice, interpretation and checking of multilevel models for longitudinal binary outcomes. Biostatistics. 2001; 2(4): 397-416.
  79. Wickham H. Data analysis. ggplot2. Springer; 2016: 189-201.
  80. Gelman A, Pardoe I. Average predictive comparisons for models with nonlinearity, interactions, and variance components. Sociol Methodol. 2007; 37(1): 23-51.
  81. Relling MV, Gardner EE, Sandborn WJ, et al. Clinical Pharmacogenetics implementation consortium guidelines for thiopurine methyltransferase genotype and thiopurine dosing. Clin Pharmacol Ther. 2011; 89(3): 387-391.
  82. Xue L, Holford N, Ding XL, et al. Theory-based pharmacokinetics and pharmacodynamics of S- and R-warfarin and effects on international normalized ratio: influence of body size, composition and genotype in cardiac surgery patients. Br J Clin Pharmacol. 2017; 83(4): 823-835.