制药行业关于R的开源项目和参与组织
付永超 / 2022-09-18
前言:
制药行业
广义的制药行业包括早期的信号通路发现、基因测序与分析、分子对接、分子合成、生产放大、制剂,体外理化试验,体外ADMET试验,体内试验的PK、PD、TOX试验,转化医学,医学写作,临床试验设计,临床试验实施,临床试验监察,药物警戒,临床试验数据统计,临床试验数据分析,药物经济学,药品营销,上市后监测,依从性与个体化用药。
R程序语言
近年来R作为一种数据可视化的工具被广泛的应用于各种领域,制药行业也受其广泛影响产生了一系列的开源项目,以及一些积极参与的制药公司、数据分析公司、个人开发者等。
R所拥有的基本的功能:
• 数据统计分析(可以实现SAS绝大多数的功能) • 图表制作(ggplot2添加包是著名的代表作) • 静态文档与交互式网页生成(Rmarkdown、Shiny) • 面向对象的编程 基于上述的基本能力,R使用者衍生出了一系列的添加包,使得R进一步的被广泛的传播与应用。
此文目的:
我想记录下当前我所观察到的关于R语言在工业界的开源项目,便于以后翻找,也便于读者以我的视角了解当前R语言在制药行业的应用。
参与R语言社区贡献的组织
1.“R语言在制药行业”会议组织
英文名称:
R/Pharma Conference
中文名称:
暂无
网址:
rinpharma.com
组织自述:
该会议是一个相对较小的、面向科学和工业的学术活动,主要关注药物开发中R的使用。
笔者概述:
制药行业自行组织建立的R语言使用经验分享交流的社区,目前主要进在线上进行会议与活动,并且公开有过往历年的会议的PPT或者视频,参与此组织的制药组织分享有很多关于他们应用的经验,查看官网记录,此组织似乎是从2018年开始的。
主要成果:
有很多类型的使用经验分享,比如:R的验证与部署、使用R完成CDISC数据准备、临床试验结果的分析与可视化、生物信息学数据分析与可视化、试验设计模拟和分析
笔者点评:
这是一个大杂烩,可以通过它快速了解有没有你所感性趣的内容,然后进一步搜索。
2.诺华生物医学研究所开源清单
英文名称:
The Novartis Institutes for BioMedical Research (NIBR) Open Source
中文名称:
暂无
网址:
opensource.nibr.com github.com/Novartis
组织自述:
诺华生物医学研究所 (NIBR) 正在开创用于药物发现的新信息学工具。 我们相信开源、全球合作的力量会带来更大的利益。
笔者概述:
这是诺华公司自己的开源项目的展示网站,其中罗列了一系列的开源项目,并有其对应的github仓库;github仓库中一共有59个开源项目,其中13个使用的是R,其他项目使用了其它编程成语言比如Java、JavaScript、TypeScript、C、Jupyter等。
主要内容:
每个人所在经历不同所关注的地方也不同,我最近使用过xgxr项目的包这是一个用于将PK、PD、临床终点等数据可视化的包,感觉非常不错;对tidymodules也有兴趣,这是一个为Shiny包装了的面向对象特性的包;他们还开源了一系列生物信息学相关的包,但我不感兴趣。
笔者点评:
精良的开源项目!如果你不打算看完这份清单上所有的项目,那你就看看诺华的开源项目吧。
3.默沙东的开源清单
英文名称:
无
中文名称:
无
网址:
组织自述:
无
笔者概述:
一个默默的、贡献开源项目的参与者;github仓库中一共有52个开源项目,其中15个使用的是R,其他项目使用了其它编程成语言比如Java、JavaScript、TypeScript、C++、Jupyter、Julia 、Ruby、Perl 等。
主要内容:
他们开源的项目的重点围绕临床试验,包括临床试验模拟simtrial、CDISC数据准备metalite、试验设计gsdmvn、gsDesign2、数据分析bayesiansprt、图表导出至静态文档r2rtf等,初次之外同样也有关于生物信息学等其他主题的开源包。
笔者点评:
我没有使用过,没得评价,但从版本号观察,似乎都处于早期阶段。
4.辉瑞研发的开源清单
英文名称:
无
中文名称:
无
网址:
github.com/PfizerRD
组织自述:
共同编码,打造更健康的世界
笔者概述:
关注于早期药理与临床前研究的开源项目参与者;github仓库中一共有39个开源项目,其中2个使用的是R,其他项目使用了其它编程成语言比如Python 、JavaScript 、C++、Jupyter、MATLAB 等。
主要内容:
仅有的两个R的开源项目也是分叉自其他公司的项目。
笔者点评:
我没有使用过,没得评价。
5.罗氏开源项目清单
英文名称:
无
中文名称:
无
网址:
github.com/Roche
组织自述:
无
笔者概述:
一些琐碎的各种开源项目的参与者;github仓库中一共有54个开源项目,其中14个使用的是R,其他项目使用了其它编程成语言比如Java、JavaScript、TypeScript、C#、Jupyter、Ruby等。
主要内容:
有三个关于生存分析的包flexsurvPlus、gemtcPlus、MAIC,我计划未来尝试下;也有两个关于静态内容生成的包rpsftmPlus、rtables;一个ggplot增强工具ggtips,提供悬停提示功能;一个关于CDISC数据准备的包synthetic.cdisc.data。
笔者点评:
从版本号观察,R添加包的完成度很高;生存分析相关的包、ggtips等都看起来让人提起兴趣。
6.Atorus Research开源清单
英文名称:
无
中文名称:
无
网址:
github.com/atorus-research
组织自述:
无
笔者概述:
这是一个服务公司的开源项目,主要提供了关于表格和CDSIC数据准备的项目,因为有仓库中存在大量重复或关联的项目,所以不罗列数据了,其主要使用R。
主要内容:
简化临床数据摘要表制作的包Tplyr,CDISC数据准备的项目 CDISC_pilot_replication。
笔者点评:
我没有使用过,没得评价。
7.Metrum Research Group开源项目清单
英文名称:
无
中文名称:
无
网址:
github.com/metrumresearchgroup metrumrg.com/open-science/
组织自述:
无
笔者概述:
这是一个服务公司的开源项目,其专注于定量药理领域,所以其项目大多围绕此;github仓库中一共有123个开源项目,其中51个使用的是R,其他项目使用了其它编程成语言比如Go、C++、Julia、Ruby、MATLAB等。
主要内容:
mrgsolve这一用于PKPD模拟的ODE引擎是他们开发与开源的;pmplots是一个创建药理学中常用的探索性和诊断性图的包;bbr管理整个建模工作流程的包。 除了R包,他们也开放的有一系列免费在线课程、和一个储存有用户提交的模型的网站,这些模型可自由下载。
笔者点评:
这在本文的一系列开源组织中,最为有计划的进行开源项目贡献的贡献者,R包质量也很好(虽然我一个都没有使用过-.-!),似乎是走工具开源服务收费的商业化路线。
8.瑞典乌普萨拉大学开源项目清单
英文名称:
无
中文名称:
无
网址:
github.com/UUPharmacometrics
组织自述:
无
笔者概述:
这是在定量药理学领域著名的学术研究机构之一,其贡献并维护了一系列的经典工具;github仓库中一共有8个开源项目,其中6个使用的是R,其他项目使用了其它编程成语言比如prel等。
主要内容:
xpose4,著名的基于NONMEM输出结果绘制图表的工具。
笔者点评:
其开发的工具包有人长期维护,质量很好。
后记
我计划未来会持续更新此文,以补充与汇集相关信息。 以上是基于兴趣搜索了解到的信息,难免所收录资料较为片面,甚至存在谬误之处。欢迎大家补充与指出。