药物 3D 打印新突破:圣地亚哥大学用机器学习筛选喷墨打印生物墨水,准确率高达 97.22%

内容一览:药物喷墨打印是一种高度灵活和智能化的制药方式。据相关报告统计,该领域市场规模将在不久的未来呈现指数级增长。过往,筛选合适生物墨水的方法费时且费力,因此也成为药物喷墨打印领域面临的主要挑战之一。为解决这一问题,国际药剂学期刊《International Journal of Pharmaceutics: X》上发布了一篇研究成果,利用机器学习模型来预测墨水可打印性,预测准确率高达 97.22%。

关键词:喷墨打印 3D 打印  随机森林   

本文首发自 HyperAI 超神经微信公众平台~

根据新华社在 2022 年发布的一篇报道,药物研发周期通常长达 10-15 年,资金投入约为 10-20 亿美元,其技术进步和迭代非常缓慢,尤其以制药领域最成熟的剂型之一固体制剂为例,100 多年来并未出现颠覆性技术,其投产上市仍面临着活性药物成分稳定性、释放动力学和生物利用度等关键性障碍。

传统制药方法虽然适用于单一制剂的大规模生产,然而在早期临床试验中,通常会对药物进行剂量递增的研究,以确定最佳及最安全的患者剂量,因此对于较小批量的试验药物,传统制药方法并不适用。

3D 打印因其具备高度灵活性,且生产过程数字化、连续化,在药物设计、制造和使用上,能够一定程度上减缓甚至克服以上障碍。

其中,药物喷墨打印不仅提供了数字化控制打印的能力,还具有控制剂量和自由设计的优势,为个性化给药提供了可能。药物喷墨打印中,墨水特性的优化以及印刷效果一直以来都是研究的焦点,以往研究人员会依据奥内佐格数来预测墨水的可打印性,然而,这种传统预测方法往往会不准确。

近期,来自圣地亚哥德孔波斯特拉大学 (Universidade de Santiago de Compostela) 的 Paola Carou-Senra 以及来自伦敦大学学院 (University College London) 的 Jun Jie Ong 等研究人员开创性地将机器学习模型应用于预测生物墨水可打印性,并成功地提高了预测率。目前该研究已发布在《International Journal of Pharmaceutics: X》期刊上,标题为「Predicting pharmaceutical inkjet printing outcomes using machine learning」。

图 1:该研究成果已发表在《International Journal of Pharmaceutics: X》

论文地址:

https://www.sciencedirect.com/science/article/pii/S2590156723000257

实验概述

奥内佐格数 (Ohnesorge) 是流体力学中用来度量黏性力与惯性力和表面张力的相互关系的无量纲数,主要用于预测墨水的可打印性。可打印配方中,0.1 < Ohnesorge < 1,即 1 < Z < 10 (Z 值是 Ohnesorge 倒数) 时,通常认为墨水可打印。然而很多例外情况下,Z > 10 时墨水也是可打印的。

  图 2:可打印配方 Z 和 Ohnesorge 的直方图和箱线图

如图 1 所示,本研究中可打印墨水配方中的 Z 值处于 1 至 62.2 之间,其中有 68 组墨水配方的 Z 值大于 10。由此可见,单纯依据 Z 值来预测可打印性并不准确。为了提高可打印性预测的准确度,研究人员采用了机器学习模型,并对比了几种不同模型性能。 

实验过程

数据集 

本研究数据集包含从 Google Scholar, PubMed, Web of Science, PubChem, the Handbook of Pharmaceutical Excipients (9th ed.) 上搜集的 2000 年 5 月至 2022 年 2 月期间出版的 75 篇英文文献的研究成果,同时还添加了 2 种内部配方信息。最终,数据集共有 687 种配方。其中,可打印配方 636 种,占总配方的 92.6%,不可打印配方 51 种,占 7.4%。

数据集中包括与喷墨打印过程有关的参数信息,具体变量如下图所示:

表 1:打印过程中的变量

模型开发 

本项研究中,研究人员开发了三种机器学习模型:人工神经网络 (artificial neural networks, ANN)、  支持向量机 (support vector machines, SVM)、随机森林 (random forests, RF),并通过计算其科恩卡帕系数 (the Cohen’s kappa coefficient, kappa)、判定系数 (coefficient of determination, R²) 和平均绝对误差 (Mean Absolute Deviation, MAE),对比得出最佳预测模型。同时,实验过程中,研究人员还探究了模型、特征集以及超参数的组合关系。

kappa: kappa 是一个用于检验一致性的指标,也可以用于衡量分类的效果,可检测模型预测结果和实际分类是否一致。其取值范围为 -1 到 1 之间,通常大于 0,其中 1 代表完全一致,0 代表随机一致,-1 代表完全不一致。 

:  判定系数,又称可决系数、决定系数,该指标建立在对总离差平方和进行分解的基础之上,用来说明  回归 方程对观测数据拟合程度的一个度量值。判定系数越高,说明对观测数据的拟合程度越好,反之判定系数越小,拟合程度越差。

MAE:  平均绝对误差,又称平均绝对离差,表示预测值和观测值之间绝对误差的平均值,因而可以准确反映实际预测误差的大小。其取值范围为 [0,+∞),当预测值与真实值完全吻合时等于 0,即完美模型;该值越大,误差越大。

超参数调优 

可打印墨水虽然可喷射,但也可能会产生卫星液滴,这种形状会导致印刷不准确,是评估墨水质量的重要指标。同时,墨水中药物不足的话,打印的药物无法达到治疗效果,因此墨水中药物的含量也是评估质量的重要指标。因此,本研究中模型除了被用来预测墨水的可打印性,还被用来预测可打印墨水的质量以及墨水中药物剂量。

在预测这两个不同方面的实验中,研发人员对模型超参数进行了优化,其中,初始状态下模型默认超参数如下表:

表 2:模型默认超参数

超参数,是机器学习  算法 中需要手动设置的一些参数。通常情况下,超参数的值对于模型性能和泛化能力有很大的影响。超参数调优(或超参数优化)是通过一定方法,自动寻找最优参数组合的过程。研究人员首先为每个模型预定义了可能取值集合,再通过对训练集进行 5 倍交叉验证的网格搜索来确定最佳超参数值,最后优化后的机器学习模型被应用于测试集。

实验结果 

在预测墨水可打印性方面,最佳预测模型为 RF 模型。研究人员指出经过优化后的 RF 模型准确率为 97.22%,kappa 系数为 0.854,这说明该模型在预测可打印性上准确率高且可靠。

在预测墨水质量,即预测可打印墨水是否产生卫星液滴方面,最佳预测模型为 ANN 模型。研究人员指出经过优化后的 ANN 模型准确率为 97.14% ,kappa 系数为 0.74。这里他们也强调,kappa 系数考虑了偶然得出正确预测的可能性,所以数据集 (数据集中大部分为可打印配方,不可打印配方占比极小) 会相对不均衡,不过即便如此,模型获得的分数和准确率表明预测是可靠的。

制药喷墨打印时,预测药物剂量方面,最佳预测模型为 RF 模型。这里,研究人员指出如果采用预定义超参数及材料名称分组的特征集,RF 模型性能最佳;如果移除残差数据集最小  阈值 ,最佳预测模型为 ANN 模型,下图为训练两个模型不同的数据集。

如图 3 所示,两个数据集的测量药物剂量的分布相似,但用于训练 RF 模型的数据集规模更大,且药物剂量在 2.5-5.0mg 之间的数据比例相对较高(药物喷墨打印中使用的典型药物剂量范围)。因此,尽管 ANN 模型的表现略好于 RF 模型,但 RF 模型更适合于优化。优化模型后的 RF 模型的 R² 为 0.800,MAE 为 0.291,表明其可以预测药物剂量,误差在 ±0.291 mg 范围内。

图 3:训练 RF 和 ANN 模型数据集中测量药物剂量图

综上,机器学习模型能够预测可打印墨水的可打印性、打印质量,同时还能够预测药物剂量,其中,不同算法和特征集还能对预测结果产生不同影响。

药物 3D 打印:推动产业走向数字化

3D 打印在药物研发的早期阶段,提供了更大的灵活性,只需调整几个参数,就可以更容易地改变药物的形状、大小、剂量、释放情况等,加快临床试验的进度、缩短新药上市的周期。同时,还能通过为患者量身定制精确剂量,提供个性化医学治疗。

2015 年 7 月,美国制药公司 Aprecia 利用 3D 打印技术制备的处方药 SPRITAM(左乙拉西坦)速溶片上市,用于治疗癫痫。这是全球首个获得美国食品药品监督管理局 (FDA) 批准的 3D 打印药物,标志着药物 3D 打印已成为现实,同时也掀起了一轮 3D 打印药物的研究热潮。此后,Aprecia 根据自身优势,成功转型为一家药物制剂技术平台公司,并与普渡大学药剂学院等科研机构以及大型跨国药企积极开展合作、促进新药研发。

放眼国内,成立于 2015 年的南京三迭纪医药,则堪称国内 3D 打印药物领域的引领者。三迭纪医药由成森平博士和美国制剂界专家和教育家李霄凌 (Xiaoling Li) 教授共同创立,成立至今,其首创了 MED 技术,成功开发了从药物剂型设计、数字化产品开发,到智能制药全链条的专有 3D 打印技术平台,其研发的 3 款 3D 打印药物–T19(针对类风湿性关节炎)、T20(降低非瓣膜病性房颤患者的卒中和全身性栓塞风险等)、T21(治疗溃疡性结肠炎),均已获得美国 FDA 临床试验批准,进入临床阶段。

无疑,药物 3D 打印构建了数字化制药的基础,其市场远期需求量大、前景可期。根据 Grandview Research 发布的一份报告,全球药物 3D 打印市场或将在不久的未来呈现指数级增长,预计到 2030 年,全球药物 3D 打印市场将达到 2.6974 亿美元,而老龄化的加剧,无疑创造了巨大的个性化医疗窗口。相信在不久的将来,药物 3D 打印将重塑生物制药的商业格局。

参考链接:

[1]http://www.news.cn/mrdx/2022-09/13/c_1310662292.htm

[2]https://www.pudong.gov.cn/019010005/20221026/741820.html

本文首发自 HyperAI 超神经微信公众平台~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/14366.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

禅意工作-诗意生活

“禅意工作&#xff0c;诗意生活”能做到这两点&#xff0c;非常非常非常难。 AI的解释&#xff1a; “禅意工作&#xff0c;诗意生活”是一种追求内心平和与幸福的生活方式&#xff0c;它将工作与生活相结合&#xff0c;达到一种和谐的状态。以下是一些关于如何实现“禅意工…

雅思词汇怎样在短期内进行突破?

雅思的考试对词汇量的要求是比较高的&#xff0c;那么该怎样才能高效的积累呢&#xff1f;和小编一起来看看雅思词汇怎样在短期内进行突破&#xff1f; 词汇突破 1&#xff09;制定合理的计划&#xff0c;反复循环 背单词是一个非常繁重的任务&#xff0c;它需要大量的精力。…

协同过滤 springboot+vue基于java的个性化图书推荐系统_1k4p4

在飞速发展的信息时代&#xff0c;随着网络学习的的普及&#xff0c;大量的学习平台和大量的图书数量迅速膨胀&#xff0c;使得学生在进行网络学习时面临“数据爆炸”和“数据过载”的情况&#xff0c;无法寻找到适合自己的图书。在面对着越来越多的图书资源&#xff0c;如何快…

AI很渴:chatGPT交流一次=喝掉一瓶水,GPT3训练=填满核反应堆

流行的大型语言模型&#xff08;LLM&#xff09;&#xff0c;如OpenAI的ChatGPT和Google的Bard&#xff0c;耗能巨大&#xff0c;需要庞大的服务器农场提供足够的数据来训练这些强大的程序。对这些数据中心进行冷却也使得AI聊天机器人对水的需求量极大。新的研究表明&#xff0…

五种网络 I/O 模型

文章目录 1. 阻塞式 I/O 模型2. 非阻塞式 I/O 模型3. I/O 多路复用4. 信号驱动式 I/O5. 异步 I/O6. I/O 模型的分类 Unix 下有五种可用的 I/O 模型&#xff1a; 阻塞式 I/O 非阻塞式 I/O I/O 多路复用&#xff08;select/poll/epoll&#xff09; 信号驱动式 I/O&#xff08;…

MongoDB远程复制集集群((两台服务器,8个实例))

第三阶段基础 时 间&#xff1a;2023年7月4日 参加人&#xff1a;全班人员 内 容&#xff1a; MongoDB远程复制集集群 目录 MongoDB远程复制集集群 实验环境&#xff1a;&#xff08;两台服务器&#xff0c;8个实例&#xff09; 环境部署&#xff1a; 安装部署 实 …

hive和datax數據採集數量對不上

hive和datax數據採集數量對不上 對數據的時候發現有些對不上&#xff0c;在hive中 staff_id DF67B3FC-02DD-4142-807A-DF4A75A4A22E’的數據只有1033 而在mysql中發現staff_id DF67B3FC-02DD-4142-807A-DF4A75A4A22E’的數據有4783條記錄&#xff08;昨天的記錄是4781&#…

小样本图像目标检测研究综述——张振伟论文阅读

小样本图像目标检测研究综述——张振伟&#xff08;计算机工程与应用 2022&#xff09; 论文阅读 目前&#xff0c;小样本图像目标检测方法多基于经典的俩阶段目标检测算法Faster R-CNN作为主干网络&#xff0c;当然也有将YOLO&#xff0c;SSD一阶段目标检测算法作为主干网络的…

信道的容量和复用

信道的极限容量 当信道质量比较差时&#xff0c;输出信号的波形难以识别&#xff0c;此时出现的现象称为码间串扰“ 失真的因素有&#xff1a;码元传输速率&#xff0c;信号传输距离&#xff0c;噪声干扰&#xff0c;传输媒体质量等。 奈奎斯特准则&#xff1a; 理想低…

Microsoft Visual Studio 2022添加.NET Framework 4.6.2框架,然后说下.NET目标包的作用。

众所周知&#xff0c;Microsoft Visual Studio 2022不再支持.NET Framework 4.6以下的框架。从而导致前期使用老框架开发的某些应用无法打开&#xff08;打开时提示安装框架&#xff0c;但又安装不成功&#xff09;的情况出现。 前于如何安装.NET Framework 4.5及更早版本框架的…

MySQL面试题总结(部分)

一.介绍MySQL为什么在面试中会提及 1.为什么要在面试时MySQL会被提及&#xff1f; 在面试中问MySQL问题有几个主要原因&#xff1a; 1. 数据库管理系统的重要性&#xff1a;MySQL作为一种常用的关系型数据库管理系统(RDBMS)&#xff0c;在互联网和企业应用中得到广泛使用。对数…

BUUCTF Web CyberPunk WriteUp

想直接查看payload的点这里 前言 二次注入&#xff08;Second-Order Injection&#xff09;是指攻击者在应用程序中注入恶意数据&#xff0c;然后在稍后的操作或不同的上下文中再次使用该恶意数据&#xff0c;导致安全漏洞。它通常发生在数据库查询、数据导出、报告生成等过程…