腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

 要:目的 旨在通过近红外光谱(NIRS)信息与腰痹通胶囊(Yaobitong CapsulesYC)中间体中值粒径(D50)的关系分析,探讨对该品种生产过程中4种中间体建立D50近红外通用定量模型的可行性。方法 采集YC生产过程中的原料细粉、干燥颗粒、整粒颗粒和总混颗粒4种中间体的NIRS,考察不同预处理方法对模型的影响,并采用间隔偏最小二乘法(iPLS)、组合间隔偏最小二乘法(siPLS)和移动窗口偏最小二乘法(mwPLS)优选NIRS波段,采用偏最小二乘法(PLS)对4种中间体建立1D50通用定量模型。结果 通用模型的交叉验证均方根误差(RMSECV)为3.918 μm,预测均方根误差(RMSEP)为2.832 μm,预测相对偏差(RSEP)为2.26%,小于5%,性能偏差比(RPD)为4.60,大于3,该模型可以用于定量测定,且与独立模型比,预测准确性相差不大。结论  NIRS通用定量模型可用于YC 4种中间体D50的测定。

腰痹通胶囊(YaobitongCapsulesYC)是由三七、川芎、延胡索、白芍、牛膝、狗脊、熟大黄、独活8味中药组成,具有活血化瘀、祛风除湿的功效,主要用于治疗腰椎间盘突出症[1]。颗粒粒径是评价制粒所得颗粒是否合格的关键指标[2-3],并对多个关键质量属性有影响,例如吸湿稳定性[4]、流动性[5]、可压缩性[6]、溶出度[7],它还影响制粒工艺参数的选择[8]及胶囊的填充[9]。在实际生产应用中,中值粒径(D50)是评价颗粒粒径的主要指标,D50是指粒径分布累积达到50%时对应的粒径值[10-11],它能较准确的反映样本的粒径情况。目前,YC正在进行工艺优化提升质量标准,D50拟纳入质量内控标准。
近红外光谱(nearinfrared spectrumNIRS)技术与化学计量法结合,能够实现快速检测化学成分含量及物理性质指标,在药材鉴别与化学成分含量快速测定中应用较多[12‑14],但较少用来快速检测物性指标。粒径信息可以通过NIRS基线的变化反映出来[15],已有研究者将NIRS技术用于粒径的快速检测。Rosas[16]以实验室自制尼美舒利为研究对象,成功开发出NIRS快速检测颗粒粒径分布(<125 μm125250 μm、>250 μm)的模型,模型的预测均方根误差(root mean squareerror of predictionRMSEP)为2.5%Otsuka[17]采用NIRS技术实时监控实验室规模的扑热息痛散流化床制粒过程,建立了颗粒D50的快速检测方法,模型的校正集相关系数达0.961Pauli[18]开发了3个在线NIRS定量分析方法,用于测定双氯芬酸钠湿法制粒和流化床干燥过程中的颗粒粒径分布,预测值在允许的误差范围内。潘晓宁[19]以党参与玄参药材为研究对象,分别构建了粒径分布累积为10%50%90%对应的粒径值(D10D50D90)的NIRS定量预测模型。上述研究表明,NIRS技术结合化学计量法是可以测定药物颗粒粒径的,但多数研究都是针对某一类样本进行分析,且都集中于化学药领域。通用模型是指针对某个指标建立一个模型,可以用于分析2种及以上的样本,通用性强,可以节约较多成本。建立一个稳定、可靠的NIRS定量预测模型是一项较为复杂的工作,耗时长且成本高。如果能针对两种及以上的样本建立一个通用的模型,将会提升检测效率,节约成本。本研究以YC生产过程中的4种中间体为研究对象,通过采集4种中间体的近红外漫反射光谱,以中间体D50为参考值,采用偏最小二乘法(partialleast squaresPLS)建立一个检测4种中间体D50的通用方法。

1  仪器与材料

1.1  仪器

Antaris II型傅里叶近红外变换光谱仪,配有积分球漫反射采样系统、Result光谱采集软件,美国Thermo公司;BT-2600激光粒度分布仪,丹东百特仪器有限公司。

1.2  材料

YC生产过程中的中间体,包含原料细粉、干燥颗粒、整粒颗粒和总混颗粒,由江苏康缘药业股份有限公司提供。本研究收集的样品为20198月至20205月生产的中间体样品,收集到的中间体样品批次为Z190801Z190820Z190901Z190918Z200301Z200320Z200401Z200420Z200501Z200502,包含4种中间体共320个样品。

2  方法

2.1  NIRS采集

4 g左右样品,置于配备的样品杯里,轻轻压实,采用积分球漫反射方式采集NIRS。扫描范围为10 0004000 cm−1,分辨率为8 cm−12倍增益,扫描次数64次,以空气为背景,每小时扫描1次背景。每个样品扫描3次,平均值用于分析。

2.2  参考值测定

激光粒度分布仪法测粒径代表性强且适用于粒径小的颗粒[10],“1.2”项下的样本粒径小于550μm,采用该法测粒径结果较为准确。取适量样品置于进料斗中,使用BT-2600激光粒度分布仪测定样品的粒径分布,并计算D50(粒径分布累积为50%时对应的粒径值)。参数设置:分散介质为空气,空气压力为0.25 MPa,遮光率为3%12%

2.3  光谱预处理方法

采集光谱时,由于受到环境温湿度、仪器状态以及颗粒状态等各种因素的影响,NIRS会产生噪声信号、基线漂移等,获取的光谱中包含了自身的信息以及其他不必要的信号。对NIRS进行合适的预处理,可以减少噪声,滤过无关信息,提高模型稳健性。常见的预处理方法有矢量归一化法、导数法(一阶导数、二阶导数)、平滑法Savitzky-GolaySG)平滑、Norris DerivativeND)平滑、多元散射校正(multiplicativescatter correctionMSC)、标准正态变量变换法(standardnormal variate transformationSNV)、基线校正以及上述几种方法的结合。矢量归一化法能增强光谱差异,可以校正由光程或样品稀释等导致的光谱变化;MSCSNV可以消除颗粒大小、分布不匀带来的干扰;导数法可以消除基线漂移;平滑法能够滤除噪声[20-21]

2.4  数据处理与评价方法

采用Unscramble X10.4Camo softwareASNorway)软件对NIRS进行预处理,采用Matlab 2016aMathwork Inc.USA)软件对样本进行变量筛选与建模,采用留一交叉验证法以交叉验证均方根误差(root mean square errors of cross validationRMSECV)为评价指标确定主因子数。以中间体D50为因变量,以对应的NIRS值为自变量建立PLS定量模型。本研究以下列参数来评价模型性能,以优选最佳模型。校正集相关系数(Rcal)、验证集相关系数(Rpre)分别表示校正模型与验证模型的拟合程度,RcalRpre越大,模型拟合效果越好;校正均方根误差(root mean square errors of calibrationRMSEC)、RMSEP分别指校正模型与验证模型中 参考值与预测值之间的均方根误差,越小模型预测性能越高;校正集偏差(BIAScal)和验证集偏差(BIASpre)分别表示校正模型与验证模型中参考值与预测值之间的偏差,其越小,模型预测精度越  [22-23]。预测相对偏差(relative standard error of predictionRSEP)是模型中参考值与预测值之间的相对偏差,一般RSEP越小模型预测性能越好;性能偏差比(ratio of performance to deviationRPD)表示模型预测性能,是标准差(SD)与RMSEP的比值,当RPD3时,表示模型预测精度高[24]。各项评价参数不能孤立参考,需要综合起来评价。

3  结果与分析

3.1  样本划分

采用随机抽样(randomsamplingRS)法划分校正集与验证集,并保证验证集中参考值范围包含于校正集中[12]。每种中间体按照31的比例划分校正集与验证集,随机选取60个样品作为校正集,20个样品作为验证集;通用模型的校正集为4种中间体校正集的总和,共240个样品,验证集为4中间体验证集的总和,共80个样品,划分结果见表1

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究 

3.2  光谱预处理方法的选择

YC中间体的近红外原始光谱见图1。本研究考察了以下预处理方法:移动窗口平滑(9点)、SNVS-G 1st9点)、基线校正、MSC、归一化法。使用上述方法对光谱进行预处理后,建立D50PLS定量模型,不同预处理方法对模型性能的影响如表2所示。以RPDRSEP为评价标准,筛选最优的预处理方法。由表2可知,原料细粉模型中,一阶求导结合S-G平滑对光谱进行预处理建模效果最优,RPD4.50RSEP2.30%;干燥颗粒模型中,采用移动窗口平滑(9点)预处理方法最佳,RPD4.12RSEP1.88%;整粒颗粒模型里,采用原始光谱建模比进行预处理后建模效果好,RPD4.15RSEP1.80%;总混颗粒模型采用移动窗口平滑(9点)方法对光谱进行预处理后建模效果最好,RPD4.84RSEP1.54%;通用模型中,采用原始光谱建模性能最佳,RPD4.60RSEP2.26%

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

3.3  特征变量筛选

筛选特征变量可以剔除无关信息,提高模型性能。本研究在上述筛选出的最佳预处理方法基础上进一步筛选特征变量。

3.3.1  基于间隔偏最小二乘法(interval PLSiPLS)筛选变量  iPLS是把全光谱划分成若干个子区间,然后在每个子区间进行建模[25]。本研究将全光谱划分成20个子区间,以RMSECV为评价指标,筛选最佳建模波段。

3.3.2  基于组合间隔偏最小二乘法(synergy interval PLSsiPLS)筛选变量  siPLS是基于iPLS,它是将全光谱划分成若干个子区间后,再把子区间任意组合起来建模。本研究是把全光谱划分成20个子区间,再以子区间组合数为4建立模型,以RMSECV为评价指标,筛选最佳建模波段。

3.3.3  基于移动窗口偏最小二乘法(moving window PLSmwPLS)筛选变量  mwPLS是从整个光谱的第一个波长点开始移动,沿波长变化的方向截取选定窗口宽度的区间,建立一系列的PLS模型[26]。本研究以初始窗口宽度为31,以10为步长依次增加窗口宽度,建立了窗口宽度为31311PLS模型,并根据RMSECV选取最佳建模波段。

3.3.4  筛选特征变量 采用3种方法建立模型的性能参数如表37所示。分别以RMSECRMSECVRMSEP为评价指标,综合评价筛选出建模的最佳波段。

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

原料细粉模型采用全光谱建模与mwPLS优选的波段建模性能相差不大,但是筛选波段后变量减少至115个,建模时间会缩短,因此选择建模波段3 999.644 018.925 739.126 136.38 cm−1
干燥颗粒模型采用siPLSmwPLS筛选变量后,模型性能均有所提高,变量数分别减少到392278个,但mwPLS筛选变量后的波点数更少且RcalRpre较大,RMSECRMSEP较小,故采用波段     4 030.504 219.494 443.194 504.906 957.917 767.86 cm−1建模。
整粒颗粒模型采用siPLSmwPLS筛选变量模型性能有所提升,变量数分别减少至31283个,但mwPLSRcalRpre更大,RMSECRMSEP也较小,且波点数也较少,故选用波段4 933.02 4 971.595 982.106 213.527 359.037 397.60 cm−1建模。
总混颗粒模型采用mwPLS法进行波段筛选后,RcalRpre均变大,RMSECRMSEP均变小,模型性能提高,因此选用波段4 015.0742 342.6  4 396.904 524.187 667.587 698.448 369.548 454.40 cm−1建模。
通用模型筛选变量后虽然降低了模型复杂程度,但是模型性能却不及全光谱模型,可能是因为通用模型是包含4个中间体信息的共用模型,采用波段筛选可能会使重要信息的流失,造成模型性能降低,故通用模型采用全波段建模。

3.4  主因子数的确定

RMSECV值为评价指标确定主因子数,主因子数选择不当会导致拟合不充分或拟合过度,一般以RMSECV值最小时对应的主因子数为最佳。本研究采用留一交叉验证法,以RMSECV为指标,考察主因子数对模型的影响。最终确定原料细粉模型、干燥颗粒模型、整粒颗粒模型、总混颗粒模型和通用模型的最佳主因子数分别为615121114

3.5  D50定量预测模型的建立

采用筛选出来的最佳预处理方法及最优NIRS波段建立D50近红外定量预测模型,见图2。优选出来的原料细粉、干燥颗粒、整粒颗粒、总混颗粒和通用模型的评价参数见表8。各项模型的RcalRpre接近于1,说明参考值与预测值相关性较高;RMSECRMSECVRMSEPRSEP较小,RPD大于3,说明模型预测性能较高,可以用于D50的定量预测。

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

3.6  模型验证与评价

将验证集样品的NIRS导入校正模型中,预测中间体的D50,并与参考值进行比较,结果见表910。原料细粉模型、干燥颗粒模型、整粒颗粒模型、总混颗粒模型及通用模型D50的平均相对预测误差分别为1.94%1.43%1.46%1.21%1.87%,均小于5%,说明2种模型的预测准确性均较高。由表11可知,独立模型与通用模型对各中间体D50的预测误差的差值均小于1%,说明二者的预测性能相近。

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

对原料细粉、干燥颗粒、整粒颗粒、总混颗粒和通用模型的验证集中参考值与预测值进行配对t检验,结果t值依次为0.220.17−0.42−0.380.75P值依次为0.8250.8660.6780.7060.454P值均>0.05,说明参考值与预测值之间无显著性差异。 

4  讨论

本研究以YC为研究对象,收集其生产过程中的原料细粉、干燥颗粒、整粒颗粒及总混颗粒共4种中间体,采用NIRS技术结合PLS建立了预测中间体D50的通用定量模型。各项评价指标表明,通用定量模型预测准确性高、能满足实际需求,且与单一模型比预测性能差异不大,可以实现对4种中间体D50的测定。
本研究中的通用模型是基于一个品种中差异不大的中间体建立起来的,通用模型预测效果较好,可能是因为中间体的D50有一定差异但还在可接受范围内,且由于这种差异使得D50的分布范围变宽,更利于建模,但对不同品种建立相关指标的通用模型的可行性还有待探索。相比激光粒度分布仪法,NIRS法测粒径会更快,若应用于在线研究将无需取样,提高分析效率。目前,NIRS通用模型在制药领域研究较少,若将NIRS技术与通用模型结合起来,建立的NIRS通用模型将具备快速准确、无损绿色、节约成本等优点,可以为中药生产过程实现在线检测相关指标提供更好的方法。
本研究是初步证明了YC 4种中间体近红外D50通用定量模型的可行性,后续完善该模型还应当加入更多的样本,以及后续生产的持续验证,并朝着在线监测方向上研究。

利益冲突  所有作者均声明不存在利益冲突

参考文献(略) 

来  源: 张永超,徐芳芳,张  欣,徐  冰,赵月梅,朱文灯,吴  云,王振中,肖  伟. 腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究 [J]. 中草药, 2021, 52(1):55-64.

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究

生物医学科研方法

基于裂区的D-最优实验设计法优化丹参川芎嗪注射液水提工艺

2021-1-15 3:45:00

生物医学科研方法

32岁的我,还能读博士吗?大龄青年读博士还有未来吗?

2021-1-15 3:54:34