1. 背景介绍
近年来,质量源于设计(QBD)和过程分析技术(PAT)的概念被广泛接受并应用于评估过程的稳健性,监控和改进过程开发和药品生产。PAT技术,特别是在线和实时监测技术,在开发可靠的新工艺以生产具有期望质量特性的产品方面显示出巨大的潜力。它还可以通过实现方便、实质和连续的测量,从而增强传统的离线分析,帮助进一步了解该过程。
近红外(NIR)、中红外(MIR)、拉曼光谱(Raman)和荧光光谱(Fluorescent)等光谱分析方法在生物过程监测和控制方面取得了进展。近几十年来,拉曼光谱技术以其化学特异性高、受水干扰小等优点,在生物制药领域受到越来越多的关注。拉曼光谱的应用有助于实现原位测量,使实时过程控制成为一种可期的PAT工具。然而,拉曼光谱是否可以用于灌流细胞培养以自动控制VCD还没有研究。
在灌流细胞培养生物反应器中,交替切向流(ATF)系统是一种稳健且可扩展的过滤系统,它使用中空纤维膜和交替切向流以相对低的剪切力实现高效的细胞保留。在生物反应器中保存细胞的同时,提取含有抗体和乳酸、铵等栓塞物质的细胞培养液。活细胞密度(VCD)和总细胞密度(TCD)通常被设定为细胞培养过程中的关键性能参数,对VCD和TCD的监测对于确定培养阶段和异常事件具有极其重要的意义。在灌流细胞培养中保持适当的活细胞密度和总细胞密度有利于细胞状态,有助于降低由交替切向流(ATF)膜污染引起的产物滞留,并产生高生产率。目前,生物量探针还可以在线测量细胞培养过程中的VCD和TCD。许多研究人员证明生物量探测器可以帮助他们监控VCD的实时变化,从而帮助他们开发出更稳健的工艺。然而,细胞培养过程非常复杂,细胞的生长、代谢、生化和生产率以及产品质量都对制造业的成功具有重要意义。拉曼光谱使传统的细胞培养过程只需一个探针就能实时监测甚至控制许多参数,大大简化了PAT的复杂性。
Abu-Absi等人于2011年报道了原位拉曼测量结果。他们借助拉曼光谱和偏最小二乘(PLS)模型,在500L生物反应器的规模上成功地在线测量了葡萄糖、谷氨酸、铵离子、乳酸的浓度以及活细胞密度(VCD)和总细胞密度(TCD)。此外,他们还提出了基于拉曼光谱的过程开发的即时反馈策略的可能性。证明了这些参数的校准模型可以从3L扩展到15L。2014年,Berry等人基于在5L生物反应器中校准的Raman模型,通过在200L和2000L中的跨尺度预测,表明VCD和TCD的模型具有尺度依赖性。其他代谢物,如葡萄糖,乳酸和渗透压模型显示了跨尺度预测的巨大性能。为了进一步证明拉曼光谱的准确性,他们创建了第一个基于拉曼的葡萄糖浓度反馈控制和乳酸回路控制模式。此外,利用拉曼光谱仪对抗体滴度进行原位和实时监测的应用于2015年得到证实。André等人[14]基于拉曼光谱实时监测抗体效价浓度。他们相信这种方法可以为建立以实时监测和控制的方式优化重组抗体生产的反馈回路奠定基础。
拉曼技术在预测细胞培养阶段的纯度方面也显示出巨大的潜力,Ashton等人在2014年展示了紫外共振拉曼(UVRR)光谱在蛋白质纯化澄清步骤前后监测可能污染细胞培养基的残余DNA和RNA变化的潜力。Singh等人利用拉曼光谱和CLS算法在细胞分批培养中高精度地测定葡萄糖和乳酸,同时他们还为定义明确的化学物质建立了一个自制的拉曼光谱库。
近年来,拉曼光谱仪作为一种实验室和工业规模的可靠的PAT工具被广泛应用于细胞培养中。Liu等人利用相关优化弯曲(COW)方法对正常工作条件(NOC)批次的不同时间间隔的拉曼数据集进行同步,建立了多元统计过程控制(MSPC)模型,该模型能够识别生物反应器是否受到污染等异常工况。Santos等人在2018年开发了一种新的代谢物建模策略,利用样本打击方法。作者尝试将指纹拉曼光谱区域分配和成分尖峰研究结合起来,以提高模型预测能力和特异性。比较了前向区间偏最小二乘(iPLS)、PLS投影变量重要性(V.I.P)和选择比(SR)三种数据分析方法对模型参数的优化,发现iPLS和V.I.P在模型预测性能上更具前景。
灌流细胞培养作为一种连续过程的策略,近年来得到了广泛的应用,并因其较高的产品收率和稳定的PQA而受到广泛关注。ATF装置可去除抑制性副产物,如乳酸、铵、溶解二氧化碳和其他副产物的积累,同时不断添加新鲜营养素。采用灌流策略,在小型生物反应器中可以获得更高的细胞数和产量。与补料相比,灌流时细胞密度高达2.14×108个细胞/mL,产品效价高达25g/L。通常,灌流过程通过引入细胞流出来维持相对稳定的状态,从而在特定的靶细胞密度下进行,同时,由于产品保留时间较短,因此保持了重组蛋白的稳定性和质量。
在最近的FDA关于连续生产的指导意见中,强调了产品质量问题,该指导意见建议应用过程监控和使用PAT工具,以帮助生成有关于输入物料、过程中物料和最终产品的过程参数和属性的实时信息,这将为高检测能力的瞬时干扰、过程偏差、动态过程控制、更准确的物料偏移和实时放行测试(RTRT)照亮道路。因此,FDA希望通过QbD和PAT等增强型开发方法对药品生产进行连续化生产,以减少药品质量问题,降低生产成本。然而,由于灌流设备的复杂性和无菌性的挑战,在灌流细胞培养过程中很少使用原位和实时监测PAT工具。到目前为止,大多数灌注细胞培养仍然依赖于传统的人工取样和离线/近线测量,这可能导致离线采样后很长时间的延迟,使得必要时很难采取纠正措施,增加了批风险。此外,人工取样会带来更多可能导致污染的人为错误风险。因此,在灌流细胞培养中应用拉曼光谱等PAT工具势在必行。
此研究首先采用拉曼光谱法对葡萄糖、乳酸、铵离子、钠离子、钾离子等代谢物在灌注流细胞培养中的预测能力进行了评价。比较了几种活细胞密度(VCD)的建模方法,选择了最佳的拉曼反馈控制方法。建立了灌流细胞培养-拉曼集成系统,成功地进行了11天的VCD在线自动控制。
2. 方法
2.1 材料
生物过程控制器系统:Finesse G3实验室通用控制器、TruBio Delta V 5.0控制软件、3L Applikon玻璃生物反应器。ATF系统:Repligen交替切向流(ATF,Repligen,Pine Brook,NJ)系统,其中中空纤维模块由孔径为0.22μm的聚醚砜(PES)组成、 纤维直径为1 mm,过滤器尺寸为0.47 m2。拉曼系统:Kaiser RAMANRXN2多通道拉曼分析仪(Kaiser Optical Systems,Inc.,Ann Arbor,MI),激光激发波长785nm,最多四个bIO LAB-220探针。采用SIMCA14.1.2软件进行建模。OPC连接系统:Raman RunTime中的嵌入式OPC服务器,MatrikonOPC数据管理软件(MatrikonOPC,加拿大艾伯塔省埃德蒙顿)。细胞系和培养基:表达人IgG1单克隆抗体的中国仓鼠卵巢(CHO)细胞系,商业化成分明确的基础和补料培养基。
2.2 细胞培养
采用3LApplikon台式生物反应器(工作体积为1500ml)灌流培养产IgG1单克隆抗体的中国仓鼠卵巢(CHO)细胞系,采用商品化的基础培养基和补料培养基进行灌流。生物反应器的运行温度为34.5℃。在整个培养过程中pH和DO保持稳定。搅拌设定为250 RPM。
生物反应器的接种密度约为0.5× 106细胞/mL。第2天VCD达到约2.0× 106时开始基础培养基灌注,VCD大于50× 106细胞/mL时开始流加补料。细胞在两个3L生物反应器中采用相同的灌流培养方式和培养技术进行培养,反应器控制器标记为FC0A和FC0B进行区别。
使用ATF2细胞保留系统和聚醚砜过滤器(孔径:0.2μm)进行灌注培养、 膜面积:0.47 m2。对于基础培养基补料,灌流率在0.6到1.5新鲜培养基体积/生物反应器每天工作体积(VVD)之间变化。对于补料培养基,灌流速率在0.2~0.4VVD之间,以14.4min的间隔进行半连续补加,细胞流加通过精细控制器控制的蠕动泵进行。
这两个生物反应器每天进行两次无菌取样,进行离线分析,然后用于建模。取样后,约2ml无菌细胞培养液样品直接送血气分析仪(RAPIDLab® 348EX BGA,Siemens),用于pH、pCO2、pO2、Na+、k+测量。用Vi-CELL(Vi-CELL,BECKMAN)测定细胞密度、活力和细胞直径。葡萄糖,谷氨酰胺,谷氨酸,用Cedex(Cedex-Bio-HT,Roche)测定乳酸、NH4+和效价。通过渗透压计(Model 2020,Advanced Instruments)测量渗透压。
2.3拉曼光谱的获得
在线拉曼测量由Kaiser RAMANRXN2多通道拉曼分析仪(Kaiser Optical Systems,Inc.,Ann Arbor,MI)进行,激光激发波长为785nm。一个拉曼分析仪支持多达4个探针,因此它能够监测多达4个探头。因此它能够将bIO-LAB-220探针浸入3L台式Applikon玻璃生物反应器中,同时检测多达4个生物反应器。还使用了典型的200mw激光功率。每条拉曼光谱都是用10秒的曝光时间和75次积累收集的。采集模式是连续的。也采用了暗光谱减法和宇宙射线滤波器。每个光谱总共用了大约13分钟来获得。分析仪在使用前进行校准,每天进行一次自动校准,以确保整个细胞培养过程中波长的准确性。
2.4化学计量学模型
收集的拉曼光谱与离线进行的各种标准测量相关。光谱和测量的生化数据使用Umetrics的SIMCA14.1.2进行分析和处理。首先利用光谱滤波模块对校准光谱进行预处理,然后用偏最小二乘(PLS)回归方法将校准光谱与标准样品进行关联。对于用于拉曼光谱的PLS模型,它是一个一般的线性回归模型,通过将预测变量(VCD、葡萄糖、乳酸……)和可观测变量(不同拉曼位移下的拉曼强度)投影到一个新的空间,PLS模型的主要参数是加载矩阵和残差矩阵。在建模过程中,参数由观测到的y变量及其对应的x变量拟合而成。通过减小预测Y与实测Y之间的误差,自动获得参数。
影响模型质量的主要因素是拉曼光谱数据的预处理方法和x-block的选取。如图3所示,对于不同的目标(Y),基于统计性能,选择拉曼数据预处理方法和x-block范围,即Y中的交叉验证均方根误差(RMSECV)(公式1)图片(1),其中n等于样本数,i等于当前样本,yi是测量参数,图片是预测参数。对于交叉验证,使用交叉验证计算测试/训练集的RMSE。以RMSECV最佳的模型作为最终的代谢物预测模型。
对拉曼光谱数据进行适当的预处理对于建立一个性能良好的模型非常重要。本研究中常用的预处理方法是标准正态变量(SNV)和导数,这些方法用于归一化轮廓、减小信号基线偏移、减小瑞利散射和背景噪声的影响。根据统计模型性能(RMSECV),选择一阶或二阶导数滤波器对不同的相关参数进行建模。对于光谱区域的选择,重要的是去除主要由噪声、伪影、瑞利散射或其他非拉曼特征组成的光谱区域。一般建模仅限于拉曼光谱的指纹区域或根据V.I.P指数进行选择。在本研究中,常用的x-block范围为800–1800 cm-1或800-3400cm-1、投影指标(V.I.P)的变量重要性也是统计上细化x-block组选择的指标。通常建立多个模型,由最小RMSECV选择优模型。
经过预处理和光谱区域选择,建立了葡萄糖、乳酸、NH4+和活细胞密度(VCD)等的独立PLS模型。通过显示交叉验证均方根误差(RMSECV)和预测均方根(RMSEP)的观察图和预测图对模型结果进行评估。另一个重要的诊断工具,即Hotelling的T2图,可以用来理解模型的超结构和检测异常值。
2.5 拉曼光谱与生物过程控制器的集成
Raman运行时系统提供嵌入式OPC-UA服务器。Finesse Trubio配有OPC DA服务器,因此可以通过MatrikonOPC数据管理器获得预测值。集成和反馈控制回路如图1所示。如图1所示,该控制策略存在两个逻辑回路。第一种称为过程控制回路,在3L生物反应器中以恒定的频率获得拉曼信号,然后将其传输到主机,即运行时系统,主机中的SimcaKaiser模块读取光谱文件并将其转换为预测值,然后这些值通过本地网络传输到MatrikonOPC数据管理器,最终Finesse TruBio DeltaV系统读取这些值并启动我们自定义的VCD自动排放逻辑,该逻辑回路实现VCD的在线自动控制。第二个是建模循环,一旦需要建立一个新模型,就必须启动这个循环。
2.6 VCD自动反馈控制
稳定灌流培养的目标VCD设置为50×106个活细胞/mL。当VCD自动控制启动,在线VCD增加到目标VCD以上时,控制逻辑触发工作。将目标VCD与Raman在线VCD之间的误差引入P.I.D算法中,将泵速级联,并与PID算法的输出成比例。为了保证自动控制过程的稳健性,一旦在线和离线测量VCD的差值大于5×106个活细胞/m,意味着预测的VCD将失去其准确性,将最新的数据加入到VCD的PLS模型的数据集中,以提高模型的准确性。
3. 结果
3.1 灌流细胞培养的拉曼光谱
一次灌注实验的拉曼光谱原始数据如图2所示,其中y轴表示拉曼强度,x轴表示从100 cm-1开始的拉曼位移至3400cm-1。图中的每一行代表一条拉曼曲线,此时的颜色表示测得的活细胞密度(VCD)。
3.2 灌流细胞培养关键生化指标的预测
为了验证利用拉曼光谱监测灌注细胞培养的关键生化指标,即IgG浓度、细胞活力、谷氨酰胺、谷氨酸、葡萄糖、乳酸、NH4+、渗透压、Na+、K+和pCO2的可能性,根据FC0A的数据建立了各种PLS模型。它们在测试集(FC0B)上的性能如图3所示。
如图3和表1所示,IgG的PLS模型,可接受的预测RMSEP为147.48 mg/L,误差主要归因于ATF柱的产物保留率随时间变化。与Li等人对补料分批培养的良好细胞活力预测(平均误差:2.5%)相比,我们的细胞活力预测模型在灌流培养中没有这么好的表现。细胞存活率的预测结果不令人满意,RMSEP为39%,这表明细胞存活率不仅受细胞密度、细胞代谢状况或外界环境的影响,而且与基础补加速率、排放速率密切相关,因此需要进一步的工作来优化模型。考虑到这些PLS模型只在一个批次内进行了校准,并且在灌流培养模式下预测更具挑战性,对于谷氨酰胺、谷氨酸、葡萄糖和乳酸等溶质,在测试集上的预测性能是可以接受的。
值得注意的是,从第26天到第45天谷氨酸的预测偏差可能是由于模型拟合不足和批次间的差异造成的。模型对第1天到第19天的葡萄糖浓度进行了准确的预测,但第19天以后随着生物反应器中葡萄糖浓度逐渐下降到0,表现为葡萄糖进料、出料和消耗的动态平衡。我们推测培养基的异质性导致了葡萄糖浓度预测误差的增加。与补料分批模式下的葡萄糖预测相比,葡萄糖预测更具挑战性,尤其是在表观葡萄糖浓度几乎保持不变的稳定阶段。
拉曼光谱对NH4+、Na+、K+也有很好的结果。由于FC0A(训练集)和FC0B(测试集)的累积差异随着培养时间的延长而增大,预测的K+浓度在后期略有漂移。在渗透压方面表现良好,RMSEP为5mosmo/kg,这意味着可以准确预测渗透压。同时,拉曼光谱也显示了预测灌流培养时生物反应器中pCO2的潜力。
3.3. 活细胞密度模型
为了实现VCD的自动控制,获得一个稳健、准确的PLS预测模型是非常重要的。对VCD的实时准确预测有助于控制器在过程在线控制回路中做出快速、正确的响应。因此,比较了6种不同的拉曼信号预处理方法和数据源模型,即2种导数模型和3种数据源模型。数据源的变化会给模型的标定空间带来很大的差异,导致VCD预测模型性能的不同。考虑到生物反应器FC0A是为VCD自动控制而设计的,因此VCD建模考虑的第一个数据源是FC0A中的历史拉曼数据,这意味着根据FC0A从第1天到第50天的历史数据预测第51天的VCD。第二个数据源来自并联的生物反应器FC0B。训练模型的第三个数据源是来自FC0B和FC0A(第1-50天)的培养数据。
如图4所示,所有6个PLS模型在训练集上都具有可接受的预测性能,特别是对于基于拉曼光谱的一阶导数模型(左侧)。同时,针对不同数据源的模型,将数据点分布在不同的范围内。更详细地说,FC0A第1-50天的训练数据具有更均匀的VCD数据分布,而FC0B的训练数据具有更多位于VCD 45-60范围内的数据点×106细胞/mL。
如图5所示,一般情况下,一阶导数训练集的RMSECV(交叉验证均方根误差)低于二阶导数的RMSE。并从Hotelling的T-range2值方面对两种导数方法进行了比较。如图6(a)所示,对于一阶导数建立的模型,有些点超过了95%的置信限,说明一阶导数预处理会影响模型的质量。因此,从Hotelling的T2-range图来看,二阶导数预处理优于一阶导数预处理。
以下是不同型号的VCD的性能测试结果。如图7和图8所示结果表明,由于数据预处理方法和数据来源的不同,预测VCD的PLS模型具有不同的测试性能。对于拉曼光谱在流加分批细胞培养VCD预测中的应用,Nicholas在验证集中获得了14.5%的最佳RMSE,其中3批用于模型训练。Aditya对VCD模型进行了实时校正,得到了较好的结果,这意味着模型是基于一个大数据集进行训练的,在验证集中得到了1.3%的RMSE。对于模型训练数据有限的灌流细胞培养,本研究的最佳VCD模型RMSEP为4.20×106个活细胞/mL,相对RMSEP为8.3%,说明我们的VCD模型是准确的。
值得注意的是,对拉曼光谱进行二阶导数预处理的PLS模型预测的RMSE均低于一阶导数,一阶导数的预测VCD均被高估,说明在我们的情况下,拉曼光谱的一阶导数会引入建模偏差。此外,二阶导数消除了这一偏差,但方差随着预测VCD的波动而增大。
另外,数据源对VCD的预选性能也有一定的影响。FC0A和FC0B是两个具有相同起始点(接种密度、DO设定点、pH策略、温度设定)的批次。然而,这种差异随着时间的推移而增加,例如从第22天到第30天,由于乳酸的积累,FC0A的pH值从7.1降至6.8,但FC0B的pH值保持在7.1左右的稳定(图S1)。如果用FC0B训练模型,两批之间的差异会导致VCD的预测性能变差。因此,历史数据比另一批(FC0B)的数据要好得多,考虑到早期灌细胞培养过程发展阶段的批间差异是合理的。此外,图8的结果还表明,将FC0B中的数据放入FC0A生成的训练数据集中并没有提高性能。
3.4. VCD的自动控制
如前所述,使用FC0A数据的二阶导数模型或使用FC0A和FC0B数据训练的二阶导数模型具有相当的预测性能。所以我们选择了具有FC0A数据的二阶导数模型,我们假设历史数据本身不会给VCD模型带来额外的偏差。
如图9所示,该图显示了我们如何在灌流细胞培养系统中实现自动排放。首先,将培养基连续注入生物反应器,在ATF细胞保留系统的帮助下连续收获产品。在VCD的自动控制之前,细胞以恒定的泵速从生物反应器中排出,需要定期修改。拉曼光谱可以预测代谢物和VCD,并通过OPC连接将值传递给deltaV控制器。在deltaV控制器中,细胞放气泵的设定值被级联到VCD模块的PID输出。如图10所示,两种将泵级联到VCD PID输出的一般方法被应用于VCD自动控制。1) 从第51天到第56天,泵的速率被限制在10~20 g/h,以确保过程的稳健,因此泵的工作就像“启动”和“打开”状态之间的开关。2) 在第56天之后,在deltaV系统的帮助下应用另一个VCD自动控制策略,VCD PID输出根据泵速率使用以下等式进行缩放:图片,其中泵速(g/h)是指泵的排放速率,PID输出(0-100)是指通过OPC连接从拉曼分析仪传输到deltaV系统的在线VCD信号的PID输出。这样,最大排放速率应在0.48VVD左右,并假定该控制回路对在线VCD的变化更为敏感。VCD的自动控制结果如图10所示,目标VCD被设置为50× 106细胞/mL,这是灌流细胞培养的常见设置。与红色填充圆相比,蓝线指示的预测VCD值是可接受的。而且,预测值围绕目标VCD波动,即50× 106个活细胞/mL。一旦在线预测VCD高于50× 106个细胞/mL,泵将如上所述开始工作。在P.I.D控制策略的帮助下,当更新的VCD降低到目标VCD时,泵速逐渐减小到0。如图10所示,很明显离线VCD在目标VCD周围具有更高的振幅,这表明未来的工作需要更多的优化。此外,从第51天到第56天,第一种VCD控制算法运行良好,从第56天到第62天,采用第二种VCD控制方法,在线VCD和离线VCD都在目标VCD附近波动,除了一个异常值。第59天的异常值应归因于VCD测量误差。因此VCD控制算法从第51天到第62天有效地工作。
表2中的结果还显示,从第51天到第62天,在线和离线的受控VCD值的标准偏差分别为1.76和2.67,这与图10中的趋势一致。在线VCD和离线VCD预测值的平均值都稳定地保持在目标VCD,分别为50.98× 106个活细胞/mL和50.67× 106个活细胞/mL。因此,本研究成功地开发出一套可行的哺乳动物细胞培养液灌流VCD自动控制策略。
4. 结论
此次研究建立了灌流细胞培养-拉曼集成系统,实现了关键代谢物的在线监测和活细胞密度的自动控制。与生物量探针、pCO2探针、葡萄糖/乳酸探针等细胞培养过程中的PAT技术相比,多功能PAT技术在降低操作复杂度的同时,具有更大的应用前景。结果表明,用一批刚校准的模型,RMSEP分别为0.71g/L、0.24g/L、5mosmo/kg和147.48mg/L,可准确预测葡萄糖、乳酸、渗透压和IgG浓度。另外,谷氨酸、谷氨酰胺、pCO2、Na+和K+等参数的预测精度也可以接受。
结果还表明,对拉曼光谱进行二阶导数预处理比一阶导数具有更好的VCD预测性能,批次本身的历史数据比平行批次的VCD建模和标定性能更好,这意味着对模型输入变量进行细致的统计筛选以及数据预处理方法对模型性能有着重要的影响。提出了一种可行的灌流哺乳动物细胞培养VCD的自动控制策略,即在线和离线VCD保持在目标VCD为50×106个活细胞/mL,即对应11天分别为50.98±1.76个活细胞/mL和50.67 ±2.67个活细胞/mL。这些工作为PAT在生物制品连续生产中的应用奠定了坚实的基础,显示了实时调节产品质量的巨大潜力,为解决生物制品连续生产中的质量问题提供了稳健的工具。