新闻资讯
介绍
红外光谱是一种用于筛查和诊断各种疾病的新兴技术。它有助于非破坏性、无标记地提取生化信息,以评估疾病,而不会干扰常规临床工作流程。它的工作原理是基于组织、细胞和体液中脂质、蛋白质、核酸和碳水化合物的分子振动变化引起的生理和病理条件的光谱特征的变化。(1−5)
红外光谱已被用于通过分析蛋白质-蛋白质、蛋白质-脂质、蛋白质-核酸相互作用的变化以及构象变化来区分健康对照样品和不同阶段的癌症。单变量方法,如比率分析、生化相关分子峰面积分析和二级蛋白质结构分析,已被用于评估与恶性肿瘤相关的分子改变。(5,6)红外光谱还经过主成分分析、聚类分析、偏最小二乘分析、线性判别分析和支持向量机等各种多元分析,以开发用于诊断和预测不同阶段/级别癌症的机器学习模型。(5,7,8)
切除活检或从体内刮取细胞,然后进行化学染色和视觉识别,被认为是癌症诊断的金标准。(9−11)然而,这些技术通常复杂且耗时,并且用于染色的化学染料可能具有细胞毒性。此外,组织病理学本身无法提供有关疾病的详细生化信息,并且其诊断能力受到操作者间变异性的限制。(7)使用细胞(光谱细胞病理学)和组织(光谱组织病理学)进行红外光谱病理学诊断可以克服与传统组织病理学相关的问题。(5,12−15)这些技术可以以非破坏性的方式提供无标记的化学信息。这两种技术都评估“局部采样”后提取的样本,其中光谱特征是在细胞水平上获取的。
从患病的内脏器官中提取样本通常需要时间和精力,这被认为是一个缺点。另一方面,与固体活检的风险相比,液体样本更容易获得。为了克服固体活检和进一步评估的局限性,提出了对体液、血液或血液衍生物进行光谱分析。(16−18)然而,使用血液或血液衍生物的光谱分析是有限的,因为每个样本代表一种“全局采样”,只能提供患者的整体健康状况,而不能提供特定疾病或器官相关的诊断。
在过去的十年中,红外光谱领域在使用血清/血浆进行疾病诊断方面的研究成果不断增加,特别是在癌症领域。(19−22)血清/血浆的红外光谱由蛋白质、胆固醇、甘油三酯、尿素、葡萄糖和其他更稀的化合物的光谱特征组成。(22)使用血清/血浆作为研究样本的技术是一种简单、非侵入性的方法,不需要大量的样本制备。然而,使用血液衍生物进行光谱分析的可靠性存在争议,因为这些样本的光谱特征可能受到各种伪影的影响。混杂因素,例如血清/血浆干燥过程中的咖啡环效应 (CRE)、各种测量策略的光学效应、溶血、饮食因素导致的血液中葡萄糖和尿素水平的变化、心血管异常和/或异常导致的生物标志物的存在患者或对照组的肝功能、感染、酗酒、年龄和性别可能会改变血液的生化特征,并最终影响光谱诊断。(23,24)数值方法的适当选择也是获得精确诊断结果的关键因素。由于这些混杂因素可以改变红外光谱特征,因此在报告血液衍生物特异性光谱疾病标记物的任何研究中都必须考虑这些方面。
这些混杂因素存在显着的局限性,因为它们存在于筛查测试的大量目标人群中。考虑到这些问题,最近对干血衍生样本的光谱研究的研究,例如前列腺的诊断,(18,25)子宫内膜,(26)卵巢,(27−29)肺,(30,31)肝脏,(32)胸部,(16,33)食道,(34)和大脑(19,35,36)癌症,必须根据其疾病诊断的主张重新评估。此类研究可以揭示这些混杂因素,这些混杂因素可能产生比实际疾病特异性标记物大得多的信号。尽管红外光谱在检测基于分子振动变化的生化变化方面有其自身的优势,但我们在此提出了在血液样本上使用该技术的局限性,并指出需要遵循标准程序,同时考虑到所有混杂因素以获得正确的诊断。
与流体样品分析相关的挑战
分析任何样品的最佳方法是在其存在的相同状态下使用它。通过热、机械或任何其他方式添加或减少任何成分都可能会破坏样品成分并最终影响最终结果。(37)然而,为了便于分析或适应特定分析仪器的采样要求,有时即使样品存在一些化学变化,物理上改变物质的状态也是不可避免的。
血清和血浆以流体状态存在。因此,在相同状态下评估血清/血浆将提供生物学上真实的分析结果。血清/血浆的近 90% 体积由水组成。(38,39)由于水 O-H 弯曲振动带的干扰,传统红外光谱在 1500–1700 cm –1区域的蛋白质酰胺 I 和 II 谱带中出现伪影。(16)另外~10%的血清/血浆含有肌酐、白蛋白、尿素、各种氨基酸、蛋白质、电解质和其他成分。(38)在正常或患病条件下,这些 ~10% 生物学相关成分的光谱特征变化有助于实际诊断。因此,通过光学方法或统计方法来分析流体样品以避免水的影响,或者在干燥水含量后对样品进行分析是可能的选择。
使用传统红外光谱仪进行液体采样和分析是一项繁琐的任务。液体生物样品的红外光谱检查仅限于所采用的采样方法的极短相互作用长度(大约10μm或更小)。衰减全反射 (ATR) 几何结构或微流体比色皿通常用作液体样品分析的采样方法。使用这两种技术,只能评估极薄的样品。(1,40)为了克服这个问题,Pupeza 等人。最近推出了一种光学工具:“场分辨红外光谱”。(41)他们使用波形稳定的少周期中红外激光脉冲通过共振吸收来激发分子振动。通过隔离样品特定电场的超短部分,可以提供没有透射和热背景的红外光谱。然而,红外光谱仪的激光器和敏感光学元件等组件限制了其便携性。另一方面,ATR-IR 光谱系统较小,可用作便携式系统,在世界发展中国家或欠发达地区的典型医院环境和农村筛查中心进行疾病诊断。(42,43)
在进行 ATR-IR 光谱采集之前,血样需要在表面上干燥。在室温下在环境大气中干燥血液样本会导致样本沉积出现不规则的环状图案。(44)当由挥发性和非挥发性物质组成的固着液滴在固体表面上干燥时,会形成环状固体污渍。挥发性物质的蒸发导致“接触线钉扎”,从而导致非挥发性物质流向接触线的毛细管流动。这种现象称为咖啡环效应(CRE)。(45)根据采样方法和所使用的红外兼容基质材料,血清或血浆的干燥可能导致 CRE 的形成。这种 CRE 的形成会扭曲光谱数据的质量,并导致薄膜内蛋白质二级结构的异常。(46)血液衍生成分在干燥时发生分级,导致整个薄膜的化学成分不均匀。由于更易溶解的成分集中在该区域,薄膜的中心区域长期保持湿润。这导致薄膜特定区域的蛋白质浓度增加,最终导致蛋白质-蛋白质相互作用增加,导致酰胺 I 带展宽。(46)
因此,为了从干燥的血液衍生样品中获得正确的光谱,必须消除 CRE。CRE可以通过采取各种物理方法来抑制,例如防止接触线钉扎、中断接触线方向的毛细管流以及避免颗粒被毛细管流输送到液滴边缘。(45)这些方法包括通过疏水表面和电润湿来脱钉接触线;通过电渗流、热和表面活性剂马兰戈尼流、湿度循环以及使用多孔基质来干扰毛细管流动;并通过颗粒-液体-气体和颗粒-固体-液体界面相互作用捕获溶质。为了实现无需 CRE 的干血衍生点,可以采用这些方法中的任何一种(图 1)。然而,要在农村健康筛查环境中使用这种技术,需要一种简单的干燥方法。作为避免CRE的手段,低温冷却等方法,(47)湿度法和机器人沉积需要太多的材料和组件,而更简单的方法,如修改红外反射采样表面和使用具有成本效益的溶剂辅助干燥,则更可取。(48−53)
图1
图1. (a和b)咖啡环效应形成和抑制的示意图,(a和c)环境大气中的蒸发和CRE形成,(b和d)受控大气中的蒸发(-30°冰干燥) C,此处)导致 CRE 的消除(经参考文献许可使用 (47),版权所有 2019 Wiley)。(e) 血浆在环境大气中蒸发后形成 CRE,以及 (f) 在受控乙醇气体气氛下通过蒸发消除 CRE。
通过改变表面形态来增加红外反射玻片的疏水性是避免 CRE 形成的一个可能选择。表面疏水性的增加导致接触角滞后的减少。较低的接触角滞后意味着接触线钉扎减少,最终导致 CRE 抑制。通过产生微观粗糙度对载玻片表面进行物理修饰,例如在红外反射载玻片上引入微柱,可以消除 CRE 问题。(35)
还可以采用无需任何外部加热即可蒸发的非破坏性、无毒/低毒液体建立颗粒-液气界面相互作用系统,以避免血液衍生物CRE的形成。(45)乙醇是一种廉价、广泛使用且相对无毒且易于蒸发的溶剂,是创建颗粒-液体-气体界面的良好选择。(54)将血滴放入使用乙醇的受控蒸气气氛中可以避免 CRE。使用含乙醇的玻璃/塑料培养皿以及带有血滴的红外反射载玻片可以轻松设计该装置。载玻片必须放置在培养皿内液面上方。乙醇的缓慢蒸发将在培养皿内产生受控气体气氛,使血滴缓慢干燥而不形成咖啡环。较高浓度的乙醇蒸气会导致血液衍生物中各种蛋白质(如白蛋白、纤维蛋白原和免疫球蛋白 G)沉淀。(55)因此,干燥过程中最好使用低浓度乙醇(10%)(图1)。任何类似于乙醇的低毒/无毒、低/非破坏性溶剂,能够在封闭室内产生受控蒸气气氛,也可用于消除 CRE。
不同测量策略的优缺点
分析物在 ∼4000–400 cm –1区域的吸收使用光谱仪或干涉仪记录。几十年来,基于透射反射(半透反射)干涉仪和衰减全内反射几何结构的 FTIR 光谱技术,由于与传统的基于光谱仪的红外技术相比易于使用且具有更好的信噪比 (SNR),因此被广泛使用。然而,量子级联激光器 (QCL)(一种相干、高亮度、波长可调光源)的出现在过去二十年彻底改变了红外生物医学光谱和成像。基于 QCL 的红外光谱主要用于透射几何结构,与基于干涉仪和光谱仪的技术相比,其信噪比 (SNR) 更高。血液衍生物分析中采用的各种红外光谱技术的品质因数总结见表格1。(56−62)
由于样品基质,光程受到指纹区域吸收的限制。例如,水-OH弯曲振动吸收会干扰血清和血浆等血液衍生物中蛋白质(白蛋白/球蛋白)的酰胺I带,将路径长度限制为<5μm。 样品的路径长度受到穿透深度 (dp) 的限制,穿透深度随波长、入射角和晶体折射率而变化。例如,对于 2,500–10,000 nm 波长范围,dp 的变化范围为 ∼1 到 2 μm。(62) QCL IR 光源的高亮度能够在数十微米的光程长度内测量水样,从而提高分析物的检测限 (LOD)。
自立式波场(61)或来自样品和多层低发射氧化锡涂层基底的入射和反射光束的干扰使光谱峰相对于波长非线性扭曲。 对于纯吸收型 ATR 信号,ATR 晶体的折射率必须大于样品的折射率。否则,由于折射率的实部和虚部对信号的贡献,光谱形状会失真为具有非线性背景的类似导数的特征。例如,血清或血浆的折射率为~1.3,(62)因此,η ATR > 1.84(对于 45° 入射角)。 QCL 红外激光器的高亮度会因强度波动而产生额外的噪声,尤其是在脉冲操作中。平衡检测模块可以抑制激光波动引起的噪声。(60)
由于自然因素导致血液成分不一致
文章部分跳到
年龄和性别的差异与血清脂质标志物、乳酸脱氢酶和γ-谷氨酰转移酶的变化有关。(63)乳酸脱氢酶和γ-谷氨酰转移酶是IR活性生物分子。乳酸脱氢酶在 1650 cm –1附近显示酰胺 I 吸收,源自蛋白质的羰基伸缩振动。γ-谷氨酰转移酶在波数区域 1600–1700 cm –1中显示由蛋白质二级结构(如 β 折叠、无规卷曲、α 螺旋和 β 转角)引起的条带。(64)大多数基于血液衍生物的 IR 癌症筛查研究都对研究对象进行了年龄匹配和性别匹配。因此,我们认为这可能不是主要的混杂因素。
溶血还会导致血液衍生物的光谱特征发生变化。(65)血液样本的溶血是由于红细胞(RBC)破裂导致细胞内成分尤其是血红蛋白的释放。(66)红细胞裂解可能发生在处理血液的不同阶段,例如收集、运输和保存。这些潜在问题可以通过缓慢抽血、避免泡沫以及与抗凝剂温和混合来避免。因此,应由经过培训的人员采集血液进行红外光谱分析。其他因素也可能导致溶血,例如遗传性和获得性溶血性贫血、抗体介导的红细胞溶解、红细胞膜异常以及红细胞细菌溶解。(66−68)溶血会导致血红蛋白的红外光谱特征发生变化,特别是与蛋白质二级结构特征相对应的谱带,例如 α 螺旋 (1657 cm –1 )、平行和反平行 β 折叠 (1640 和 1680 cm –1 ) 以及酪氨酸环(1517 厘米–1)。(69)因此,准确记录患者病史非常重要。
由于合并症和/或饮食的协同作用导致血液成分不一致
由于食物或液体的摄入而导致的血液衍生物的生化变化是一个潜在的混杂因素。全血、血浆或血清中葡萄糖和尿素的浓度可能会根据饮食摄入量而变化,这需要在血液衍生物特异性 IR 诊断研究中解决。(70)在健康的非糖尿病成年人中,血糖浓度可能在 70 至 140 mg/dL 之间变化,与最后一餐的时间和成分有关。然而,患有轻度至重度糖尿病的成年人,血糖水平可能会高出 2-3 倍。(70,71)此外,正常血尿素水平在 6 至 24 mg/dL 之间变化,但高蛋白饮食、脱水和肾功能异常会导致血尿素水平升高。(72,73)葡萄糖和尿素是 IR 活性生物分子,因此,其血液浓度的任何变化都将是潜在的混杂因素(图 2a)。
图2
图 2. (a) 使用 Gaussian 软件生成的葡萄糖(黑色)和尿素(红色)的红外吸收光谱以及FAEE(绿色)的计算机红外吸收光谱(支持信息中提供了方法)。(b) 干燥的 LDL、HDL 和血清膜的红外吸收光谱。(c) 健康对照牛 (A) 和患有急性感染的牛 (B,中度感染;C,严重感染) 液体血清的二阶导数红外光谱的比较。酰胺 I 区域中发现的红外光谱变化可归因于血清蛋白,并且可以与白蛋白/球蛋白比率相关。(经参考文献许可使用 (22),版权所有 2002 牛津大学出版社并经参考文献许可 (80),版权所有 2008 Wiley]。
对于葡萄糖,由于 O-H、C-H、C-O 和 C-O-C 振动而产生的红外吸收带位于 3570-3120、3085-3020、1230-1000 和 1275-800 cm-1 区域–分别为1。佩蒂布瓦等人。使用 997–1062 cm –1吸收区域中血清样品的红外特征评估血糖浓度的变化。(74)使用全血的 ATR 光谱,Guang 等人。利用吸收区域 1500–1000 cm –1的变化将 2 型糖尿病患者与健康对照区分开来。(75)尿素的红外吸收光谱在波数区域 1683–1560、1495–1400 和 1190–1005 cm –1中显示出由于 C=O、C–N 和 N–H 振动而产生的谱带。佩雷斯-瓜伊塔等人。通过对尿素特定波数区域 1683–1560 和 1495–1405 cm –1应用偏最小二乘回归模型来评估血清样品中尿素含量的变化。(76)因此,血糖/尿素水平的任何变化都会反映在血液衍生物的红外光谱中,这在任何基于血液的诊断研究中都是潜在的混杂因素。
酗酒和相关的肝损伤会导致血液中酶和蛋白质浓度升高,例如 γ-谷氨酰转移酶、丙氨酸转氨酶、天冬氨酸转氨酶和载脂蛋白 J。(77)脂肪酸乙酯 (FAEE) 是近期乙醇消耗的标志物,也是一种红外可检测的生物分子,可能会带来挑战。(77)由于 1000-1800 cm –1指纹红外区域中的C-H 振动导致显着的红外波段(图 2a ) ,FAEE 也可能使饮酒成为潜在的混杂因素。此外,非酒精性脂肪肝还会引起多种酶的异常变化。
血液中高密度脂蛋白(HDL)和低密度脂蛋白(LDL)的变化也会引起血清红外光谱中脂质和蛋白质振动带的相应变化(图2b)。(22)由胆固醇酯的酯C=O基团和磷脂磷酸二酯基团的不对称和对称伸缩振动引起的脂质吸收带分别出现在1735、1242和1088 cm –1处。1655 cm –1处的酰胺 I 谱带(C=O 拉伸)和 1546 cm –1处的酰胺 II 谱带(N–H 弯曲)源自蛋白质中肽基团的振动,而脂质和蛋白质 CH 3组均出现在 1446 和 1378 cm –1。考虑到高胆固醇血症的流行、代谢综合征的相关成分(例如肥胖和高血压)以及正在进行或过去的治疗,任何大规模筛查的实施都可能受到这些变化的不利影响。
最后,由于各种炎症分子的释放、细胞代谢的变化和细胞过度死亡,免疫和炎症反应也可能影响血清谱。慢性病毒和细菌感染也可能是潜在的混杂因素。这些病原体的存在可能会改变血清蛋白、脂质、核酸和碳水化合物的水平,从而导致红外光谱特征的差异。(23)此外,不同人群的肠道微生物群也可能改变血液参数。(78,79)在一项旨在检测牛血清中错误折叠的朊病毒蛋白以确认牛海绵状脑病的研究中,Lasch 等人。由于非特异性免疫反应,观察到正常牛血清和受感染牛血清之间存在巨大差异,表现为白蛋白与球蛋白比率的变化。(80)该小组还观察到,由于球蛋白的 β-折叠蛋白贡献增加,导致白蛋白与球蛋白的比率发生变化,导致1637 cm –1处的二阶导数酰胺 I 组分增加(图 2c)。尽管这与各种癌症红外光谱诊断研究的血清样本研究有很大不同,但这些癌症背景下的炎症可能是分化的来源,并且如果炎症无法区分,则在应用于更大的人群时可能会带来挑战来自对常见感染或其他潜在免疫疾病的免疫反应。这些多重光谱影响确实引起了人们对诊断结果的担忧,因为光谱数据可能会受到所研究癌症的非特异性因素的影响,因此可能会降低对更广泛人群的普遍性。
数值分析方法的优点和局限性
文章部分跳到
选择数值方法以便通过对光谱数据集的训练、验证和盲测来获得正确的诊断结果是一项至关重要的任务。通常使用多元线性回归、主成分回归、主成分分析-线性判别分析、偏最小二乘判别分析、人工神经网络、随机森林、支持向量机等方法来实现敏感性和特异性。这些方法在根据样本大小、数据集维度、数据集中存在的噪声以及数据中存在的异常值得出正确的诊断结果方面有一些优点和局限性(表 2)。鉴于异质性的不同来源,对收集的数据进行过度拟合是一个令人担忧的问题,因为该测试正在进行当前的前瞻性试验,这可能会大大降低该测试的敏感性和特异性。所选数值方法的局限性可能会成为获得正确诊断结果的潜在混杂因素。(81−91)
结论
各个小组提出的血液衍生物红外光谱分析高通量技术经过精心设计,可以满足基于临床的低成本筛查测试的需求。然而,在所有可能掩盖信号的因素中,在实际临床人群中明确证明其功效之前,对这种方法的热情应该受到抑制。讨论了使用红外光谱作为诊断工具期间遇到的主要混杂因素。通过修改红外反射采样表面或通过溶剂辅助干燥方法,可以避免在干燥血液衍生物时形成 CRE。在光谱评估之前,必须考虑心血管和肝脏健康、糖尿病和感染等健康史。饮食规律一定要统一,必须限制所有参与此类疾病筛查试验的个人饮酒。必须根据光谱数据集的数量和质量来选择数值方法以获得灵敏度和特异性。以工作流程的形式,我们提出了获得正确的基于红外光谱的诊断所需遵循的各个步骤(图3)。该工作流程强调,研究设计和数据处理必须考虑所有讨论的潜在混杂因素。最后,建议当红外光谱被视为使用血液样本的诊断工具时,应遵循精心制定的标准操作程序。












