单细胞多组学技术可以对细胞和组织进行深入的系统级生物学理解。然而,捕获不同玩法的全面且也许基于系统的解析具有挑战性。为此,正在开发用于多组学单细胞解析的生物信息学和机器学习方式。
目前尚不清楚当前的工具是否可以化解模态集成和跨模态预测的双重问题,而无需进行大量的参数微调。
今年,研究人员设计了 LIBRA,一种基于神经网络的框架,用于学习配对的多组学概况之间的翻译,从而构建共享的潜在空间。此外,他们还实现了一种变体 aLIBRA,它可以通过识别优化全面任务和预测任务的参数搭配来进行自动微调。该论文发表在《定量生物学》杂志上。
全部模型参数和评估指标都可以通过最少的用户迭代提供向用户。此外,aLIBRA 允许经验丰富的用户实施自定义设置。LIBRA 工具箱可作为 R 和 Python 库在 GitHub (TranslationalBioinformaticsUnit/LIBRA) 上不收费获得。
LIBRA 在八个多组学单细胞数据集(包括三种组学搭配)中进行了评估。大家观察到,在评估提升集成潜在空间中细胞类型(聚类)分辨率的能力时,LIBRA 是一种最先进的工具。
此外,在评估跨数据玩法的预测能力时,例如从基因表达预测染色质可及性,LIBRA 优于现有工具。正如预期的那样,自适应参数优化(aLIBRA)显着提升了从配对数据集学习预测模型的性能。