摘 要: | 【目的】细胞类型鉴定是单细胞RNA测序的关键步骤之一,存在单细胞RNA测序数据分类准确率较低及各细胞类型距离特征度量不足的问题。【方法】提出一种基于多相似性损失函数(Multi Similarity Loss, MSL)的大间隔最近邻(Large Margin Nearest Neighbor, LMNN)单细胞分类方法。多相似性损失从多个角度衡量相似性,解决了LMNN算法的三元组损失函数训练样本较小时样本对之间关系利用率不高的问题,从而提升单细胞分类效果。【结果】在胰腺单细胞数据集baron_human和segerstolpe上的实验表明,基于MSL-LMNN的分类准确率高于主要度量学习方法,而且与随机森林结合的准确率达到0.96,较现有单细胞分类方法有所提升。【结论】提出的MSL-LMNN能够准确有效地识别胰腺单细胞测序数据细胞类型,具有一定的应用价值。
|