摘 要: | 电子医疗系统中的医疗健康数据为医学研究和医疗实践奠定了强大的数据基础,如何充分利用这些数据进行探索和分析,更好地支持临床决策和大众健康仍然面临着诸多挑战.因此,对中文医疗命名实体识别方法和研究现状进行归纳分析,对于医学研究具有一定的指导意义.本文阐述了医疗命名实体识别任务的定义,分析并提出了中文医疗命名实体识别的研究热点:语义缺失、资源不足问题、命名实体嵌套.详细介绍了中文医疗命名实体识别的研究现状,从最初的基于规则和字典方法到基于传统的统计学习方法再到现在的基于深度学习方法,不断地将新技术应用到命名实体识别研究中以提高性能.系统总结了常用的若干数据集和实验测评指标,以此评价了中文医疗命名实体识别模型的性能.通过综合论述和分析给出了数据增强等未来的研究建议.
|