基于隐含主题和语义树的医学文本自动批注 |
| |
引用本文: | 李博,文敦伟,王珂,刘景鑫.基于隐含主题和语义树的医学文本自动批注[J].吉林大学学报(信息科学版),2012,42(1):234-239. |
| |
作者姓名: | 李博 文敦伟 王珂 刘景鑫 |
| |
作者单位: | 1. 吉林大学 通信工程学院,长春 130012;
2. 阿萨巴斯卡大学 计算机与信息系统学院,阿萨巴斯卡 T9S3A3, 加拿大;
3. 吉林大学 中日联谊医院,长春 130033 |
| |
基金项目: | 国家自然科学基金项目(60372062). |
| |
摘 要: | 针对医学文本缺乏可量化数据结构,基于关键词模型的文本处理方法不适用的问题,在研究词之间潜在语义关联和关键词树结构的基础上,构造了一种基于潜在语义树的语义分析模型用于医学文本的数据挖掘。进一步地将隐含主题与潜在语义的研究相关联,设计出一种基于潜在狄利克雷分配和潜在语义树模型的文本处理方法,可针对不同类型的医学文本生成有一定可读性的自动批注。该方法形成的自动批注主观性低,其准确度和可读性均高于关键词模型的处理结果,可辅助医生进行医学文本的批注和分类,从而减轻其工作量。程序结果表明,该方法目前可应用于对医学图像所见形成诊断意见、对病人病历进行摘要形成和对病症描述给出对症处方等方面,批注的语义匹配度可达67.7%,文本的平均可读性为60.02%。
|
关 键 词: | 信息处理技术 医学文本 自动批注 潜在狄利克雷分配 潜在语义分析 语义树 |
收稿时间: | 2011-06-27 |
Automatic annotation for medical texts based on hidden topic and semantic tree |
| |
Institution: | 1. School of Communication Engineering, Jilin University, Changchun 130012, China;
2. School of Computing and Information Systems, Athabasca University, Athabasca T9S3A3, Canada;
3. China-Japan Union Hospital, Jilin University, Changchun 130033, China |
| |
Abstract: | |
| |
Keywords: | information processing medical texts automatic annotation latent Dirichlet allocation latent semantic analysis semantic tree |
|
| 点击此处可从《吉林大学学报(信息科学版)》浏览原始摘要信息 |
| 点击此处可从《吉林大学学报(信息科学版)》下载免费的PDF全文 |
|