基于混合正则化的无标签领域的归纳迁移学习 |
| |
引用本文: | 庄福振,罗平,何清,史忠植.基于混合正则化的无标签领域的归纳迁移学习[J].科学通报,2009,54(11):1618-1625. |
| |
作者姓名: | 庄福振 罗平 何清 史忠植 |
| |
作者单位: | ① 中国科学院计算技术研究所智能信息处理重点实验室, 北京 100190;
② 惠普中国实验室, 北京 100084;
③ 中国科学院研究生院, 北京 100049 |
| |
基金项目: | 国家自然科学基金(批准号: 60435010, 60675010)、国家高技术研究发展计划(编号: 2006AA01Z128, 2007AA01Z132)、国家重点基础研究发展计划(编号: 2007CB311004)和国家科技支撑计划(编号: 2006BAC08B06)资助项目 |
| |
摘 要: | 近年来迁移学习已经引起了越来越广泛的兴趣, 签数据以及源领域数据是不同分布的分类问题, 且建立一个归纳分类模型对新来的目标数据进行预测. 首先分析了直推式迁移学习(transductive transfer learning)中存在的类别比例漂移问题, 然后提出归一化的方法使得预测的类别比例接近于实际样本类别比例. 更进一步, 提出了一种基于混合正则化框架的归纳迁移学习算法. 其中包括目标领域分布结构的流形正则化, 预测概率的熵正则化, 以及类别比例的期望正则化. 这个框架被用于从源领域到目标领域学习的归纳模型中. 最后, 在实际文本数据集上的实验结果表明, 提出的归纳迁移学习模型是有效的, 同时该模型可以直接对新来的目标数据进行预测.
|
关 键 词: | 迁移学习 归纳学习 直推式学习 混合正则化 |
收稿时间: | 2008-07-08 |
修稿时间: | 2008-11-22 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科学通报》浏览原始摘要信息 |
| 点击此处可从《科学通报》下载免费的PDF全文 |
|