首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
重抽样技术——自举法   总被引:2,自引:0,他引:2  
自举法是1个容量为n的原始样本中重复抽取一系列容量也是n的随机样本,并保证每次抽样中每一样本观察值被抽取的概率都是1/n(复置抽样)。这各方法可用于检查样本统计数θ的基本性质,估计θ的标准误和确定一定置信系数下θ的置信区间。提出单变量自举、多变量自举和离回归自举3种方法,并各附实例,也简要地讨论了重抽样的另一种技术--自析法。  相似文献   

2.
提出一种基于自动编码特征的汉语解释性意见句识别的分类方法。首先从汽车和手机两个领域的产品评论中构造一个解释性意见语料库, 然后采用分类的方法进行解释性意见句识别。特别地, 采用自动编码技术表示和学习解释性意见句分类的词向量特征。最后, 在支持向量机框架下通过实验优选解释性词向量 维度, 并与一些传统特征表示方法进行比较。实验结果表明, 与传统的卡方、信息增益和TF-IDF及其组合方法相比, 自动编码特征的引入能有效提升汉语解释性意见句识别性能。  相似文献   

3.
属性抽取的目标是从非结构化文本中抽取与文本实体相关的属性和属性值,然而在电商场景下基于序列标注的模型缺少应对大规模属性抽取任务的可扩展性和可泛化性能力。本文提出基于阅读理解的商品属性抽取模型,通过额外加入问句来强化模型对属性的理解,结合双仿射注意力机制捕获问句和文本之间的语义特征,进一步提高模型的抽取性能。本文在电商数据集上对不同类型问句和不同解码器进行了对比实验,结果表明本文提出的方法优于多个基线模型,相较于OpenTag和SUOpenTag模型,属性抽取的F1值分别提升7.70%和3.26%,未登录词识别的F1值分别提升15.51%和8.12%。  相似文献   

4.
粗糙集和决策树都属于归纳学习方法,都可以从一个离散值决策表中抽取出规则.本文从算法过程、计算复杂性、规则个数、泛化能力、稳健性几个方面对粗糙集和决策树进行了比较研究,得出了一些重要结论,能为相关研究提供一些有价值的参考.  相似文献   

5.
基于卷积神经网络的合成孔径雷达图像目标识别   总被引:1,自引:1,他引:0  
为了解决现有合成孔径雷达(SAR)图像目标识别算法识别率不高、泛化能力不足的问题,提出一种基于卷积神经网络的SAR图像目标识别模型CMNet网络。通过设计针对SAR图像特点的特征提取网络,在损失函数中引入中心损失与Softmax损失联合监督训练过程,兼顾类内聚合和类间分离,提高算法精度和泛化能力。网络模型中所有卷积层后引入批量归一化层加快模型收敛速度、防止过拟合。实验使用美国运动和静止目标获取与识别数据库进行测试,10类目标平均识别率达到99. 30%。结果表明,提出的CMNet网络模型具有较高的识别率和泛化能力,在公开数据集上取得较好结果。  相似文献   

6.
给出F-规律预测,F-规律预测的规律挖掘概念,提出F-规律预测的规律挖掘定理与F-规律预测的规律挖掘原理。F-规律预测的规律挖掘是预测系统中未知规律的一个新的研究方向。  相似文献   

7.
该文结合Zeyde等人提出的低分辨率图像自举算法和双重稀疏性字典的训练方法,提出了一种新的单幅图像超分辨率重构方法。该方法在训练字典的过程中,首先对低分辨率训练样本图像采用自举算法进行超分辨率重构,然后将自举重构输出图像与低分辨率、高分辨率训练样本图像求差,并将两幅差值图像的小波分解系数作为样本数据源,训练具有双重稀疏性的字典对。文中详细讨论了结合低分辨率图像自举和双重稀疏性字典训练的单幅图像超分辨率重构算法框架,并通过实验比较证明,该文方法较其他方法具有更好的超分辨率重构效果。  相似文献   

8.
为解决无人机对地攻击决策问题, 对影响地面目标威胁度的指标因素进行了分析和量化, 构建了基于在线支持向量的目标威胁度预测模型。利用在线支持向量机实现目标威胁度排序, 进而完成空对地的攻击决策。研究的空对地决策算法具有在线训练、 模型精确度高、 需要样本少和泛化能力强等特点, 有利于快速准确地进行空对地攻击决策。最后, 通过仿真实例验证该算法的正确性。仿真结果表明, 在线支持向量机在计算目标威胁度过程中速度快且精确度高。  相似文献   

9.
本文对聚变产生的α粒子自举电流进行了研究,研究中采用了简便的Pade近似形式,同时考虑了回旋角散射效应和慢化过程中牵引作用的影响,给出了α粒子自举电流计算的理论表达式.采用ITER装置参数进行了数值计算,得到了α粒子自举电流的密度分布和大小,研究了影响自举电流大小的物理因素.结果表明α粒子自举电流随中心等离子体初始温度、密度和α粒子初始能量的增大而增大.结果表明α粒子自举电流较小,只占总自举电流的7%左右.  相似文献   

10.
文本挖掘技术综述   总被引:17,自引:0,他引:17  
文本挖掘,是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程.对其进行深入的研究势必将极大地提高人们从海量的文本数据中提取信息的能力,具有很高的商业价值.首先介绍了文本数据挖掘的研究情况,然后给出了文本挖掘的框架,对文本挖掘中信息的抽取技术以及文本挖掘中使用的相关技术、评估方法等都作了详细的介绍,最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景.  相似文献   

11.
针对互联网中的产品评论信息,提出一种三层过滤的评价对象抽取方法.该方法采用一个自举式的抽取算法在评论文本中得到候选的评价对象和情感词;利用评价对象与情感词之间的关联度对候选词进行关联置信度计算,提取关联置信度高的评价对象以提高识别的准确率;引入一个不相关的平行领域对剩余的候选词进行领域置信度计算,挖掘低频的评价对象.3个公开数据集中的实验结果表明该方法能够显著地提高评价对象的识别效果.   相似文献   

12.
提出了结合主动学习和自动标注的评价对象抽取方法。具体实现过程中,首先,利用少量的已标注样本训练分类器,对非标注样本进行测试,获取自动标注结果及其置信度:其次,通过置信度计算每个样本的整体置信度,挑选出低置信度即不确定性高的样本待标注:最后,对待标注样本中置信度低的词语进行人工标注,而置信度高的部分则采用自动标注结果。实验表明,该方法可以在确保抽取性能的同时有效地减小人工标注语料的开销。  相似文献   

13.
本文结合网络虚拟社会中舆情检索的实际需求,提出了一种面向博客群的主题倾向性分析模型.针对博客主题评论篇幅长短不一的结构特点,模型采用不同的文本倾向性处理方法:对于较长篇幅评论文本,分别统计目标评论中赞同、反对字符的倾向字符权重及其分布密度;对于拥有少量文字的主题评论,通过计算评论中字符倾向权重之和,实现评论倾向性评估.实验中通过构建面向“网络文化”的博客主题测试集,对模型的主题评论倾向性计算方法以及语义检索能力进行验证评估.实验结果表明模型具有较好的文本倾向性识别能力.  相似文献   

14.
立足于对高校网络这一校内主要舆论平台的监控的实际需要,结合中文信息处理领域中网络爬虫、网页除噪、特征提取、文本分类等技术,给出了一种高校网络舆情监控系统的实现方案,并通过实验验证了系统的有效性.  相似文献   

15.
为了研究中文情感文本中评价对象省略现象的识别方法, 将评价对象省略识别建模为一个二元分类问题, 利用机器学习算法进行自动学习。探讨当前句位置无关特征、当前句位置相关特征和上下文相关特征对评价对象省略识别的作用。3个不同领域的实验结果表明, 新提出的基于机器学习的评价对象省略识别方法能够获得较好的识别效果。  相似文献   

16.
基于非负矩阵分解的中文倾向性句子识别   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于非负矩阵分解(NMF、SNMF和WNMF)的中文倾向性句子识别算法.该算法首先构建倾向性特征矩阵,然后通过NMF、SNMF和WNMF算法分别来降维、提取潜在语义,最后采用支持向量机分类器识别中文倾向性句子.实验结果表明,与PCA和SVD相比,NMF、SNMF和WNMF算法能有效地降低维度、提取潜在语义,并提...  相似文献   

17.
Aiming at the importance of the analysis for public opinion on Internet, the authors propose a high-performance extraction method for public opinion. In this method, the space model for classification is adopted to describe the relationship between words and categories. The combined feature selection method is used to remove noisy words from the original feature space effectively. Then the category weight of words is calculated by the improved formula combining the frequency of words and distribution of words. Finally, the class weights of the not-categorized documents based on the category weight of words are obtained for realizing opinion extraction. Experiment results show that the method has comparatively high classification and good stability.  相似文献   

18.
为解决课程评论中隐式评价对象识别问题,提出了一种基于文本分类的隐式评价对象的识别方法。首先通过word2vec 模型获得训练文本对应的词向量,获得短文本特征; 其次将短文本特征在TextCNN 中进一步提取高层次特征,通过K-max 池化操作后放入Softmax 分类器中进行训练得出分类模型; 最后利用训练好的分类器对隐式评价句进行分类,获取隐式评价句对应的评价对象。实验表明,基于卷积神经网络对隐式课程评论进行属性分类,课程评论的隐式评价对象识别正确率达到89. 9%,满足了课程评论中对隐式评价句对象识别的需求。  相似文献   

19.
提出与评价对象抽取相关的7类语义特征: 评价触发词、评价消解词、评价对象绝缘词、后指动词、前指动词、心理动词和指向定语的评价名词, 以及与极性判定相关的5类语义特征: 褒义性名词、贬义性名词、语义偏移型名词、度量衡形容词和语义构式。从引入语义特征的必要性以及如何使用这些特征两方面进行阐述。实验证明, 语义特征的引入有助于提高评价对象抽取及极性判断的准确率。  相似文献   

20.
借鉴流行病学仓室建模的思想,根据人们对负面舆情了解情况和态度,将人们划为4类:易感类、潜伏类、感染类、移出类.通过对负面舆情的传播的分析,确定了4者之间的转移关系,建立微分方程模型,同时提出了易感类转移为感染类的概率应该随着时间由大变小,而感染类转化为移出类的概率应该随着时间由小变大,确定其概率函数,并由此得出了负面舆情的控制策略.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号