共查询到10条相似文献,搜索用时 15 毫秒
1.
《广州大学学报(自然科学版)》2016,(1)
在当前信息化的年代里,文本数据在高速的增长,人们获取有用的信息犹如大海捞针.文本聚类作为文本挖掘的基础技术,发挥了很重要的作用.由于缺乏预先定义的类和类标号的训练实例,如何选择合适的数据相似度是文本聚类的关键问题.文章为此提出一种新的衡量文本相似度的方法 Adaptive Metric Selection(AMS).文章通过抓取网页内容,为聚类提供数据来源,分词和向量化是必要的转化,利用特征提取的方法获取特征项,并用Isomap进行降维,最后利用自适应选择方法 AMS对数据进行相似度衡量再进行聚类分析.实验结果表明,AMS明显优于从多种相似度独立进行聚类的平均结果. 相似文献
2.
针对海量网络文本信息的获取、 量化和分析的难题, 采用信息抓取技术获得网络金融舆情文本信息, 并根据数据的信息量对金融舆情信息进行分类, 建立因子模型和时间序列模型, 分析网络金融舆情信息对我国股票市场的影响。通过实证得到以下结论: 与单只股票相关的网络文本信息数量, 明显影响了该只股票在第2日的收益率; 信息容量越大的网络文本信息对股票的影响力越大, 而不同组的信息对收益率的作用方向不同; 网络文本信息的数量与股票波动率明显相关, 信息容量不同的文本信息对波动率的影响力也不同。 相似文献
3.
互联网信息量日益剧增,人们很难在海量的信息中找到需要的主题信息.提出基于遗传算法进行文本特征的提取,并把与主题相关的信息实时入库,用户可以直接从库中获得过滤后的主题信息.通过实验考查,证明该方案明显地提升了搜索的准确度与效率. 相似文献
4.
5.
论文以斯宾塞《仙后》为例,从一文多思法的角度,探讨文学作品中的发散思维的培养。即1.运用新历史主义的研究方法鉴赏文本,启发学生从文本与社会历史宗教背景的角度来启发思维;2.运用原型批评的研究方法鉴赏文本,从文本与文化传统的角度来启发思维;3.运用阐释学的研究方法鉴赏文本,从文本与寓意和象征意义的角度来启发思维。 相似文献
6.
为了提高文本语义相似性度量的准确性,该文从深度学习的角度出发提出了一种新的文本语义相似性度量框架,充分利用深度神经网络实现词级别、句子级别、文本级别的表示学习,使得学习到的表示向量能提供融合上下文信息的丰富语义信息,在此基础上,设计了相似性度量层,采用简单的三层网络实现任意两个文本向量的相似性值计算.在两个基准数据集上... 相似文献
7.
针对属性值信息不完全的多属性群决策问题,从聚类分析的角度,提出了一种新的决策方法.该方法首先整理决策信息,形成数据库,然后依据支持方案的不同将数据库中的数据聚类,进而依据支持数据的多少完成对方案的排序.该方法的特点是易于在计算机上实现,并且评价过程相对客观.最后,给出了一个例子验证了方法的有效性. 相似文献
8.
基于熵的多点脉搏传感器信息融合方法 总被引:2,自引:0,他引:2
研究了现有的脉搏信号处理方法及其测量技术,提出了一种多点脉搏信息融合方法,该方法可以从多点的脉搏信号中提取出具有最大信息量的值,从而把多路脉搏信号融合成一路脉搏信号,可以得到一路既具有较大信息量,同时具有小数据量的高质量脉搏信号,十分有利于脉搏信息参数的计算和数据存储. 相似文献
9.
遥感影像信息量的计算方法研究 总被引:7,自引:0,他引:7
对遥感数据进行定量评价一直是遥感技术应用领域的一个难点.以信息论中的信息熵为理论基础,运用概率论的基本原理,建立了遥感影像信息量与灰度值、色彩、噪声之间的数学表达,提出了遥感影像信息熵、噪声疑义度、邻元相关性、互信息量及影像单像元的平均信息量、波段间的相关性、影像实际信息量的计算方法,并给出了多波段遥感影像信息量的计算流程,从信息量的角度提出了评价遥感数据质量的新方法. 相似文献
10.
刘永山 《北京理工大学学报》1998,18(1):47-51
为了更深入地研究引战配合的信息过程,从信息的角度给出引战配合过程的信息描述。方法从信息论的角度将引战配合划分为两个过程:信息传输过程和信息控制过程;给出了可作为引战配合效率的指标,即引战配合过程武器系统所获取的信息量的两种度量方法。 相似文献