共查询到20条相似文献,搜索用时 15 毫秒
1.
一种个性化的主题提取和层次发现算法 总被引:3,自引:0,他引:3
从语义相关性角度分析超链归纳主题搜索(HITS) 算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此提出了一种个性化的主题提取和层次发现算法(PTDHE),通过个人查询日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的.PTDHE采用基于最小最大原则的图划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面.在14个查询上的实验结果表明,与HITS算法相比,PTDHE算法不仅可以减少2%~66%的主题漂移率,而且可以发现与查询相关的多个主题. 相似文献
2.
追踪事件微博报道:一种流的动态话题模型 总被引:1,自引:0,他引:1
为了解决微博中存在的话题漂移和大量噪声问题,提出了基于动态话题模型和微博信息熵相结合的流的动态话题模型。首先利用动态话题模型在整个追踪过程,从正反两个方面增强对追踪话题的描述,进一步克服了话题漂移问题。但由于微博中存在大量中间类微博,所以定义并使用微博信息熵来衡量一条微博对于话题报道的重要性,并将其扩展到动态话题模型中,用于区分新闻类和中间类微博。在超过17万用户的1 200万条微博上进行了话题追踪,实验结果表明,本文算法较之传统的动态话题模型更有效,追踪结果包含更少噪声。 相似文献
3.
采用几何方法精确地计算了广义梯形模糊数的重心(COG),提出了一种度量广义梯形模糊数相似性测度的新方法;考虑了广义梯形模糊数之间的几何距离、重心、周长和面积;证明了所提出相似性测度的一些基本性质.最后,通过实例说明文章提出的度量方法比现有方法能更好地度量广义梯形模糊数的相似性测度. 相似文献
4.
为了解决信号重构性能差的问题,提出了一种基于广义Jaccard系数的广义正交匹配追踪(generalized orthogonal matching pursuit, gOMP)重构算法。该算法利用广义Jaccard系数相似性匹配准则替换gOMP算法中的内积度量准则,优化了通过感知矩阵来选择与残差余量最匹配原子的匹配方式。实验结果表明,该算法的重构成功率不仅高于gOMP算法,同时也高于OMP、StOMP等算法。 相似文献
5.
用户间的信任关系、用户对商品的偏好兴趣及商品的时效性都会影响对商品的推荐效果.将这些因素引入到基本的HITS算法中,对HITS算法进行了改进.将用户对商品的偏好兴趣矩阵进行了改进,利用隐馈数据通过逻辑回归算法估计用户对商品的偏好兴趣,对评分为零的情况赋予了不同的偏好兴趣度,这样更符合实际.将改进的HITS算法和协同过滤算法相结合得到一个混合推荐算法,同时将用户分为活跃用户和非活跃用户分别进行推荐.将提出的算法在Movielens数据集上进行了试验,结果表明该算法在一定程度上缓解了数据稀疏和冷启动的问题,推荐效果优于基于用户的协同过滤算法. 相似文献
6.
提出了一种测定膜蒸馏过程传热系数的新方法,即考察NaCl和KCl水溶液膜蒸馏浓缩过程中的通量变化,利用膜表面结晶导致通量急剧下降这一现象间接确定料液侧膜表面的温度,从而由模型方程计算传热系数。通过不同流速下的膜蒸馏实验结果,拟合出了传热系数关联式,其中雷诺准数指数为0.8,与Dittus-Boelter公式一致;在此基础上求出膜蒸馏系数,其平均值5.5×10-7kg/(m2·s·Pa),与文献报道接近;以实验确定的模型参数预测纯水膜蒸馏通量,实验值与预测值吻合较好。这些都说明了本文提出方法的有效性。 相似文献
7.
意见挖掘在企业智能分析、政府舆情分析等领域发挥着重要作用,为了充分挖掘主观性文本所蕴含的商业价值和社会价值,提出了一种基于情感主题模型的特征选择方法。该方法重点考察极性词及其共现现象,采用主题模型挖掘出正面褒义主题和负面贬义主题中极性词的分布情况,旨在度量情感特征在情感倾向表达中的重要性。实验阶段结合支持向量机分类器进行分析。实验表明该特征选择方法能有效提高跨领域文本情感分类准确性,具有较好的实用价值。 相似文献
8.
中文微博具有更新快、时效性强等特点,产生的热点话题均具有一定的突发性,与此同时文本中有代表性的特征词也会随之激增。利用这一特性,在传统的TF-IDF(term frequency-inverse document frequency)基础上提出一种改进的特征权重算法,称之为TF-IDF-KE(term frequency-inverse document frequency-kinetic energy),用以解决突发性热点话题在聚类时特征不明显的问题。该算法结合物体的动能原理,将特征项的突发值用动能的概念进行描述,加入权值计算,提高突发性特征项的权重,最后使用CURE(clustering using representatives)算法,实现微博的话题检测。该方法描述了文本和特征项所具有的动态属性,实验结果表明,该方法能够有效地提高话题检测的效果。 相似文献
9.
引进文本相关度这一影响因子,提出了一种基于蚁群聚类算法的突发话题检测算法,该算法结合蚁群聚类算法的优势,综合考虑文本聚类和文本相关度的影响,得到对网络突发话题检测的最优聚类效果,并对近年来网络突发话题进行实验,达到了很好的聚类速度和聚类效果,验证了算法对突发话题检测的准确性和即时性. 相似文献
10.
罗乐霞 《长春工程学院学报(自然科学版)》2014,(4):113-115
对毕业设计选题分配算法进行研究与设计,根据教师评定的课题难易程度与课题类型的权重分配及学生成绩与学生自我评价的权重分配,提出基于KM算法的SA-KM算法,针对KM算法全局搜索能力较弱的问题进行优化,改善学生自主选题的范围,提高整体满意度。该算法具有科学性、人性化的课题类型分配和难易程度分配,能够对毕业生毕业设计做出客观、准确的评价。 相似文献
11.
陈柯 《大连理工大学学报》1998,(Z1)
引入一个用于解偏微分方程广义边界无法代法的新预处理算法。文中首先考虑标准边界元法使用的稀疏预处理子。然后阐述广义边界元法及其推广。使用离散小波变换来加速基于分离的预处理子。广义边界元法能有效迭代的关键在于压缩轴基函数形成的矩阵,用有紧支撑集的轴基函数得到了预处理迭代的新结果。也给出一些数值试验结果。 相似文献
12.
针对传统的潜在狄利克雷分析(LDA)模型在提取评论主题时存在着计算时间长、计算效率低的问题,提出基于MapReduce架构的并行LAD模型建立方法.在文本预处理的基础上,得到文档-主题分布和主题-特征词分布,分别计算主题相似度和特征词权重,结合k-均值聚类算法,实现评论主题提取的并行化.通过Hadoop并行计算平台进行实验,结果表明,该方法在处理大规模文本时能获得接近线性的加速比,对主题模型的建立效果也有提高. 相似文献
13.
为恢复被混合噪声污染的低秩矩阵,提出了一种新的广义鲁棒主成分分析(GRPCA)算法。它通过最小化核范数、1范数和2,1范数的组合问题,从观测矩阵中分离出低秩部分和混合噪声部分,并用随机排序的交替方向乘子法求解。利用本文方法进行垃圾邮件分类的实验结果表明,与经典的主成分分析(PCA)和鲁棒主成分分析(RPCA)算法相比,本文方法可以有效提高垃圾邮件分类的精确度和稳定性。 相似文献
14.
针对海量数据上的话题发现任务,提出了一种均匀快速的数据预切分算法。在保证一定精度情况下,通过该算法可以按照数据的语义关联强度快速有效地将数据集切分成大小均匀的子数据集,以支持后续的话题发现算法的并行执行。实验表明,所提出的方法能够快速切分海量数据,保持块内数据的语义关联,大大提升话题发现的效率与质量。 相似文献
15.
新型高效丙酮精馏塔的研究与应用 总被引:2,自引:0,他引:2
李群生 《北京化工大学学报(自然科学版)》1998,25(2):1-5,26
研究了丙酮-水的相平衡曲线与特点,在计算机上进行了丙酮精馏的模拟与优化,并进行了不同进料浓度下的精馏工艺计算,将新型高效填料与计算机计算结果用于丙酮精馏塔的设计,工业应用试车一次成功,与浮阀塔,泡罩塔,板-填复合塔等塔型相比,新塔提高生产能力67.5%~180%,节能25%~40%,同时得到纯度达99.9%的丙酮产品,排放残液中丙酮质量分数w≤0.05%。 相似文献
16.
中文网页自动分类新算法 总被引:8,自引:0,他引:8
为了有效地组织因特网上极其丰富的信息资源 ,通过分析中文和中文网页的特点 ,提出了一种新的中文网页的自动分类算法。这种算法主要利用字间的相关信息、词频以及页面的标记信息等 ,提取网页特征 ,并计算可调的词频加权参数 ,然后通过本类和非本类训练 ,建立专家数据库。实验表明 ,该算法可以获得 80 %以上的网页分类准确率 相似文献
17.
针对一系列连续运动的视频序列,利用前后帧间的相关性,在分析块匹配算法高精度和三步法的运算速度快的基础上,提出了一种基于块的新算法。实验结果表明,该算法比EBMA算法运算量大大减小,运算精度又比三步法得到了很好的提高。 相似文献
19.
利用矩阵的Σ-K-L分解,研究了广义投影算子(A2=A*)和超广义投影算子(A2=A+)的性质,得到了一些新的特征,这些结论推广了Baksalary的有关结果. 相似文献
20.
为提高多层前向神经网络的学习速度和算法的稳定性,提出一种基于综合目标函数的改进学习算法.该算法在误差平方和目标函数中引入一个辅助约束项构成综合目标函数,并利用综合目标函数训练网络的输出层权值,采用牛顿法推导出训练输出层权值的递推公式.辅助约束项隐含有对网络输出平滑性的约束,提高了学习算法的稳定性.利用该算法对不同非线性函数生成的样本数据的学习结果表明,新算法的收敛速度、精度均优于Karayiannis等人的二阶学习算法. 相似文献