首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
专家可为社区问答提供权威的答复,高效精准的专家发现有助于提升问答社区的服务质量.现有社区用户数据中存在噪声标签数据,且由于专家数量较少造成分类数据不平衡,从而降低了监督学习模型的专家发现精度.针对上述问题,本文提出一种基于特征扰动的半监督专家发现方法.该方法构建了一种无标签数据特征扰动策略,利用Sharpening算法实现无标签数据的伪标签化;基于ADASYN算法,通过构建专家用户邻近样本的方式扩充专家样本数据量,缓解分类数据的不平衡;构建联合损失函数,利用有标签和伪标签数据共同训练分类器,增强模型的泛化性能.实验结果表明,该方法在多个评价指标上优于已有模型和方法.  相似文献   

2.
网络中的社区发现是当前的一个研究热点。在众多社区发现算法中,标签传播算法因简单快速而被广泛应用。但标签传播算法也存在结果稳定性较差的问题。通过提取非重叠完全子图来避免社区重叠,提取最小极大团来避免巨型社区的出现,基于此,对标签传播算法的初始化过程进行改进,提出了一种稳定的标签传播社区发现算法,即非重叠最小极大团提取算法。在真实网络中的实验结果表明该算法可以大幅提高结果的稳定性。  相似文献   

3.
重叠社区发现是复杂网络分析研究的重要目标之一。针对传统多标签传播算法存在的社区发现结果具有随机性、不稳定性,以及忽视节点影响力对标签传播的影响等问题,提出一种基于节点影响力与多标签传播的能够生成稳定社区的重叠社区发现算法。算法在节点影响力的计算、排序和核心节点识别基础上,通过邻居节点初始标签的再处理和基于平衡系数的节点标签异步更新策略,实现复杂网络重叠社区的有效识别。在真实数据集和人工数据集上的实验综合表明,算法性能优于各对比算法,适用于大规模复杂网络。  相似文献   

4.
Lasr.FM,MovieLens等在线服务一个重要的特征是用户能手动使用标签标注对象,很多研究人员使用标签改进推荐质量.但是,标签是一个用户对对象的局部描述,不同的用户可能使用不同的标签来描述同一个对象,但表达同样的意义,这导致了单纯的使用标签进行推荐所达到的效果不理想.因此,本文首先根据标签共生分布计算标签相似度,...  相似文献   

5.
采用标签传播算法进行社区发现时间效率高,无需人工参数,但容易产生精度限制的问题.研究了启发式的标签传播算法,快速地进行社区的初始划分,大量减少了初始标签的个数,进行标签迭代传播来修正初始划分得到最终的社区.理论分析和实验证明这种方法在不增加时间复杂度的情况下,提高了准确率,并有效消除了精度限制的现象.  相似文献   

6.
用户兴趣挖掘是实现个性化推荐与智能化服务的关键问题。Web2.0引入的社会化标注可以反映用户的潜在兴趣。该文提出一种基于用户标注行为的兴趣建模方法,根据用户与标签的交互模式反映用户的兴趣倾向。从用户对不同标签的"认同度"和"依赖度"两方面衡量用户的标签兴趣,并使用"标签基因"对用户的兴趣进行细粒度分解。来自真实用户数据的实验结果表明,该方法可以有效提高用户兴趣的预测准确度和覆盖率,创建的兴趣模型更加符合用户的真实情况。  相似文献   

7.
发现复杂网络中的结构和特征是社区发现的一个重要任务.标签传播算法(LPA)因具有接近线性的时间复杂度,常用于快速处理大规模的社区网络.针对该算法在节点的更新顺序和标签选择策略上存在很大的随机性,严重破坏了算法的稳定性和社区划分结果的准确性.提出了一种基于节点H指数的标签传播算法,即利用节点的综合影响力改进标签传播算法的节点更新顺序和标签选择策略.实验研究表明,改进算法有效地降低了算法的随机性,提高了社区划分的稳定性和准确性.  相似文献   

8.
社区发现的目标是发现复杂网络的结构、行为和组织形式。标签传播算法是一种快速有效的社区发现算法,然而在初始的标签传播算法中,节点的结构信息和特征信息没有得到充分利用,且存在标签传播过程不稳定的问题。针对上述问题,文章提出了一种基于改进的密度峰值聚类算法和标签传播算法的有向加权复杂网络社区发现算法(DPC-LPA)。该算法首先根据节点的结构和特征对其进行加权,充分利用了结构信息和特征信息;然后,采用改进的密度峰值聚类算法来寻找网络的社区中心,并据此构建初始社区,提高了社区划分的质量;其次,基于节点相似度和节点权重,合理确定标签传播的更新顺序,并通过衡量节点间标签传播的强度来完成标签传播,解决了标签传播算法不稳定的问题。最后,在CiteSeer、Cora、WebKB和SCHOLAT真实数据集上,将DPC-LPA算法与DCN、WCF-LPA、CLPE算法进行对比实验。实验结果证明了DPC-LPA算法的可行性和有效性:从模块度来看,利用DPC-LPA算法划分的社区具有更加显著的社区结构;从调整兰德系数来看,DPC-LPA算法的社区划分质量更稳定;从运行时间来看,DPC-LPA算法具有较高的效率。  相似文献   

9.
通过研究微博社区的结构特征和用户交流模式,提出了一种基于微博用户交互行为的社区发现方法.该方法借鉴引文分析理论中的著者互引分析和著者耦合分析,分析微博社区内用户的交互行为,考虑到不同交互行为体现了对微博的不同兴趣度,给不同的交互行为赋予了不同权重,进行相似度计算,并利用用户相似度进行社区发现.实验结果显示,本文提出的方法可以有效地进行社区发现.  相似文献   

10.
标签传播社区发现方法LPA(Label Propagation Algorithm,简称LPA)和已有的一些算法相比具有算法复杂度低、思想简单、不需要指定社区数量等优点,但相比于传统社区发现方法(如GN)也有准确率较低的缺点。文章提出了一种改进的、基于节点局部相似性的标签传播算法LPALS(Label Propagation Algo-rithm based on Local Similarity,简称LPALS)。实验结果表明,LPALS算法在提高准确率的同时也保证了算法具有较低的时间复杂度。  相似文献   

11.
在几种流行的推荐算法的基础上,本文提出了一种新的融合用户聚类和关联规则的算法来改善推荐效果。该算法在经典的关联规则算法Apriori基础上引入多最小支持度的概念,并在关联规则算法之前进行用户聚类,在聚类算法中使用了包含字符属性的混合属性距离函数,提高聚类效果。在此算法的基础上,设计并实现了一种新的基于图书馆的推荐系统。实验证明该算法改善了数字图书馆中新书的推荐质量,去除了部分只含高浏览量图书的无意义规则,并趋向于发现相近种类图书的关联性。  相似文献   

12.
一种基于社会化媒体和社会网络结构的混合推荐模型   总被引:1,自引:1,他引:0  
近年来,社交网络的迅速发展为在线用户之间的沟通和交流带来极大便利,为良好的信息推荐服务提供了丰富的资源,与此同时也为个性化推荐带来了更为复杂的技术挑战.本文通过自然语言处理技术获取用户在社会化媒体(新浪微博)中的个性化兴趣标签信息,应用到自行设计开发的社会化阅读应用牛赞网中.进一步地,利用用户在牛赞网中的阅读行为和社交信息,结合用户的社会化媒体兴趣,提出了一种混合推荐模型.实验基于牛赞网中的实际数据集,并与基于用户的经典协同推荐模型进行了对比,结果表明,提出的模型在推荐性能的几个指标(AUC、准确率、召回率、多样性和新颖性)上都有很大的提高.最后,通过对牛赞网中几个典型用户进行进一步的案例分析后得出,混合推荐模型的最优参数需要根据不同社会化行为的用户进行调节.  相似文献   

13.
针对网络的聚类进行研究,提出了一种基于标记注意力机制的社区发现算法,网络特征通过标记节点频率及反示例节点频率联合度量,为使网络特征的度量更加关注于示例节点的细节信息,引入注意力机制来处理网络特征。社区划分由复杂网络预处理、网络节点的策略、社区博弈归并三个部分组成,其中网络节点的策略由无贡献节点归并、节点到社区的判断以及节点逻辑标记和的判断三个步骤组成。实验借助于真实网络进行验证,在归一化互信息、模块度、社区划分数量及运行时间四个方面,基于标记注意力机制的社区发现算法都优于其它社区发现算法。在实际生活中应用此算法,能够更加直观地显示网络内部之间存在的联系。  相似文献   

14.
当处理的半结构数据时,从中挖掘出其隐含的结构显得愈来愈重要了,不仅对于用户而且对于整个系统来说,其重要性也是不言而喻的.算法structure_discovery将聚类算法应用到半结构化数据的结构发现上,将描述同一类对象的共有结构按照相似度聚集到一起形成类,然后从类中发现满足用户兴趣度的结构.与同类算法比较,structure_discovery为增量式算法,同时,聚类技术的使用提高了结构发现效率.  相似文献   

15.
针对传统的社区发现算法无法发现社区中的核心成员和边界成员的缺点,提出了基于PCM聚类算法的Blog社区发现算法,用来识别Blog社区的核心和边界.首先,使用随机行走的方法计算可以衡量两个Blog亲密度的对称社会距离;然后,在对称社区距离的基础上使用PCM聚类算法对Blog进行聚类,得到每个社区中的成员属于社区的概率表示.最后,通过确定相应的概率阈值,确定社区的核心和边界.实验结果表明:该算法能够获得社区中的成员属于社区的概率,根据这个概率可以确定社区中的核心成员和边界成员.  相似文献   

16.
为解决传统的协同过滤算法不能准确理解用户的喜好,影响推荐准确率和推荐效果,提出基于社会化标签语义相似度的协同过滤算法.算法以标签语义相似度为基础,将项目资源和相关标签的语义信息纳入,显著提高了推荐系统的预测性能.研究结果表明:与以具体评分数据为基础的算法相比,该算法较好地解决了词相似度和句子相似度计算问题,推荐准确度和性能较以往的协同过滤算法有明显提高,改善了推荐效果.  相似文献   

17.
领先用户的需求能够反映出市场和技术的发展趋势,准确地识别领先用户并对其领先性进行排名,对企业开展开放式创新和提升创新绩效意义重大.本研究根据创新社区中用户的特征,从活跃性、创新性、共享性和影响力4个维度构建领先用户识别指标体系,在此基础上提出了基于凝聚层次聚类算法的领先用户识别方法,然后通过灰色关联分析方法计算用户领先性以实现用户排名.对以华为产品定义社区的实例进行实例分析的结果表明:本文提出的领先用户识别方法可以准确地识别出创新社区中的领先用户,并反映出领先用户之间的差异.此研究结果可为企业识别和筛选领先用户提供参考.  相似文献   

18.
基于互信息改进算法的新词发现对中文分词系统改进   总被引:6,自引:0,他引:6  
提出一种非监督的新词识别方法。该方法利用互信息(PMI)的改进算法--PMIk算法与少量基本规则相结合, 从大规模语料中自动识别2~n元网络新词(n为发现的新词最大长度, 可以根据需要指定)。基于257 MB的百度贴吧语料实验, 当PMIk方法的参数为10时, 结果精度达到97.39%, 比PMI方法提高28.79%, 实验结果表明, 该新词发现方法能够有效地从大规模网络语料中发现新词。将新词发现结果编纂成用户词典, 加载到汉语词法分析系统ICTCLAS中, 基于10 KB的百度贴吧语料实验, 比加载用户词典前的分词结果准确率、召回率和F值分别提高7.93%, 3.73%和5.91%。实验表明, 通过进行新词发现能有效改善分词系统对网络文本的处理效果。  相似文献   

19.
在海量异质灵活资源参与含高比例新能源电网的运行调节背景下,针对用户用电特性分析的准确性、鲁棒性、计算效率的高要求问题,提出了一种基于特征指标完善和改进型密度峰值算法的电力负荷聚类分析方法。首先,通过提取9个完备的特征指标进行指标降维和完善以代替日负荷曲线组成的功率向量作为聚类输入;其次,采用熵权法对各项特征指标赋予权重保证负荷曲线的形态特征;最后,采用一种改进型密度峰值聚类算法对日负荷进行聚类分析。基于某地区实际负荷数据进行算例分析,结果表明,所提方法在鲁棒性、聚类质量等方面相比于传统电力负荷聚类算法均具有优越性,聚类结果能真实有效地反映用户的实际用电特性,为制定精准的电力用户画像、需求侧响应策略提供了态势感知基础。  相似文献   

20.
介绍了复杂网络及社团结构的相关概念,给出节点的综合特征值和增益函数的定义,然后提出一种新的社团发现算法(CNCD).综合特征值与节点的度数及其聚类系数有关,用于发现社团中的核心节点;增益函数决定何时获得社团结构的最佳划分.作者用C++语言实现算法,并使用经典数据集对算法进行验证,实验结果表明此算法不仅能够得到正确的社团结构,而且通过动态调整算法中的参数值,能够得到比传统算法更加详细的社团划分结果,获得网络的细节信息.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号