首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对社交网络服务中汇聚的大量带有地理和社交属性的数据,提出一种改进的综合考虑用户位置和好友关系的个性化位置Top-k查询方法。首先,在传统Top-k空间查询方法的基础上,将用户的好友关系及好友签到统计信息引入评分函数,以便对查询结果进行个性化排序。然后,改进IR-tree索引结构以支持对位置信息和社交关系的混合索引。最后,在查询过程中采用基于优先级队列的最佳优先遍历方法进行剪枝,从而减少搜索空间。实验表明,改进的评分函数、索引结构和遍历方法能够实现社交网络环境中个性化且高效的Top-k查询。  相似文献   

2.
随着基于位置服务应用的不断推广,空间文本数据查询的应用价值(例如结合地理位置和用户标签的社交推荐)也在不断提高.但是,随着数据规模的迅速增长,传统的基于单机环境实现的技术难以为用户提供低延时和高吞吐量的服务.为此,本文基于Spark平台对分布式环境下的空间文本查询算法进行了探究.采用了面向海量空间文本数据的两层索引框架(包括全局索引和局部索引),该框架利用了分阶段过滤的策略来处理分布式下的布尔范围查询问题.同时,针对空间文本相似连接提出了Prefix-RI结构并提出了相应的分布式算法.基于Spark平台实现了所提出的分布式算法,并通过大量的实验对比验证了所提出方法的优越性.  相似文献   

3.
为了提高时间感知的空间关键词查询处理效率,提出了一种新的索引结构——TK来索引路网基本信息以及对象的位置、文本和时间信息.此外,还提出了同时使用位置、文本和时间信息的搜索空间削减策略,以进一步提高查询处理的效率.最后,通过与现有的TG索引结构的对比实验验证了所提方法的高效性.  相似文献   

4.
随着移动社交网络的迅速发展,如何从海量带有时间属性和地理位置属性的短文本信息中快速查询到有效信息具有重要意义.社交网络环境下传统短文本查询算法忽略时间维度,并且在海量数据下无法满足用户快速响应的需求.针对以上问题,提出一种社交网络环境下并行短文本查询算法.提出的算法设计了基于MapReduce模型下的查询框架,该框架使用了基于滑动窗口下的多版本时空索引(MVSTR-tree),保证了查询过程中融合了时间和空间属性,实现了对海量数据高效查询的目标.最后,通过真实数据集的实验证明该算法能有效缩短查询时间.  相似文献   

5.
针对基于位置的web搜索需要将网页中位置信息和文本信息相结合进行索引的应用需求,提出了先倒排表再R-tree索引和先R-tree再倒排表索引两种混合索引结构,同时处理文本和位置信息.大规模真实数据集上的实验表明,这两种方法在查询效率上明显优于已有的倒排表和R-tree相互独立的索引模式.  相似文献   

6.
为了解决无线广播环境下空间关键字查询的问题,研究广播环境下空间关键字k近邻查询处理(BkSKQ),设计了一种结合kd树、倒排位图和(1,m)索引机制的空间关键字索引(ISKW)结构,以有效地组织对象的关键字信息、位置信息以及索引信息.该索引结构为客户的查询处理提供有效的指导,使得他们尽可能只下载查询处理所必须的数据信息.在ISKW索引结构的基础上,提出了BkSKQ查询处理算法.最后,通过模拟实验验证了提出的索引结构和算法的性能,实验结果表明所提出方法在访问时间和调谐时间上明显优于基于IR树的方法(BIRM).  相似文献   

7.
中文密文数据库正则查询的研究与实现   总被引:1,自引:1,他引:0  
为提高中文密文数据库查询的灵活性、便捷性、高效性,设计了一种新的密文索引结构.它通过登记汉字所在记录的记录标识以及汉字在属性值中的位置,来提供对中文正则查询的支持.在这种索引的基础上,提出了一系列正则查询处理算法,这些算法利用索引登记的汉字位置信息来筛选符合查询条件的记录.仿真实验证明,利用这种索引和算法,能够在中文密...  相似文献   

8.
为提高中文密文数据库查询的灵活性、便捷性、高效性,设计了一种新的密文索引结构。它通过登记汉字所在记录的记录标识以及汉字在属性值中的位置,来提供对中文正则查询的支持。在这种索引的基础上,提出了一系列正则查询处理算法,这些算法利用索引登记的汉字位置信息来筛选符合查询条件的记录。仿真实验证明,利用这种索引和算法,能够在中文密文数据库上实现正则查询,且算法的查询性能良好。  相似文献   

9.
研究无线广播环境下空间网络数据库关键字查询问题,提出一种包含路网加权四叉树、各关键字四叉树和路网距离矩阵的空中索引结构(KSSN).讨论了kNN查询处理问题,提出了高效的查询处理算法.所提出的算法能综合利用路网距离信息和关键字信息高效地消减不存在查询结果对象的路网空间,提高查询处理的效率.KSSN索引结构可推广至其他类型的查询,比如范围查询、Rank查询.在一个真实路网上进行了仿真实验,验证了基于KSSN索引结构的查询处理算法的性能.实验结果表明:所提出算法的访问时间和调谐时间分别为参照的IRRDA算法的25.13%和12.31%.  相似文献   

10.
基于位置的服务(location based services, LBS)为人们日常生活带来极大便利的同时也严重地威胁到用户的隐私.为了在保护用户位置隐私的同时降低用户的查询代价,提出了一种基于安全索引的位置隐私保护方法(location privacy protection method based on secure index, LPPMSI).LPPMSI不需要用户搜集数据信息,数据拥有者为虚假位置信息建立安全索引.用户能够安全、快速地检索到虚假位置信息,服务器再执行基于虚假位置的LBS.并且还提出了基于滑动窗口的候选位置选择算法,有效减少候选位置选择时间.实验结果表明,LPPMSI在不改变隐私保护能力的前提下,不需要用户花费大量时间搜集数据分布及查询概率信息.  相似文献   

11.
利用基于位置的社交网络(LBSN)中的共享位置信息,提出一种结合相遇和拓扑结构的朋友推荐算法.该方法定义用户关系为相遇模型,通过考虑朋友间时间和空间的相遇特征,基于随机路点模型计算轨迹间在相同时间下的相遇频率作为用户相似度,结合拓扑相似度作为最终的推荐依据.实验结果表明,所提出的方法较传统基于拓扑的好友推荐算法准确率更高.  相似文献   

12.
基于位置的服务(LBS)进行数据发布时,数据拥有者委派第三方服务商来发布数据,服务提供商代表数据拥有者向用户提供服务。但是LBS中的服务提供商可能是不可信的,这样会在LBS大数据的查询中形成由于商业目的而篡改的不准确的结果。LBS大数据中移动对象的位置随时间而变化,因此数据的动态性导致了索引结构大量的更新操作。该文提出了一种基于固定网格划分四叉树索引机制的空间范围查询验证技术,该技术采用网格划分的方法对空间数据进行划分,并采用四叉树对划分后的网格进行索引。该空间索引结构更新代价低,方便了数据的管理,缩短了检索的时间,四叉树索引对于范围查询具有较高的查询验证效率。该方法确保了用户查询结果的真实性、完整性和正确性。通过实验验证了该方法是有效的。  相似文献   

13.
随着互联网和全球定位技术的高速发展,基于位置的社交网络(location-based social network)不断涌现,鼓励用户通过签到的形式发布个人动态并实时分享地理位置。海量的签到数据为挖掘用户偏好提供了机会,有利于提供基于位置的服务,如兴趣点(point of interest)推荐。兴趣点推荐旨在通过分析用户历史出行记录来得到用户的位置偏好,从而在未来为用户推荐新的地点,同时也能帮助广告商精准地投放用户感兴趣的广告。地点类别往往能够精准地提炼出位置的上下文语义,而现有的兴趣点研究大多都直接去计算用户对地点的偏好,没有有效地结合类别信息。通过对社交网站Yelp的公开数据集进行分析,发现相比访问共同的地点,朋友之间更容易访问相同的类别。因此,考虑朋友间地点类别偏好关系比直接考虑用户间项目偏好的关系更为合适。文中提出一种结合地点类别和社交网络的兴趣点推荐算法CSRS,先从用户历史签到记录获取用户地点类别偏好,然后考虑朋友间的类别偏好差异性。在Yelp数据集上的实验结果表明,与其他算法相比,文中提出的算法在准确率和召回率指标上都取得了更好的结果。  相似文献   

14.
逆向Skyline查询能够应用到诸如决策支持、用户偏好支持以及市场行为分析等方面。由于参考对象q的存在,在执行逆向Skyline查询的过程中数据空间被划分成许多分区。然而,存在的算法都没有考虑这个问题的影响,直接使用原始数据集建立索引结构。本文提出了一种新的逆向Skyline查询方法CRSQ,它考虑了这个问题。CRSQ首先根据查询对象q对数据进行聚类,然后建立R-tree索引,最后利用高效修剪策略修剪索引搜索空间。实验结果表明CRSQ算法是有效的,它相对于没有聚类技术的算法获得了50%以上的性能提高。  相似文献   

15.
基于关键词的RDF数据查询方法   总被引:1,自引:0,他引:1  
在建立关键词倒排索引和路径索引的基础上,提出一个利用量化均衡规则和等距规则的启发式查询算法,并按照查询结果的大小排序返回最相关的前k个结果.通过建模RDF数据为RDF句子图,将文本信息封装到句子节点,同时将查询结果建模为包括所有查询关键词并且叶节点是关键词节点的无根树,将关键词查询问题转化为斯坦纳树问题.假设RDF句子图包括n个节点,最坏情况下索引占用的空间是3n2.假设关键词节点数为k,查询算法的时间复杂度为O(kn).该方法不需要依赖RDF数据的模式信息,支持对数据中的属性和关系名进行关键词查询.实验证明该方法能够快速而有效地实现RDF数据的关键词查询.  相似文献   

16.
一种基于内容的视频信息检索技术的研究   总被引:3,自引:0,他引:3  
在多媒体技术迅速发展的今天,作为多媒体信息中最复杂的视频信息,用传统的文件检索方法已无法满足用户的查询要求,而新的基于内容的检索技术将更好地满足视频信息的查询和检索.文章从基于内容的检索中用户的查询要求出发,将视频流划分成多个视频段,用对象和事件来表达每个视频段的视频内容,并在考虑时态特性的基础上,提出新的索引结构和查询算法,以有效地支持基于内容的检索和查询。  相似文献   

17.
检索系统构建了用于记录各数据项在数据表和字段中位置的索引结构,以及基于数据库关系图的用于描述各个数据表之间关联关系的主外键关系表,根据索引结构和主外键关系表检索出与用户输入的多个关键词相关联的记录.为了进一步提高检索效率,又构建了一个查询结果存储结构,把查询过的关键词和对应的结果存入其中.当用户输入关键词进行检索时,检索系统先去查询结果存储结构中检索,如果检索到就直接输出结果,否则再通过访问索引结构和主外键关系表构建SQL语句到原始数据库中进行检索得到结果.实验结果表明,这种基于索引结构和查询结果存储结构的检索机制具有较好的检索性能.  相似文献   

18.
随着空间数据飞速增长,不仅POI(Point Of Interest)越来越密集,而且每个空间点的文本描述也越来越多,以往关键词近似查询算法中,不同长度的关键词需要不同的阈值相匹配,影响查询效率和查询结果.针对以上不足提出了支持空间多子串近似匹配的空间关键词查询算法,在该算法中不需要考虑阈值的改变,而是将编辑距离直接应用到索引结构中.通过真实数据进行实验,表明该算法在查询精准性和查询效率上都有较大的提高.  相似文献   

19.
 空间数据库存储空间对象的相关信息,在很多实际应用中需要汇总空间数据,但这种汇总非常耗费时间而且计算代价很高.受非空间数据仓库的启发,可以建立空间数据仓库来加速空间OLAP操作.考虑星型模式且着重于空间维的概念分层,这种分层主要根据空间R-树索引来建立.提出了一个空间查询算法,并考虑了数据更新.  相似文献   

20.
高性能网页索引器JU_Indexer的实现   总被引:4,自引:1,他引:3  
高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号