首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对云存储中加密数据的搜索问题,提出了一种基于主题模型的多关键词排序搜索方法.首先,利用主题模型进行建模,在不同的主题下分别使用TextRank算法来提取文档关键词并为关键词赋予不同的权重值,并根据文档主题分布将不同主题下的关键词进行整合,然后利用平衡二叉树建立文档索引结构.此外,采用词干算法将同一词根的不同关键词转化为同一关键词,解决了同形关键词的问题.最后,通过真实数据进行实验分析.实验结果表明,所提出的方案具有更高的搜索效率和准确性.  相似文献   

2.
网络电话语音的识别具有广阔的应用前景 ,而相对较低的话音质量突出了关键词捕捉的重要意义。关键词捕捉的核心问题是关键词可信度的估计。在零虚警假设下提出了关键词的后验可信度 ,在测度中结合了声学层分数和基于拼音的统计语言模型分数 ,利用动态规划推导了计算测度的前向后向算法。在 2 4 0个关键词的捕捉实验中 ,后验可信度下的关键词识别率高于 88%。基于拼音格 HMM(隐 Markov模型 ) ,对可信度估计、关键词捕捉、最优部分路径搜索及拼音多候选重排进行了统一的解释。  相似文献   

3.
提出了一种基于多Agent的Web个性化信息检索系统的模型(WPIRS-MA),该模型利用多智能Agent技术,结合用户的关键词描述,挖掘用户潜在的兴趣和特征,在各Agent的协调下,完成信息检索、过滤和聚类.框架分析表明该模型具有良好的灵活性、智能型和扩展性.基于5个站点的Web文档测试分析结果表明,该模型可以保证良好的关键词集的正确率,用户查询满意度达到80%以上.  相似文献   

4.
越南语属于低资源语种,高质量关键词新闻数据稀缺,为了解决样本不足条件下生成越南语新闻关键词准确性不高的问题,提出了一种多特征融合的越南语关键词生成模型,拟提升生成的越南语关键词与越南语新闻文档的相关性.首先,将越南语新闻实体、词性、词汇位置特征与词向量拼接,使输入模型的词向量包含更多维度的语义信息;其次,利用双向注意力...  相似文献   

5.
基于证书的可搜索加密(searchable encryption,SE)方案存在用户公钥验证与证书管理上的缺陷,且多数单关键词搜索的方案会返回大量不相关的密文,而少数采用多关键词搜索的方案需要建立很长的关键词密文索引。本文提出了新的关键词密文检索方案,该方案采用了无证书公钥密码体制,既避免了基于证书的密码体制中的公钥验证和证书管理问题,又解决了基于身份的密码体制中密钥托管问题;方案中采用了连接关键词搜索,多关键词搜索使得密文查找更加精准;本文把访问关键词密文陷门进行了聚合,使得陷门长度简短有效,且通信带宽和存储量得到一定程度上的节约。在随机预言机模型下,证明本文方案可抗离线关键词猜测攻击。  相似文献   

6.
关键词检测是语音识别中一个重要的研究方向.关键词检测技术的重点之一就是代表非关键词语音的模型,不论识别系统的方法怎样,大部分是采用废料模型的,而废料模型的结构和类型对整个系统的性能有很大的影响.提出了一种基于音节格的废料模型.实验表明,与传统的基于音素类的废料模型相比,关键词的检测率有了很大的提高.  相似文献   

7.
关键词确认是语音识别中一个重要的研究方向。对于关键词确认系统来讲,废料模型的结构和类型对整个系统的性能有很大的影响。文中提出了一种基于音节格的废料模型。实验表明,与传统的基于音素类的废料模型相比,关键词确认率有了很大的提高。  相似文献   

8.
针对多候选汉语音节网格语音关键词检索任务,在Gauss混合模型以及多候选识别算法方面进行了研究改进。首先探讨了Gauss混合模型的不同简化策略并用实验进行了验证,证明了全协方差矩阵在识别性能上的优越性;随后对经典的多候选令牌传递算法做出了针对汉语特点的改进。实验表明这2方面的研究不仅提高了以音节作为输出的语音识别引擎的单候选识别效果,也大幅提高了多候选的识别性能。最后搭建了一个基于多候选网格的语音关键词检索系统,在该系统中验证了上述改进的效果。  相似文献   

9.
传统的关键词抽取算法不能够抽取那些没有在文本当中出现过的关键词,因此在抽取法律问题(短文本)的关键词任务上效果不佳。该文提出了一种基于强化学习的序列到序列(seq2seq)模型来从法律问题中抽取关键词。首先,编码器将给定法律问题文本的语义信息压入一个密集矢量;然后,解码器自动生成关键词。因为在关键词抽取任务中,生成的关键词的前后顺序无关紧要,所以引入强化学习来训练所提出的模型。该模型结合了强化学习在决策上的优势和序列到序列模型在长期记忆方面的优势,在真实数据集上的实验结果表明,该模型在关键词抽取任务上有较好的效果。  相似文献   

10.
语音关键词识别技术作为语音识别的重要分支在20世纪90年代逐渐被重视起来,时至今日,语音关键词识别技术已经被应用到车内语音命令识别、机器人交互及特殊语音筛选等众多领域。本文给出了语音关键词识别技术的整体模型及性能评价指标,综述了语音关键词识别系统声学模型构建技术的现状,详细总结了语音关键词识别系统声学模型构建技术,并重点总结了深度学习在声学模型构建上的应用。最后对语音关键词识别技术的发展前景进行了讨论,认为深度学习隐马尔科夫混合模型作为连续语音识别中最成熟的模型构建技术将在关键词识别中有更多应用,循环神经网络有可能凭借其序列训练能力成为更有效的模型构建技术,而大计算量、云平台及便携可穿戴将会成为语音关键词识别技术发展的主流方向。  相似文献   

11.
在对话过程中,人们通常根据对方上一句话的关键词做出相应的回复。为了生成与关键词含义相关的回复,提出了拓展关键词信息注意力机制的对话生成模型。首先从输入语句中提取关键词,然后根据关键词词向量余弦相似度找出与关键词相关的词语构成拓展关键词集合,将集合中词语的词向量通过注意力机制的方式加入解码过程来影响回复生成。在中文微博数据集及英文Twitter数据集上的实验表明,该模型在回复语句的相关性及多样性方面取得了优于其他模型的结果。  相似文献   

12.
提出了一种网络信息文本分类模型的建立方法,根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型,分别进行了基于最近邻决策和K-近邻决策的分类效果试验研究,结果显示,K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

13.
Introduction Forvoicecontrolledtelephonedialingandinquirysystems,wordspottingisanimportanttechnologytodetectsomespecificwords(keywords)embeddedincontinuousspeech.HigginsandWohlford[1]definedfiltertemplatestorepresentnonkeywordspeechandproposedadynamictimewarping(DTW)basedcontinuousspeechrecognition(CSR)methodtodealwiththekeywordspottingproblem.Recently,hiddenMarkovmodel(HMM)basedkeywordrecognizersusingtheCSRmethodhavebeenreported[2,3].However,thesekindsofrecognizerscanonlydealwiththespo…  相似文献   

14.
提出了一种网络信息文本分类模型的建立方法。根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型。分别进行了基于最近邻决策和K-邻近决策的分类效果试验研究,结果显示:K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

15.
为了解决传统依据关键字、概念和属性值等检索技术没有考虑不同主体中情报信息间的语义关系,无法提供令用户满意的情报检索结果问题,通过语义Web方法研究了多功能情报信息自适应检索技术。设计基于语义Web的多功能情报信息自适应检索模型,检索模型包括人机交互层、知识处理层以及知识存储层。在知识存储层建立本体语义模型。在知识处理层,从检索的多功能情报信息关键词中推断和其语义有关的概念,依据概念有关词汇对原始查询进行扩展,对语义相似度进行计算。在人机交互层,将用户反馈情况看作判断检索结果优劣的衡量因素,依据相似关键词获取相似结果集,按照反馈因子完成对所有相似结果的排序,把排序结果发送给用户,实现多功能情报信息自适应检索。结果表明,所提方法能够同时保证召回率与精度;排序误差率低;检索结果和用户查询结果最相符,检索结果准确,可令用户满意。可见所提方法检索性能强。  相似文献   

16.
为提高信息检索的准确率和全面性, 在对语义检索技术和领域本体的构建进行充分研究的基础上, 在网络教育资源的检索工作中应用了本体语义的概念, 提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene 对扩展后的查询条件进行检索的语义检索模型。实验结果表明, 该检索模型的综合查全率为81郾5%, 综合查准率为83郾1%, 这两项指标均优于传统的关键字检索方法。  相似文献   

17.
基于社会利益的差异将社会划分为阶层、利益集团和个人,利用这种划分建立了基于多智能体的知识获取与发现的SEBI模型,提出了在SEBI系统中智能体喜好信息表与喜好地址表相关联算法,通过地址表进行通信和信息交互以及根据反馈信息修改自己思维状态的思想。这些算法保证了SEBI系统具有搜索信息范围小、效率高和自动改善性能等特点。  相似文献   

18.
A novel personalized Web search model is proposed. The new system, as a middleware between a user and a Web search engine, is set up on the client machine. It can learn a user's preference implicitly and then generate the user profile automatically. When the user inputs query keywords, the system can automatically generate a few personalized expansion words by computing the term-term associations according to the current user profile, and then these words together with the query keywords are submitted to a popular search engine such as Yahoo or Google. These expansion words help to express accurately the user's search intention. The new Web search model can make a common search engine personalized, that is, the search engine can return different search results to different users who input the same keywords. The experimental results show the feasibility and applicability of the presented work.  相似文献   

19.
中文网络话语流行植入英语关键词,自主选择英语关键词轻松交流,全英文连贯表达似乎就不遥远。不同句子结构的英语关键词,在人际评价语言中表达情感态度、对事物概念进行识别和归类、把观点与观点进行语篇层次对接。功能语法阐释旨在强调英文是在使用英语以完成相应功能的过程中自然而然生成的。  相似文献   

20.
该文运用文献计量学的共词分析方法对量子信息科学2002—2011年的56072篇SCI论文的关键词进行分析,通过多元统计分析、共词聚类分析、类团粘合力计算和绘制关键词一关键词共现的聚类树形图和核心关键词关联知识图谱,挖掘当前量子信息科学的研究热点,得出量子信息科学目前主要集中在量子密码、量子计算、量子纠缠、量子点、量子阱、半导体量子点、量子阱激光器、量子点激光器、量子信息科学实验技术、制备量子点、量子阱、量子芯片等方面的研究上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号