首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
由于科学研究的复杂性以及社会性,越来越多的研究者倾向于通过合作共同解决科研问题。而合作发表论文成为研究者之间合作的重要方式,合作发表能促进研究者之间乃至研究机构之间的知识交流和资源共享。为此收集并整理了CNKI(中国知网)2001—2016年K大学M学院教师的论文合作数据,构建研究者合作网络。在此基础上,运用科学计量学和社会网络分析法,系统理解合作网络的特征及规律,以期为促进高校的科研与创新活动管理,提供新的视角和建议。  相似文献   

2.
Web文本分类是Web文本挖掘的主要内容,而特征项权重的计算是web文本分类中一个非常重要的步骤。Web文本一般由标题、描述和正文三部分组成。根据Web文本的这一特点,本文提出了一种基于位置的特征项权重算法,并使用此算法对Web文本进行了分类实验。实验结果表明该算法有效提高了Web文本分类系统的分类性能。  相似文献   

3.
意见挖掘在企业智能分析、政府舆情分析等领域发挥着重要作用,为了充分挖掘主观性文本所蕴含的商业价值和社会价值,提出了一种基于情感主题模型的特征选择方法。该方法重点考察极性词及其共现现象,采用主题模型挖掘出正面褒义主题和负面贬义主题中极性词的分布情况,旨在度量情感特征在情感倾向表达中的重要性。实验阶段结合支持向量机分类器进行分析。实验表明该特征选择方法能有效提高跨领域文本情感分类准确性,具有较好的实用价值。  相似文献   

4.
梁泉  翁剑成  胡娟娟  韩冰 《科学技术与工程》2021,21(28):11921-11931
公共交通是保障城市交通顺畅绿色运行的重要支撑,准确把握公共交通出行行为特征和需求是关键。从公共交通出行行为特征挖掘和行为预测两方面,解析了以往公共交通出行需求分析存在的问题及原因。结合北京市交通运行监测平台数据和多源数据处理方法,分析了多源数据为公共交通出行特征精细化挖掘和行为精准化预测带来的机遇,并从数据关联分析和计算效能等角度梳理了面临的挑战。从公共交通多源数据关联匹配、公共交通出行特征刻画和公共交通出行行为预测三个方面提出了解决思路和方法,并通过案例分析验证了可行性。为把握多源数据驱动下精细化的公共交通出行需求提供了总体解决方案。  相似文献   

5.
中文文本挖掘的特征导航机制   总被引:9,自引:0,他引:9  
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制,按概念层次和上下文环境展现用户所关心的内容  相似文献   

6.
在设备状态监测过程中引入数据自组织挖掘思想,建立一种设备状态退化预警方法。采用隐马尔科夫模型(HMM)对设备的早期退化状态进行准确辨识和评估,并进一步建立设备退化过程的自组织预测模型。案例分析中将该方法应用到旋转机械轴承运行状态退化的预警过程中。结果表明,基于自组织数据挖掘的设备状态退化趋势预测方法预测效果准确、客观性强,预测值与实际值的拟合程度高,相对误差仅为3.1%。新方法能够预测设备未来时间段的退化状态及其发展趋势,提前给出预警信息,有效地制定预知维修计划,及时采取预防措施,防止因设备突发失效引起非计划停机造成生产和经济损失。  相似文献   

7.
探讨围绕知识发现领域中较为宏观、较为重大的问题。首先,根据复杂类型数据(包括Web数据、多媒体数据、空间数据、时间序列数据等)所具有的非线性动力学性质和特征,采用模式(定义为Hilbert空间中的矢量)来定量地表征复杂类型数据的多变性及具有的不确定状态和行为,并用模式的变化来刻画其整体知识发现过程的发展和演变规律;其次,以知识发现系统内在机理的研究为基础,构造了复杂类型数据知识发现系统的总体结构模型——发现特征子空间模型DFSSM;最后,用基于Web的文本挖掘系统和基于图像信息(气象云图)的知识发现系统作为实例进行了验证,结果表明DFSSM方法对于非结构化的文本数据及图像数据类型的知识发现过程具有指导性作用。因此,该结构模型具有较好的实用性与普适性,有望拓展到其他复杂类型数据的知识发现过程中。  相似文献   

8.
张晖  张艳 《科技信息》2007,(30):87-87
基于Web的文本挖掘是文本挖掘的一个重要的组成部分,本文对文本挖掘的主要过程如文本预处理、特征表示、特征提取等进行了讨论。  相似文献   

9.
利用少量转变文本的行间距与字间距等空间特征,提出了一种利用替换文本空间特征进行隐藏信息嵌入和提取的策略.  相似文献   

10.
工程施工招标投标制是我国建筑业和基本建筑管理体制的一项重大改革,是加强建筑市场管理的重要环节。自推行招标投标制以来,我国已经初步形成了一个建筑市场管理框架,目前正朝着统一、开放、竞争有序的方向发展。如今,招标投标是市场竞争的基本方式,在招标过程中人们最为关心也是需要着重考虑的问题,即如何报价才是最有效的。围绕这个主题,本文以一个全新的角度来论述工程施工项目的投标报价策略研究。  相似文献   

11.
《创新科技》2020,(2):38-48
中国的经济发展具有地区特色,不同省份的政策制定存在异同,把握异同之处有益于政策制定。运用ROSTCM6.0文本挖掘软件,以及NETDRAW和UCINET社会网络分析软件对浙江省、甘肃省的省级农村电商政策文本进行了文本分析。研究发现,由于农业基础、经济水平、技术发展的差距,浙江省与甘肃省在农村电商政策制定时有不同的侧重点。基于研究发现,提出各地区应根据当地经济社会发展、技术水平等情况制定有效的电商扶贫政策并根据地区的发展变化而及时调整相关政策的建议。  相似文献   

12.
文本特征选择是自然语言处理中的关键问题。针对文本特征的高维性和稀疏性问题,在过滤式特征选择算法文档-逆文档评率(term frequency-inverse document frequency, TF-IDF)的基础上,提出了用遗传算法对文本特征进行优化选择,使其最大程度地贴合后续的文本分类算法,在保证文本分类精确度的同时,降低特征维度以缩减预测时间。实验显示,该算法与单一的过滤式文本特征选择算法相比,能够有效减少所选文本特征数量(即降低特征维度),能有效提高文本的分类能力。  相似文献   

13.
信息隐藏技术在如今信息战争与商业机密传递中占据了越来越重要的地位,而文本信息由于其冗余较少、便于传播、易于校验等特点是目前电子信息传播的主要手段。利用字处理软件书写文本时可对文本信息设置各种文本格式这一特点,提出了一种利用文本特征进行信息隐藏的嵌入和提取策略。  相似文献   

14.
Web应用中大量用户请求频繁与数据库交互会严重影响系统性能,中间件层缓存有助于减少请求与数据库的交互开销、提高服务器的响应速度。研究了在Web应用服务器中引入语义缓存机制,在查询缓存时利用语义信息进行匹配,然后动态追踪和分析用户访问时间性、访问内容量、业务关联等用户访问特征,在此基础上设计一种基于用户访问特征的语义缓存替换算法。原型实验表明其能够提高缓存命中率,并使服务器的响应时间和吞吐量也得到改善。  相似文献   

15.
海下采煤防治水工作重点是对顶板突水水源的预测和监控。本文通过对海域不同水体的水文地球化学特征研究,及不同水体的混合水样配比试验,找出水情监控中的特征离子并加以辨识,确定预警阈值,辅以水质自动监测系统,实现对海水溃入的早期预测预警,确保海下采煤安全。  相似文献   

16.
本文以2012年美国数学建模ICM给出的数据为例,采用语义网络分析的思想,从节点嫌疑程度和话题嫌疑程度两指标出发建立数学模型,并结合灰色关联度分析将两种指标转化为嫌疑程度优先级,给出该社交往网络中罪犯的嫌疑程度优先级排名,实证结果表明了模型的有效性。  相似文献   

17.
为实现“安全第一、预防为主、综合治理”的民航安全管理目标,建立了从报告中学习并评估风险等级的深度学习模型.首先采集航空安全报告系统中10年报告,根据严重度建立事件后果的量化指标,确定5个风险等级:高、中高、中、中低和低风险,并消除事件结果分布不平衡和结果多样性的影响.然后应用卷积神经网络(Convolutional Neural Network,CNN)探索非结构化的事件概要与风险等级之间的关系,通过该模型对事件进行分类,确定风险等级.风险评估模型与不同量化指标和不同方法对比,其分类准确率可达96%,优于其他指标和方法.最后应用该模型对非结构化的事件概要挖掘,对2020年事件进行快速的风险评估,预测准确率可达80%.基于CNN的民航风险评估模型可以对文本格式的事件概要充分挖掘,快速评估与主动感知风险,对支持安全预警具有重要意义.  相似文献   

18.
本研究阐述了分析区域创新现状与模式,对于实施创新驱动发展战略的重要意义。基于对四川省获科技进步奖项目的分析,运用文本挖掘与社会网络分析法对四川省的区域开放协同创新进行了研究。结果表明:四川开放协同创新中政府、企业、高校、研究机构、医院5大主体间的多边合作逐步加强,其中企业始终保持主导地位,高校企业、产学研、研究机构企业合作项目较多且趋势良好;区域开放协同创新水平由高到低依次为成都平原、川南、攀西、川东北、川西北经济区,城市开放协同创新格局呈“核心-边缘”分布特征;四川形成了全省、各经济区“大小”日益复杂的开放协同创新网络,其中成都长期保持网络中心地位,次级网络中心则在成都平原、川南、攀西和川东北经济区动态变化。最后提出统筹规划布局多个区域创新中心、优化区域开放协同创新网络、构建良好创新生态系统、强化企业创新主体地位等建议。  相似文献   

19.
特征选择是机器学习和数据挖掘中的一个关键问题,它可以实现数据维度的约减,从而提高学习模型的泛化能力.近年来,为了提高特征选择算法的性能,集成思想被应用到特征选择算法中,即将多个基特征选择器进行集成.本文从提高特征选择算法对大规模数据处理能力的角度出发,提出了一种基于最小最大策略的集成特征选择方法.它主要包括三个步骤:第一,将原始数据根据类别信息划分成多个相对较小的平衡数据子集;第二,在每一个数据子集上进行特征选择,得到多个特征选择结果;第三,对多个特征选择结果依据最小—最大策略进行集成,得出最终的特征选择结果.通过实验对比了该集成策略与其它三种集成策略对分类准确率的影响,结果表明最小最大集成策略在大部分情况下能够获得较好的性能,且基于最小最大策略的集成特征选择可以有效处理大规模数据.  相似文献   

20.
新型研发机构逐步上升为中国创新驱动发展的主力军。利用文本挖掘、共词语义网络分析等方法,全面剖析长三角和珠三角地区新型研发机构政策的注意力焦点和政策工具,为支持高水平新型研发机构建设与发展提供参考。研究发现:政策类型以“通知”和“意见”为主,体现了政府的弹性管理机制,但执行力度较弱;政策注意力与新型研发机构的使命、功能内涵密切相关,鼓励政产学研高度融合,突出企业主体地位,强调体制机制创新;政策工具运用存在结构性失衡,注重供给型政策工具,环境型和需求型政策工具使用不足。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号