首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
大数据和人工智能作为国家战略,使得新技术在司法领域应用的重要性凸显.同时,最高人民法院推动人工智能在司法领域的深度应用为相关研究提供了契机.最高人民法院主导的信息化建设以及司法公开等需求使得大量的裁判文书上网,裁判文书作为重要的法律文本信息资源,包含大量关键的案件审判信息,具有多元化的研究与应用价值.然而,裁判文书中存...  相似文献   

2.
本文提出了一个基于法律事实的适用法条推荐模型.作为应用,本文选取了刑事诈骗罪和民事离婚纠纷两个案由的裁判文书数据集,使用FastText模型,并基于迁移学习方法从预训练的通用词向量出发训练法律词向量,再以此为基础进行文本分类.结果显示,经过迁移学习后,无论诈骗罪案件还是离婚纠纷案件均能做到对案情描述文本全面、准确地推荐适用法条,特别是具有针对性的法规、司法解释等.随着迁移学习模式的不断完善,本文研究的方法还应该可进一步用于证据推送、量刑预测等.  相似文献   

3.
基于文本交互信息对文本语义匹配模型的重要性,提出一种结合序列生成任务的自监督学习方法.该方法利用自监督模型提取的文本数据对的交互信息,以特征增强的方式辅助基于神经网络的语义匹配模型,构建多任务的文本匹配模型.9个模型的实验结果表明,加入自监督学习模块后,原始模型的效果都有不同程度的提升,表明所提方法可以有效地改进深度文...  相似文献   

4.
中文BBS态度倾向分析算法研究   总被引:2,自引:1,他引:1  
作为互联网上网民自由发表言论的重要场所,BBS包含了大量的舆情信息,对其进行分析和舆情监控具有重要意义.本文研究了中文BBS态度倾向的自动识别问题,提出了基于情感词的BBS态度倾向启发式算法以及基于有监督学习的BBS态度倾向识别算法.实验中使用了三种不同的分类模型,并将有监督学习算法与启发式算法进行了实验对比.实验结果表明,有监督学习的BBS态度倾向识别效果明显优于启发式算法的效果.  相似文献   

5.
以2004—2017年公开的30余万份涉毒类案件刑事判决书为研究对象,利用文本分类和信息抽取技术构建面向刑事案例的知识图谱,介绍了知识图谱的构建流程和技术方法.基于所构建的知识图谱,可实现对相关案件关键情节和判决结果的统计应用,为司法文书的智能化处理提供数据基础.  相似文献   

6.
长期以来,涉及未成年人人身侵害的案件屡屡成为媒体报道的热点.这类报道虽均采用匿名报道等方式保护未成年人的隐私权,但效果甚微.新闻媒体应努力寻找新闻价值和新闻侵权之间的平衡点,把尊重和保护未成年人的合法权益放在第一位.  相似文献   

7.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.  相似文献   

8.
将组件的颜色信息引入谱方法Matting中,利用组件颜色信息,通过对比各个组件之间的颜色相似性,对组件进行分组,从而提取出前景物体.这样做有两个好处:第一是可以摒弃传统的Matting问题解决方法中利用Trimap图进行半监督学习的过程,而是利用颜色相似性信息作为约束条件或者启发式信息应用到无监督的学习过程中,降低了自动提取前景物体的盲目性.第二是获得颜色相似性信息后只需要再结合很少的前、背景提示信息,就可以使得无法确定为前景还是背景的组件进一步减少,从而完成一个半监督的学习过程,而不用像传统方法那样引入大量的用户操作才能完成半监督的学习过程.  相似文献   

9.
交互支持向量机学习算法及其应用   总被引:31,自引:0,他引:31  
交互支持向量机学习算法能解决一些监督学习问题中学习样本较少的问题,它以支持向量机( S V M )方法为基础,将设计分类器变成一个交互的过程,即: 根据对已知样本进行的 S V M 分类器设计,主动采样选择“有用”的新样本,并进行下一步 S V M 分类器的设计。与普通 S V M 法相比,该方法所需的样本量大大降低,而且可能达到更好的推广能力。文本信息过滤问题的实例说明了该算法的有效性。  相似文献   

10.
网络社交媒体的快速发展提供了便捷的信息获取方式,但也滋生了谣言和虚假新闻,现有的谣言检测模型在有标注数据充足时能有效解决分类问题,然而谣言可用的标注数据有限,各种针对谣言特点精心设计的模型倾向于过拟合,同时,现有模型的鲁棒性不足,谣言传播者恶意破坏谣言传播结构会使模型出现分类错误.针对以上问题,采用自监督的图对比学习方法,对原始谣言传播图进行不同方式的数据增强来模拟对原图的扰动,建立自监督对比学习任务,使图编码器捕获谣言更趋本质的特征,缓解了过拟合,提高了模型的鲁棒性与泛化性能.在来源于主流社交媒体平台的三个公开数据集Twitter15,Twitter16和PHEME上进行了对比实验,实验结果显示,提出的模型的准确率比基准模型分别提高3.4%,1.8%和1.2%,证实了图自监督对比学习方法在谣言检测任务上的有效性.  相似文献   

11.
相似案例匹配任务旨在判断2篇裁判文书所描述的案件是否相似,通常被看作裁判文书的文本匹配问题,在司法审判过程中具有重要的应用。现有深度学习模型大多将案例长文本编码为单一向量表示,模型很难从长文本中学习到裁判文书之间的细微差异。考虑到案例文本各部分的内容较为固定,本文提出将案例长文本拆分为多个片断并分别编码,以便获取不同部分的细微特征;同时,采用可学习仿射变换改进相似度打分模块,使模型学习到了更多细微的差异,进一步提高了案例匹配的性能。在CAIL2019-SCM数据集上的实验结果表明,本文提出方法与现有方法相比准确率提升了1.89%。  相似文献   

12.
《河南科学》2016,(9):1423-1427
为了提高大规模数据的分类性能,提出一种基于主动学习的有监督在线多核学习算法SOMK_AL(Supervised online multiple kernel learning algorithm based active learning).首先,采用主动学习的方法缩减数据规模.通过训练生成两个分类器,对读入数据xt进行预测,将两个分类器预测类别不一致的数据作为信息含量高的有标记数据,参与在线学习过程中的核更新;接着,在核集成过程中,通过随机抽样的方法构造核函数集的子集,仅仅在子集中实现核更新,缩减核更新的计算规模.最后,在大规模数据的基准数据集上进行实验,对提出的算法的有效性进行评估,结果表明SOMK_AL能较好地提高数据的分类性能.  相似文献   

13.
提出了一种将监督学习和半监督学习融合的方法,并用于从文献中自动抽取蛋白质关系.在AImed语料上的实验得到63.2%的F值,这表明该方法达到目前较好的性能.  相似文献   

14.
提出了一种基于LPA和Tri-Training算法的半监督文本倾向性分类框架.通过LPA对初始样本进行快速分类,获得更多可信的有标签数据,优化分类框架的训练过程.引入Tri-Training算法,提高分类框架的泛化能力和可用性.实验结果表明,在不同标注比例的样本集上,该框架都有较好的分类性能,相较有监督学习算法和单一的半监督算法提高了分类精度,并有较强的鲁棒性,为解决有标签样本比例较少情况下的文本倾向性分类提供了一个新的思路.  相似文献   

15.
在机器学习中,当测试阶段无法得到训练阶段拥有的特权信息时,特权学习(learning using privileged information,LUPI)是一个有效的解决框架.由于获取特权信息需要特殊的条件,或由于其他原因,往往不能获得全部训练样本的特权信息,因此提出了一种直观却有效的方法.对于缺失特权信息的这部分训练样本,将它们的可用信息同时用作特权信息,并将其纳入到支持向量机(support vector machine+,SVM+)的模型中,引入了一种新的扩展SVM+(extended SVM+,e SVM+)模型.进一步地,对于不涉及特权信息的常规有监督学习问题,也将训练样本的特征(可用信息)同时用作特权信息,引出一种新的扩展SVM模型(e SVM),e SVM也可认为是SVM+的特例.在两个公开的人脸表情数据库BU-3DFE和Bosphorus上进行了实验,结果证实了将可用信息用作特权信息策略的有效性.  相似文献   

16.
流形学习算法是维度约简与数据可视化领域的重要工具,提高算法的效率与健壮性对其实际应用有积极意义.经典的流形学习算法普遍的对噪音点较为敏感,现有的改进算法尚存在不足.本文提出一种基于监督学习与核函数的健壮流形学习算法,把核方法与监督学习引入降维过程,利用已知标签数据信息与核函数特性,使得同类样本变得紧密,不同类样本变成分...  相似文献   

17.
樊晓明 《科技信息》2013,(15):488-489
《中华人民共和国政府信息公开条例》的公布与实施,使政府信息资源管理有了法律保障,各政府机构之间的信息流通障碍得以打破,社会各界也能更加有效地监督政府工作。但是,政府信息公开的过程中可能会涉及到公民个人信息的内容,处理不当就会对公民隐私权、财产权、经营权等权利造成危害。本文的主旨就是探讨在政府信息公开的过程中,如何合理保护公民个人信息。  相似文献   

18.
行政案卷作为行政行为的重要载体,是很多政府信息公开申请案件的诉讼标的。但行政案卷的性质比较特殊,在信息公开申请中的审查难度较大,公开的标准难以把握。从审查维度上讲,法院需要对行政案卷公开申请进行深入细致的审查,履行相应职责,在相对人信息公开诉权保障与行政机关不宜公开的事项之间进行权衡,确保行政利益与相对人诉权保护的良性互动。通过行政案卷公开申请的规范分析、域外考察、规则重构等角度研究法院在此类案件中的审查要素,从内部信息、过程性信息、档案信息等维度进行细致分析,明确具体案件应该适用的审查标准,以期对理论和实践有所裨益。  相似文献   

19.
对只能获得部分标记的训练文本,将主动学习方法应用到文本信息抽取中,提出了一种基于主动学习隐马尔可夫模型的文本信息抽取方法.在该方法中,通过主动学习,仅将对隐马尔可夫模型的训练最有价值的训练文本挑选出来进行标记.实验表明,通过选择模型信任值的最佳门槛值,该方法在保证文本信息抽取性能的前提下,大大减少了用户标记训练文本的工作量.  相似文献   

20.
近年来,互联网信贷市场迅猛发展,多角度多信息源充分了解贷款申请人的信用情况显得愈发重要。法院的案件裁判文书的权威性、规范性以及其官方可得性,使其成为贷款申请人信用评估的重要数据源。命名实体识别技术在司法领域的应用亟待探索。针对网上公开的刑事裁判文书进行概要信息提取,构建基于罪名相关成分标注语料库的隐马尔科夫模型和最大熵马尔科夫模型,并利用其识别提取裁判文书中的被告人及其罪名等关键司法信息,可以为互联网信贷平台的信用风险管理工作提供更充分的信息资源。开放性测试结果显示基于罪名相关成分标注的HMM和MEMM的平均F值分别达到了87.79%、90.25%,说明提出的方法克服了裁判文书格式的差异和罪名实体识别的困难,具有较好的刑事裁判文书概要信息提取效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号