作者:王红; 李晗; 李浩飞 期刊:《计算机科学与探索》 2020年第02期
针对民航突发事件领域本体关系抽取准确率低的问题,提出了一种结合注意力机制与双向门控循环单元(BiGRU)的关系抽取模型。首先查询预先训练的词向量矩阵,将文本中每个词语映射为向量表示;其次构建BiGRU,得到词语序列的上下文语义信息;然后在词语层面和句子层面分别引入注意力机制,为表达语义关系更重要的词语和句子分配更大的权重;最后进行模型的训练与优化。将该模型应用在民航突发事件领域本体的关系提取中,实验结果表明该模型相...
作者:李兴亚; 陈钰枫; 徐金安; 张玉洁 期刊:《北京大学学报·自然科学版》 2020年第01期
提出一种融合门控机制的远程监督关系抽取方法。首先在词级别上自动选择正相关特征,过滤与关系标签无关的词级别噪声;然后在门控机制内引入软标签的思想,弱化硬标签对噪声过滤的影响;最后结合句子级别的噪声过滤,提升模型的整体性能。在公开数据集上的实验结果表明,相对于句子级别噪声过滤方法,所提方法的性能有显著提高。
作者:宋睿; 陈鑫; 洪宇; 张民 期刊:《中文信息学报》 2019年第10期
关系抽取是信息抽取领域一项十分具有挑战性的任务,用于将非结构化文本转化为结构化数据。近年来,卷积神经网络和循环神经网络等深度学习模型,被广泛应用于关系抽取的任务中,且取得了不错的效果。卷积网络和循环网络在该任务上各有优势,且存在一定的差异性。其中,卷积网络擅长局部特征提取,循环网络能够捕获序列整体信息。针对该现象,该文综合卷积网络抽取局部特征的优势和循环网络在时序依赖中的建模能力,提出了卷积循环神经网络(...
作者:尹鹏; 周林; 郭强; 刘镇江 期刊:《计算机技术与发展》 2019年第09期
关系抽取是自然语言处理的重要研究内容,是知识图谱构建的关键技术。目前,在神经网络中引入注意力机制进行关系抽取成为主流方法,现有方法一般结合句子单词和实体相关性计算注意力,没有考虑短语和实体关系之间的相关性,并且对实体信息利用不够充分。针对该问题,提出基于短语级注意力机制的关系抽取方法。首先用卷积层对词向量做卷积,以滑动窗口的方式得到短语级的向量表示,然后利用短语与实体关系之间的相关性计算注意力。为了使实...
作者:李浩; 刘永坚; 解庆; 唐伶俐 期刊:《计算机科学》 2019年第10期
实体关系抽取作为信息抽取的主要任务之一,其目的在于确定无结构文本中两个实体的关系类别。目前准确率较高的有监督方法由于需要大量的人工标注语料而受到了限制,而远程监督方法则通过知识库与文本集进行启发式对齐来获取大量关系三元组,这是解决大规模关系抽取任务的主要途径。针对目前远程监督关系抽取的研究未能充分利用句子上下文词语的高层语义,以及未考虑关系之间的依赖包含关系的问题,文中提出了一种基于多层次注意力机制...
作者:熊晶; 焦清局; 刘运通 期刊:《信息技术与信息化》 2019年第12期
甲骨学研究离不开后世文献的调研和分析,且其涉及的研究内容十分广泛。为解决文献调研中学科体系庞大、知识点繁杂、信息孤岛林立等问题,提出建立甲骨学知识关联网络的方案。基于科学知识图谱在文献分析方面的优势,实现了甲骨学的实体发现和关系抽取,从而构建了知识网络,以期更好地服务于甲骨学研究。
作者:柴瑜晗; 刘妍; 司亚琪; 仇晶 期刊:《信息技术与网络安全》 2018年第04期
随着互联网的快速发展,数据量呈现爆发式增长,对海量的互联网数据进行有效分析并且快速精准地挖掘有用知识是人们的迫切需求。大数据分析技术、信息抽取技术以及网络表示学习的研究能够有效进行大数据分析和抽取有用的知识,吸引了大量的研究者的目光。对近年来的大数据分析技术、信息抽取技术以及网络表示学习的工作进行了介绍和总结。
作者:杨肖方; 陈锦秀; 张加臻 期刊:《心智与计算》 2012年第01期
本文介绍了利用半监督学习方法自动发现标注语料中丢失的关系类型。针对候选关系样例,我们采用混合模型来表示,即利用关系类型的语言信息和结构化信息来表示一个关系样例。我们利用半监督学习算法Bootstrapping和标签传播算法标注语料中已存在关系类型的样例。对于剩下的关系样例,我们采用聚类的方法,得到的结果对应到标注语料中丢失的关系类型。本实验的实验数据是ACE2005中文语料,实验表明我们的模型取得了良好的效果。
作者:吴粤敏; 丁港归; 胡滨 期刊:《数据分析与知识发现》 2019年第05期
【目的】研究中文文本中关系自动抽取的方法。【方法】以224家农业上市公司2015年–2017年的678份年报为数据来源,采用基于双重注意力机制的门控循环单元算法,进行中文文本关系自动抽取研究。【结果】最终模型在农业金融文本数据集上的平均准确率达78%,相较循环神经网络算法,该算法平均准确率提高约12%。【局限】仅针对224家农业上市公司的数据进行研究,研究涉农企业对象有待进一步拓展。【结论】该模型能够在农业金融相关文本的关...
作者:张婷 期刊:《电子技术与软件工程》 2019年第01期
本体是知识工程和人工智能本体是研讨的一个重要课题,其目标是获取相关范畴的常识,供给对该范畴常识的一起理解,识别该范畴公认的词汇,而且从不同的形式化术语层次上出现这些词汇,明确定义词汇之间的关系还有词汇。范畴本体的构建是一个非常复杂的进程,本文对本体构建概念获取、关系获取以及应用的关键技术相关内容进行综述,期望本文的综述能够对深入理解本体构建相关内容有所帮助。
作者:汝承森; 唐晋韬; 谢松县; 李莎莎; 王挺 期刊:《国防科技大学学报》 2018年第03期
目前远监督方法被广泛应用于关系抽取任务.然而,远监督方法中存在大量错误标注现象,给 远监督方法的学习效果带来了很大的影响.提出利用语义Jcad 度量关系短语与依存词间语义相似性的错 误标注消除方法.消除错误标注后的训练数据用于训练模型,完成关系抽取.实验结果表明:该方法可以有 效消除错误标注,提高关系抽取的性能.
作者:陈文瑞; 姜开; 杨春雷 期刊:《航天工业管理》 2019年第04期
互联网上的知识大都以非结构化或者半结构化的形式存在于文本、表格和网页中,使得对知识的抽取以及应用较为困难,谷歌公司认为完美的搜索引擎应该能够准确理解用户的意图并且正确反馈用户所期望的信息。与人的记忆偏重于关联类似,搜索结果中也体现着关联,以“链接”为中心的系统在开放的互联网环境里更容易生长和扩展。
作者:鲍玉来; 耿雪来; 飞龙 期刊:《现代情报》 2019年第08期
[目的/意义]在非结构化语料集中抽取知识要素,是实现知识图谱的重要环节,本文探索了应用深度学习中的卷积神经网络(CNN)模型进行旅游领域知识关系抽取方法。[方法/过程]抓取专业旅游网站的相关数据建立语料库,对部分语料进行人工标注作为训练集和测试集,通过Python语言编程实现分词、向量化及CNN模型,进行关系抽取实验。[结果/结论]实验结果表明,应用卷积神经网络对非结构化的旅游文本进行关系抽取时能够取得满意的效果(Precision ...
作者:陈振彬; 叶颖雅; 冯浩男; 李明轩; 陈珂 期刊:《广东石油化工学院学报》 2019年第04期
在中文关系抽取任务中,数据稀疏和噪声传播问题是其研究难点。基于此,提出了在文本特征组织方面融合位置特征、最短依存特征和N-gram特征等多元特征,并提升关键性特征的权重,以缓解传统词特征的数据稀疏问题。这种组合特征进一步改善了文本中噪声传播问题,提高了句法特征在稀疏性问题下的可靠性。此外,在传统的双向LSTM神经网络中加入注意力机制,使模型更关注较为重要的特征,降低噪声对抽取任务的影响。在人物关系公开语料集上进行...
作者:温政; 段利国; 李爱萍 期刊:《计算机工程与设计》 2019年第09期
对命名实体之间的语义关系抽取进行研究。分别使用Word2vec和GloVe对句子最短依存路径进行词向量表示,作为卷积神经网络和双向长短期记忆网络的输入,通过网络自动学习特征,通过拼接的方式将两种特征融合,通过softmax分类器得出所属关系的类型。采用SemEval-2010 Task 8数据集,实验结果表明,使用多种词向量表示最短依存路径和通过拼接的方式融合卷积神经网络与长短期记忆网络的特征能显著提高关系抽取的效果。
作者:杜嘉; 刘思含; 李文浩; 徐啸迪; 刘旭红 期刊:《智能计算机与应用》 2019年第01期
关系抽取是构建知识图谱的一个重要过程。为了更好地构建煤矿领域知识图谱,本文对关系抽取的方法进行研究。传统关系抽取方法在训练前多需要人工选取特征、大量标注数据、且需要专业领域的专家辅助、费时费力、且成本较高。本文采用字向量和深度学习相结合的方法对实体间的关系进行抽取,降低数据标注的难度,提高训练效率。实验结果证明使用字向量与深度学习相结合的方法能够较有效地完成煤矿领域实体关系抽取的任务。
作者:吴佳昌; 吴观茂 期刊:《计算机应用与软件》 2019年第04期
关系抽取是自然语言中的一项重要任务,其结果对后续的信息抽取和自动问答系统有重要的影响。随着深度学习的日益火热,基于卷积神经网络的实体关系抽取已取得了不错的结果。不过词向量表示比较单一,提取的特征也有限。针对这个问题,将Word2vec训练的词向量和由自然语言处理工具得出的依存关系对分别作为模型两通道的输入向量,使用双通道卷积神经网络提取特征来实现实体关系抽取。该模型可以提取更深层的语义信息,并取得了比传统词向...
手机短信3D动画自动生成系统是根据发送方短信的内容,经过信息抽取、语义分析等一系列步骤,最终生成一段与短信内容匹配的三维动画并发送给接收方.信息抽取处于手机3D动画自动生成系统首要和关键的位置,其目的是为3D动画自动生成系统的后续环节提供可动画的信息.本文引入路径特征实现中文短信文本的关系抽取.利用哈尔滨工业大学LTP-Cloud平台对短信进行预处理,从处理结果中提取路径并泛化得到路径特征,通过一阶归纳学习器组合特征,...
作者:张金壬; 章韵; 王宇 期刊:《计算机应用研究》 2019年第07期
关系抽取是信息抽取中的一项重要任务。在处理问答对形式的文本时,除了文本中实体间的关系抽取之外,作为连接问句与答句之间关系的提问模式同样需要抽取。通过有监督的标注算法(条件随机场)与基于模板元组自举的半监督算法的结合在抽取实体间关系时有不错的表现,但传统半监督中发现句式模板的方式难以迁移到提问模式抽取中。针对这种情况,通过引入句向量计算文本相似度并选取句式模板,提出一种基于sentence2vec技术与半监督算法结...