作者:项威; 王邦 期刊:《计算机技术与发展》 2020年第02期
事件抽取是构建知识图谱的关键任务之一,也是当前自然语言处理的研究热点和难点问题。事件抽取研究从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息,对人们认知世界有着深远的意义,在信息检索、智能问答、情感分析等应用场景有着重要的意义和价值。在公开国际测评和语料的推动下,事件抽取研究受到越来越多的学者关注,取得了许多的研究成果。按照事件抽取任务定义,有预先定义结构化的事件表示框架的框架表示事件抽取和通过...
深度卷积神经网络属于类脑计算领域的一类比较重要的研究,已经在一些领域取得了突出的研究成果且被广泛运用。其中在自然语言处理、信息搜索、声音识别、计算机视觉以及语义理解等方面。因为这些成就导致在工业和学术领域人们开始对神经网络进行研究,同时促进了人工智能的开发,只需在卷积神经网络传入数据,就可以根据数据表现出相应的症状。
作者:牟志; 殷锋; 袁平 期刊:《现代计算机》 2020年第02期
深度神经网络(DNN)的日益发展被应用到图像语音识别等多个领域之中,然而面对输入样本的轻微改变,经过DNN复杂的内部神经元可能导致细小的扰动被大幅度地扩大,从而使得神经网络模型的输出结果完全不同于人工判别结果,对于自然语言处理任务中,可以诱导欺骗垃圾邮件短信识别系统。通过统计词向量空间各个维度分布变化,提出一种基于高斯分布的中性词构造方法(GSNeutral),在此基础上建立GScRNN网络,纠正出输入样本中存在扰动的部分,通过...
作者:刘胜杰; 许亮 期刊:《现代计算机》 2020年第01期
文本的表示是自然语言处理领域重要的工作,如何更好地表示文本语义是自然语言处理领域实际应用的重要基石。通过训练得到的词嵌入向量表示,可以认为其即代表单词本身及其含义。单词在不同语境下的含义不一样,不同的语境下涉及到一词多义问题,如何准确表示词嵌入向量以适应不同的语境也是目前研究的热点。目前词嵌入技术还处于初级阶段,还有很多问题值得深入研究。
作者:段雨佳; 鞠婷 期刊:《电子科技》 2020年第01期
针对代码审查过程中的代码审查意见对于开发者可能无价值的问题,文中提出了一种基于深度学习长短期记忆网络的代码审查意见有效性评估方法。该方法通过提取代码审查意见中与审查意见有效性相关的特征,并根据这些特征构建评估模型,从而评估审查意见对于开发人员是否有价值。为了验证方法的有效性,文中选取了GitHub上开源Eclipse项目中的审查信息作为实验数据,并将所提方法与其它机器学习方法对比。实验结果表明,该方法可以有效评估...
作者:陈天翔 期刊:《信息技术与信息化》 2020年第01期
本文针对在金融领域的研究中,面对大量文本数据时缺乏有效分析手段、分析效率低的问题,应用自然语言处理技术,提出了一种基于注意力机制和深度学习的金融文本情感分类模型。该模型可以把自然语言表示的金融文本作为输入,通过计算自动得到情感分类标签,进而为金融舆情研究提供一定的参考。实验结果表明,该模型在由新闻标题、公告标题组成的数据集上具有很强的拟合能力,此外引入注意力机制对情感分类的准确性有较为明显的提升。
作者:吴冰; 刘伟军; 宋元斌; 李福林; 熊若鑫 期刊:《制造业自动化》 2020年第03期
目前的电网设计评审主要依靠人工进行,过程枯燥,耗费时间,容易产生错误和遗漏,设计模型的合规性自动评审是解决上述问题的一条重要途径。针对GIM模型净空距离规范,提出基于自然语言处理的自动化评审方法,设计专门用于描述设计规范的受限自然语言GIM-CNL,用以提高目前的自然语言处理工具提取规范条文信息的准确率,经NLP技术处理生成相应的语法树,进一步依据领域本体模型转化为以DSL语言表述的规则,计算机自动依据DSL规则对GIM模型进...
作者:张海军; 陈映辉 期刊:《计算机工程》 2020年第03期
通过类图像处理与向量化方法对访问流量语料库大数据进行词向量化处理,实现面向大数据跨站脚本攻击的智能检测。利用类图像处理方法进行数据获取、数据清洗、数据抽样和特征提取,设计一种基于神经网络的词向量化算法,得到词向量化大数据。在此基础上,提出多种不同深度的DCNNs智能检测算法。设置不同的超参数进行实验得到算法的识别率均值、方差和标准差,结果表明,该算法具有较高的识别率和稳定性。
作者:彭祝亮; 刘博文; 范程岸; 王杰; 肖明; 廖泽恩 期刊:《计算机工程》 2020年第03期
基于方面的情感分析已广泛应用于文本信息挖掘,但在句子情感极性模糊或包含多个不同方面情感极性时难以准确提取特征信息,削弱了情感极性分类效果。为解决该问题,提出一种结合双向长短记忆网络和方面注意力模块的情感分类方法。利用多个方面注意力模块同时对不同方面进行独立训练,使每个方面信息与注意力操作互不影响,各自进行注意力参数的学习与调整,以充分提取特定方面的隐藏信息,从而更准确地识别不同方面的情感极性。在SemEval...
11月6日,寒武纪科技公司新一代人工智能芯片,采用与“阿尔法狗”类似的深度学习技术,适用范围覆盖了图像识别、安防监控、智能驾驶、无人机、语音识别、自然语言处理等人工智能的重点应用领域.寒武纪公司首席执行官陈天石介绍,与传统芯片不同,寒武纪的人工智能芯片模拟大脑的神经元和突触,一条指令即可完成一组神经元的处理.这种计算模式在做智能处理时,比如识别图像,效率要比传统芯片高几百倍.
语言学理论对自然语言处理的影响不仅仅从基本的理性主义中可以看到,同时也可以从机器学习上感受到。但是现阶段由于人们的科学技术和知识储存量有限,很多时候对于自然语言处理的影响还没有足够的了解,现阶段我国的自然语言处理仍然是困扰人们的难题。因此,本文主要对语言学理论和自然语言处理、语境语义与自然语言处理、社区语境语用大数据进行阐述,为日后研究自然语言处理的应用和作用提供参考依据。
作者:shirleyxie 期刊: 2019年第08期
近日,专注于人工智能认知领域的AI创业公司RichAI睿企科技完成近千万美元天使轮融资,由昆仲资本和云启资本联合投资。据悉,本轮融资将主要用于下一代认知智能系统,深度学习及NLP(Natural Language Processing,自然语言处理)技术的深入研发及垂直行业的产品落地,建立开放兼容、自主智能、不断发展的新一代行业智能化系统生态环境。
命名实体链接作为自然语言处理的一个重要分支,能够将文本数据转换为带有标注的文本,通过从文本到概念的转化,能够便于计算机快速准确地获取目标信息,在查询意图分析、文本挖掘、知识库构建等方面具有广泛的应用前景。命名实体链接技术主要由命名实体识别和命名实体消歧两个分支组成,本文着眼于这两个技术分支,介绍了命名实体链接的发展状况和技术原理,结合专利申请重点梳理了技术演进路线。
作者:李国红; 姜磊; 张超 期刊:《信息通信技术与政策》 2019年第10期
在人工智能技术体系中,计算机视觉与图像识别、语音识别和语音合成、自然语言处理属于基础性功能技术,被研究应用于智能机器人、自动驾驶、智慧医疗、智能安防等产品和领域,是人工智能发展至今最接近产品化的技术。本文基于对上述3类技术全球及国内专利检索和大量专利文献的阅读,分别对其专利申请现状、特点和申请趋势进行了深入分析,并对比相关国家高科技企业专利布局差异,希望为国内企业开展人工智能技术研究和知识产权布局提供...
8月24日,“中国数字图书全球发行平台”会在京举办。“中国数字图书全球发行平台”由北京欣博友数据科技有限公司和美国传捷通睿公司合作开发。该平台拥有自主的知识产权和先进技术,可制作完成符合全球各渠道要求的各种电子书格式,并与全球300多家一级电子书阅读渠道和23万多家图书馆建立了合作关系,可制作符合ONIX及其他标准的图书元数据,拥有自然语言处理(NLP)数据分析技术,可对电子书全球销售数据进行收集,整合和分析...
近日,麦肯锡的最新报告预计,机器将在未来2~3年取代30%的银行员工。但同时强调,自动化不一定等同于裁员。报告认为,采用机器学习、自然语言处理、认知技术、自动化流程、智能工作流工具已成为全球投行业的大趋势,目的是用机器来做大量重复性劳动,在降低运营成本的同时,更好地协助前台部门(front office)服务客户。
作者:吴刚勇; 张千斌; 吴恒超; 顾冰 期刊:《电力大数据》 2018年第10期
本文主要结合浙江湖州电力业务需求,旨在打破客户对用电诉求存在的盲区,从而提高对用户用电需求的管理程度,实现热点投诉业务工单的原因挖掘。为了更好的深入挖掘投诉工单背后所蕴含的信息,研究基于自然语言处理技术出发,对电力客户投诉工单进行深入文本挖掘,利用隐马尔可夫模型等分词技术分析投诉工单中的受理内容,进行词频统计,通过TF-IDF算法计算关键词重要性权重值,提取权重值大的关键词频作为客户投诉文本挖掘的最终结果,并运...
自然语言处理预测司法是实现智慧司法的技术路径,目的在于解决司法效率之困、庭审实质之困、司法公正之困。其预测的精准程度受制于法律逻辑模型的完善程度、自然语言技术处理文本的张力、法律预测理论引导下实践的优化。智慧实践又不得不面对法学本身基本矛盾,即逻辑和经验影响下正义困境,规范和判例导向中的规范适用,事实与价值争论中规范生成的难题。本文拟从伦理构建、语料建设、渐进改革、风险规制等路径构建,从而合目的、有...
主语人称代词在人类语言中扮演着至关重要的角色,自然语言处理中不可避免地要理清各个代词间的关系和其指向事物的类型。由于代词指代事物的变化性,代词的处理成了机器翻译中的一大难点。法语和汉语两种语言中不同的人称代词系统的区别造成了二语间机器翻译的许多障碍。在本篇论文中,我们将借助两种机器翻译引擎的翻译结果分析在法汉主语人称代词处理上出现的问题与难点并加以总结归纳,提出相应的改进方法。
作者: 期刊:《网络安全和信息化》 2017年第03期
IBM宣布推出专为大中型企业而设计的新的全闪存存储解决方案,来处理企业资源规划(ERP)和金融交易以及认知应用(如机器学习和自然语言处理)等广泛的工作负载。