作者:赵永标; 张其林; 谷琼 期刊:《现代信息科技》 2019年第14期
在线挖掘可比语料是构建大规模可比语料库的可行途径之一,在线可比度计算是语料挖掘过程中的关键环节。本文提出一种融合词汇重合度和主题模型的在线可比度计算方式,主题模型选择能够进行在线学习的Online LDA,利用词对齐工具GIZA++进行主题映射,融合方式为加权求和。在下载的中英新闻语料上的测试结果表明,两种计算方式融合后的准确性比两种都要高。
作者:周杰 丁道劲 吴雯娜 曾建勋 期刊:《图书情报工作》 2013年第16期
国家叙词库是一个包含三层结构的知识组织系统,自下而上依次为工具层、表现层和应用层。在详细描述国家叙词库的结构和元数据框架的基础上,从基础词库、概念库和范畴体系方面,论述国家叙词库的构建流程,并对其未来的维护与应用机制进行展望。