摘要:提出了一种应用中文自由文本作为知识源的本体构造方法,将采用该方法分词后得到的词汇分别计算,进而得到在样本文本和日常语.料库中的出现概率估计值,将二者对比得到出现频率的显著性指标,由此自动识别并提取领域用词汇,再应用互信息分析识别领域词汇之间的结合特性。它可自动建立可能的领域本体词汇及词汇之间基本关系的集合,同时还可构造出基于领域词汇和它们之间结合度的领域词图,为进一步进行人工本体构造提供方便的可视化界面。该成果可为实现大规模基于内容的知识管理提供自动化/半自动化本体支持。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社