6794.
为了解决困扰词义及译文消歧的数据稀疏及知识获取问题,提出一种基于Web利用
n-gram统计语言模型进行消歧的方法.在提出词汇语义与其
n-gram语言模型存在对应关系假设的基础上,首先利用Hownet建立中文歧义词的英文译文与知网DEF的对应关系并得到该DEF下的词汇集合,然后通过搜索引擎在Web上搜索,并以此计算不同DEF中词汇
n-gram出现的概率,然后进行消歧决策.在国际语义评测SemEval-2007中的Multilingual Chinese English Lexical Sample Task测试集上的测试表明,该方法的
Pmar值为55.9%,比其上该任务参评最好的无指导系统性能高出12.8%.… …
相似文献