英汉机译中基于相似性与猜测规则识别未登录词
来源期刊:东北大学学报(自然科学版)1998年第6期
论文作者:张月杰 姚天顺
文章页码:3 - 5
关键词:英汉机译;未登录词;相似性;猜测规则;
摘 要:介绍英汉机译中识别未登录词的一种新方法.首先通过相似性测量,寻找与未登录词最相似单词;然后通过手工制作的猜测规则,正确标注未登录词.测试结果说明,标注未登录词的三种性能指标分别为:大约93.8%的查全率、76.3%的查准率及94.1%的覆盖率.在以大约91.7%的标注精确率识别未登录词的同时,获得增加至大约97.3%的整体标注精确率.从而改善英语分析性能,促进英汉机译质量提高
张月杰,姚天顺
东北大学信息科学与工程学院
摘 要:介绍英汉机译中识别未登录词的一种新方法.首先通过相似性测量,寻找与未登录词最相似单词;然后通过手工制作的猜测规则,正确标注未登录词.测试结果说明,标注未登录词的三种性能指标分别为:大约93.8%的查全率、76.3%的查准率及94.1%的覆盖率.在以大约91.7%的标注精确率识别未登录词的同时,获得增加至大约97.3%的整体标注精确率.从而改善英语分析性能,促进英汉机译质量提高
关键词:英汉机译;未登录词;相似性;猜测规则;