多语言机译系统中高质量语义单元库形成方法
来源期刊:工程科学学报2008年第6期
论文作者:胡玥 高小宇 高庆狮
文章页码:698 - 704
关键词:自然语言处理系统;自然语言;机器翻译;语义单元;
摘 要:讨论构建多自然语言互译机译系统所需的高质量、可扩充、完备的、无可弃、无重复、无非正常歧义的多语统一语义单元知识库.在构建过程中采用类型特征分类方法有效降低计算复杂性,使去重复的计算量降低一半,去可弃的计算量降到O(βN)(N是语义单元库规模,β是有界数,β<C,C是常数).全部算法都可以在多核处理机上以常数效率地实现.同时讨论了语义单元的再分解和自然语言种类的增多时语义单元知识库的扩充方法.该知识库不仅用于多自然语言互译系统,还可作为自然语言理解和处理的基础知识库.
胡玥,高小宇,高庆狮
摘 要:讨论构建多自然语言互译机译系统所需的高质量、可扩充、完备的、无可弃、无重复、无非正常歧义的多语统一语义单元知识库.在构建过程中采用类型特征分类方法有效降低计算复杂性,使去重复的计算量降低一半,去可弃的计算量降到O(βN)(N是语义单元库规模,β是有界数,β<C,C是常数).全部算法都可以在多核处理机上以常数效率地实现.同时讨论了语义单元的再分解和自然语言种类的增多时语义单元知识库的扩充方法.该知识库不仅用于多自然语言互译系统,还可作为自然语言理解和处理的基础知识库.
关键词:自然语言处理系统;自然语言;机器翻译;语义单元;