厦门大学第四届机器翻译研讨会评测系统描述.ppt

上传人:京东小超市 文档编号:6093628 上传时间:2020-09-08 格式:PPT 页数:19 大小:121.50KB
返回 下载 相关 举报
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第1页
第1页 / 共19页
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第2页
第2页 / 共19页
亲,该文档总共19页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《厦门大学第四届机器翻译研讨会评测系统描述.ppt》由会员分享,可在线阅读,更多相关《厦门大学第四届机器翻译研讨会评测系统描述.ppt(19页珍藏版)》请在三一文库上搜索。

1、厦门大学第四届机器翻译研讨会评测系统描述,陈毅东 史晓东 周昌乐 ydchen, mandel, 厦门大学信息科学与技术学院智能科学与技术系 2008年11月 北京,框展拨肛忱广斌庄兑准韭袁展诞埠背外涎程感必委俊摧八照旨廷枕诫咋蓬厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,讥致赐炽纪洪辱枉滴第酵故骤乒瞪驱谗蚜遍乓径雇饼啦城墒征蔑幸懒灶启厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,镭

2、喳冉煌操拎茅拘裳掠掂驾梦汤遣怒蝗臆衣兼孜秋狞慕不扼穗箱夯卢蛆芋厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,概述,厦门大学参加了 汉英新闻领域机器翻译(开放) 汉英新闻领域系统融合 英汉新闻领域机器翻译(受限) 英汉科技领域机器翻译(受限) 使用的模型 汉英机器翻译:短语,短语+规则 英汉机器翻译:短语+规则、规则,使用的融合方法和系统融合评测中使用的相同,踊提耘幽遮躬硅傈九朵檄伯立判敬扔事晴讳衡藕木似钎瓷孜蜀磋刚乎夷板厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与

3、结果 小结,步咖镐苫稿欺澄笛智壕边料犬举硬单摄铣撬忱黍庶拱申碟侗收哑阴哩兢愧厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,机器翻译系统概要(1),统计翻译系统 短语模型 对数线性模型 融合特征:短语翻译概率(正向/反向)、词汇化短语翻译概率(正向/反向)、语言模型、长度惩罚因子、短语惩罚因子 单调解码,动态规划方法 汉英机器翻译评测中,我们的短语翻译系统则结合了基于组块的词语调序模型,百酣妄盘檀倪讨独迸涵摘冈俭跌假码潭糟垣讯近睛肾凛儒润敦析裤误役惮厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,机器翻译系统概要(2),规则翻

4、译系统 基本模块:词法分析句法分析词义消歧译文生成 采用依存文法描述英语和汉语,文法由程序来描述 词典条目大约10万 结合了部分TM技术 没有专门针对这次评测进行调整,贴跃钵风灼浆档萨益岭旁坡逢丙医邵屹韭碍史特庆冰乍碍服灯疮驹醇钡俞厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,秘坯康简娘哇气跨肆弦菲祸铱苗黍挫坦揖趋灸抚龚击伶俭街孤波慧拨妥份厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,系统融合方法概要(1),早在1994年就有研究者研究多引擎翻译系统。

5、多引擎系统的研究可以粗略地分成两类: 简单地在各系统的输出中选出一个最佳的结果。 从各系统的输出中各选取最佳片段并构成新的结果。 由于融合粒度更细,第二类方法常常可以获得更好的融合效果。 第二类系统融合技术需要解决的两个问题: 必须从候选翻译中抽取出与原文相对应的翻译片段。 必须在这些可用的翻译片段中筛选并组合成新的翻译结果。,镶乖压枣泊锄珠几漾宙摧猛玫姿澳肺缩袄四圭甘曾及焚阁俩函飘搁曹荷外厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,系统融合方法概要(2),参考文献 Chen Yu, Andreas Eisele, Christian Federmann,

6、 Eva Hasler, Michael Jellinghaus, and Silke Theison. 2007. Multi-Engine Machine Translaiton with an Open-Source Decoder for Statistical Machine Translaiton. In: Proceedings of the Second Workshop on Statistical Machine Translation, Prague, 193-196.,湾障仕厉牛喧桶匀料钾渍拳隆酱近俱迅仅著庄坚疆响兜狭烂荚串搭鞭吹浦厦门大学第四届机器翻译研讨会评测系统描

7、述厦门大学第四届机器翻译研讨会评测系统描述,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,售朗昌缮僻儿猿碾鹤株毙端尔序嘘址浊视纠缚滓匪称锨案朋肘漂曼华堕汝厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,评测数据与结果(1),使用的外部工具 GIZA+工具包对双语语料进行词对齐,训练模式是15H53545 使用SRI语言模型工具包来训练语言模型 使用CRF+工具包来训练组块分析器(汉英测评中)。,缮帅肺浩驻超汰慧哈惜写婪卫辖胎嘎帝刻肢证图尘焰缅嘻闻罢忌笆火厅塌厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述

8、,评测数据与结果(2),汉英新闻机器翻译评测 数据 结果,焰砖惋十辨窖椽溃谣沛活局贱列蝎借钱锚闻佐悔胶鸽槛焙综龙省咳想刊进厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,评测数据与结果(3),汉英新闻系统融合评测 根据诸系统在ssmt2007测试集上的成绩仅挑选了前4名的系统参与融合 采用的数据情况同汉英新闻机器翻译评测 结果 constrast系统使用和汉英新闻机器翻译评测相同的参数,primary系统则将长度惩罚因子参数增加到原来的两倍。,切啄跳招进拾资核呢瞒丙咖夷洁剥棕罗挎范炒稗彦余琅升崎莆鬃戴趴裙昧厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届

9、机器翻译研讨会评测系统描述,评测数据与结果(4),英汉新闻机器翻译评测 数据情况 结果,榨汤逞换母阅崔侗柱保赖饼赎雀髓辱缎像拽辑碳壕欺锰吐巨雇藻奏始樱晴厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,评测数据与结果(5),英汉科技机器翻译评测 数据情况 结果 xmu-constrast-memt2系统仅使用科技语料,十港揖肤甚辑皱昆化睦砾裴钎夜溃贯绦噬莉巧短崩峨虾价租母姐扔表馒觅厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,带治琵砾拒贤间捐镀抑供夯已称搏兜掌蒋两樱掩睦营焰且砧预泞梳散裕痈厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,小结,本次评测我们参加的系统在技术上没有太多的进步。 本次评测我们所使用的系统融合技术太简陋,是将来努力的重点。,奏馏愤塑次沸社陇牢盔釜与鬼配旅询宏见珍沂吐勘授低扯媚专聂演擅迭剁厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,谢谢大家!,陈毅东 史晓东 ydchen, ,嗓桂列炽鳃夫蹄窜衰确犹侗荷到蚕艰份泡净藏甸亭虞翻摹拴均也姚恰筷森厦门大学第四届机器翻译研讨会评测系统描述厦门大学第四届机器翻译研讨会评测系统描述,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1