面向专利文献的机器翻译系统定制.ppt

上传人:本田雅阁 文档编号:3223416 上传时间:2019-08-02 格式:PPT 页数:18 大小:882.04KB
返回 下载 相关 举报
面向专利文献的机器翻译系统定制.ppt_第1页
第1页 / 共18页
面向专利文献的机器翻译系统定制.ppt_第2页
第2页 / 共18页
面向专利文献的机器翻译系统定制.ppt_第3页
第3页 / 共18页
面向专利文献的机器翻译系统定制.ppt_第4页
第4页 / 共18页
面向专利文献的机器翻译系统定制.ppt_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《面向专利文献的机器翻译系统定制.ppt》由会员分享,可在线阅读,更多相关《面向专利文献的机器翻译系统定制.ppt(18页珍藏版)》请在三一文库上搜索。

1、面向专利文献的机器翻译系统定制,Siriussoft Corp.,目录,公司简介 技术竞争力 韩国专利文献的特点 定制过程 改良需求,2008-11-04,公司简介,Siriussoft 目前拥有韩译英、英译韩、韩译日以及日译韩的机器翻译技术。 公司计划扩展机器翻译所涵盖语种,如汉译韩、德译英、法译英以及俄译英。,3,现行经营模式 产品 : 集成有机器翻译引擎的 在线专利检索系统 韩国专利 (K2E-PAT) EP, US, JP, PCT 专利 (E2K) 平台: KIPRIS 网站 (eng.kipris.or.kr) PIE 网站 () 目标客户: 终端用户 一千四百万 KIRRIS 用

2、户 研究人员、信息专家 个人发明者、专利律师等 价格 : $ 30 /篇 (K2E) 篇幅不限,公司简介,终端用户,研究人员,个人发明者,专利律师,信息专家,公司简介,历史与成就,2019-08-02,5,机器翻译:计算语言学的分支学科,研究如何运用计算机软件将文本或语音从一种自然语言翻译为另一种自然语言 。 语素处理技术 句法处理技术 语义处理技术 语境处理技术 句子生成技术,技术竞争力,源语句,语素分析器,句法分析器,词典,知识库,语境处理,语法库,生成器,目标语句,分析,语法,技术竞争力,专利领域专用MT系统 词典和语法的涵盖范围限制在专利领域文章, 使输出译文具有高准确度。 K2E 专

3、利机器翻译系统 K2J 专利机器翻译系统 E2K 专利机器翻译系统 J2K 专利机器翻译系统 MT 方法 K - E 引擎 : 以“基于模板”为主的机器翻译 K J 引擎 : 基于规则的机器翻译 将来会用到混合方法,目标文本,基于规则,基于模板,基于统计,词法分析,源文本,混合机器翻译系统,技术竞争力,专利技术 (ETRI) 多语言翻译设备中用于识别多语言短语的系统(KR0261273) 基于概念的跨国语言翻译系统的自动语法修正方法(KR0204068 ) 对大量机器翻译请求的快速响应 翻译记忆 例) Opposition to Utility Model Registration 例) Th

4、e due date of submission of the amendment for the present application is not allowed until the above due date. 对同一个机器翻译请求进行分布式计算 负载平衡技术 多样与便捷的 API 网络翻译, 批量翻译, 电子文件翻译等,语序差异 英语是SVO语言,而韩语是SOV语言 格标记 英语中不存在格标记 没有对应于“, ”的英文词 冠词 韩语中不存在冠词 通常不被翻译成特定的词,韩国专利文献的特点, ,He ate the cookies,S O V,S V O,韩国专利文献的特点,间隔单位

5、不同 英语 词与语素相对应 不需要改变间隔单位 韩语 词(eojeol)与语素不同 需要改变间隔单位 * Eojeol是人性化的间隔单位 主语 韩语语句中,主语可以省略 英语语句的主语不能被对应到一个韩语词汇,韩国专利文献的特点,专利文献 极长又复杂的句子 韩语专利文献中,句子由平均14.5个Eojeol组成 韩语新闻文章中,句子由平均12.3个Eojeol组成 独特的句型 摘要 例) 本发明涉及 发明内容详述 例)根据现有技术 如图N所示 附图简要说明 例) 图n是用于说明的视图 有益效果 例) 本发明的有益效果在于 权利要求 例)如权利要求n所述的,进一步包括,11,定制过程,半自动词典创

6、建过程 通过包含在专利文献中的括号提取韩英语对 双语专利标题语料库 双语专利标题,12,(TFT : Thine Film Transistor),(patterning),(etching),(deposition),定制过程,手动词典创建过程 日常处理 机器翻译过程中未得到翻译的词汇被自动报告给翻译人员 年度处理 术语从一年中的韩语专利文献中抽取 新术语自动识别 新术语人工翻译 加入到字典,13,定制过程,名字翻译过程 包含在PCT等同专利、申请代码、公司网站及罗马字体书写规则中的英文名,14,定制过程,语句模板创建过程 手工创建专利特有语句模板 例1) 源文本: KR 模板 : NP1

7、匹配模板: NP1 that be:v achieved by the present invention 目标文本: The system that is achieved by the present invention is developed. 例2) 源文本: KR 模板: NP1 NP2 VP1 匹配模板: NP1TopicVP1 compared to NP2 目标文本: The Invention improved performance compared to the prior art.,15,定制过程,消除词语歧义 DB建设: IPC的统计信息 例) 韩语词“” 可以被翻译成 电子领域中的“磁极” 医药领域中的“刺激”,16,改良需求,源语句自身的错误 间隔错误 例) (synchronization plan) + (east evaporation plan) + (same period fire plan) + (same period studio plan) 拼写错误 源句改写 机器翻译系统错误 通常出现在长句和复杂句中 混合方法 缺少语言资源 专利领域中的双语文本 PCT 等同专利,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1