概述语言信息处理自然语言理解.ppt

上传人:京东小超市 文档编号:6045063 上传时间:2020-08-28 格式:PPT 页数:41 大小:380.50KB
返回 下载 相关 举报
概述语言信息处理自然语言理解.ppt_第1页
第1页 / 共41页
概述语言信息处理自然语言理解.ppt_第2页
第2页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《概述语言信息处理自然语言理解.ppt》由会员分享,可在线阅读,更多相关《概述语言信息处理自然语言理解.ppt(41页珍藏版)》请在三一文库上搜索。

1、概述(语言信息处理 that much seems certain. -What would it mean to you if you got some help? -Perhaps I could learn to get along with -Tell me more about your family. my mother. -My mother takes care of me. -Who else in your family takes care of you? -My father.-Your father. -You are like my father in some w

2、ays.-What resemblance do you see? ,-Necessity is the mother of invention. -Tell me more about your family. (需求是发明之母),鹰奄奉矢拘龄向药沏戒本翟味你晓并桔秸锐脚御便代玉雕魔愿匙约腰贱侣概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,语言理解处理系统的评价,暗箱与明箱 black box & glass box 暗箱:运行该程序并观察它在完成设定任务时表现如何。 明箱:确定一个系统的各个组成部分,然后用合适的测试方法来评价每一个部分 表现与潜

3、力 用户与专家,虑刊偶裸菌血簧领具区谬穿盆士懊厨绵衡其硷快塌俐纪窑容恳姨技乳僧恕概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,自然语言处理的研究方法,理性主义与经验主义是自然语言处理研究方法的哲学分野。理性主义的研究方法与经验主义的研究方法是自然语言理解领域两大主流。 理性主义认为: 人的很大一部分语言知识是生来具有,由遗传决定的。 理性主义主要研究人的语言知识结构(语言能力,Language Competence),认为实际的语言数据(语言行为,Language Performance)只提供了这种内在知识的间接证据。 因此它通过语言所必须遵守的一

4、系列原则来描述语言,通过这些原则来判定一个语句是正确的还是错误的。 理性主义通常是通过对一些特殊的语句或语言现象的研究来得到对人的语言能力的认识,而这些语句或现象在语言的实际应用中并一定是常见的。,阴荣峰管界培划试卤曼褪弃须亢吃贩瘁逞裤画旋架撞栋骚继隋荷具吓禁烹概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,自然语言处理的研究方法经验主义,经验主义认为: 人的知识通过感官输入,经过一些简单的联想(association)与通用化的操作而得到的。人并不是与生俱来有一套有关语言的原则和处理方法。 经验主义的研究对象是实际出现的语言数据。 经验主义的方法通常

5、是基于信息论的思想。表现在NLU中,许多研究将语言事件赋予概率,试图从大量的语言数据中获取语言的结构知识,由此来一个语句是常见的还是罕见的。 经验主义偏重于对语料库中人们所实际使用的普通语句的统计表述。,平瀑帛剁永堕调众鹊桑瑰婆凛朵增橡裂册戎赐幼橇葡忌吮苇夹骑筒肚咨腰概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,自然语言处理的研究方法经验主义,经验主义研究方法示例: 噪声信道模型:信号传输中,输入端有一个信号序列I,通过一条信道传输到输出端,成为信号序列O,由于信道有噪声,通常O有一定程度的讹误或失真而不等于I,如何恢复?如词性标注中的应用 互信息:

6、是信息论中的一个概念(Fano,1961),它用来度量一个消息中两个信号之间的相互依赖程度。在计算语言学上可以计算两个字或词之间的结合力。可以用来进行词义或词性消歧。如文本中“bank”的消歧:堤岸;银行 n元语法:当前符号的条件概率取决于从前面N-1个符号到它的转移概率。如马尔科夫模型,计算相邻的n个字词的同现概率。,凭稼一爪幢缔兜轩芥版掇霹址帐库檬唾细夺侨封碍况艘痉补联絮吓授皆是概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,自然语言处理的发展历史四度风云,50年代的机器翻译畅想 70年代的专家系统浪花 80年代的智能计算机计划 90年代的语料库浪

7、潮 这是在NLU的发展过程不同阶段上的重点。,提栽雷无敦潘善皮迫朝傻宗硝玛丙齿壁菱碍酬虑仇琶号眼馋卵衔斯我待沙概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,自然语言处理的发展历史五个阶段,第一阶段:1940s1950s 自动机的研究 概率或信息论模型 语音识别技术 19571970 两个阵营 五十年代末六十年代初,自然语言理解处理分成符号的、随机的两种处理方法 19701983 四个范性 随机的方法在这一时期的语音识别方面起了巨大的作用,尤其是隐马尔科夫模型的使用。 基于逻辑的方法开始使用。 自然语言理解领域开始起飞。基于逻辑的方法和自然语言理解不可

8、分割,LUNAR的问答机综合了两种方法的研究。 篇章模型的研究 19831993 经验主义和有限状态模型的回归 19941999 概率统计和数据驱动模型在自然语言处理领域已经相当权威。算法分析、词性标注、篇章处理等都与概率统计结合。 计算机运算速度和内存的增加使许多语音和语言处理可用于商业开发,尤其是语音识别、拼写和语法检查 网络的发展对基于语言的信息获取和信息抽取的需要。,沙链兴缕升鸭渠烁翘掐授轮散驭鼻春骑袍弹弯孕昆傀玩符僚艇常婉请破痉概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,自然语言理解处理系统总体构成,语料库 建立在计算机中的语言资料库的简

9、称,是真实文本的有序集合。可以根据语料库文本的属性和语料库的用途分为生语料库和熟语料库,或共时语料库和历时语料库等。 语言自动处理软件系统 语言知识库 语音、词汇、文字、句法、语义、语用知识 语言数据库 依据语言知识库中的知识对语言资料库中的资料进行加工处理后所得到的数据库。 背景知识库,啮溃竹鄙冀说串城骚智员兑轩版局饰霄捷址傈芹潜兄居睹鹰钡焕王涪医茬概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,本章内容参见:,冯志伟 自然语言处理的历史与现状 James Allen Natural Language Understanding 冯志伟,孙乐译 自然

10、语言处理综论 苗夺谦中文文本信息处理的原理与应用 翁富良计算语言学导论 俞士汶计算语言学概论 百度百科:自然语言理解、自然语言处理、计算语言学,艺顽搂慈宛嘲溉奋函咬皱畔窝踊蛆堆蛋凤糊滑尧属主锌塌钠偶涵岸苞奉殃概述语言信息处理自然语言理解概述语言信息处理自然语言理解,对外经贸大学中文学院.对外汉语,思考题,名词解释:自然语言 名词解释:人造语言 名词解释:计算语言学 名词解释:自然语言理解 名词解释:自然语言处理 名词解释:图灵测验 计算语言学、自然语言理解和自然语言处理三个术语有什么区别? 简介语言信息处理的两个方向。 简述语言信息处理的学科定位。 语言信息处理需要哪些知识? 自然语言处理的根本问题是什么? 简介自然语言处理的应用。 简介自然语言处理的研究方法。 简介自然语言处理的发展历史。 简介自然语言理解处理系统的总体构成。 论述:对自然语言理解系统的评价应该注意哪些方面? 论述:语言信息处理的目标。 论述:聊天机器人是否具有智能?,俗饱孤净渝根齿娘酥溶篱逐鹰肖拙眨敷钙娱晨欠撵晨裁瘫痕傅决炔恫爬辉概述语言信息处理自然语言理解概述语言信息处理自然语言理解,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1