《语言学教程.ppt》由会员分享,可在线阅读,更多相关《语言学教程.ppt(36页珍藏版)》请在三一文库上搜索。
1、整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt计算机有能力搜索一个特定的词,词汇的顺序,甚至一个文本里的某一个词类。计算机也能检索一个词所有的实例,它还能计算一个词出现的次数,从而收集到有关这个词的频率的信息。然后以某种方式对数据进行分类。整理ppt整理ppt整理ppt整理pptngives包含词类的隐含部分的信息第三人称单数现在时动词,在正常阅读里,我们仅能通过求助于预先存在的英语语法知识来检索它。然而,在一个已经注解过的语料里,形式gives可能以givesVVZ的形式出现,代码VVZ表示它是一个词汇中动词(VV)的第三人称单数现在时(
2、Z)形式。诸如这样的注解,使检索和分析包含在语料里的语言的信息变得更快、更容易。Text encoding and annotation整理pptLeech(1993)描写了适用于文本语料的注解的7条准则。1.为了恢复到自然的语料,从有注解的语料里删去注解是可能的。2.从文本里单独摘录注解是可能的。3.注解方案应该以终端用户可利用的指导方针为基础。4.应该弄清楚,注解是如何并且由谁来完成。5.终端用户应该知道语料注解不是没有错误的,而只是一种潜在的有用的工具。6.注解方案应尽可能地立足于普遍接受的和中性的理论原则。7.任何注解方案都无优先权被视为是标准的注解。整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt整理ppt