汉语名词隐喻的计算机识别研究.docx

上传人:rrsccc 文档编号:9141491 上传时间:2021-02-04 格式:DOCX 页数:6 大小:15.93KB
返回 下载 相关 举报
汉语名词隐喻的计算机识别研究.docx_第1页
第1页 / 共6页
汉语名词隐喻的计算机识别研究.docx_第2页
第2页 / 共6页
汉语名词隐喻的计算机识别研究.docx_第3页
第3页 / 共6页
汉语名词隐喻的计算机识别研究.docx_第4页
第4页 / 共6页
汉语名词隐喻的计算机识别研究.docx_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《汉语名词隐喻的计算机识别研究.docx》由会员分享,可在线阅读,更多相关《汉语名词隐喻的计算机识别研究.docx(6页珍藏版)》请在三一文库上搜索。

1、汉语名词隐喻的计算机识别研究研究语言,对隐喻绝不陌生。隐喻发轫于修辞学,自亚里士多德时代起就是文学研究的热点。曾有学者这样赞誉:所有比喻中最光辉、因为最光辉也是最必然和最常见的隐喻,可向百科全书的任何词目挑战。;早在我们传统的诗经中,先人们便已开始熟练地运用明喻、暗喻等表现技巧。长期以来,汉语学界对隐喻的研究也十分重视,但主要还是作为修辞学的研究对象。隐喻,是一切语言普遍存在的语言现象,在我们的日常语言生活中隐喻也随处可见。但在长期的研究过程中,无论东西方的学者,都是把它作为一种修辞手段来加以研究,并没有关注其作为重要思维方式的隐喻认知研究。隐喻不仅仅是一种语言的修辞手段,而且更是人类的一种思

2、维方式,是人类语言运用的一种认知机制。而自 20 世纪 70 年代以来,随着认知科学的发展,隐喻获得了新的研究视角。认知视角下的隐喻理论研究不仅推动了语言学研究,而且对文学研究、翻译研究及语言教学研究也产生了积极的意义。可长期以来,隐喻研究的复杂和困难,以及学者们对其没能引起足够的重视,使得隐喻的计算机研究一直没有成为人工智能乃至自然语言处理的中心问题,依然是一个难以攻克的难题。而对于修辞学界来说,也重点在强调修辞学研究要面向社会交际需要,多元化的社会离不开计算机信息处理,实验语音学、计算机文字处理、计算机分词和词频统计、语法语义形式分析成果斐然,在中文信息处理领域,语音学、文字学和语法学已经

3、站稳了脚跟,语义学正跃跃欲试,也仅限于义素分析;与语言学的诸多分支学科相比,在中文信息处理领域,修辞学至今仍无立足之处,显然是大大落后了。事实上,制约中文信息处理领域的瓶颈,不是语音、语法,而是语义修辞!;北京大学的俞士汶教授曾谈到,当前自然语言处理研究的主攻方向,还是让计算机能够自动地识别和消解自然语言的歧义。这方面曲维光的现代汉语词语级歧义自动消解研究对其进行了较为充分的说明。而在中文信息处理学界,隐喻还并未成长为备受关注的研究课题。北京语言大学的王治敏在其文汉语名词短语隐喻识别研究中提到,隐喻是自然语言处理中的棘手问题,如果隐喻的识别和理解不能得到很好的解决,那它将成为未来自然语言处理技

4、术发展的瓶颈。在这一难题的解决上,如果能把隐喻同大规模语料结合起来,把隐喻的描写成果标注到语料库中,这样机器就可以在此基础上自动学习了。北京大学周昌乐这样说过:语言理解的最大困难之处,也是最高境界,就是达到对隐喻意义的理解。一、汉语名词隐喻本文研究的对象是汉语中名词的结构在中文信息处理中的应用,之所以选取名词而非其他此类,主要是考虑到名词隐喻研究更符合当今中文信息处理的发展要求,已有相关学者在名词及其短语结构上做过大量的研究,提供了很好的借鉴。而且,名词隐喻的数量相对较多,且在结构上有其自己独特的特点,因而选取名词及其短语作为中文信息处理的考察对象不仅具有可参考性且具有可研究价值。隐喻现象的纷

5、繁复杂使其研究角度更是层出不穷,由于人们的着眼点不同,对隐喻的理解也各执一词。因而,直接对名词隐喻进行描写十分困难,为避免这一问题,把名词隐喻放到语言层级单位的大背景下考察更加明确。(一)始源域和目标域认知语言学认为一个概念隐喻包含两个部分:始源域和目标域,隐喻的认知力量就在于将始源域的图示结构投射到目标域之上。始源域(源域)对应于汉语中的术语喻体;,目标域对应于本体;。例如:理想的翅膀 知识的海洋源域翅膀;海洋;,目标域理想;知识;,隐喻过程就是用我们所熟悉的简单的事物去类比、诠释复杂陌生的事物,隐喻的过程也就是源域到目标域的映射过程。因而以上表达可以转换为理想如飞鸟;知识如海洋;的隐喻系列

6、表达。(二)构词隐喻定义:构词隐喻一般指词汇层级以下的隐喻表达,即用比喻手段构造出的复合词。构词隐喻有名词或名词素充当源域和目标域,可以转换成目标域如源域;的明喻表达。构词隐喻从意义上可分为两种类型:(1)隐喻含义在词汇层面基本消失,不再有隐喻含义例如:他去新剪了一个蘑菇头,看起来特别可爱。听到这个消息,被愁苦锁住的柳叶眉立马舒展开来。这里的蘑菇头;柳叶眉;等词都是由两个名词组合的复合词。在词汇层面它们只是头;眉;的一种,不具有隐喻义,但在构词层面却表达头似蘑菇;眉如柳叶;的隐喻含义。可见,这类构词隐喻只存在一个词语的构词层面,构词成分组合后上升到词汇层面隐喻义消失。(2)构词隐喻上升到词汇层

7、面隐喻义并未消失,而是继续保留在词汇层面中。例如:桃花眼 乌鸦嘴 刀子嘴 豆腐心 豹子胆 美女蛇以上词语可作如下理解:桃花眼:指一个人的眼神迷离,十分勾魂。乌鸦嘴:指一个人多话令人讨厌。刀子嘴:指一个人的嘴像刀子一样尖刻。豆腐心:指一个人的心像豆腐一样柔软。豹子胆:指一个人的胆子很大。美女蛇:指恶毒的漂亮女人。这类词语的含义并非两个名词或名语素简单组合的叠加。桃花眼;不单单指眼;的一种,而是指代一种神采形象;美女蛇;也并非蛇;的一种,而是指一类女人。当它们和其他词语自合成更大的组合后,会产生新的隐喻表达。例如:你这个人真是乌鸦嘴,好的不灵坏的灵。你真是吃了豹子胆了,敢顶撞上司。这里构词层面乌鸦

8、嘴;豹子胆;转换成嘴如乌鸦;胆如豹子;的明喻,嘴;胆;是源域。但乌鸦嘴;豹子胆;进入句子后,重新组合成你这个人是乌鸦嘴;、你真是吃了豹子胆;的句子层面隐喻表达。乌鸦嘴;豹子胆;只是整体作为句子隐喻的源域。这实际上是构词隐喻与句子隐喻的套叠形式。构词隐喻的特点:(1)句法分布源域和目标域的组合顺序相对固定,绝大多数是源域在前,目标域在后;,即源域+目标域;的组合。例如:杏核眼 金鱼眼 鹅蛋脸 瓜子脸 娃娃脸 招风耳 鹰钩鼻狮子鼻蒜头鼻 酒槽鼻 樱桃嘴 鸭子嘴 水蛇腰 罗圈腿 鱼尾纹这里源域和目标域来自两个不同的概念域。源域 n1杏核、招风、樱桃;和目标域 n2眼、耳、嘴;可以实现明喻n2 如 n

9、1;的转换。例如:杏核眼:眼如杏核 招风耳:耳如招风 樱桃嘴:嘴如樱桃其中有些三字隐喻还可进一步缩合成双字隐喻,如杏核眼、鹰钩鼻;可以说成杏眼、鹰鼻;。(2)音节构成构词隐喻大多表现为 1+1 或 2+1 组合,目标域通常是单音节词语。如:虎|目 兔|唇 贝|齿 虎|牙 雀|斑 鸡|胸剑|眉 蛾|眉 黛|眉 虎|背 熊|腰 螓|首鸭子|嘴 水蛇|腰 水桶|腰 罗圈|腿 鱼尾|纹;(3)在源域到目标域的映射过程中,有些词语的目标域整体继承了源域的某种属性特征。例如:金鱼眼:眼如金鱼的一样大 鹰钩鼻:鼻子如鹰钩一样弯刀子嘴:嘴如刀子一样尖刻 豹子胆:胆子如豹子一般大对于同一个目标域,由于源域的不同

10、,表现出不同的情感评价,例如,汉语中对嘴;和腰;的描写就各有不同,表示褒义的词樱桃嘴;杨柳腰;,表示贬义的词语如鸭子嘴;水蛇腰、水桶腰;。(4)隐喻的源域和目标域一般来自具体概念。如:源域:植物:蘑菇、梨花、柳叶、杏核、桃花、瓜子、樱桃、杨柳;食物:蛋卷、蒜头;动物:卧蚕、金鱼、丹凤、鹅蛋、鹰、狮子、鸭子、水蛇、鱼尾;人物:娃娃;事物:酒槽、水桶、罗圈;其他:招风;目标域:人体部件(人的五官);从上面的分类可见,目标域确定为的概念域,其源域分别来自、等具体的概念域,其中以和的概念域居多。二、汉语名词隐喻的计算机识别研究以名词 海洋;一词为例,它可以构成知识的海洋;、信息的海洋;等隐喻表达,也可

11、以构成国家的海洋资源;、一片蓝色的海洋;等非隐喻表达。可见,词语的隐喻表达与其共现的词语密切相关。要识别一个词是否为隐喻表达必须依赖它的上下文。在计算机识别过程中,可以采用机器学习的方法,把隐喻识别问题进一步转换为隐喻义和字面义的分类问题,当然机器学习方法的要旨是首先对语料标注标记,把隐喻和非隐喻分开。当然,前期准备工作量大,以确保计算机能从大量的语料标注中识别出所需要的内容。此外,还可以根据一些辅助特征来进行识别,如词语的左右位置信息、标点、停用词。以左右位置信息为例:左在知识的海洋中遨游在科学的海洋中探索右我们要利用海洋知识海洋科学探索一个名词处于海洋;左右的不同位置,形成了隐喻和非隐喻两

12、种表达。结构中,知识;位于海洋;左侧,通常为隐喻表达,例如:知识的海洋;科学的海洋;;位于海洋;的右侧,通常为非隐喻表达,例如:海洋知识;海洋的科学;。而让计算机自动识别表示人体五官的词语,如卧蚕眉、鹰钩鼻、水蛇腰、鱼尾纹;等名词隐喻,同样可在结构形式上予以一定的固定模式,它们都可以解释为。但是也要注意的是,不是所有的都可以表述为的形式。如美女蛇;,并不是指如美女一样的蛇;,这是隐喻意义的深化,其外化结构与其表达义之间并不存在直接相关性。因而这类词在中文信息处理中又将进行更深化的识别性研究,需要建立更加完善的知识库供计算机在识别中进行选择。参考文献:1 U.埃科.符号学与语言哲学M.天津:百花文艺出版社,2006:169.2 周昌乐.意义的转绎:汉语隐喻的计算释义M.北京:东方出版社,2009:21-27.3 乔俊杰.击科学和人文之剑 开创汉语修辞研究新局面J.社科纵横,2010,25(4):101.4 王治敏.汉语名词短语隐喻识别研究M.北京:北京语言大学出版社,2010:2-9,32-36.5 俞士汶,王治敏,朱学锋.隐喻自动处理研究进展J.中文信息学报,2009,23(6):48.6 王治敏.名词隐喻的计算研究及识别实验J.语言教学与研究,2008(2):73.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1