检索运算符[特制材料].doc

上传人:rrsccc 文档编号:9363467 上传时间:2021-02-21 格式:DOC 页数:6 大小:120.50KB
返回 下载 相关 举报
检索运算符[特制材料].doc_第1页
第1页 / 共6页
检索运算符[特制材料].doc_第2页
第2页 / 共6页
检索运算符[特制材料].doc_第3页
第3页 / 共6页
检索运算符[特制材料].doc_第4页
第4页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《检索运算符[特制材料].doc》由会员分享,可在线阅读,更多相关《检索运算符[特制材料].doc(6页珍藏版)》请在三一文库上搜索。

1、检索运算符检索运算符又分为6类,分别是:比较运算符、逻辑运算符、重复逻辑运算符、属性运算符、限定运算符和加权运算符。检索运算符只能在检索表达式中使用,并且都不能作用于BIT字段。1. 比较运算符符号含义和作用举例=等于作者 = 李力!=不等于版面 != 国际大于工资 1000小于工资 =大于等于工资 = 1000=小于等于工资 = 1000l 比较运算符作用于NUMBER、DATE、CHAR字段。但=和!=可作用于PHRASE和DOCUMENT字段。l 比较运算符的左值必须是一个的检索入口(字段名或其别名)。l 只有当字段类型为DATE、NUMBER和CHAR时,比较运算符的右值才可以是一个值

2、列表,并且只有比较运算符=和!=支持右值为一个值列表。l 如果检索条件不是单个词,而是一个表达式,则该表达式应该用圆括号“(”和“)”括起来。2. 逻辑运算符符号含义和作用举例and两者必须同时满足中国 and 美国xor两者只能满足其一中国 xor 美国not两者中只能出现前者中国 not 美国or两者至少满足其一中国 or 美国l 逻辑运算符可作用于除BIT之外的所有字段。l 逻辑运算符不仅能够连接两个检索词,也可以连接两个检索子表达式,从而构造出非常复杂的检索表达式。3. 重复逻辑运算符符号含义和作用举例*=检索各个字段上满足同一条件的记录c1,c2 *= (中国 and 香港)=检索只

3、有一个字段上满足条件的记录c1,c2 = (中国 and 香港)-=检索只有第一个字段满足条件的记录c1,c2 -= (中国 and 香港)+=检索任意字段上同时满足条件的记录c1,c2 += (中国 and 香港)l 重复逻辑运算符实际上是在各个指定的字段上用相同的条件式进行检索后,再在各个字段之间进行指定的逻辑运算,可作用于除BIT之外的所有字段。l 重复逻辑运算符的左值必须是由单字节的逗号,分隔的两个或两个以上的检索入口(字段名或其别名)。如果右值不是单个词,而是一个表达式,则该表达式应该用圆括号“(”和“)”括起来。4. 属性运算符符号含义和作用举例adj两者邻接先后同时出现中国 ad

4、j 香港equ/n两者正好相距n个字先后同时出现中国 equ/10 香港pre/n两者相距至多n个字先后同时出现中国 pre/10 香港pre/n#两者正好相距n个字先后同时出现中国 pre/10# 香港pre/nL两者相距至少n个字先后同时出现中国 pre/10L 香港pre/pos=n两者正好相距n个字先后同时出现中国 pre/pos=10 香港pre/sen两者在同一句中先后同时出现中国 pre/sen 香港pre/sen=n两者在指定的句中先后同时出现中国 pre/sen=1 香港pre/seg两者在同一段中先后同时出现中国 pre/seg 香港pre/seg=n两者在指定的段中先后同

5、时先出现中国 pre/seg=1 香港pre/tit两者在标题中先后同时出现中国 pre/tit 香港pre/txt两者在正文中先后同时出现中国 pre/txt 香港pre/att两者在指定属性的节点先后同时出现中国 pre/文 香港pre/att=v两者在指定属性值的节点先后同时出现中国 pre/章=2 香港pre/att$sub=v两者在指定特征值的节点先后同时出现中国 pre/文$色=红 香港 待续续前表符号含义和作用举例and/n两者相距至多n个字同时出现中国 and/10 香港and/n#两者正好相距n个字同时出现中国 and/10# 香港and/nL两者相距至少n个字同时出现中国

6、and/10L 香港and/pos=n两者正好相距n个字同时出现中国 and/pos=10 香港and/sen在同一句中两者同时出现中国 and/sen 香港and/sen=n在指定的句中两者同时出现中国 and/sen=2 香港and/seg在同一段中两者同时出现中国 and/seg 香港and/seg=n在指定的段中两者同时出现中国 and/seg=2 香港and/tit在标题中两者同时出现中国 and/tit 香港and/txt在正文中两者同时出现中国 and/txt 香港and/att在指定属性的节点两者同时出现中国 and/文 香港and/att=v在指定属性值的节点两者同时出现中国

7、 and/章=2 香港and/att$sub=v在指定特征值的节点两者同时出现中国 and/文$色=红 香港xor/n同一句中不能在n个字之内同时出现中国 xor/10 香港xor/n#同一句中不能正好相距n个字同时出现中国 xor/10# 香港xor/nL同一句中不能在n个字之外同时出现中国 xor/10L 香港xor/pos=n同一句中不能正好相距n个字同时出现中国 xor/pos=10 香港xor/sen在同一句中只能出现其一中国 xor/sen 香港xor/sen=n在指定的句中只能出现其一中国 xor/sen=1 香港xor/seg在同一段中只能出现其一中国 xor/seg 香港xo

8、r/seg=n在指定的段中只能出现其一中国 xor/seg=1 香港xor/tit在标题中只能出现其一中国 xor/tit 香港xor/txt在正文中只能出现其一中国 xor/txt 香港xor/att在指定属性的节点只能出现其一中国 xor/文 香港xor/att=v在指定属性值的节点只能出现其一中国 xor/章=2 香港xor/att$sub=v在指定特征值的节点只能出现其一中国 xor/文$色=红 香港待续续前表符号含义和作用举例not/n同一句中不能在n个字之内出现后者中国 not/10 香港not/n#同一句中不能正好相距n个字出现后者中国 not/10# 香港not/nL同一句中不

9、能在n个字之外出现后者中国 not/10L 香港not/pos=n同一句中不能正好相距n个字出现后者中国 not/pos=10 香港not/sen在同一句中只能出现前者中国 not/sen 香港not/sen=n在指定的句中只能出现前者中国 not/sen=1 香港not/seg在同一段中只能出现前者中国 not/seg 香港not/seg=n在指定的段中只能出现前者中国 not/seg=1 香港not/tit在标题中只能出现前者中国 not/tit 香港not/txt在正文中只能出现前者中国 not/txt 香港not/att在指定属性的节点只能出现前者中国 not/文 香港not/att

10、=v在指定属性值的节点只能出现前者中国 not/章=2 香港not/att$sub=v在指定特征值的节点只能出现前者中国 not/文$色=红 香港or/sen=n在指定的句中至少出现一个中国 or/sen=1 香港or/seg=n在指定的段中至少出现一个中国 or/seg=1 香港or/tit在标题中至少出现一个中国 or/tit 香港or/att在指定属性的节点至少出现一个中国 or/文 香港or/att=v在指定属性值的节点至少出现一个中国 or/章=2 香港or/att$sub=v在指定特征值的节点至少出现一个中国 or/文$色=红 香港l 属性运算符只作用于DOCUMENT字段。但ad

11、j、X/n、X/n#、X/nL和X/pos=n运算符可作用于PHRASE字段。其中X代表pre、and、or、not和xor,以下同,不再特别说明。l 属性运算符X/att、X/att=v以及X/att$sub=v中的att对应一个具体的格式索引属性别名(如果没有别名,则为格式索引属性名,其本身不是一个法定的语法符号,而只是用来说明语法的合法属性的表示符);sub对应一个具体的格式索引属性的特征别名(如果特征没有别名,则为特征名,其本身不是一个法定的语法符号,而只是用来说明语法的合法特征的表示符),如果这个特征是该格式索引属性所定义的唯一特征,或者是第一个特征,则$sub部分可以省略;v是一个

12、格式索引属性或其特征的值,值的形式与具体的编码方式有关。如果att之前加上“”符,则表示是属性限定条件的“非”运算,如“and/att$sub=v”的意义是“两者同时出现,且不满足att的sub特征值为v的条件”。l 运算符pre/att、pre/att=v和pre/att$sub=v不是合法的,但att、att=v和att$sub=v可与pos、sen、seg、tit、txt等一起使用,如属性运算符pre/txt/att$sub=v则是合法的。l 属性运算符中的“=”可以用其他任意比较运算符替代。但X/att=v和X/att$sub=v中的“=”可以用哪些比较运算符替代,取决于格式索引属性或

13、其特征的编码方式。l 属性运算符X/sen=n和X/seg=n中的n,都从0开始计数。l 属性运算符X/n#/L的隐含条件是它们在同一句中。N的计算方法是位置在前的检索词的词尾到位置在后的检索词的词首之间的字母单词或中文字的个数。其中字母L大小写无关,表示Leastwise。这里X/n等价于X/pos=n。l 属性运算符adj等价于pre/0;equ/n等价于pre/n#。运算符adj和equ/n只是为了向下兼容而设计的,应尽量避免使用。l 属性运算符X/txt不等价于X/seg0(或X/seg!=0), 并且不能与/sen=n和/n#/L属性同时使用。X/txt不要求两个运算对象满足“段号相

14、等”的条件。 l 属性运算符X/tit等价于X/seg=0。5. 限定运算符表示符号含义和作用使用举例/pos=n检索词在指定的位置出现中国/pos=0/sen=n检索词在指定的句中出现中国/sen=12/senLIKE函数中规定的词在同一句中出现LIKE(中国国家剧院)/sen/sen=n检索词在指定的句中出现中国/sen=12/segLIKE函数中规定的词在同一段中出现LIKE(中国国家剧院)/seg/tit检索词在标题中中国/tit/txt检索词在正文中中国/txt/att检索词具有att属性中国/文/att=v检索词具有att属性,且值为v中国/章=2/att$sub=v检索词具有at

15、t属性,且sub特征值为v中国/文$色=红/frec=n检索词在记录中的频率必须满足要求中国/frec5/fre=n输出满足词频数条件的索引词(值)%/fre=1000000/rec=n输出满足命中数条件的索引词(值)%/rec=1000000l 限定符/rec=n和/fre=n只用于输出索引词(或字段值),且n的值不能为0,而对于以记录为结果的检索则无效。可作用于除BIT之外的所有字段。l 限定符/pos=n和/frec=n可作用于DOCUMENT和PHRASE字段,其它检索限定符则只对DOCUMENT字段上的检索有效。限定符/frec=n中n的值不能为0。l 限定符/sen和/seg只能用

16、于LIKE函数结果的限定。并且需要特别注意的是:当限定符/pos=n与限定符/sen或/sen=n同时使用时,限定符/pos=n的意义有可能发生改变,表示词之间的距离,而不是词本身的位置,此时函数LIKE()/sen/pos=n的效果相当于使用属性运算符and/pos=n。请参见LIKE函数的说明。l 限定符/att、/att=v以及/att$sub=v中的att对应一个具体的格式索引属性别名(如果没有别名,则为格式索引属性名,其本身不是一个法定的语法符号,而只是用来说明语法的合法属性的表示符);sub对应一个具体的格式索引属性的特征别名(如果特征没有别名,则为特征名,其本身不是一个法定的语法

17、符号,而只是用来说明语法的合法特征的表示符),如果这个特征是该格式索引属性所定义的唯一特征,或者是第一个特征,则$sub部分可以省略;v是一个格式索引属性或其特征的值,值的形式与具体的编码方式有关。如果att之前加上“”符,则表示是限定条件的“非”运算,如“/att$sub=v”的意义是“检索词不满足具有att属性,且sub特征值为v的条件”。l 限定符中的“=”可以用其他任意比较运算符替代。但/att=v和/att$sub=v中的“=”可以用哪些比较运算符替代,取决于格式索引属性或其特征的编码方式。l 限定符中的n,都从0开始计数。其中/pos=n中的n是指检索词在句中出现的起始位置,一个字

18、/词在句中的位置的计算规则请参见3.4.1节的说明。限定符/pos=n与属性运算符X/pos=n是有差别的。l 限定符/txt等价于/seg0(或/seg!=0),并且可以与/sen=n和/pos=n同时使用,这一点与运算符X/txt不同。l 限定符/tit等价于/seg=0。6. 加权运算符表示符号含义和作用使用举例/n指定某个检索词在查询中的权重计算机/10 * 科学l 检索词在查询中的缺省权重是1。l 权重n是一个不小于1的实数,且不能用科学记数法表示。l 权重只对用于进行相关性排序的字段(DOCUMENT或PHRASE),并进行相关性排序时有效。在进行相关性排序前,系统需要根据固定的算法自动计算每个检索词对一个命中记录的相关度的作用因子(即贡献率),权重的作用就是用来倍增(放大)这个词的“作用因子”的。7. 运算符的等价符号用英文单词书写运算符,有时觉得比较麻烦,可用下列等价符号进行替代:常规运算符!=ADJPREANDXORNOTOR等价运算符空格&*-+6文书#借鉴

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1