词频共现矩阵分析步骤.pdf

上传人:大张伟 文档编号:5707925 上传时间:2020-07-23 格式:PDF 页数:29 大小:5.45MB
返回 下载 相关 举报
词频共现矩阵分析步骤.pdf_第1页
第1页 / 共29页
词频共现矩阵分析步骤.pdf_第2页
第2页 / 共29页
词频共现矩阵分析步骤.pdf_第3页
第3页 / 共29页
词频共现矩阵分析步骤.pdf_第4页
第4页 / 共29页
词频共现矩阵分析步骤.pdf_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《词频共现矩阵分析步骤.pdf》由会员分享,可在线阅读,更多相关《词频共现矩阵分析步骤.pdf(29页珍藏版)》请在三一文库上搜索。

1、2014 年 07 月 15 日于上海市杨浦区-侯风飞注1 作者:侯风飞 词频共现矩阵分析步骤 作者:侯风飞 词频共现矩阵分析步骤 目录目录 1 将所选的几百篇期刊导出.1 2 进行关键字的词频分析.2 3 找出几百篇期刊的关键字.7 4 用 BibExcel 进行运行,得出“词频共现矩阵”.10 5 将“词频共现矩阵”粘贴到“Ucinet 软件”中,用 NetDraw 画图.25 2014 年 07 月 15 日于上海市杨浦区-侯风飞注1 1 将所选的几百篇期刊导出将所选的几百篇期刊导出 2014 年 07 月 15 日于上海市杨浦区-侯风飞注2 2 进行关键字的词频分析进行关键字的词频分析

2、 2014 年 07 月 15 日于上海市杨浦区-侯风飞注3 2014 年 07 月 15 日于上海市杨浦区-侯风飞注4 2014 年 07 月 15 日于上海市杨浦区-侯风飞注5 2014 年 07 月 15 日于上海市杨浦区-侯风飞注6 2014 年 07 月 15 日于上海市杨浦区-侯风飞注7 3 找出几百篇期刊的关键字找出几百篇期刊的关键字 2014 年 07 月 15 日于上海市杨浦区-侯风飞注8 2014 年 07 月 15 日于上海市杨浦区-侯风飞注9 2014 年 07 月 15 日于上海市杨浦区-侯风飞注10 4 用用 BibExcel 进行运行,得出“词频共现矩阵”进行运行

3、,得出“词频共现矩阵” (1)使用 bibexcel 打开数据文件(关键词关键词.txt) ,特别注意的是,事先要将数据文件进 行格式化(上面已经进行了格式化) ,如图 1 所示: (2)在窗口“Frequency distribution”的下拉菜单中选中“Whole string” ,并选中“Make new out-file” , 以及 “Old tag” 中填写字段 “DE” , 单击按钮 “Start” , 将产生一个后缀名为.oux 的新文件。如图 2 所示 2014 年 07 月 15 日于上海市杨浦区-侯风飞注11 (3)选中文件“关键词.oux” ,并在“The List”窗

4、口打开,从窗口“Select field to be analysed”的下拉菜单中选中“Any; separated field” (数据文件中单个关键词以;隔开) , 并单击“Prep”按钮,将产生一个新文件“关键词.out” ,所有单个关键词以文件为单位分别 列出。如文件 1 含有 3 个关键词分别为“竞争情报” 、 “装备制造业” 、 “技术创新” 。如图 3 所示: 2014 年 07 月 15 日于上海市杨浦区-侯风飞注12 (4)打开数据文件“关键词.out” ,在工具栏选中“AnalyzeAdd frequencies” ,得到 后缀名为.cit 的文件,在此统计得出关键词的词

5、频。 如图中,在这 1425 篇文献中,关键词“竞争情报”出现 1109 次, “企业竞争情报”出 现 47 次,知识管理出现 40 次。 2014 年 07 月 15 日于上海市杨浦区-侯风飞注13 (5)这一步有两种方法:第一种:这一步有两种方法:第一种:将上图中的词频统计列表拷贝到 Excel 文件中,并 按词频降序排列,选择频次 20 以上的关键词(共 35 个,排除关键词“竞争情报” )做进一 步分析,将关键词及其频次复制回 BibExcel。 第二种:第二种:将本文上面“第二步进行关键字的词频统计”的结果,进行筛选,比如关键字 出现 3 次以上的,将出现 3 次以上的关键字粘贴回

6、BibExcel 中去,其格式和下图一样。第 二种方式能够自由选择出现在几次以上的关键字进行词频共现分析。 一般数据量大时一定一般数据量大时一定 要用第二种方法更精确一些!要用第二种方法更精确一些! 2014 年 07 月 15 日于上海市杨浦区-侯风飞注14 2014 年 07 月 15 日于上海市杨浦区-侯风飞注15 2014 年 07 月 15 日于上海市杨浦区-侯风飞注16 2014 年 07 月 15 日于上海市杨浦区-侯风飞注17 (6)接下来,选中数据文件“关键词.out” ,选择工具“Analyze _ Co-occurrence _ Make pairs via listbo

7、x.” ,得到后缀为.coc 的文件,得到关键词共现频次。 2014 年 07 月 15 日于上海市杨浦区-侯风飞注18 2014 年 07 月 15 日于上海市杨浦区-侯风飞注19 (7)选中数据文件“关键词.coc” ,并选择工具“Analyze _ List units in pairs” ,得到后 缀名为.ccc 的文件, (8)打开数据文件“关键词.ccc” ,并在文件列表中单击文件“关键词.coc” ,选择工具 “Analyze _”Make a matrix for MDS etc” ,得到共词矩阵。 2014 年 07 月 15 日于上海市杨浦区-侯风飞注20 2014 年 0

8、7 月 15 日于上海市杨浦区-侯风飞注21 2014 年 07 月 15 日于上海市杨浦区-侯风飞注22 2014 年 07 月 15 日于上海市杨浦区-侯风飞注23 2014 年 07 月 15 日于上海市杨浦区-侯风飞注24 (9)将共词矩阵导入 EXCEL 文件中,进行下一步分析。 2014 年 07 月 15 日于上海市杨浦区-侯风飞注25 5 将“词频共现矩阵”粘贴到“Ucinet 软件”中,用 NetDraw 画图5 将“词频共现矩阵”粘贴到“Ucinet 软件”中,用 NetDraw 画图 2014 年 07 月 15 日于上海市杨浦区-侯风飞注26 2014 年 07 月 15 日于上海市杨浦区-侯风飞注27 2014 年 07 月 15 日于上海市杨浦区-侯风飞注28

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1