网络信息采集与利用.ppt

上传人:本田雅阁 文档编号:3221694 上传时间:2019-08-02 格式:PPT 页数:75 大小:278.01KB
返回 下载 相关 举报
网络信息采集与利用.ppt_第1页
第1页 / 共75页
网络信息采集与利用.ppt_第2页
第2页 / 共75页
网络信息采集与利用.ppt_第3页
第3页 / 共75页
网络信息采集与利用.ppt_第4页
第4页 / 共75页
网络信息采集与利用.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《网络信息采集与利用.ppt》由会员分享,可在线阅读,更多相关《网络信息采集与利用.ppt(75页珍藏版)》请在三一文库上搜索。

1、1,网络信息采集与利用,贾朝辉,2,本课程共九章,第1章 网络信息资源概论 第2章 网络信息处理方式及关键技术 第3章 搜索引擎及其使用 第4章 其他网络信息资源及其使用 第5章 联机检索技术及其应用 第6章 网络学术数据库信息采集 第7章 非万维网网络信息的采集 第8章 网络信息编辑 第9章 网络竞争情报采集与分析,3,第1章 网络信息资源概论,第一节 互联网概况 第二节 网络信息资源概述 第三节 网络信息资源的类型 第四节 网络信息资源检索 第五节 网络信息采集与利用的未来趋势,4,第一节 互联网概况,一、互联网在中国的发展 二、互联网术语 1.通信协议 2.IP地址 3.子网和子网掩码

2、4.域名系统 5.中文域名 6.网络实名 7.局域网及广域网 8.Internet服务器,5,第一节 互联网概况,三、Internet提供的服务 1.电子邮件 2.电子公告板 3.远程登录 4.网络新闻 5.文件传输协议 6.博客 7.其他服务,6,第一节 互联网概况,四、计算机网络安全 1.防火墙技术 2.密码技术,7,第二节 网络信息资源概述,一、网络信息资源的含义 二、网络信息资源的特点 存储数字化 表现形式多样化 以网络为传输媒介 传播方式的动态性 信息源复杂,8,第三节 网络信息资源的类型,一、按所对应的非网络信息资源分类 二、按人类信息交流的方式分类 三、按信息存取方式分类 四、按

3、网络信息资源的层次分类,9,第四节 网络信息资源检索,一、网络信息资源检索的方法 浏览信息 借助网络检索工具 利用搜索引擎 在线数据库查询,10,第四节 网络信息资源检索,二、网络信息资源检索的技巧 主题指南与搜索引擎相结合 缩小检索范围 扩大检索范围 使用组合搜索关键词 强制搜索 模糊搜索 先思考 先分析,11,第四节 网络信息资源检索,三、影响网络信息资源检索的因素 信息资源的质量 检索软件 用户水平 四、提高网络信息资源检索效率的方法 培养“信息素养” 不断探索、积累经验、提高信息获取能力,12,第五节 网络信息采集与利用的未来趋势,一、网络检索自动化技术的发展 二、多媒体技术的应用 三

4、、多语种检索 四、检索工具智能化,13,第2章 网络信息处理方式及关键技术,第一节 文献标引理论 第二节 检索语言 第三节 计算机信息检索 第四节 元数据技术 第五节 中文自动分词处理技术 第六节 文本自动处理技术 第七节 网络信息挖掘,14,第一节 文献标引理论,一、文献标引的概念 1.文献标引的目的及意义 2.文献标引的方式 3.主题标引与分类标引的异同,15,第一节 文献标引理论,二、文献分类标引原则 1.学科属性原则 2.专指性原 3.实用性原 4.系统性原则 5.逻辑性原则 6.一致性原则 7.“其他”类原则 8.入上位类或依论述重点归类原则 9.新学科、新主题文献分类原则,16,第

5、一节 文献标引理论,三、文献主题标引 1.特征 2.类型 四、网络信息资源的分类标引,17,第二节 检索语言,一、检索语言的概念 二、检索语言的分类 1.分类语言 2.主题语言,18,第三节 计算机信息检索,一、计算机信息检索概述 1.计算机信息检索概念 2.计算机信息检索的特点 3.计算机信息检索系统的构成 4.计算机信息检索系统的分类,19,第三节 计算机信息检索,二、计算机信息检索技术 1.布尔逻辑检索 2.截词检索 3.字段检索 4.位置算符检索 5.全文检索,20,第四节 元数据技术,一、元数据的概念 二、元数据的应用 1.元数据的应用目的 2.元数据的应用领域 3.Metadata

6、格式的应用现状,21,第五节 中文自动分词处理技术,一、中文自动分词概述 二、中文文献的索引方法 1.基于字符串匹配的分词方法 2.基于统计的分词方法 3.基于理解的分词方法 三、简单的匹配方法 1.正向减字最大匹配法(MM) 2.逆向减字最大匹配法(RMM) 3.正/逆向结合的方法,22,第五节 中文自动分词处理技术,四、典型自动分词系统介绍 1.早期的自动分词系统 2.清华大学SEGTAG系统 3.复旦分词系统,23,第六节 文本自动处理技术,一、 文本自动处理技术概述 二、文本自动分类 1.数据准备 2.训练 3.运行 三、文本自动聚类 四、自动文摘,24,第七节 网络信息挖掘,一、网络

7、信息挖掘中的关键技术 1.目标样本的特征提取 2.中文分词处理 3.获取网络中的动态信息 二、网络信息挖掘技术流程的实现 三、网络信息挖掘技术在搜索引擎中的应用,25,第3章 搜索引擎及其使用,第一节 搜索引擎概述 第二节 搜索技术基础 第三节 搜索引擎Google的使用 第四节 百度搜索的使用 第五节 特色搜索引擎,26,第一节 搜索引擎概述,一、搜索引擎的历史 二、搜索引擎的分类 三、搜索引擎的工作原理 四、搜索引擎的组成 五、搜索引擎的性能指标,27,第一节 搜索引擎概述,六、搜索引擎面临的挑战 1.网络信息量迅猛增加 2.网络信息的无序化 3.信息的有用性评价困难 4.网络信息日新月异

8、的变化 5.带宽等其他因素,28,第一节 搜索引擎概述,七、搜索引擎的未来发展 1.破解用户之意,信息抽取,优化排序 2.基于视觉网页块分析 3.网页库内容分类 4.潜在相关性 5.网页结构化信息抽取类技术 6.自然语言处理,简单的语意语法分析 7.重复识别,29,第一节 搜索引擎概述,8.行业优化 9.相关搜索 10.采集更多的数据 11.跟踪互联网变化,进行细节上的优化,30,第一节 搜索引擎概述,八、常用搜索引擎简介 1. 英文搜索引擎 2.中文搜索引擎,31,第二节 搜索技术基础,一、基本的搜索技巧 1.简单信息查找 2.使用双引号进行精确查找 3.使用加减号限定查找 4.有针对性地选

9、用搜索引擎 5.细化查询 6.根据需求选择查询方法,32,第二节 搜索技术基础,7.注意细节 8.利用选项界定查询 9. 尽可能将搜索范围限定在特定的领域里 10.使用更特定的词汇,33,第二节 搜索技术基础,二、快速搜索技巧 1.搜索词组 2.选择词组 3.查找信息源,34,第三节 搜索引擎Google的使用,一、Google简介 二、Google的使用方法 1.首页介绍 2.基本搜索 3.辅助搜索 4.进阶搜索 5.其他语法 6.图片搜索,35,第三节 搜索引擎Google的使用,7.目录搜索 8.新闻组(Usenet)搜索 9.新闻搜索 10.其他功能,36,第四节 百度搜索的使用,一、

10、百度简介 二、百度搜索的使用方法 1.基本语法 2.百度新闻搜索 3.百度MP3搜索 4.百度图片搜索 5.百度贴吧搜索 6.百度中文搜索风云榜 7.百度搜索工具,37,第五节 特色搜索引擎,一、图片搜索 1.中文图片搜索引擎 2.英文图片搜索引擎 二、FTP搜索引擎 三、新闻组搜索 四、新闻搜索引擎 五、MP3搜索引擎 1.中搜MP3搜索 2.搜刮网(SoGua),38,第五节 特色搜索引擎,六、Flash搜索引擎 七、其他特色搜索引擎 1.字典搜索 2.地图搜索 3.域名搜索和IP搜索 4.寻人搜索 5.科技搜索引擎,39,第4章 其他网络信息资源及其利用,第一节 网页浏览器及使用技巧 第

11、二节 网络目录的利用 第三节 虚拟图书馆资源的挖掘,40,第一节 网页浏览器及使用技巧,一、Internet Explore 8 浏览器 1.IE8.0的安装 2.初次启动 3.IE8.0新增的功能 二、其他浏览器 1.Mozilla Firefox 浏览器 2.Opera 浏览器,41,第一节 网页浏览器及使用技巧,3.Safari 浏览器 4.可在线翻译的Fast Browser 浏览器 三、离线浏览器 1.Offline Explorer Pro 浏览器 2.Web Zip 浏览器 3.Web Reaper 浏览器,42,第二节 网络目录的利用,一、网络目录概述 1.目录资源的收集和分类

12、 2.网络目录结构 3.网络目录分类方法 4.网络目录与搜索引擎的比较,43,第二节 网络目录的利用,二、Open Directory Project ODP的由来 分类,44,第二节 网络目录的利用,三、其他优秀网络目录简介 LookSmart Galaxy About AskJeeves Sina sohu,45,第二节 网络目录的利用,四、专业目录的使用 EEVL Internet精英搜索,46,第三节 虚拟图书馆资源的挖掘,一、虚拟图书馆概述 相关概念 虚拟图书馆与数字图书馆的比较 虚拟图书馆设计原理,47,第二节 网络目录的利用,二、虚拟图书馆资源及其利用 WWW虚拟图书馆 列治文公

13、共图书馆 化学虚拟图书馆 虚拟运输图书馆 澳门虚拟图书馆 数字虚拟图书馆 清华大学虚拟图书馆 大英图书馆,48,第5章 联机检索技术及其应用,第一节 联机检索概述 第二节 主要国际联机检索简介,49,第一节 联机检索概述,一、联机检索概况 二、联机检索的特点 三、联机检索的服务范围,50,第二节 主要国际联机检索简介,一、DIALOG系统 二、Questel-Orbit 三、ESA-IRS 四、STN系统 五、OCLC First Search,51,第6章 网络学术数据库信息采集,第一节 中国高等教育文献保障系统 第二节 万方数据资源系统 第三节 中文全文型期刊数据库中国知网 第四节 中文图

14、书数据库 第五节 综合性数据库EI Village 第六节 全文电子期刊,52,第一节 中国高等教育文献保障系统,一、CALIS的概况 二、CALIS的主要服务内容 CALIS联合目录公共检索系统 联机编目 集团采购 文献传递网,53,第二节 万方数据资源系统,一、万方数据资源系统概况 二、万方数据资源的内容 期刊论文 学位论文 会议论文 专利 成果 法规 标准 企业信息 西文期刊论文 西文会议论文 科技动态,54,第三节 中文全文型期刊数据库 中国知网,一、中国知网简介 二、中国知识资源总库 系列元数据库 系列专业知识仓库 系列知识元数据仓库 其他,55,第四节 中文图书数据库,一、超星数字

15、图书馆 二、书生之家 主页板块介绍 检索图书 阅读器,56,第五节 综合性数据库EI Village,一、简介 二、数据库介绍 Compendex数据库 Inspec数据库 NTIS数据库,57,第五节 综合性数据库EI Village,三、检索方法 快速检索 专家检索 词典检索 检索历史 四、辅助索引,58,第六节 全文电子期刊,一、Elsevier Science Direct On Site 数据库简介 检索指南 二、IEEE/IEE Electronic Library 简介 检索方法 三、Springer Link 简介 检索途径,59,第七章 非万维网网络信息的采集,第一节 FTP

16、 第二节 邮件列表 第三节 Usenet 第四节 Telnet和BBS,60,第一节 FTP,一、FTP简介 FTP服务器和客户端 FTP登录 二、FTP搜索引擎,61,第一节 FTP,三、FTP信息资源的获取 CuteFTP FTP信息资源的解读技巧 四、知名FTP资源,62,第二节 邮件列表,一、邮件列表简介 二、邮件列表的使用方法和技巧 深沪股市行情 综合性中文邮件列表 HAM WinNews,63,第三节 Usenet,Usenet简介 特点,64,第四节 Telnet和BBS,一、Telnet 二、BBS,65,第八章 网络信息编辑,第一节 信息筛选 第二节 网络信息制作,66,第一

17、节 信息筛选,一、网络信息的价值判断 真实性 权威性 时效性 趣味性 实用性 二、与网络信息收集有关的知识产权问题,67,第一节 信息筛选,二、与网络信息收集有关的知识产权问题 网络在知识产权方面存在的问题,68,第二节 网络信息制作,一、单篇稿件的加工 稿件的修改 稿件的改正 稿件的增补 稿件的提炼 稿件的标题制作 二、多篇稿件的整合 三、网络信息的组织,69,第二节 网络信息制作,二、多篇稿件的整合 围绕稿件进行整合 围绕事件进行整合 围绕主题进行整合 三、网络信息的组织,70,第二节 网络信息制作,三、网络信息的组织 高效导读 恰当评价 物尽其用,71,第九章 网络竞争情报采集与分析,第一节 竞争情报的基本概念 第二节 竞争情报的获取 第三节 竞争情报的分析方法,72,第一节 竞争情报的基本概念,竞争情报 功能,73,第二节 竞争情报的获取,一、竞争情报的获取策略 1.竞争情报工作的一般步骤 2.明确“需”与“求” 3.连续性和系统性原则 确定检索语言,74,第二节 竞争情报的获取,二、信息源及竞争对手情报的获取方法 公开资料 电子信息源 人际关系网 会议信息,75,第三节 竞争情报的分析方法,一、SWOT分析法 二、专利分析 三、财务报表分析 四、竞争对手跟踪,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1