公司数据仓库毕业生实习报告.doc

上传人:scccc 文档编号:14067413 上传时间:2022-02-01 格式:DOC 页数:7 大小:22.50KB
返回 下载 相关 举报
公司数据仓库毕业生实习报告.doc_第1页
第1页 / 共7页
公司数据仓库毕业生实习报告.doc_第2页
第2页 / 共7页
公司数据仓库毕业生实习报告.doc_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《公司数据仓库毕业生实习报告.doc》由会员分享,可在线阅读,更多相关《公司数据仓库毕业生实习报告.doc(7页珍藏版)》请在三一文库上搜索。

1、公司数据仓库毕业生实习报告毕业实习期间,我在一家小公司做一个关于数据仓库的 小项目,虽然以前没有学过这方面的理论,更没有开发过类 似的项目,不过在上司的帮助下,自己的努力更好项目做的 也差不多了,感觉在这方面也有了自己的认识,下面我就自 己对这方面学习到的一些东西给大家分享一下:一、导读部分: 说起数据仓库,可能很多同学首先就会想到数据库,毕 竟就错了一个字,但是就是这一个字使这二者差异很大:传统的数据库技术是以单一的数据资源,即数据库为中 心,进行事务处理、批处理等各种数据处理工作,主要是操 作型处理,操作型处理也叫事务处理,是指对数据库联机的 日常操作,通常是对一个或一组纪录的查询和修改,

2、主要为 企业的特定应用服务的,注重响应时间,数据的安全性和完 整性。而数据仓库则是面向主题的、集成的、不可更新的 ( 稳 定性 ) 、随时间不断变化(不同时间)的数据集合,用以支 持经营管理中的决策制定过程,主要用于分析型处理 ( 也叫 信息型处理 ) 分析型处理则用于管理人员的决策分析,经常 要访问大量的历史数据。这只是数据库与数据仓库的一个概念性的大致区别,可1文档收集于互联网,如有不妥请联系删除 .见二者差别之大,另外它们在我们编程人员最关心的建立与 操作各方面也差别很大,因此如果你没有这方面的知识想只 凭借数据库发面的知识来开发数据仓库的产品是很不可能 的,这就要求你要从数据仓库最基础

3、的知识学起。二、数据仓库的基础知识:1. 数据仓库概念始于上世纪 80 年代中期,首次出现是 在被誉为“数据仓库之父” williamh inmon 的建立数据 仓库一书中。随着人们对大型数据系统研究、管理、维护等方面的深刻识认和不断完善, 在总结、丰富、集中多行企业信息的经验之后,为数据仓库 给出了更为精确的定义,即“数据仓库是在企业管理和决策 中面向主题的、集成的、与时间相关的、不可修改的数据集 合”。数据仓库并没有严格的数据理论基础,也没有成熟的 基本模式,且更偏向于工程,具有强烈的工程性。通常按其 关键技术部份分为数据的抽取、存储与管理以及数据的表现 等三个基本方面。数据仓库的重点与要

4、求是能够准确、安全、可靠地从数 据库中取出数据,经过加工转换成有规律信息之后,再供管 理人员进行分析使用。数据仓库主要是应用于决策支持系统,其主要目的是“提取”信 息并加以扩展,用来进行处理基于数据仓库的决策支持系统 (dss) 的应用。2 基于数据仓库的决策支持系统基于数据仓库的决策 支 持 系 统 (dss) 由 三 个 部 件 组 成 : 数 据 仓 库 技 术 (data warehousing) , 联 机 分 析 处 理 技 术 (olap , on line analytical pro cessing) ,数据挖掘技术 (data mining) 。联机分析处理 (olap ,

5、 on analytical pro cessing) 是使分析人员、管理人员或执行人员能够从多种角度对从原 始数据中转化出来的、能够真正为用户所理解的、并真实反映企业给特性的信息进行快 速、一致、交互地存取,从而获得对数据的更深入了解的一 类软件技术。 olap 的目标是满足决策支持或多维环境特定的 查询和报表需求。数据仓库侧重于存储和管理面向决策主题 的数据;而 olap 侧重于数据仓库的数据分析,并将 其转换成辅助决策信息。 ola p 的一个主要特点是多维 数据分析,这与数据仓库的多维数据组织正好形成相互结合、 相互补充的关系。问此,利用olap 技术与数据仓库的结合可以较好地解决传统

6、决策 支持系统既需要处理大量数据又需要进行大量数值计算的 问题。olap 的多维数据分析主要通过对多维数据的维进行剖 切、钻取和旋转来实现对数据库所提供的数据进行深入分析, 为决策者提供决策支持。多维结构是决策支持的支柱,也是 olap 的核心。数据挖掘 (data mining) 是从大量的、不完全的、有噪 声的。模糊的、随机的数据中提取隐含在其中的、人们事先 不知道的、但又是潜在有用的信息和知识的过程。数据挖掘可以看成是一种数据搜寻过程,它不必预先假 设或提出问题,但是仍能找到那些非预期的却令人关注的信 息,这些信息表示了数据元素的关系和模式。它能挖掘出数 据键潜在的模式 (pattern

7、) ,找出最有价值的信息和知识 (knowledge) 。指导商业行为或辅助科学研究。研究对象是 大规模和超大规模的数据集合。三:在建立数据仓库时应该注意的重点问题:1. 找清楚主题 , 主题是你的数据仓库研究的一个大方 向,如果你把这个都没有弄清楚的话后面的工作都是白费了。 一般数据仓库的主题就是客户最关心的部分,是客户的项目 做好以后在运行期间时常进行操作和观察的核心内容。只要 你在建立的前真正弄清楚了客户的需求,一般主题的建立就 不会出问题。2. 维度的建设,说白了维度就是客户的使用分析处理 是的一个观察角度,数据仓库是多维的,也就是用户在观察 的时候是从多个角度来观察的。这就要求你在具

8、体的多维数 据建立前要把用户的业务模型建立完备,一般这是一个迭代 的过程,在建立好或修改好一个模型后最好和用户沟通一下, 然后根据用户的要求再做相应的修改,另外基础数据库里面 的维度表也要同步,把实际用到的维度都能在数据库里有所 反应。3. 维度层次的建立:维度层次其实就是用户在观察时 能够细化的单位,也可以说是一个范围,它是用户在进行切 片,上钻,下钻时的重要单位,在建立层次的时候首先是要 搞清楚要有那些层次,这个通常是用户要求的,然后在基础 数据库建立的时候一定要把这些层次的顺序弄清楚,现在的 数据仓库工具大多都是自动对你提供的数据表进行搜索而 发现维度层次的,要是的建立基础数据表的时候不

9、注意可能 你以后得出的结果就会错很远。四:总结:1. 找实习工作的认识:我觉得实习其实就是一个从大学生活到工作的一个过 度阶段,学校和社会差别很大。有很多学生在学校里对自己 以后工作的事想的少,准备的少,一旦步入社会自己心里上 一片空白,在实习时对于自己到底干什么工作,自己有什么 专业技能也不是很清楚,最后总是过了很久快返校时才找到 实习单位。我认为实习很重要,因为实习和正常上班没有什 么两样,如果实习时就没有方向的话,以后工作了想找到方 向会走弯路。还有对于大多数同学来说,先就业,在择业是 最好的,毕竟自己在学校里接触社会少,专业实际操作和运 用能力与实际工作要求还是有一定的差距,不要老想着

10、自己 一定要找到一份好工作,自己专业内的工作,自己喜欢的工 作,这样是不切合实际的。2. 工作总结:在日常的工作中也有很多小问题值得我 们注意,我总结了一下几条: 最好每天都能做工作日记,早上上班前写好自己在 这一天的工作目标,工作中应该注意的重点问题,有哪些事 情是要问清楚主管的等。然后在每天的下班前在看一下自己 当天做了那些工作,哪些工作目标没有完成,为什么没有完 成,自己在以后的工作中应该注意哪些问题,这些将是 很重要的,经常看看会有很大进步。 在开发项目的时候最好每天都有一个备份机制,因 为电脑出故障是时常发生的,如果没有备份的话可能会发生 前功尽弃的可能。 在开发时遇到需求说明不是很清楚的地方一定要向 上级主管问清楚,因为软件是做给客户用的,我们不能凭空 想像,那样开发出来的东西很有可能会返工。 在工作中可能会碰到和你的顶头上司发生矛盾的事, 如果已经发生了,你要想清楚为什么会发生这种事,这些事 情能不能避免,如果能避免自己在日后的工作中就要多注意 一些。 在讨论问题时要有自己的见解,不能人云亦云没有见解 工作要踏实,认认真真做。 要多总结,多交流。以上就是我在数据仓库实习期间自己的一些认识和看 法,可能还有很多东西自己平时没有注意到,我也希望,祝 愿每一位实习生包括我自己能够在日后的工作中取得更大 进步。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1