高校财务样本数据库研究.doc

上传人:scccc 文档编号:11986255 上传时间:2021-11-30 格式:DOC 页数:8 大小:21.50KB
返回 下载 相关 举报
高校财务样本数据库研究.doc_第1页
第1页 / 共8页
高校财务样本数据库研究.doc_第2页
第2页 / 共8页
高校财务样本数据库研究.doc_第3页
第3页 / 共8页
高校财务样本数据库研究.doc_第4页
第4页 / 共8页
高校财务样本数据库研究.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《高校财务样本数据库研究.doc》由会员分享,可在线阅读,更多相关《高校财务样本数据库研究.doc(8页珍藏版)》请在三一文库上搜索。

1、高校财务样本数据库研究 摘要:研究了大数据算法在高校财务数据分析中的应用,提出了基于水库抽样算法建立样本数据库的方法,结果表明:基于水库抽样算法建立样本数据库,能够大幅缩短建立时间、系统开销小、且建立完成后其内部数据具有良好的均匀特性,可有效解决传统高校财务管理中基础数据样本生成时间长、开销大、分布不均匀的缺点,提高了财务基础数据分析质量,推动了高校财务管理工作的发展 关键词:大数据;高校财务;数据分析 大数据对高校财务管理的影响比较广泛而深远,它将有利于高校的资源配置,强化高校全面预算管理,加强成本核算意识,同时提高资金使用效益,防范财务风险,使高校侧重预算编制和结果分析的财务管理向业务全过

2、程的财务管理转变,实现高校财务管理新变革大数据为高校财务管理带来变革的关键特性之一是其预测性作用,传统财务利用财务报表和人为经验为高校财务管理者提供决策依据,随着海量数据的产生,此种方式已不能在合理的时间范围内产生合理性的判断依据,远不能达到目前高校财务管理精细化要求,更偏离信息化时代所强调的信息支持决策的发展方向从目前高校财务管理实际来看,基础数据的分析是关键,而数据更新及时、均匀特性好的样本数据库是进行分析的前提条件但由于受到高校财务数据多等因素限制,传统财务的线性扫描处理方法无法对基础数据进行快速均匀的抽取处理,导致了高校财务数据分析工作上的困难,不利于高校财务管理工作的开展应用大数据对

3、数据进行全面分析,遵循的是每件事情都有迹可循,找到事物变化的规律,能够更好地对高校资源筹划、资本运营、资产管理以及当前办学和长期的规划进行预测,把握高校发展方向,使教育产出能更好地适应市场需求,合理配置资源,提高经济与社会效益,实现高校跨越式可持续发展大数据技术的出现,为高校财务数据分析工作提供了新的技术手段,文中将大数据算法与高校财务数据分析进行结合与应用,在保证速度的前提下,建立具有良好均匀特性的样本数据库 样本数据库 数据库构架 数据挖掘与分析是大数据在教育领域中的应用之一,其主要作用是进行预测分析、行为分析、学业分析等的应用和研究其中财务数据分析能够为学生心理健康、奖优助评、贫困生关怀

4、、个性化就业等领域提供数据参考为了实现数据的有效收集,应建立财务基础数据样本数据库,为下一步数据分析提供有力支持,其总体架构为:传统财务通常利用线性扫描与随机选取的方法进行样本数据抽取,抽取过程中需要将所有数据加载进内存或缓存,同时在索引递增的同时利用随机函数生成索引用于确定抽取元素数据加载和随机索引生成带来了大量的系统开销,同时如果随机算法的选择并不优秀,还会导致样本的重复概率增加为解决上述问题,文中利用水库抽样算法作为样本数据抽取的基础算法,该算法打破了传统财务线性的时间处理局限,在未损失精度的前提下,提供传统财务所不能提供的海量数据样本生成能力样本数据库除了数据抽取功能之外,还要求具有数

5、据的统计分类和序列化功能对样本数据进行统计分类可以实现按类别和权重的样本抽取,从而丰富大数据分析的手段同时通过对样本数据进行统计分类,还能解决基础数据的序列化问题序列化通过为分类数据添加指定索引,可以大大提升数据的检索速度和准确性所以,做好样本数据的统计分类,并按照财务管理信息类别对基础数据进行合理的序列化对数据处理是十分必要的对样本数据进行分类和序列化之后,可对每一类数据进行必要的统计,总结样本数据特点,把握样本数据处理原则,提高样本数据的处理质量 数据库数据样本处理流程 数据样本处理流程为: 数据库抽样算法及其改进 数据库线性抽样算法 在尽可能快的时间内,对基础数据库中的学生进行尽力均匀抽

6、取,形成样本用于数据分析尽力均匀抽取意味着尽力保证每个学生被抽为样本的概率是相同的输入:基础数据库中的学生数据输出:这组数据的个均匀取样 水库抽样算法定义 针对应用情景,可以利用水库抽样算法进行样本抽取,该算法的特征为:)抽取时限要求较高,且数据只扫描一次)利用计算机资源有限,只为用户想要获取的个取样分配内存空间用于计算)扫描前个数据时,已保存的个取样是均匀抽取的,随着的增长,个取样的随机性一直不变算法定义为:)申请一个长度为的数组保存抽样)保存首先接收到的个元素)当接收到第个新元素时,以的概率随机替换中元素 改进算法均匀性证明 该算法的取样是均匀的,在任何时候接收到大于的个数时,选出的个数一

7、定是已扫描数据中的均匀抽取:当接收到第个数时,第个数能保存在数组中的概率为(),因为在接收到第个数的时候要以()的概率随机替换而第个数被选中的概率是,他们相乘为,就是第个数被换出数组的概率所以()就是在接收个元素时,第个数在数组中的概率同理在接收第个数时,第个数仍然保存在数组中的概率为(),以此类推,接收第个数时,第个元素仍保存在数组中的概率为(),如果上述事件都发生,那么在接收第个数时,第个数才能保存在数组中,因此它保留在抽样数组中的概率是这些时间发生概率的积,就是()×()×()××() 算法实现 算法实现的伪代码为:初始化:;处理:()(,)()

8、实证结果分析 财务流程中,对于业务数据的时效性有较高要求,处理算法的优劣直接影响执行算法主机的系统开销,从而影响整个财务流程的运转速度为对比传统线性扫描算法和水库抽样算法的系统开销,对两种算法进行了程序实现,设定样本规模为并进行了样本抽取,种抽取算法带来的系统开销对比如图()所示,可见传统线性扫描随数据量级的上升系统开销不断增大,而水库抽样则稳定在样本规模时的临界值传统的利用随机数确定抽样元素,随机函数利用时间等作为种子产生随机数,虽保证了随机性,但不能保证样本抽取的均匀特性,而水库抽样弥补了传统方法的这个缺陷,图()展示了部分抽样结果 结语 大数据环境中,高校财务数据的数量级不断提升,因此基

9、础数据的分析成为难点而样本数据库作为基础数据分析的必要支撑,其建立生成尤为重要通过本文的分析可知,大数据技术的出现,给了均匀、快速的样本生成以新的手段支持,为在允许的时间与精度范围内的分析提供了依据本文提供了基础数据样本数据库的建立思路,在样本数据库的基础上利用水库抽样算法进行抽样,作者对上述思路进行了程序实现并提供了试验结果该应用手段解决了高校财务管理中基础数据样本来源困难,提高了财务基础数据分析质量,丰富了高校财务分析工作手段 参考文献: 韩丹丹大数据时代下高校财务管理如何做好基础数据的分析财务管理,(): 黎羊基于高校财务管理问题的调查与对策研究长春:吉林大学,: 薛砚丹基于决策树算法的

10、高校财务管理与决策分析研究银川:宁夏大学,: 王宏志大数据算法北京:机械工业出版社,: 王元卓,靳小龙,程学旗网络大数据:现状与展望计算机学报,(): 孙大为,张广艳,郑纬民大数据流式计算:关键技术及系统实例软件学报,(): 杨静,张楠男,李建,等决策树算法的研究与应用计算机技术与发展,(): 陈东浅谈高校财务决策支持系统及其构建财会通讯:综合(上),(): ,:(),: 孟涛数据挖掘在高校财务中的应用软件导刊,(): 郭迟,刘经南,方媛,等位置大数据的价值提取与协同挖掘方法软件学报,(): 王珊,王会举,覃雄派架构大数据:挑战、现状与展望计算机学报,(): 孟小峰,慈祥大数据管理:概念、技术与挑战计算机研究与发展,(): 第 8 页 共 8 页免责声明:图文来源网络征集,版权归原作者所有。若侵犯了您的合法权益,请作者持权属证明与本站联系,我们将及时更正、删除!谢谢!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1