ImageVerifierCode 换一换
格式:DOCX , 页数:1 ,大小:13.24KB ,
资源ID:446675      下载积分:5 金币
已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(知乎的企业级数据模型.docx)为本站会员(飞猪)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(发送邮件至doc331@126.com或直接QQ联系客服),我们立即给予删除!

知乎的企业级数据模型.docx

知乎的企业级数据模型知乎数据平台是一个公司级的数据平台,它负责维护基础流量数据和数据仓库,为算法、商业、搜索、后端服务提供所需的数据源。此外,它还为管理层、运营、产品、数据分析师等提供数据看板和分析系统,并维护数据地图、埋点管理系统、埋点配置和测试系统等产品。在数据分层方面,知乎数据平台采用星形模型,包括事实表和维度表。事实表采用退化维度的方法,以减少关联多表的操作。为了满足实时查询的需求,知乎调研了HiVe和HBaSe,但当两张大表join时,两者的性能都较低。因此,知乎选择将MySQL的BinLog实时打到Kafka,并使用SparkStreaming程序实时将数据写入Kudu,然后使用Impala进行实时的Kudu查询。

宁ICP备18001539号-1