为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

淘宝量子统计架构设计中的核心点

2017-10-15 3页 doc 15KB 9阅读

用户头像

is_983143

暂无简介

举报
淘宝量子统计架构设计中的核心点淘宝量子统计架构设计中的核心点 量子统计架构设计 淘宝-张茂森 Agenda ??a name=baidusnap9><>1量子统计面临的挑战 ??>1量子统计架构设计 ??>1量子统计的技术研究方向 挑战 ??>1成本 ??>1高并发数据分析网站的C<>10K问题 ??>1关系型数据库和实时数据计算结果的异构融合 ??>1复杂的数据查询接口逻辑和开发效率、查询效率、和正确性 ??>1分布式计算和任务管理 一组数据 ??>1实时计算处理数据3T/日 ??>1离线分布式计算处理数据超过20T/日 ??>1数据接口请求75...
淘宝量子统计架构设计中的核心点
淘宝量子统计架构中的核心点 量子统计架构设计 淘宝-张茂森 Agenda ??a name=baidusnap9><>1量子统计面临的挑战 ??>1量子统计架构设计 ??>1量子统计的技术研究方向 挑战 ??>1成本 ??>1高并发数据分析网站的C<>10K问 ??>1关系型数据库和实时数据计算结果的异构融合 ??>1复杂的数据查询接口逻辑和开发效率、查询效率、和正确性 ??>1分布式计算和任务管理 一组数据 ??>1实时计算处理数据3T/日 ??>1离线分布式计算处理数据超过20T/日 ??>1数据接口请求7500w/日 ??>1网站资源请求9000w/日 ??>1实时结果请求<>1700w/日 ??>1服务超过百万的淘宝卖家 小结 ??>1电子商务类的数据处理、计算、分析目前没有“银弹” ??>1整合、整合再整合 量子统计架构示意图 网站展现 数据中间层 分布式实时计计算 算 数据流向 基于Ajax的JS前端 基于Nginx的数据中间层 展现数据库集群 实时计算和查询引擎 基于Hadoop的分布式数据仓库 量子Javascript前端 ??>1把计算推向客户Browser ??>1利用Ajax技术提升用户体验 ??>1模块化的产品形式 –展现组件化和控制逻辑分离 随着Html5的到来,IE6的老去 Javascript将大放异彩 量子数据中间层 ??>1信条:非阻塞、持续优化 ??>1核心:Nginx和量子贡献的扩展模块 –非阻塞缓存 –非阻塞数据库访问 –实时引擎访问接口 –单元测试 ??>1异构数据的融合 –LZSQL ??>1将异构查询透明 ??>1将数据库结果和实时引擎结果进行融合 ??>1进行针对业务级的SQL优化 ??>1Lua作为粘合剂 –解决非阻塞程序编写困难 –提升数据二次处理能力 ??>1相对稳定的专职开发人员 ??>1关系型数据库优化技能的持续培养 实时流计算框架SuperMario ??>1纠结 –C++、JAVA、Erlang、 Go ??>1选择 –Erlang+ZooKeeper ??>1保持简单,先解决: –低延迟、高可靠性 –异构数据任务的快速串联 ??>1下一步: –封装更复杂的流模型 –热迁移 实时计算、查询引擎 ??>1成本是梦魇 –MySQL将是现在所需服务器的5-7倍 –Postgresql也差不多 –很多NoSQL产品的性能只是传说 ??>1选择 –B化 t内ree存 +消 So耗rted list + Hash的计算引擎,尽可能的优 –利用Epoll实现简单查询模型 ??>1下一步方向 –使本用并混提合升存可储靠方性案:Memory+Disk,进一步降低成 离线分布式计算和任务调度管理 ??>1Hadoop集群 –原生Map-Reduce代码 –Hive代码 –Hadoop streaming代码 ??>1任务调度 –构建任务依赖关系、加入优先级控制,多种时间粒度的任务调度 –统一进行任务的调度 –高可靠性,监控、报警、自动恢复/重启是关键 雅虎淘宝天cronjob Octopus 网 ??>1数据生产链的困境 –任务依赖要和任务优先级、稳定性要求统筹考虑 –数据正确性怎么校验 –构造基于经验的检验规则 –数据结果间的四则运算关系 –日任务数800个 数据分析网站的运维 ??>1别人负载高的时候,我们也高:因为实时计算 ??>1别人负载低的时候,我们也高:因为离线计算 ??>1运维的压力会是制约一个数据团队发展的重要因素 –一定要重视运维,用开放的心态将专职运维人员加入进来 –数据计算代码要可重入,去掉状态依赖 –上下游依赖要理顺,并建立应急处理手册 –重视开发人员中偏运维职能人员培养和提升 量子的技术研究方向 ??>1多维数据分析 –将用昂户贵的数据分析技术分享给更多的 –实时滑动窗口的多维分析 –海量数据的多维分析 ??>1数据可视化 –教育和培养用户解读数据 –更直观的展现数据的价值 ??>1NoSQL产品在实时计算中的应用 –解决K-V服务扩展性的难题 –解决数据实时转换的难题 –量子和OceanBase的合作 Thanks Q&A
/
本文档为【淘宝量子统计架构设计中的核心点】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索