百度分布式计算技术发展下载_在线阅读_26

is_167388

暂无简介

百度分布式计算技术发展百度分布式计算技术发展连林江 lianlinjiang@baidu.com 2012.07.08 我基础架构部项目经理负责分布式计算团队 HDFS MapReduce及其他批量计算模型 Resource Management System 大纲分布式计算平台我们的挑战分布式计算技术2.0 展望分布式计算平台 2008 开始于Hadoop v0.18/0.19 300台机器，2个集群 Now 总规模2W以上...

百度分布式计算技术发展连林江 lianlinjiang@baidu.com 2012.07.08 我基础架构部项目经理负责分布式计算团队 HDFS MapReduce及其他批量计算模型 Resource Management System 大纲分布式计算平台我们的挑战分布式计算技术2.0 展望分布式计算平台 2008 开始于Hadoop v0.18/0.19 300台机器，2个集群 Now 总规模2W以上最大集群接近4,000节点每日处理数据20PB+ 每日作业数120,000+ 分布式计算平台日志日志分析报表计算网页建库 Link挖掘策略训练网页 UGC 我们的挑战规模单集群100020003000500010000 效率资源利用率（cpu/mem/io）—高峰vs平均存储利用—无压缩、冷数据存储与计算资源使用均衡问题服务可用随着规模增大问题变得突出 3K+节点升级或异常小时级中断用户影响面：在可用99.9%下用户容忍度变低 Hadoop 分布式计算技术2.0 MapReduce 2.0 HDFS 2.0 ARK （A Resource Keeper） Other Computing Model MapReduce HDFS HDFS 2.0--Scalability 1.0面临问题内存可扩展性 1.5亿文件/1.2亿块，内存占用90GB 负载可扩展性集群规模扩大单点NameNode请求压力增大 3000节点：连接超时/拒绝，有时操作响应延迟高 HDFS 2.0--Scalability HDFS 2.0--Scalability HDFS 2.0--Scalability 内存负载: 10亿文件，10亿块 Namespace：66GB文件数据+1GB目录，单节点管理请求负载 13.7%耗cpu操作 Namespace Namespace不再维护块信息，大部分操作都不需要加全局锁，可以更充分利用CPU资源吞吐按照我们的负载读写比例 x5~10 HDFS 2.0--Availability 1.0面临问题 NameNode单点/手工Failover 启动/升级时间长 2亿文件/3K节点，启动时间40-50分钟（百度） HDFS 2.0--Availability Active NameSpace/FMS Standby NS/FMS edit.new edit.temp edit. done1 edit. done2 edit.done10 edit.done11 FSImage DataNode Pull edit.temp FSImage DataNode DataNode BlockReport/BlockReceive Replay/CheckPoint Push HDFS 2.0--Availability 热备支持分钟级别切换最坏情况，应用可能丢失1分钟级数据 HDFS 2.0--透明压缩存储压力很大？很多是存储决定预算 70-80%使用率为什么不压缩？应用层压缩后，造成无法对数据split来分布式计算使用可分割的压缩算法，使用非常复杂压缩需要同步耗费CPU 用户希望透明冷数据使用不频繁量很大存储成本较高 HDFS 2.0--透明压缩 HDFS 2.0--透明压缩改进效果节省存储空间30%+，增加Quota 40%+ 进一步的高压缩算法启用会有更大收益 MapReduce 2.0 1.0面临问题 JobTracker单点负载太重，扩展性受限1W 故障/升级中断服务重跑作业资源粒度过粗 slot（cpu、mem）资源利用不高 Shuffle+Reduce，空占slot MapReduce 2.0 ResourceManager Agent Agent Agent MRSlave Agent MRSlave Agent MRSlave ShuffleService ShuffleService MRSlave ShuffleService MRSlave MRSlave MRMaster MRMaster MetaServer MapReduce 2.0 - 架构优势可扩展性W台以上架构松耦合，支持多种计算模型可支持热升级更精细的资源调度 MR优化：Shuffle独立/Task同质调度 MapReduce 2.0 -资源模型业务A Flash-300 Normal-300 Normal-600 业务B ROOT 100%L 组合节点物理节点逻辑节点业务A 33% 业务B 67% 100%L 100%L 100%L MapReduce 2.0 –资源模型资源需求用一个多元组表示，目前使用(cpu, mem)，后续可以变成(cpu, mem, disk, disk io, net io) 调度资源的共享与抢占作业的优先级资源的物理分组与逻辑分组资源充分共享灵活的优先级控制管理方便 MapReduce 2.0 - 资源模型优势 MapReduce 2.0 – Shuffle独立 ShuffleService Data Transfer Server Data Server Index Cache Data & Events Manager Results & Events manager Map Results collector Shuffle Copier ShuffleTask scheduler Connection manager Buddy Ram Merger State & metrics http server Map Task Reduce Task Local Commit Get Shuffle Results Meta MRMaster Heartbeat / assign shuffle PuergeJob Meta MRMaster Report shuffle task state Schedule reduce 展望 W台以上大集群高吞吐高资源利用率 HDFS 压缩传输&分级压缩 Untility Storage MapReduce DAG IDLE计算平台 Q & A 谢谢！

本文档为【百度分布式计算技术发展】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。

百度分布式计算技术发展

热门搜索

历史搜索