资源预览内容
第1页 / 共33页
第2页 / 共33页
第3页 / 共33页
第4页 / 共33页
第5页 / 共33页
第6页 / 共33页
第7页 / 共33页
第8页 / 共33页
第9页 / 共33页
第10页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
云存储架构的发展杨钢 2013/11/25内容体验存储技术发展简史金山云存储的技术路线简单的存储系统架构讨论主要开源方案简介部分新技术点的简介存储技术发展简史主要阶段存储设备DAS / SAN / NAS控制器架构存储集群控制器架构的基本原理硬盘级别数据冗余RAID 5/6 和 LUNRS 码纠错热备盘条带化 RAIDRAID 6N+2 容错控制器实现复杂,效率降低,较少使用 云存储集群的基本原理多台服务器集群物理设备级别冗余内网修复金山云存储技术路线需求按部署模型区分公有云存储私有云存储混合云存储按使用场景区分高性能计算虚拟机平台(云主机 / VDI / etc)Key-Value 对象存储(网盘 / Hadoop / etc)冷数据(备份 / 视频监控 / etc)其他需求按分布模型分集中式异地容灾式有主控分布式对等分布式需求维度功能性能可靠性价格发展历程2008年 存储实验室2009年 WPS在线办公空间2010年 金山快盘2011年 小米Cloud2012年 金山云技术路线规划开源软件部分定制完全自主开发简单存储架构讨论存储集群的基础架构APIScheduler / 调度器Name node / 元数据节点Data node / 存储节点存储集群的基础架构调度与元数据静态Hash一致性Hash弹性Hash 一致性Hash 错误检测和修复R + W NLoggingFix on reading数据块组织大文件条带化小文件块组织快速元数据管理快速元数据管理多机房主控式对等式异步备份独立设备 / 物理位置独立兼顾写入效率和带宽现状具有较好的独立容错性原子版本功能适合对数据保全要求高的领域开源方案简介较多使用的开源方案HDFS数据分析场景:Hadoop MapReduce / HIVE适用于大文件流式追加和读取非通用接口LustreGlusterFS使用 NFS/CIFS代理提供通用服务使用 Hash 而不是元数据服务效率问题,大规模应用案例缺失CephFUSEZFS各存储方案基本原理 HDFS各存储方案基本原理 GlusterFS各存储方案基本原理 Ceph部分新技术点简介镜像模式 VS Erasure Code镜像模式优势速度快,不论写入和恢复结构简单,易实现和维护EC较少冗余Erasure codeVandermonde-RS and Cauchy-RS常用开源库Jerasure基于EC的存储系统基础设计输入效率EC Codec (Encoder /Decoder)谢谢
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号