Google的基本思想
- 三架马车
- GFS
- 分布式文件系统的核心架构和原理
- 机架感知
- MapReduce计算模型
- PageRank问题
- MapReduce
- BigTable
三架马车
Google的基本思想主要有三个,称之为三架马车,分别是GFS(Google File System)、MapReduce计算模型、BigTable大表
GFS
分布式文件系统的核心架构和原理
机架感知
MapReduce计算模型
PageRank问题
PageRank问题就是网页排序的问题,可以简化为如何解决大矩阵的计算问题?
MapReduce
Google为了解决上面的PageRank问题,进而提出了MapReduce计算模型。该模型只是思想,具体由Java程序编写。
以下面的1+2+…+10为例:
BigTable
回顾一下:关系型数据库,他是需要遵循范式的要求。范式的优点是:减少数据冗余,范式的缺点是:影响性能;关系型数据库是行式数据库,适合 insert update select。
而BigTable与关系型数据库相反,大表思想是想把所有的数据存入一张表中。不遵循范式要求。通过牺牲空间,提高性能。故而HBase是列式数据库,适合做select。