大数据架构师指南
上QQ阅读APP看书,第一时间看更新

3.7 部署要求

大数据正在从专注于个别项目向对企业战略信息架构的影响上转移,对数据量、种类、速度和复杂性的处理正迫使许多传统方法发生改变,带来前所未有的难题,大数据项目的部署实施及上线安全稳定运行是一个复杂的过程,涉及内容众多,在建构时选何选型、制订方案、实施落地,是决策人应该了解的知识。

首先,企业内部需明确大数据的发展战略及定位问题。大数据平台是作为企业内部的业务服务平台,还是对外提供服务,其不同的定位将面临不同的解决方案。

其次,软件规划考虑上线的业务类型,并以此为依据对大数据组件进行选择,如功能、性能、稳定性、高可用性、高可靠性、高扩展性、安全性等,都是需要考虑的因素。

再次,硬件规划需要结合现状及资金投入计划进行规划。一般来说,硬件配置越高,其性能越好,但效费比未必经济。因此部署时也需要寻找一个经济上的均衡点,让硬件能最大效率地发挥出功能和性能。例如,部署环境选择是采用物理机部署,还是虚拟化方式部署?是按业务场景进行多集群部署模式,还是单一大集群部署模式?这些都是需要考虑的问题。

最后,容灾问题是容易忽略的关键问题。关键业务是否支持容灾?是采用同城容灾,还是异地容灾模式?容灾恢复时间等指标是多少?这些问题都需要系统考虑,并且会直接影响全系统的建设成本。

可以看出,大数据部署非常复杂,不仅要综合各种因素进行权衡分析,而且需要逐步细化落地。