您的位置: 网界网 > 存储 > 正文

SSD能否让大数据分析更有效?

2014年03月22日 23:58:12 | 作者:Phil Goodwin | 来源:TechTarget中国 | 查看本文手机版

摘要:“SSD能否让大数据分析变得更为高效”,我的答案是“不能”,不过也不能一概而论,其取决于你的环境是CPU受限还是I/O受限。

标签
CPU
SSD
大数据分析

Phil Goodwin is a storage consultant and frequent TechTarget contributor。

 

固态驱动器(SSD)是否能够让大数据[注]分析变得更有效率?

Phil Goodwin:首先,我来描述一下三种不同类型的SSD部署。第一种是服务器端高速缓存,即直接将SSD安装至服务器;第二种是存储端高速缓存,我将其形容成“Tier 0”,即通过自动存储分层将SSD置于阵列中的一个特定层;最后一种是全闪存阵列。

好了,现在我来回答刚才的问题,“SSD能否让大数据分析变得更为高效”,我的答案是“不能”,不过也不能一概而论,其取决于你的环境是CPU受限还是I/O受限。分析讲究两个重要的因素:处理和I/O。如果是CPU受限,或是处理端负载过重,那就没办法,事实上你需要换个更快的处理器;但如果你需要循环往复地读取大量的数据(其中也掺入大量需要顺序读的数据),或者类似的情况,这就是I/O受限,那么SSD的确能够帮上忙,让大数据分析变得更有效率。

因此,确切地说(+微信关注网络世界),问题应该是:当处于I/O受限的环境时,哪种SSD部署更为明智?实践表明,当处于需要翻来覆去地读数据的情况时,使用服务器端或Tier 0;而当读取的数据是大量且连续的(而不是循环式的),布置全闪存阵列则更为适合,可以从中获得大量的性能。自此,你就可以从正确的配置中真正地收获奇效。

参考资料

1.大数据:(Big Data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ...详情>>

[责任编辑:存储 chai_shasha@cnw.com.cn]