首页 / 办公指南 / 大数据架构

图片名称

据架构对大数据的运行非常重要。如果你想知道常见的大数据架构有哪些?下面福昕知翼就来告诉你。大数据这个词大家都听过,可是大数据架构是什么估计有些人就不是很清楚了,其实大数据架构就是大数据的存储平台,将大数据进行存储后,在进行分析和挖掘,最后以形象的方式展示在我们眼前,所以大数据架构对大数据的运行非常重要。如果你想知道常见的大数据架构有哪些?下面福昕知翼就来告诉你。 什么是大数据架构?大数据体系架构是用于摄取和处理大量数据(通常称为“大数据”)的总体系统,以便可以出于业务目的对其进行分析。根据组织的业务需求,可以将体系结构视为大数据解决方案的蓝图。大数据架构旨在处理以下类型的工作:1、大数据源的批处理。2、实时处理大数据。3、预测分析和机器学习。精心设计的大数据架构可以为您的公司节省资金,并帮助您预测未来的趋势,以便您制定良好的业务决策。大数据架构设计用来处理对传统数据库系统而言太大或太复杂的数据的引入、处理和分析。 组织进入大数据领域的门槛各不相同,具体取决于用户的权限及其工具的功能。 对某些组织来说,大数据可能意味着数百个GB的数据,而对另一些组织来说,大数据则意味着数百个TB的数据。 随着处理大数据集工具的发展,大数据的涵义也在不断地变化。常见的大数据架构有哪些?1、传统大数据架构之所以叫传统大数据架构,是因为其定位是为了解决传统BI的问题。①优点:简单,易懂,对于BI系统来说,基本思想没有发生变化,变化的仅仅是技术选型,用大数据架构替换掉BI的组件。②缺点:对于大数据来说,没有BI下完备的Cube架构,对业务支撑的灵活度不够,所以对于存在大量报表,或者复杂的钻取的场景,需要太多的手工定制化,同时该架构依旧以批处理为主,缺乏实时的支撑。③适用场景:数据分析需求依旧以BI场景为主,但是因为数据量、性能等问题无法满足日常使用。2、流式架构在传统大数据架构的基础上,直接拔掉了批处理,数据全程以流的形式处理,所以在数据接入端没有了ETL,转而替换为数据通道。①优点:没有臃肿的ETL过程,数据的实效性非常高。②缺点:流式架构不存在批处理,对于数据的重播和历史统计无法很好的支撑。对于离线分析仅仅支撑窗口之内的分析。③适用场景:预警,监控,对数据有有效期要求的情况。3、Lambda架构大多数架构基本都是Lambda架构或者基于其变种的架构。Lambda的数据通道分为两条分支:实时流和离线。①优点:既有实时又有离线,对于数据分析场景涵盖的非常到位。②缺点:离线层和实时流虽然面临的场景不相同,但是其内部处理的逻辑却是相同,因此有大量荣誉和重复的模块存在。③适用场景:同时存在实时和离线需求的情况。 4、Kappa架构在Lambda的基础上进行了优化,将实时和流部分进行了合并,将数据通道以消息队列进行替代。①优点:解决了Lambda架构里面的冗余部分,以数据可重播的思想进行了设计,整个架构非常简洁。②缺点:虽然Kappa架构看起来简洁,但实施难度相对较高,尤其是对于数据重播部分。③适用场景:和Lambda类似,改架构是针对Lambda的优化。5、Unifield架构以上的种种架构都围绕海量数据处理为主,Unifield架构则将机器学习和数据处理揉为一体,在流处理层新增了机器学习层。①优点:提供了一套数据分析和机器学习结合的架构方案,解决了机器学习如何与数据平台进行结合的问题。②缺点:实施复杂度更高,对于机器学习架构来说,从软件包到硬件部署都和数据分析平台有着非常大的差别,因此在实施过程中的难度系数更高。③适用场景:有着大量数据需要分析,同时对机器学习方便又有着非常大的需求或者有规划。 大数据需要进行存储、整理、分析、提取等多个步骤后,才会提交给用户使用,想一想就知道这是一个极为复杂的过程,如果没有一个好的大数据架构平台,大数据处理起来将非常缓慢。在福昕知翼网中有很多关于大数据的相关文章,如果你对大数据感兴趣,不妨去阅读一番。