首页 资讯 财经 汽车 关注 科技 房产 图片 全国 视频

数据

旗下栏目: 业内 数据 数码 手机

打点大数据之初探Hadoop刊行版

来源:新闻门户     作者:华夏门户     浏览:次     发布时间:2021-10-11
摘要:Hadoop是一项开源技能,它是当今与大数据应用最为息息相关的数据打点平台。该漫衍式处理惩罚框架主要由Yahoo建设于20……

中国IDC圈2月22日报道:Hadoop是一项开源技能,它是当今与大数据应用最为息息相关的数据打点平台。该漫衍式处理惩罚框架主要由Yahoo建设于2006年,部门是基于由Google在一些技能论文中所叙述的思想;很快,诸如Facebook,Linkedln以及Twitter之类的互联网公司回收该技能并开始对其成长孝敬气力。在已往几年,Hadoop已经演酿成一种有着基本设施组件和相关东西的巨大生态系统,并且它被各家供给商打包在一起成为贸易Hadoop刊行版本。

对付高级阐明勾当来说,在集群处事器上运行的Hadoop为成立一个高机能,低本钱的大数据打点架构提供了途径。跟着人们逐渐意识到其本领的晋升,Hadoop的应用伸张到了其他行业,包罗对殽杂有传统布局化数据和新型非布局以及半布局化数据的应用措施的陈诉和阐明。这包罗网络点击流数据,在线告白信息,社交媒体数据,医疗记录,以及来廉价造设备的传感器数据和源自互联网设备的数据。

Hadoop为何物

Hadoop框架包括了大量开源软件组件,这些组件拥有用于计较,处理惩罚,打点和阐明大量数据的焦点模子,而这些数据则由各类百般的支撑技能所困绕。这些焦点组件包罗: Hadoop Distributed File System(HDFS Hadoop漫衍式文件系统),它支持传统的分级目次和文件系统,而他们则是将文件漫衍于Hadoop集群中的存储节点上(譬喻:DataNodes数据节点)。

MapReduce是可以对批量应用措施举办并行处理惩罚的编程模子和执行框架。

YARN(这是对Yet Another Resource Negotiator的简称)认真打点任务调治,为运行中的应用措施分派集群资源,并在可用资源呈现争用时举办仲裁。它同时还对正在处理惩罚中任务的希望举办追踪和监控。

Hadoop Common是由差异组件利用的一组库和东西。

在Hadoop集群中,那些焦点部门和其他软件模子是分层于计较和数据存储硬件节点荟萃之上的。这些节点通过高速内网毗连以形成高机能并行漫衍式处理惩罚系统。

作为一个开源技能的荟萃,Hadoop并不受控于任何一个单独的供给商;相反的是,它的开拓是由Apache Software Foundation举办打点的。Apache为用户提供Hadoop利用许可,根基上可以让用户免费,无版税的利用该软件。开拓人员可以直接从Apache的网站下载并自行构建Hadoop情况。可是,Hadoop供给商提供带有根基成果的预构建社区版本,该版本同样是免费下载并能在各类硬件平台长举办安装的。同时尚有市场贸易版和企业版——Hadoop刊行版按照维护和支持处事的差异品级来打包软件。

在某些环境下,供给商也会基于Apache的技能提供机能和成果方面的加强——譬喻,通过提供附加的软件东西来简化集群设置和打点,或是与外部平台的数据整合。这些贸易产物让各类局限的公司对Hadoop的采取度越来越高。这长短常有代价的,尤其是当贸易公司供给商的支持处事团队可以启动一家公司Hadoop基本设施的设计和开拓,而且可以或许引导东西的选择和高级成果的集成以快速陈设高机能阐明办理方案来满意新兴业务需求的时候。

典范Hadoop软件栈组件

当你拿到一份贸易版本的Hadoop时,你能从中真正得到什么呢?除了焦点组件,典范的Hadoop宣布版本会包括(但不限于)以下内容:

诸如Tez和Spark之类的替代数据处理惩罚和应用措施执行打点器,它们可以在YARN之上运行或是与YARN并行以提供集群打点;缓存数据打点;以及其他改进处理惩罚机能的要领。

Apache HBase是一款列式数据库打点系统,它仿照的是运行在HDFS之上Google的Big Table项目。

诸如Hive,Impala,Stinger,Drill以及Spark SQL之类的SQL-on-Hadoop东西,这些东西为直接查询存储在HDFS中的数据提供了与SQL尺度差异水平的兼容性。 诸如Pig之类的开拓东西可以辅佐开拓人员构建MapReduce项目。

诸如ZooKeeper或是Ambari之类的设置打点东西可以用来举办监控和打点。

诸如Mahout之类的阐明情况可觉得呆板进修,数据挖掘和预测阐明提供阐明模子。

由于该软件是开源的,因此对付Hadoop刊行版你无需付费。相反的是,供给商则售卖有差异程度处事协议(SLAs)的年度支持订阅版本。固然每家供给商城市对自家的附加组件举办晋升,如此一来也作为Hadoop宣布版的一部门为Hadoop社区做出了孝敬,所有的供给商城市努力参加到Apache Hadoop社区中来。

谁在打点Hadoop大数据打点情况

在Hadoop系统之外得到所需机能需要一个熟悉IT专业的协调团队,该团队致力于架构打算,设计,开拓,测试,陈设,运行中操纵和维护方面的事情以确保最佳机能,而意识到这一点长短常重要的。这样的IT团队凡是会要求:

需求阐明师基于运行于Hadoop情况中的应用措施范例来评估系统机能需求。

系统架构师评估机能需求并设计硬件设置。

系统工程师对Hadoop软件栈举办安装,设置和调优。

应用措施开拓人员设计并实现应用措施。 数据打点专家做数据整合,建设数据机关并执行其他打点任务。

系统打点员举办操纵打点和维护。

项目打点人员监视各级栈和应用措施开拓事情的实现。

项目司理认真Hadoop情况和优先级,应用措施开拓和陈设的实现。

Hadoop软件平台市场

责任编辑:华夏门户

热点新闻资讯

首页 | 资讯 | 关注 | 科技 | 财经 | 汽车 | 房产 | 图片 | 视频 | 全国

Copyright © www.msgkpx.com 北京新闻网 版权所有 粤icp备10021497号-9

电脑版 | 移动版