聊聊大數據Lambda架構

2021-02-04    分類: 網站建設

Lambda Architecture 概念

Mathan Marz的大作Big Data: Principles and best practices of scalable real-time data systems介紹了Lambda Architecture的概念,用于在大數據架構中,如何讓real-time與batch job更好地結合起來,以達成對大數據的實時處理。

聊聊大數據Lambda架構

大數據平臺中包括批量計算的Batch Layer和實時計算的Speed Layer,通過在一套平臺中將批計算和流計算整合在一起。

例如使用Hadoop MapReduce、Spark進行批量數據的處理,使用Apache Storm、Spark Streaming 進行實時數據的處理。

這種架構在一定程度上解決了不同計算類型的問題,但是帶來的問題是框架太多,會導致平臺復雜度過高、運維成功高等。

Lambda架構的主要思想就是將大數據系統構建為多個層次,如下圖所示:

聊聊大數據Lambda架構

我們來梳理一下他們是如何分工協助的:

  • 首先new data作為整個數據系統的數據源頭,Batch Layer作為數據的批處理層次對原始數據進行加工與處理,并且將處理的數據結果的Batch View輸入到Serving Layer。(這里對應的是全量數據)
  • Speed Layer對于實時增加的數據進行處理,生成對增量數據計算結果的Real-time View。(這里對應的是增量數據)
  • 最終用戶查詢是通過Batch View與Real-time View相結合的形式將最終結果呈現出來。

基于Lambda架構,一旦數據通過Batch layer進入到Serving layer,在Real-time view中的相應結果就不再需要了。

小 結

Lambda架構結合了實時處理與批處理的結果,很好的反饋了查詢需求,并且在速度和可靠性之間求取了平衡,具有足夠的擴展性。理想狀態下,所有的查詢都可以定位成一個函數:

  1. Query?=?Function(Data)?

但是,若數據達到相當大的一個級別(例如PB),且還需要支持實時查詢時,就需要耗費非常龐大的資源。

而Lambda架構將數據和計算系統進行細分:

  1. Query?=?Batch(Old_Data)?+?RealTime(New_Data)?

但是這種架構同樣存在一些問題:需要運維兩套不同的計算系統,并且合并查詢結果,這一定程序上帶來了復雜性的增加。

網頁名稱:聊聊大數據Lambda架構
本文路徑:http://m.kartarina.com/news/99044.html

成都網站建設公司_創新互聯,為您提供動態網站定制開發品牌網站設計搜索引擎優化網站改版全網營銷推廣

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

搜索引擎優化
主站蜘蛛池模板: 98久久人妻无码精品系列蜜桃| 亚欧无码精品无码有性视频| 伊人久久精品无码av一区| 久久青青草原亚洲av无码| 无码一区二区三区免费| 一本大道久久东京热无码AV| 久久无码高潮喷水| 狠狠躁夜夜躁无码中文字幕| 亚洲久热无码av中文字幕 | 国产午夜鲁丝片AV无码| 亚洲午夜无码AV毛片久久| 亚洲AV色吊丝无码| 国产亚洲精久久久久久无码| 人妻无码中文字幕| 国产精品无码一区二区在线观| 亚洲AV无码成人专区片在线观看| 色欲AV无码一区二区三区| 久久久久久亚洲av无码蜜芽| 精品人妻无码区二区三区| 亚洲AV永久无码区成人网站| 伊人久久大香线蕉无码麻豆 | 精品人妻无码区在线视频| 国产精品无码无需播放器| 无码日韩人妻AV一区免费l| 成人无码区免费视频观看| 亚洲另类无码一区二区三区| 精品亚洲AV无码一区二区三区| 日韩AV无码精品人妻系列| 国产午夜精品无码| 亚洲日韩中文无码久久| 成年午夜无码av片在线观看| 无码欧精品亚洲日韩一区夜夜嗨 | 亚洲AV综合色区无码一二三区| 日韩亚洲AV无码一区二区不卡| 亚洲国产精品无码专区影院| 亚洲国产精品无码久久SM| 久久人妻内射无码一区三区 | 无码狠狠躁久久久久久久| 亚洲6080yy久久无码产自国产| 天堂一区人妻无码| 狠狠精品久久久无码中文字幕 |