1970 年,關系型數據庫之父 E.F.Codd 發表《用于大型共享數據庫的關系數據模型》論文,正式拉開數據庫技術發展序幕。以 Oracle、DB2、SQL Server 為代表的三大商業數據庫產品獨占鰲頭,隨后涌現出 MySQL、PostgreSQL 等為代表的開源數據庫 ,和以 Amazon RDS 等為代表的云數據庫,拉開百花齊放的數據庫新序幕。
創新互聯公司主營臨澤網站建設的網絡公司,主營網站建設方案,app軟件開發,臨澤h5微信平臺小程序開發搭建,臨澤網站營銷推廣歡迎臨澤等地區企業咨詢
我們知道,云計算十年為產業轉型升級提供了 歷史 性契機,但變革仍在進行,隨著云計算的普及,數據庫市場發生根本性改變,云廠商打破傳統商業數據庫的堡壘,成為數據庫領域全新力量。其中以連續六年入選 Gartner 領導者象限的亞馬遜云 科技 為代表,我們一起探討:為什么亞馬遜云 科技 能始終保持其創新性?縱觀云原生時代下,亞馬遜云 科技 數據庫未來還有哪些更多的可能性?
01 面對四大數據庫發展趨勢,亞馬遜云 科技 打造五大數據庫理念
后疫情時代下,加速了不少行業的業務在線化和數字化運營,企業對數據價值挖掘的需求越發強烈,亞馬遜云 科技 大中華區產品部總經理顧凡詳細介紹其中四大趨勢:
一是伴隨互聯網、移動互聯網的發展,電商、視頻、社交、出行等新應用場景的興起,不僅數據量大,對數據實時性要求極高,傳統關系型數據庫無法滿足需求,因此驅動云原生數據庫的出現。
二是開源數據庫的廣泛應用。
三是應用程序現代化對數據庫提出更高要求,期待數據庫擁有更高的性能、可擴展性、可用性以及降低成本,讓開發人員專注于核心業務的應用開發,不用關注和核心業務無關的代碼。
四是軟件架構歷經 PC、互聯網、移動互聯網,再到如今的萬物互聯時代,其中的迭代和轉型正在驅動數據庫選型的變化。
在此四大趨勢下,伴隨企業的業務量越來越大、越來越復雜,對數據庫的要求越來越高。亞馬遜云 科技 洞察客戶需求,在打造云上數據庫產品時提出五大理念:
一是專庫專用,極致性能;二是無服務器,敏捷創新;第三是全球架構,一鍵部署;第四是平滑遷移,加速上云;第五是 AI 賦能,深度集成。
02 歷經真實錘煉,五大數據庫理念,持續賦能企業數智轉型
顧凡表示,隨著數據爆炸式增長,微服務架構與 DevOps 愈發流行的今天,一個數據庫打天下的時代已然過去。我們需要在不同的應用場景下,針對不同的數據類型和不同的數據訪問特點,為開發者和企業提供專門構建的工具。
所以亞馬遜云 科技 提出 第一個核心數據庫理念:專庫專用 。在此理念下,推出針對關系數據、鍵值數據、文檔數據、內存數據、圖數據、時許數據、分類賬數據、寬列等專門構建數據庫的產品家族。
這些數據庫產品均經歷過亞馬遜內部核心業務的真實錘煉,成績斐然:
亞馬遜電商當年是 Oracle 的客戶之一,隨著亞馬遜電商的應用重構和業務體量發展,亞馬遜電商決定將業務遷移到亞馬遜云 科技 里。100 多個團隊參與這龐大的遷移工作中,將亞馬遜電商采購、目錄管理、訂單執行、廣告、財務系統、錢包、視頻流等關鍵系統全部從 Oracle 遷出來。2019 年,亞馬遜將存儲近 7500 個Oracle 數據庫中的 75 PB 內部數據遷移到多項亞馬遜云 科技 的數據庫服務中,包括 Amazon DynamoDB、Amazon Aurora、Amazon ElastiCache,于是亞馬遜電商成為亞馬遜云 科技 在全球的“第一大客戶”。
從 Oracle 切換到亞馬遜云 科技 后,亞馬遜電商節省了 60% 成本,面向消費者端的應用程序延遲降低 40%,數據庫管理支出減少 70%。
以被譽為“亞馬遜云 科技 歷史 上用戶數量增速最快的云服務”Amazon Aurora 為例,其擁有科媲美高端商業數據庫的速度和可用性,還擁有開源數據庫的簡單性與成本效益,Amazon Aurora 讓客戶滿足“魚和熊掌兼得”需求。
據顧凡介紹,Amazon Aurora 可提供 5 倍于標準 MySQL 性能,3 倍于 PostgreSQL 吞吐量。同時提供高可用,可用區(AZ)+1的高可用,Global Databases 可完成跨區域災備。可擴展到 15 個只讀副本,成本只有商業數據庫的 1/10。
醫藥企業九州通為藥廠、供應商,搭建藥廠、供應商、消費者提供供應鏈鏈條。其 B2B 系統的業務特點是讀多寫少,受促銷活動、工作時間等影響,經常會出現波峰波谷落差較大的情況,讀寫比例在 7:2 或者 8:3。九州通采用 Amazon Aurora 后實現讀寫分離和按需擴展,整體數據庫性能提升 5 倍,TCO 降低 50%。實現了跨可用區部署、負載均衡、自動故障轉移、精細監控、按需自動伸縮等。
據權威機構預測,到 2022 年,75% 數據庫將被部署或遷移至云平臺。在這個過程中,亞馬遜云 科技 是如何通過技術來幫助客戶加速應用上云的?這離不開除了上述的“專庫專用”外,以下四大理念:
第二個理念是無服務器、敏捷創新。 亞馬遜云 科技 大中華區產品部數據類產品高級經理王曉野表示,企業業務總有波峰波谷之時,如何按照企業 80-90% 的業務峰值來規劃數據庫的存儲容量和計算資源的話,將給應用帶來一定的業務連續性的妥協和挑戰。因此大多數企業都是按照峰值留有余地來選擇數據庫的計算資源,這將造成成本上的浪費。而 Serverless 數據庫服務可完成無差別的繁復工作和自動化擴展。
Amazon DynamoDB 是亞馬遜云 科技 自研 Serverless 數據庫,其誕生最早可追溯到 2004 年,當時亞馬遜電商作為 Oracle 的客戶,盡管對于關系型數據庫在零售場景的需求并不頻繁,70% 均是鍵值類操作,此時倒逼亞馬遜電商思考:為什么要把關系型數據庫這么重得使用?我們可以設計一款支持讀寫、可橫向擴展的分布式數據庫嗎?后來的故事大家都知道了,這款數據庫就是 Amazon DynamoDB,并在 2007 年發表論文,掀起業界 NoSQL 分布式數據庫技術創新大潮。
Amazon DynamoDB 可為大規模應用提供支持,支撐亞馬遜自身多個高流量網站和系統,如亞馬遜電商網站、亞馬遜全球 442 個物流中心等。在亞馬遜電商一年一度 Prime Day,光是針對DynamoDB API 的調用達到數萬億次,最高峰值請求達到每秒 8920 萬次。由此可見,DynamoDB 擁有高吞吐、擴展性、一致性、可預測響應延遲、高可用等優勢。
智能可穿戴設備廠商華米 科技 ,在全球 70 多個國家擁有近 1 億用戶。僅 2020 年上半年,其手表出貨量超 174 萬臺,截止到 2021 年 2 月,華米 科技 的可穿戴設備累計記錄步數是 151 萬步,累計記錄的睡眠時間是 128 億個夜晚,記錄心率總時長達 1208 億個小時。如此龐大的數據同時必須保證極高的安全性和低延遲相應,如何保證穩定性是巨大的挑戰。
DynamoDB 幫助華米 科技 在任何規模下都能提供延遲不超過 10 毫秒的一致響應時間。華米 科技 健康 云的 P0 和 P1 級別故障減少了約 30%,總體服務可用性提升了 0.25%,系統可用性指標達到 99.99%,為華為 科技 全球化擴展提供了有力的支撐。
最新無服務數據庫產品是 Amazon Aurora Serverless V2 提供瞬間擴展能力,真正把擴展能力發揮到極致,在不到一秒的時間內,將幾百個事務擴展到數十萬的級別。同時在擴展時每一次調整的增量都是非常精細化的去管理,如果按照峰值來規劃數據庫資源,可實現大概90%的成本節省。目前 Amazon Aurora Serverless V2 在全球實現預覽。
第三個理念是全球架構、一鍵部署。 在全球化的今天,如何支撐全球客戶的業務擴展連續性、一致性、以最低延遲帶給到終端客戶上,對數據庫提出新的挑戰。
亞馬遜云 科技 提供 Amazon Aurora 關系型數據庫Global Database、Amazon DynamoDB、Amazon ElastiCache 內存數據庫、Amazon DocumentDB 文檔數據庫都能利用亞馬遜云 科技 的骨干網絡提供比互聯網更穩定的網絡支撐,以一鍵部署的方式,幫助客戶實現幾千公里跨區域數據庫災備,故障恢復大概能在一分鐘之內完成,同時跨區域的數據復制延遲通常小于一秒。
第四個理念是平滑遷移、加速上云。 目前,450000+ 數據庫通過亞馬遜云 科技 數據庫遷移服務遷移到亞馬遜云 科技 中,這個數字每年都在不斷增長。亞馬遜云 科技 提供 Amazon DMS、Amazon Database Migration Service 等工具讓開發者和企業進行自助式云遷移。另外,對于遷移過程中可能會需要的支持,可通過專業服務團隊和合作伙伴網絡成員,為客戶提供專業支持,還通過 Database Freedom 項目幫助客戶降低他們的顧慮。
今年 11 月,最新產品 Babelfish for Amazon Aurora PostgreSQL 在全球和中國兩個區域正式可用,可加速企業上云的遷移,實現讓企業可以利用原有的技術棧、原有的 SQL Server T-SQL的人員可以利用到云數據庫進行創新。
第五個理念是 AI賦能,深度集成。 我們觀察到,ML 技術賦能數據庫開發者,開發者無需具備機器學習專業知識,就可進行機器學習操作。在此潮流下,亞馬遜云 科技 推出 Amazon Neptune,借由 Deep Graph Library 和 Amazon SageMaker 驅動圖神經網絡。
今年 8 月,Neptune ML 在中國正式可用,允許數據工程師不需要掌握機器學習的技能直接從圖數據庫里導出數據、轉換格式、訓練模型并發布,用 gremlin 語句調用訓練成的模型在數據庫里實現推理,進行欺詐檢測,推薦物品。
目前,亞馬遜云 科技 加速在中國區域服務落地,2021年至今新發布 60 多個數據庫服務與功能。亞馬遜云 科技 正是通過上述五大數據庫理念,打造豐富的數據庫產品家族,在全球智能化發展趨勢下,為企業提供更快更好的數智服務,釋放數據價值,并連續六年入選 Gartner 領導者象限,得到業界和客戶的深度認可。
NoSQL 數據庫因其功能性、易于開發性和可擴展性而廣受認可,它們越來越多地用于大數據和實時 Web 應用程序,在本文中,我們通過示例討論 NoSQL、何時使用 NoSQL 與 SQL 及其用例。
NoSQL是一種下一代數據庫管理系統 (DBMS)。NoSQL 數據庫具有靈活的模式,可用于構建具有大量數據和高負載的現代應用程序。
“NoSQL”一詞最初是由 Carlo Strozzi 在 1998 年創造的,盡管自 1960 年代后期以來就已經存在類似的數據庫。然而,NoSQL 的發展始于 2009 年初,并且發展迅速。
在處理大量數據時,任何關系數據庫管理系統 (RDBMS) 的響應時間都會變慢。為了解決這個問題,我們可以通過升級現有硬件來“擴大”信息系統,這非常昂貴。但是,NoSQL 可以更好地橫向擴展并且更具成本效益。
NoSQL 對于非結構化或非常大的數據對象(例如聊天日志數據、視頻或圖像)非常有用,這就是為什么 NoSQL 在微軟、谷歌、亞馬遜、Meta (Facebook) 等互聯網巨頭中特別受歡迎的原因。
一些流行的 NoSQL 數據庫包括:
隨著企業更快地積累更大的數據集,結構化數據和關系模式并不總是適合。有必要使用非結構化數據和大型對象來更好地捕獲這些信息。
傳統的 RDBMS 使用 SQL(結構化查詢語言)語法來存儲和檢索結構化數據,相反,NoSQL 數據庫包含廣泛的功能,可以存儲和檢索結構化、半結構化、非結構化和多態數據。
有時,NoSQL 也被稱為“ 不僅僅是 SQL ”,強調它可能支持類似 SQL 的語言或與 SQL 數據庫并列。SQL 和 NoSQL DBMS 之間的一個區別是 JOIN 功能。SQL 數據庫使用 JOIN 子句來組合來自兩個或多個表的行,因為 NoSQL 數據庫本質上不是表格的,所以這個功能并不總是可行或相關的。
但是,一些 NoSQL DBMS 可以執行類似于 JOIN的操作——就像 MongoDB 一樣。這并不意味著不再需要 SQL DBMS,相反,NoSQL 和 SQL 數據庫傾向于以不同的方式解決類似的問題。
一般來說,在以下情況下,NoSQL 比 SQL 更可取:
許多行業都在采用 NoSQL,取代關系數據庫,從而為某些業務應用程序提供更高的靈活性和可擴展性,下面給出了 NoSQL 數據庫的一些企業用例。
內容管理是一組用于收集、管理、傳遞、檢索和發布任何格式的信息的過程,包括文本、圖像、音頻和視頻。NoSQL 數據庫可以通過其靈活和開放的數據模型為存儲多媒體內容提供更好的選擇。
例如,福布斯在短短幾個月內就構建了一個基于 MongoDB 的定制內容管理系統,以更低的成本為他們提供了更大的敏捷性。
大數據是指太大而無法通過傳統處理系統處理的數據集,實時存儲和檢索大數據的系統在分析 歷史 數據的同時使用流處理來攝取新數據,這是一系列非常適合 NoSQL 數據庫的功能。
Zoom使用 DynamoDB(按需模式)使其數據能夠在沒有性能問題的情況下進行擴展,即使該服務在 COVID-19 大流行的早期使用量激增。
物聯網設備具有連接到互聯網或通信網絡的嵌入式軟件和傳感器,能夠在無需人工干預的情況下收集和共享數據。隨著數十億臺設備生成數不清的數據,IoT NoSQL 數據庫為 IoT 服務提供商提供了可擴展性和更靈活的架構。
Freshub就是這樣的一項服務,它從 MySQL 切換到 MongoDB,以更好地處理其大型、動態、非統一的數據集。
擁有數十億智能手機用戶,可擴展性正成為在移動設備上提供服務的企業面臨的最大挑戰。具有更靈活數據模型的 NoSQL DBMS 通常是完美的解決方案。
例如,The Weather Channel使用 MongoDB 數據庫每分鐘處理數百萬個請求,同時還處理用戶數據并提供天氣更新。
AWS推出了與SQL兼容的查詢語言PartiQL,只要數據庫查詢引擎提供PartiQL支持,使用者就能以PartiQL單一查詢關聯式數據庫的結構化資料,以及開放資料格式中的巢狀資料或是半結構化資料,甚至還能用來查詢NoSQL或是文件數據庫中無固定結構(Schema-less)的資料。除了AWS自家的數據庫服務,NoSQL數據庫Couchbase Server也承諾將會支持PartiQL。
企業資料分散在關聯式數據庫、非關聯式數據庫以及資料湖泊中。高度結構化的資料,儲存在SQL數據庫或是資料倉儲;無固定結構的資料則由鍵值儲存、圖形數據庫(Graph Database)、分類帳數據庫或是時間序列數據庫等NoSQL數據庫處理;而在資料湖泊中的資料,可能也有部分缺乏結構,或是可能為巢狀或是多值結構。不同的資料類型適用于不同的使用案例,而每種類型的資料,可能都有自己的查詢語言。
不同的資料儲存對應不同的查詢語言,當企業更換資料格式或是數據庫引擎時,可能還需要跟著改變應用程式和查詢語法,AWS提到,這對于資料的應用,特別是使用資料湖泊的靈活性與效率,有著很大的阻礙。為了統一不同類型數據庫存取方法,AWS發布了查詢語言PartiQL,這是個與SQL兼容的查詢語言,可以用來查詢以各種格式儲存在各地的資料。
用戶可以使用PartiQL來查詢關聯式數據庫,像是在Redshift實作交易或是資料分析等應用,或對于Amazon S3資料湖泊的開放資料格式,同樣能使用PartiQL對巢狀資料與半結構化資料例如Amazon Ion格式進行查詢,另外,PartiQL也可用于文件數據庫等NoSQL數據庫,查詢無固定結構的資料。
AWS表示,PartiQL的出現,是為了滿足自家查詢和轉換大量資料的需求,其提供嚴格的SQL兼容性,可與標準SQL混合使用,執行連接(Join)、過濾(Filtering)與聚合(Aggregation)操作,并以最小擴充支持巢狀和半結構化資料,讓開發者以簡單且一致的方法,不需要更改查詢語言,就能查詢各種格式和服務的資料。
PartiQL具格式獨立性與儲存獨立性,PartiQL語法和語義不依賴任何資料格式,無論使用者是要查詢JSON、Parquet、ORC、CSV還是Ion等格式,查詢語句的寫法都相同,PartiQL的查詢在綜合邏輯類型系統上運作,才對應到不同底層的格式。而PartiQL也不相依于特定資料儲存,因此適用于不同的底層資料儲存。
雖然過去針對跨不同類型數據庫查詢的問題,已有不少解決方案,AWS指出,像是Postgres JSON同樣也兼容于SQL,但是卻無法良好地處理JSON巢狀資料;而半結構化查詢語言,雖然能良好處理巢狀資料,但卻無法與SQL語言兼容。AWS提到,PartiQL是第一個能夠完全解決這些問題的查詢語言。
目前AWS已在自家多項服務支持PartiQL,包括Amazon S3 Select、Amazon Glacier Select、Amazon Redshift Spectrum、Amazon QLDB,接下來幾個月將會有更多的AWS服務支持PartiQL,Couchbase也公布將加入支持PartiQL的行列。現在PartiQL以Apache2.0授權許可開源,公開教學、規范以及參考實作,所有社群都能使用并參與貢獻。
如何玩轉 NoSQL數據庫?作者:IT專家網
Weather公司CIO Bryson Koehler整理出了MongoDB,Riak和Cassandra等NoSQL數據庫的特性。他指出這其中最重要的特性是“NoSQL不會限制住你”。
Weather公司,致力于天氣報告和天氣預報業務,其并不缺乏數據,當然也不缺乏數據管理工具。但它為什么需要三種不同的NoSQL數據庫?
最近,我向Weather 公司的CIO Bryson Koehler提出了這個疑問,除了公司的CIO,Bryson Koehler還是其他很多業務單元的孵化者,包括Weather Channel,WeatherFX,Weather Underground,和Intellicast等。Weather公司每天獲取和處理著約20萬億字節數據,對外提供當前全球天氣狀況,并為航空公司,緊急服務,貨運商,公用事業,保險,以及在線天氣網站和天氣應用程序的用戶提供天氣預報服務。每天需求增加了數十億的天氣數據請求,并且預期響應時間要在10毫秒左右。
Riak是Weather 公司的后臺NoSQL數據庫,服務于公司的事務性存儲公用網絡(SUN)數據獲取平臺,它運行在多個亞馬遜網絡服務(AWS)的可用區域上,并以每小時15次的頻率捕獲超過20億氣象數據信息,。所以,Riak具有明確的處理規模,但該公司也使用Cassandra以及新近添加的MongoDB數據庫,為Weather.com 上IOS和Android移動應用程序服務。
Weather 公司使用了不同的產品,Koehler解釋說,因為“不同的工具有不同的優勢。
Cassandra,它服務于Weather 公司以及全球消費者使用的第三方天氣應用的API數據:“我們的數據分發平臺每秒處理數十萬的事務,我們發現Cassandra在用于全球分發數據上是一個很棒的解決方案,并且在[數據庫]讀取方面體現出很高的可用性 “。它本質上為全球各地消費者所使用的數據服務,包括Weather 公司和第三方的天氣應用程序。
MongoDB,它提供了Weather.com網站和移動應用程序的中間層緩存功能:“離開我們的核心API,我們還沒有全部Weather.com內容,所以MongoDB是容器和分發站,為Weather.com以及Android和iOS上的移動應用程序服務。Mongo有很多好處,這些好處基于其內建的JSON格式以及靈活性上。“
Riak,用于消費氣象數據和觀測,包括來自世界各地的圖片和視頻等:“我們喜愛Riak因其優秀的數據攝取能力,而且是以一種全球分布式的方式來實現。這對于從全球分布式平臺上獲取數據的入站式數據庫是一個真正可靠的選擇。
我曾聽說Datastax,Basho和Couchbase的高管貶低MongoDB的可擴展性,但MongoDB指向大規模部署,在Facebook對超過200萬臺移動設備上應用程序提供支持,在eHarmony公司,MongDB每天處理著數十億的潛在比賽預約。據Koehle所述,MongoDB為Weather.com和Weather.com移動應用程序處理著“每天十億交易”,“毫無疑問,你可以通過配置和部署Mongo來處理大批量的交易數據。”
盡管如此,Koehler承認,他將“很樂于看到MongoDB繼續使全球集群和多位置[功能]更加無縫化且易于使用。” 這些屬于全球性的分布式集群,復制和負載平衡是Cassandra和Riak眾所周知的功能。
從規模討論的角度來看,很少有公司達到Weather公司的經營規模。易于開發,架構靈活性和JSON數據處理使得MongoDB的成為世界上最流行的NoSQL數據庫。這就是為什么微軟和IBM都進行了MongoDB的模仿,如微軟的Azure DocumentDB和IBM的 Cloudant,而不是Cassandra和Riak。
Weather公司可以從三個NoSQL標準降低至兩個的過程中得到鞏固,Koehler說,但公司沒有準備好這么做。
“由于我們構造了由許多不同的數據解決方案組成的網狀結構,我們目前的環境已過于復雜,”他說。“我們希望給團隊一些自由的空間,讓我們可以了解所有選擇的利弊,但你將會看到一些整合。”
到了那個時候,遷移將不在是一件難事,因為“關于NoSQL數據庫最重要的事情是,你不會被困在其中,” Koehler說。“如果你的架構和編碼正確,從一個數據庫遷移到另一個并不難。隨著模式的自由以及數據轉存技術的發展,無論前者是一個key-value存儲或其他什么形式,轉儲數據都將十分容易。“
對特定產品進程自定義編碼的復雜的存儲過程已經一去不復返了,Koehler說,但關于“結構化和編碼正確”還有很多需要考慮的地方?這樣做是為了避免特殊供應商提供的工具和功能可能讓你身陷其中。他舉了亞馬遜網絡服務“(AWS)的消息服務為例。
“你不必讓服務在云中運行,”他解釋說。“你可以只部署自己的RabbitMQ的環境,而不是陷于其中,所以你可以將一個原先部署在AWS 上的應用程序轉而部署在谷歌計算云服務上。無論它是數據平臺,存儲環境,或云計算環境,都要小心別讓自己局限在一個僅由一個供應商提供的小范圍空間內“。
轉載
網站名稱:亞馬遜nosql數據庫,什么是nosql數據庫
標題來源:http://m.kartarina.com/article26/dseegjg.html
成都網站建設公司_創新互聯,為您提供網站營銷、網站收錄、外貿建站、Google、ChatGPT、
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯