[資訊] AWS雲八大類型資料庫

 2020:AWS雲上八大類型資料庫簡介

http://www.dostor.com/p/70314.html


1.關係型數據庫RDS

AWS RDS是2009年發佈的,它如今提供五種託管的關係型數據庫,包括MySQL、MariaDB、PostgreSQL、Oracle和SQL Server,使用者可以將資料庫從本地遷移到雲端資料庫,AWS提供多個版本供選擇,基本可以不用做任何修改將資料庫遷移到雲上。


這種託管的方案照顧了用戶原有的使用習慣,便於用戶遷移。雲端關係型數據庫用起來更省心,不用進行各種麻煩的運維工作。


普通使用者只需點擊幾下滑鼠就可以創建一個關係型數據庫(RDS),以MySQL為例,可以選擇資料庫的版本,可以選擇運行MySQL的主機的規格,可以配置存儲類型(是SSD還是磁片),在容量不夠的時候還能自動擴容,還能設置多可用區備份實例,以確保安全。


2.Amazon Aurora,它是2014年發佈的一種相容MySQL和PostgreSQL的關係型數據庫,所謂相容,就意味著MySQL和PostgreSQL可以無縫遷移到Amazon Aurora。


用戶可以像剛才一樣進行各種設置,也可以選擇無伺服器的模式,這種模式其實是AWS更推薦的方式,它可以不用設置主機、存儲類型以及多可用區,只管用就可以了,不用關心性能和可用性的問題,也不用任何升級和維護的操作。


Amazon Aurora既滿足了商業資料庫的性能和可用性的要求,同時,又把成本降低到商業資料庫的1/10,此外,AWS還做了性能上的優化,使得Amazon Aurora的輸送量可以達到MySQL的5倍、PostgreSQL的3倍。


3.Amazon DynamoDB鍵值資料庫

Amazon DynamoDB是AWS在2012年發佈的鍵/值和文檔資料庫,最早是為了處理亞馬遜電商業務高峰期系統瓶頸問題,經過仔細分析後卻發現原來70%的運營需求是鍵值型資料的查詢,且只需要返回含有主鍵值的一行資料即可。於是AWS工程師們意識到,這樣大規模的特定需求,需要一種不同類型的資料庫,這就是非關聯式資料為Amazon DynamoDB,最終被亞馬遜電商驗證的一個方案,可以說,它的出生和演進都與互聯網業務的有著千絲萬縷的聯繫。


Amazon DynamoDB屬於NoSQL(No-Not Only-不只是SQL的資料庫)資料庫的一種,它每天可以應對超過十萬億次,峰值每秒超兩千萬次的請求,存儲容量可以達到數個PB,非常適合移動、Web、遊戲、廣告技術、物聯網等對查詢速度要求很高的場景。而且,操作簡單易上手,運維管理成本也低,比較受歡迎。


4.Amazon ElastiCache記憶體中資料庫

Amazon ElastiCache是2011年發佈的一款託管記憶體中資料庫服務,它支援兩種開源的記憶體中資料庫引擎:Redis和Memcached,用戶最看重的就是記憶體中資料庫的高性能表現,它可以提供亞毫秒級的延時。


場景方面,它適合緩存使用者的資訊(比如使用者會話),它適合用在電商平臺,適合用來構建聊天室,適合用來創建遊戲排行榜,總之是資料量特別大、延遲要求又高的那類場景,以互聯網類應用最為典型。


5.Amazon DocumentDB文檔資料庫

Amazon DocumentDB是2019年1月發佈的,這是一款快速的、可擴展的、高可用的文檔資料庫,它是AWS開發的能相容Amazon MongoDB的資料庫,用Amazon MongoDB的人幾乎可以無縫的切換到Amazon DocumentDB上來,可以複用原來的代碼。


Amazon MongoDB存儲的所謂文檔其實是JSON資料,JSON是一種典型的半結構資料,它最大的特點是能適應欄位不確定的場景,檔模型非常靈活,便於對應用程式進行快速調整和反覆運算,從而縮短開發時間,典型場景方面,比如在電商平臺裡它負責存儲商品資訊、買家評論等內容。


6.Amazon Keyspaces寬表資料庫

2020年4月,AWS正式推出Amazon Keyspaces,它是一款相容Apache Cassandra的資料庫服務,原來Apache Cassandra使用者可以無縫切換到新的Apache Keyspaces上。發佈後不久,中國的兩個區域(由光環新網運營的 AWS 中國(北京)區域和由西雲資料運營的 AWS 中國(寧夏)區域)也很快都陸續上線了。


Apache Cassandra在2011年發佈了第一個正式版本,它是一款典型的寬表資料庫,資料模型基於穀歌的 Bigtable,存儲則採用了亞馬遜的 Dynamo 的分散式設計方案,AWS後來提供了Apache Cassandra的託管服務。


考慮到Apache Cassandra存在的一些問題,AWS修改了Apache Cassandra的代碼,使得它能夠作為一款託管的無伺服器服務,讓使用者無需做任何管理操作,而且可以按照實際使用的資源付費,可以用它輕鬆構建一個每可處理數千個需求的,輸送量和存儲空間幾乎無限的應用程式。


7.Amazon Neptune圖資料庫

Amazon Neptune是2018年5月發佈的一款完全託管的圖資料庫服務,所謂圖資料庫跟圖片沒關係,它描述的是現實世界中個體和個體之間網路關係的資料結構,雖然有一些開源的實現方案,但AWS並沒有直接採用,而是相容了部分標準之後提供了專有服務。


圖資料庫的典型場景不難想像,它適合在社交網路上管理社交關係,實現好友推薦功能,在電商網站上猜你想買,推薦商品,此外還有知識圖譜等場景,總之,是資料與資料有關聯關係的應用。


Amazon Neptune提供了圖資料庫引擎,可以存儲十億個關係,並讓查詢的延遲降低到毫秒級,關聯關係的查詢其實很複雜,如果用關係型數據庫處理這種資料的時候,資料庫操作非常多,性能會下降的非常厲害,而Amazon Neptune的查詢能將延遲降到毫秒級。


8.Amazon TimeStream時序資料庫

Amazon Timestream是2020年9月底發佈的一款時間序列資料庫服務,時間序列資料是按時間順序記錄的資料列,對時間序列進行分析可以找出樣本內時間序列的統計特性和發展規律,構建時間序列模型,進行預測。


Amazon Timestream適用於物聯網和運營應用程式,該服務每天可以存儲和分析數萬億個事件,與關係型數據庫相比,速度提高了1000 倍,而成本僅為關聯式資料庫的十分之一。


作為一款託管服務,Amazon Timestream節省了管理時序資料的時間和成本,作為一款無伺服器服務,它的性能和容量能自動伸縮,可以近乎無限地進行擴容,使用者無需關注底層基礎設施。


Amazon Timestream有資料分層策略,把近期資料保留在記憶體中,歷史資料放在低成本存儲層,Amazon Timestream的查詢引擎可以對各種資料層的資料進行查詢,此外,Amazon Timestream 內置了時間序列分析函數,説明使用者近乎即時地識別資料的趨勢和模式。



#Amazon, AWS, RDS, Aurora, DynamoDB, ElastiCache, DocumentDB, Keyspaces, Neptune, Timestream


留言