免费在线高清亚洲成人电影,海量高清色情影片免费观看,中国黄色毛片视频,亚洲精品午夜久久久伊人

基于HBase的工業大數據存儲實戰

2018-12-25 10:05

隨著工業4.0時代的到來，工業互聯網和企業的智能化、信息化都將不斷推進，傳統的工業實時數據庫和關系數據庫已經難以完全勝任工業大數據的存儲，以HBase為代表的NoSQL數據庫正在蓬勃發展，其完全分布式特征、高性能、多副本和靈活的動態擴展等特點，使得HBase在工業大數據的存儲上擁有強大的優勢，打破了流程工業生產中的"數據壁壘"效應的瓶頸,可以促進工業生產水平和生產管理水平的提高。本期格物匯，就來給大家介紹HBase數據庫及格創東智相關實戰案例。

了解HBase

HBase是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集群。HBASE的目標是存儲并處理大型的數據，更具體來說是僅需使用普通的硬件配置，就能夠處理由成千上萬的行和列所組成的大型數據。

HBASE是GoogleBigtable的開源實現，但是也有很多不同之處。比如：Google Bigtable使用GFS作為其文件存儲系統，HBASE利用HadoopHDFS作為其文件存儲系統；Google運行MAPREDUCE來處理Bigtable中的海量數據，HBASE同樣利用Hadoop MapReduce來處理HBASE中的海量數據；Google Bigtable利用Chubby作為協同服務，HBASE利用Zookeeper作為協同服務。

與傳統數據庫的相比，HBASE具備多重優勢：

1）線性擴展，隨著數據量增多可以通過節點擴展進行支撐；

2）數據存儲在hdfs上，備份機制健全；

3）通過zookeeper協調查找數據，訪問速度快。

HBase實戰案例

為了更好的介紹 HBase 在人工智能場景下的使用，下面我們以某半導體顯示企業為案例，給大家分析格創東智大數據團隊如何利用 HBase 設計出一個快速查找面板特征的系統。

目前，該公司的業務場景里面有很多面板相關的特征數據，每張面板數據大概 3.2k。這些面板數據又被分成很多組，每個面板特征屬于某個組。組和面板的數據分布如下：

——43%左右的組含有1張面板數據；

——47%左右的組含有 2 ~9張面板數據；

——其余的組面板數范圍為 10 ~ 10000張。

現在的業務需求主要有以下兩類：

——根據組的 id 查找該組下面的所有面板數據；