為什么選擇kafka采集數(shù)據(jù)?大數(shù)據(jù)采集層主要可以使用Flume, Kafka兩種技術(shù)。查看全文>>
本地和遠程模式安裝配置方式大致相同,本質(zhì)上是將Hive默認的元數(shù)據(jù)存儲介質(zhì)由自帶的Derby數(shù)據(jù)庫替換為MySQL數(shù)據(jù)庫,這樣無論在任何目錄下以任何方式啟動Hive,只要連接的是同一臺Hive服務(wù),那么所有節(jié)點訪問的元數(shù)據(jù)信息是一致的,從而實現(xiàn)元數(shù)據(jù)的共享。下面就以本地模式為例,講解安裝過程。查看全文>>
任何一種編程語言都有特定的數(shù)據(jù)類型,Scala也不例外。與其他語言相比,Scala中的所有值都有一個類型,包括數(shù)值和函數(shù)。接下來,通過一張圖來描述Scala數(shù)據(jù)類型的層次結(jié)構(gòu),具體如圖1所示。查看全文>>
HBase數(shù)據(jù)庫最常見的操作就是讀寫數(shù)據(jù),接下來,針對HBase讀寫數(shù)據(jù)的流程進行詳細介紹。查看全文>>
Hadoop集群的安裝和配置完成之后。并不能直接啟動集群,因為在初次啟動HDFS集群時,必須對主節(jié)點進行格式化處理,具體指令如下。查看全文>>
大數(shù)據(jù)不斷向世界的各行各業(yè)滲透,影響著我們的衣食住行。例如,網(wǎng)上購物時,經(jīng)常會發(fā)現(xiàn)電子商務(wù)門戶網(wǎng)站向我們推薦商品,往往這類商品都是我們最近需要的。查看全文>>