首頁技術(shù)文章正文

怎樣創(chuàng)建Dataset對象?

更新時間:2021-09-08 來源:黑馬程序員 瀏覽量:

IT培訓(xùn)班

創(chuàng)建Dataset可以通過SparkSession中的createDataset來創(chuàng)建,具體代碼如下。

scala >val personDs=

spark.createDataset(sc.textFile("/spark/person.txt"))

personDs:org.apache.spark.sq1.Dataset[string]=[value:string]

scala>personDs.show()
+- - -  - - - - - - -- - - +
|        value             |
+- - -  - - - - - - -- - - +
|1 zhangsan 20             |

|2 lisi      29            |

|3 wangwu   25             |

|4 zhaoliu  30             |

|5 tianqi    35            |             

|6 jerry     40            |

+- - -  - - - - - - -- - - +

從上述返回結(jié)果personDs 的屬性可以看出,Dataset從已存在的RDD中構(gòu)建成功,并且賦Fvalue為String類型。Dataset和DataFrame擁有完全在相同的成員函數(shù),通過show方式可以展示personDs中數(shù)據(jù)的具體內(nèi)容。

Dataset不僅能從RDD中構(gòu)建,它與DataFrame也可以互相轉(zhuǎn)換,DataFrame可以通過as[ElementType]方法轉(zhuǎn)換為Dataset,同樣Dataset 也可以使用toDF()方法轉(zhuǎn)換為DataFrame,具體代碼如下:

scala>spark.read.text("/spark/person.txt".as[String]
res14:org.apache.spark.sql.Dataset[string]=[value: string]
scala>spatk.read.text("/spark/person.txt").as[String].toDF()
Res15:org.apache.spark.sql.DataFrame=[value: string]

Detaset操作:與 DeuaFreme 大致相同,讀者可查看官方API http://spark  apache.org/dsats/api/scall index.html#org.apche,spark.sql.Dataset詳細(xì)學(xué)習(xí)更多的Dataset操作。






猜你喜歡:

DataFrame是什么?與RDD有什么區(qū)別?

DataFrame的創(chuàng)建方法【大數(shù)據(jù)文章】

Scala子類繼承父類的方法【黑馬程序員】

黑馬程序員python大數(shù)據(jù)培訓(xùn)

分享到:

Java培訓(xùn)班課程javaee

Python培訓(xùn)機(jī)構(gòu)python大數(shù)據(jù)

web前端培訓(xùn)課程升級V8.5web

AI+設(shè)計培訓(xùn)課程ui

大數(shù)據(jù)培訓(xùn)課程cloud

軟件測試培訓(xùn)課程test

c

新媒體運營培訓(xùn)netmarket

產(chǎn)品經(jīng)理培訓(xùn)課程pm

linux培訓(xùn)Linux

movies

智能機(jī)器人培訓(xùn)robot

電商視覺設(shè)計課程uids

AI

集成電路應(yīng)用開發(fā)(嵌入式)培訓(xùn)課程jdbc

在線咨詢 我要報名
和我們在線交談!