中文字幕av高清_国产视频一二区_男女羞羞羞视频午夜视频_成人精品一区_欧美色视_在线视频这里只有精品

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  應聘面試  >  大數據面試題  > 批次累加

批次累加

來源:千鋒教育
發布人:wjy
時間: 2022-09-02 15:35:53 1662104153

UpdataStateBykey updataStateBykey是特殊的reduceByKey, 相當于oldValue+reduceByKey(newValue1,newValue2),通過傳入一個updateFunc來實現批次間數據累加的操作。

實現它必須設置checkPoint路徑,updataStateBykey會自動將每次計算的結果持久化到磁盤,批次間的數據則是緩存在內存中。

缺點:大量占用內存,大量產生小文件 MapwithState mapwithState是spark1.6新增的累加操作,目前還在測試中,它的原理網上查不到,只知道是updataStateBykey的升級版,效率提升10倍。

缺點:資料不全,社區很小 不建議使用狀態流累加操作,建議用窗口+第三方存儲(redis)來達到同樣的效果。

Spark Streaming中的updateStateByKey和mapWithState的區別和使用。

UpdateStateByKey:統計全局的key的狀態,但是就算沒有數據輸入,他也會在每一個批次的時候返回之前的key的狀態。

這樣的缺點就是,如果數據量太大的話,而且我們需要checkpoint數據,這樣會占用較大的存儲。

如果要使用updateStateByKey,就需要設置一個checkpoint目錄(updateStateByKey自己是無法保存key的狀態的),開啟checkpoint機制。因為key的state是在內存維護的,如果宕機,則重啟之后之前維護的狀態就沒有了,所以要長期保存它的話需要啟用checkpoint,以便恢復數據。 

MapWithState:也是用于全局統計key的狀態,但是它如果沒有數據輸入,便不會返回之前的key的狀態,有一點增量的感覺。

這樣做的好處是,我們可以只關心那些已經發生變化的key,對于沒有數據輸入,則不會返回那些沒有變化的key的數據。

這樣即使數據量很大,checkpoint也不會像updateStateByKey那樣,占用太多的存儲。

批次累加

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
主站蜘蛛池模板: 欧美淫视频| 午夜激情在线免费观看 | 国产专区在线播放 | 一区免费视频 | 特级理论片 | 国产精品久久久久免费a∨ 国产激情一区二区三区 | 黄色免费在线观看视频 | 国产一级片免费观看 | 免费的黄色毛片 | zzzzyyyy精品国产 | 国产中文字幕在线 | 亚洲精久久 | 日韩一级在线免费观看 | 精品电影 | 久草视频在线播放 | 欧美亚洲一| 日本在线视频观看 | 中文字幕日本视频 | 欧美久久久久久久久久久久 | 伊人久久精品 | 美女网站视频免费黄 | 亚洲成年 | 伊人久久爱 | 国产福利在线视频 | 2021狠狠干 | 精品国产九九 | 狠狠爱www人成狠狠爱综合网 | 欧美日韩免费一区二区三区 | 精品国产一区二区三区免费 | 日本黄色免费观看 | av毛片| 91精品国产高清一区二区性色 | 黄色免费观看网站 | 玖玖在线精品 | 亚洲精品国产精品乱码不99按摩 | 国产精品久久久久久久久久东京 | 秋霞久久 | 欧美干b | 国产视频一区在线观看 | 国产第一页在线播放 | 精品视频一区二区 |