SparkAPI Java版】JavaPairRDD——countByValue、countByValueApprox

      網(wǎng)友投稿 857 2025-04-01

      /** * Return the count of each unique value in this RDD as a map of (value, count) pairs. The final * combine step happens locally on the master, equivalent to running a single reduce task. */

      返回RDD中每個(gè)值的計(jì)數(shù),作為(value,count)對(duì)的映射。

      返回的是map

      // java public static java.util.Map countByValue() // scala def countByValue(): Map[(K, V), Long]

      public class CountByValue { public static void main(String[] args) { System.setProperty("hadoop.home.dir", "E:\hadoop-2.7.1"); SparkConf sparkConf = new SparkConf().setMaster("local").setAppName("Spark_DEMO"); JavaSparkContext sc = new JavaSparkContext(sparkConf); JavaPairRDD javaPairRDD1 = sc.parallelizePairs(Lists.newArrayList( new Tuple2("cat", "11"), new Tuple2("dog", "22"), new Tuple2("cat", "11"), new Tuple2("pig", "44"), new Tuple2("duck", "55"), new Tuple2("cat", "66")), 3); Map, Long> value = javaPairRDD1.countByValue(); for (Map.Entry, Long> entry : value.entrySet()){ System.out.println(entry.getKey()+"->"+entry.getValue()); } } }

      19/03/20 17:15:31 INFO DAGScheduler: Job 0 finished: countByValue at CountByValue.java:23, took 1.093040 s 19/03/20 17:15:31 INFO SparkContext: Invoking stop() from shutdown hook (duck,55)->1 (dog,22)->1 (pig,44)->1 (cat,66)->1 (cat,11)->2 19/03/20 17:15:31 INFO SparkUI: Stopped Spark web UI at http://10.124.209.6:4040

      /** * Approximate version of countByValue(). * * The confidence is the probability that the error bounds of the result will * contain the true value. That is, if countApprox were called repeatedly * with confidence 0.9, we would expect 90% of the results to contain the * true count. The confidence must be in the range [0,1] or an exception will * be thrown. * * @param timeout maximum time to wait for the job, in milliseconds * @param confidence the desired statistical confidence in the result * @return a potentially incomplete result, with error bounds */

      CountByValue()的近似版本。

      【SparkAPI JAVA版】JavaPairRDD——countByValue、countByValueApprox

      置信度必須在[0,1]范圍內(nèi),否則異常將被扔掉。

      *@參數(shù)超時(shí)等待作業(yè)的最長(zhǎng)時(shí)間(毫秒)

      *@參數(shù)置信度結(jié)果中所需的統(tǒng)計(jì)置信度

      *@返回一個(gè)可能不完整的結(jié)果,帶有錯(cuò)誤界限

      // java public static PartialResult> countByValueApprox(long timeout) public static PartialResult> countByValueApprox(long timeout, double confidence) // scala def countByValueApprox(timeout: Long): PartialResult[Map[(K, V), BoundedDouble]] def countByValueApprox(timeout: Long, confidence: Double): PartialResult[Map[(K, V), BoundedDouble]]

      EI企業(yè)智能 Java spark 可信智能計(jì)算服務(wù) TICS 智能數(shù)據(jù)

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:如何定位MySQL中的慢查詢
      下一篇:全屋定制家居拆單設(shè)備,解密其重要性與注意事項(xiàng)
      相關(guān)文章
      亚洲狠狠色丁香婷婷综合| 亚洲精品国偷自产在线| 亚洲第一AV网站| 久久久久亚洲AV无码专区网站| 亚洲AV成人一区二区三区观看| 亚洲AV一二三区成人影片| 亚洲香蕉免费有线视频| 7777久久亚洲中文字幕蜜桃| 婷婷亚洲久悠悠色悠在线播放| 亚洲人成网77777亚洲色| 亚洲精品成人无码中文毛片不卡| 久久精品国产精品亚洲| 久久亚洲精品无码观看不卡| 亚洲狠狠爱综合影院婷婷| 久久久久亚洲AV成人网| 国产亚洲AV手机在线观看| 亚洲情综合五月天| 好看的亚洲黄色经典| 亚洲AV无码一区二区三区系列| 久久综合图区亚洲综合图区| 亚洲国语精品自产拍在线观看| 亚洲国产女人aaa毛片在线| 亚洲高清视频免费| 91亚洲精品自在在线观看| 亚洲小视频在线播放| 亚洲精品人成网在线播放影院| 亚洲 日韩经典 中文字幕| 亚洲综合一区国产精品| 国产青草亚洲香蕉精品久久| 亚洲AⅤ优女AV综合久久久| 亚洲第一永久AV网站久久精品男人的天堂AV | 亚洲爆乳AAA无码专区| 国产精品亚洲а∨无码播放麻豆| 亚洲第一黄片大全| 亚洲精品无码成人AAA片| 亚洲国产成人精品不卡青青草原| 亚洲熟妇色自偷自拍另类| 2020天堂在线亚洲精品专区| 亚洲AV成人精品日韩一区 | 亚洲欧洲日产国码二区首页| 亚洲AV成人一区二区三区在线看|