Ai
1 Star 0 Fork 0

诸葛子房/spark-demo

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
WordCount.java 943 Bytes
一键复制 编辑 原始数据 按行查看 历史
xiaoqiu2017wy@163.com 提交于 2022-05-15 11:08 +08:00 . wordcount
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import scala.Tuple2;
import java.util.Arrays;
public class WordCount {
public static void main(String[] args) {
SparkConf conf = new SparkConf();
conf.setMaster("local");
conf.setAppName("spark_wordcount_java");
JavaSparkContext sc = new JavaSparkContext(conf);
JavaRDD<String> lines = sc.textFile("src/main/resources/data");
JavaRDD<String> words = lines.flatMap(line-> Arrays.asList(line.split(" ")).iterator());
JavaPairRDD<String, Integer> pairRDD = words.mapToPair(word -> new Tuple2<>(word, 1));
JavaPairRDD<String, Integer> result = pairRDD.reduceByKey((v1, v2) -> v1 + v2);
result.foreach(tuple2 -> System.out.println(tuple2));
sc.stop();
}
}
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/ZhuGeZiFang/spark-demo.git
git@gitee.com:ZhuGeZiFang/spark-demo.git
ZhuGeZiFang
spark-demo
spark-demo
master

搜索帮助