1039542 geekyouth 1578938931
深圳地铁大数据客流分析系统🚇🚄🌟
Scala
7 months ago
1640228 opensci 1578990842
1K
混合型科学大数据流水线系统,包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能
Scala
7 months ago
941
打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspark、HiveQL、Scala等脚本的计算中间件。
606
大数据平台数据服务框架。实现了Kafka实时数据过滤、清洗、转换、消费,实现了Spark SQL对Redis、MongoDB等非关系型数据库的数据的读写;集成了规则引擎,可基于规则引擎实现客户标签、画像等相关功能。
Scala
almost 2 years ago
2020111 btajl 1578991426
605
RepChain(Reactive Permissioned Chain)是第一款采用响应式编程实现的自主可控的区块链基础组件。由广州软件应用技术研究院、中国科学院软件研究所、贵阳信息技术研究院、中科智城(广州)信息科技有限公司、中科软科技股份有限公司和北京连琪科技有限公司共同研发,支持单位有中科嘉速和广州中科易德。RepChain已通过工信部信通院“2019、2020可信区块链”功能和性能测试。
Scala
3 months ago
11439529 fire framework 1677489254
498
Fire框架是由中通大数据自主研发并开源的、专门用于进行Spark和Flink任务开发的大数据框架,可节约70%以上的代码量。首创基于注解进行Spark和Flink任务开发,具备实时血缘、根因诊断、动态调优、参数热调整等众多平台化功能。Fire框架在中通内部每天处理数据量高达数千亿,在外部已被数十家公司所使用。
Scala
4 days ago
320
Open-source high-performance RISC-V processor
1152645 cookeem 1695081646
299
一个基于akka的分布式websocket聊天程序
Scala
over 6 years ago
239
spark源代码注释与翻译
Scala
9 years ago
209
Spark快速开发框架,提高开发效率,主要针对离线任务场景
Scala
almost 3 years ago
7503275 carlos gxl 1596983323
201
项目主要模块 基于对电商用户行为数据的基本分类,我们可以发现主要有以下三个分析方向: 1. 热门统计 利用用户的点击浏览行为,进行流量统计、近期热门商品统计等。 2. 偏好统计 利用用户的偏好行为,比如收藏、喜欢、评分等,进行用户画像分析,给出个 性化的商品推荐列表。 3. 风险控制 利用用户的常规业务行为,比如登录、下单、支付等,分析数据,对异常情况 进行报警提示。
Scala
over 3 years ago
184
webmagicx一款基于webmagic的可配置化的爬虫框架
Scala
6 years ago
Violation
163
java和scala 代码的jni教程示例 测试调用c/c++native 动态库
Scala
almost 2 years ago
1020923 bluejoe 1578938480
132
针对Solr的SQL查询引擎
109
基于Apache Spark的Netflix电影的离线与实时推荐系统
Scala
almost 6 years ago

Search