所有star的仓库都会放在这里。可以根据需求创建不同的星选集来管理它们。
一份给开源新手的保姆级开源百科,欢迎你一起来对内容进行补充与更正。
最近更新:
1年多前
混合型科学大数据流水线系统,包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能
最近更新:
1年多前
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
最近更新:
2年多前
轻量级/高性能/可插件扩展的ETL工具
最近更新:
5年多前
DLFlow基于滴滴用户画像组深度学习大规模离线计算实战经验而诞生,其能够有效的结合单机GPU高性能计算和分布式Spark大数据处理能力。DLFlow利用Spark进行大规模特征处理并生成特征数据,模型训练则利用本地GPU完成,大规模数据预测仍由Spark完成。使用DLFlow时,无需过多关注特征处理和Pipeline流程构建,用户只需要专注于算法模型定义,其余事务都可以交给框架处理。
最近更新:
接近6年前
模仿dubbo设计思路开发出来的一套分布式服务框架,[因为关注人员较多,所以为考虑大家阅读,所以决定重构当前设计及完善开发文档]
最近更新:
8年多前
阅读《spark graphx in action》一书及系列博客时候所编写的测试代码及注释。
最近更新:
接近9年前