支持多种文本去重算法(MinHash+LSH、SimHash、MD5、精确匹配)的高效 Web 应用程序,适用于中大规模文本数据处理。
写写文档,学习一下吧
这是一个基于Flask的文档相似度数据可视化工具,将原有的单页HTML应用转换为前后端分离的架构,提供了更好的性能和用户体验。
最近一年贡献:38 次
最长连续贡献:2 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。