TRELLIS.2是一款先进的大型 3D 生成模型(40 亿参数),专为高保真图像到 3D 的生成而设计
增值税发票OCR识别,使用flask微服务架构,识别type:增值税电子普通发票,增值税普通发票,增值税专用发票;识别字段为:发票代码、发票号码、开票日期、校验码、税后金额等
票OCR识别,实现方式使用RT-DERTv2目标检测提取关键位置发票信息,PaddleOCR根据提取的位置进行文字识别。 支持图片和PDF识别,主要识别了发票标题、发票代码、发票号码、开票日期、购买方名称、购买方识别号、销售方名称、销售方识别号、含税金额、不含税金额、税费信息。
使用spring boot打造文件文档在线预览项目解决方案,支持doc、docx、ppt、pptx、wps、xls、xlsx、zip、rar、ofd、xmind、bpmn 、eml 、epub、3ds、dwg、psd 、mp4、mp3以及众多类文本类型文件在线预览
边缘AI应用:基于立创泰山派RK3566的智能网络摄像头 实现功能: 1.利用Rockit实现视频捕获和硬件编码 2.利用RKNN实现实时推理 3.利用ZLMediaKit实现RTSP视频推流 使用线程池对视频捕获任务,实时推理任务,编码与推流任务进行管理,实现了一套能够自主AI识别的视频监控摄像头。
Happy-LLM 是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程
VideoLingo 是一站式视频翻译本地化配音工具,能够一键生成 Netflix 级别的高质量字幕,还能加上高质量的克隆配音,让全世界的知识能够跨越语言的障碍共享
一个全面的健身指导平台,可以为你制定锻炼计划、跟踪进度并访问包含详细说明和视频演示的庞大锻炼数据库
GeoPort 是支持虚拟定位到全球任意位置的跨平台开源工具,不仅支持 iOS 17/18 系统,还可以在 Windows 和 Mac 上运行,无需复杂的 Python 环境配置,
一款美观的实时终端监控工具,用于监控 Claude AI token 的使用情况
解析不卡pro播放器含decoder-pro.js decoder-pro.wasm jessibuca-pro.js三个主文件
聚合支付,IJPay 让支付触手可及,封装了微信支付、QQ支付、支付宝支付、京东支付、银联支付、PayPal支付等常用的支付方式以及各种常用的接口。不依赖任何第三方 mvc 框架,仅仅作为工具使用简单快速完成支付模块的开发,可轻松嵌入到任何系统里。