TRELLIS.2是一款先进的大型 3D 生成模型(40 亿参数),专为高保真图像到 3D 的生成而设计
增值税发票OCR识别,使用flask微服务架构,识别type:增值税电子普通发票,增值税普通发票,增值税专用发票;识别字段为:发票代码、发票号码、开票日期、校验码、税后金额等
票OCR识别,实现方式使用RT-DERTv2目标检测提取关键位置发票信息,PaddleOCR根据提取的位置进行文字识别。 支持图片和PDF识别,主要识别了发票标题、发票代码、发票号码、开票日期、购买方名称、购买方识别号、销售方名称、销售方识别号、含税金额、不含税金额、税费信息。
使用spring boot打造文件文档在线预览项目解决方案,支持doc、docx、ppt、pptx、wps、xls、xlsx、zip、rar、ofd、xmind、bpmn 、eml 、epub、3ds、dwg、psd 、mp4、mp3以及众多类文本类型文件在线预览
边缘AI应用:基于立创泰山派RK3566的智能网络摄像头 实现功能: 1.利用Rockit实现视频捕获和硬件编码 2.利用RKNN实现实时推理 3.利用ZLMediaKit实现RTSP视频推流 使用线程池对视频捕获任务,实时推理任务,编码与推流任务进行管理,实现了一套能够自主AI识别的视频监控摄像头。
Happy-LLM 是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程
VideoLingo 是一站式视频翻译本地化配音工具,能够一键生成 Netflix 级别的高质量字幕,还能加上高质量的克隆配音,让全世界的知识能够跨越语言的障碍共享