Fay是一个完整的开源项目,包含Fay控制器及数字人模型,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、语音助理、远程语音助理、数字人互动、数字人面试官及心理测评、贾维斯、Her。 开源项目,非产品试用!!!
SpeechBrain是一个开放源代码和所有功能于一身的基于PyTorch语音工具包。 目标是创建一个单一、灵活且用户友好的工具包,可用于轻松开发最先进的语音技术,包括语音识别系统、说话人识别系统、语音增强系统、多麦克风信号处理系统和很多其他的。
一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。