在图像获取和传输过程中,往往伴随着各种形式的损坏,降低了图像质量和对图像信息的准确解释,一些老照片因为保存不当也会变得存在污渍或者破损缺失。图像修复技术主要用来修复日常生活中被噪声污染或者人为破坏的破损图像,也可应用于替换图像中的小区域或者瑕疵。目前,图像修复工作仍然由经验丰富的图像修复师来完成,让图像修复借助深度学习算法实现自动化日趋成为该领域的发展方向。
Last updated: almost 2 years ago该开源项目旨在提供一个能够自动检测并识别中文语音的模型,支持wav、mp4、m4a等格式的音频文件上传。无论是从录音设备中获取的wav文件,还是从视频中提取的mp4、m4a文件,我们的模型可以准确识别其中的中文文字内容。通过集成最先进的语音识别技术和深度学习算法,我们的模型能够快速、准确地将声音转换为文字,为用户提供便捷的语音识别体验。
Last updated: 2 years ago图像上色是一个具有挑战性的问题,因为它涉及到多模态不确定性和高度的不确定性。直接训练深度神经网络通常会导致语义色彩错误和低色彩丰富度。尽管基于变压器的方法可以提供更好的结果,但它们通常依赖于手动设计的先验,具有较差的泛化能力,并引入颜色流动效应。为了解决这些问题,本课题设计了一种使用改进的双GAN解码器进行图像着色的端到端方法。
Last updated: 2 years ago在这项工作中,本项目提出了一个动态单元来实时地将正常的视频动态进行编码,而不需要额外的内存开销。此外,本项目将元学习引入到模型中,形成了一个可通过少量学习即可快速适应各种现实视频场景的模型,称为元学习模块。该模块只需要几次更新迭代即可实现对新场景的快速适应能力。
Last updated: 2 years ago车道是智能汽车视觉导航系统的关键。车道自然是一个具有高级语义的交通标志,但它具有特定的局部模式,需要详细的底层特征才能准确定位。模型对车道进行检测的过程中,首先检测具有高级语义特征的车道,然后根据低级特征进行细化。该算法使用了Vision Transformer来收集全局上下文,从而进一步增强了车道的特征表示。
Last updated: 2 years ago老旧照片修复是一项很有意义的研究,如果你想让50-80年代之间的黑白照片变为彩色?或者修复那些带有划痕的旧照片,亦或是模糊照片清晰化?都可以采用本项目解决,本项目针对于计算机学生的毕业设计,项目提供算法模型与新设计的前端gui界面
Last updated: 2 years ago