42 Star 455 Fork 215

sanluan / einvoice

 / 详情

我的苹果电脑。识别的时候总是提示缺BWSimKai字体

已完成
创建于  
2023-04-12 09:02

我已经安装了GB2312的楷体,而且系统已经加载了,就是仍然提示缺失,还无法识别发票

18:38:00.261 [main] WARN org.apache.pdfbox.pdmodel.font.PDType0Font - No Unicode mapping for CID+1 (1) in font BWSimKai
18:38:00.263 [main] WARN org.apache.pdfbox.pdmodel.font.PDType0Font - No Unicode mapping for CID+2 (2) in font BWSimKai
18:38:00.263 [main] WARN org.apache.pdfbox.pdmodel.font.PDType0Font - No Unicode mapping for CID+3 (3) in font BWSimKai
18:38:00.263 [main] WARN org.apache.pdfbox.pdmodel.font.PDType0Font - No Unicode mapping for CID+4 (4) in font BWSimKai


18:38:00.592 [main] DEBUG org.apache.fontbox.util.autodetect.FontFileFinder - checkFontfile check /Users/liuyw/Library/Fonts/simkai.ttf
18:38:00.597 [main] DEBUG org.apache.fontbox.util.autodetect.FontFileFinder - checkFontfile found /Users/liuyw/Library/Fonts/simkai.ttf

比如发票里面固定的“名称”、“纳税人识别号”都无法读取

字体说明

最搞的是,我把这个字体改成GB2312,再去读取就能识别了。

然后我去百度了BWSimKai字体,居然没有这个字体。。瞬间麻木了!

评论 (5)

天空破击 创建了任务

目前没有采用硬编码指定字体 可能就走操作系统的字体了

哦。不晓得服务器上会是什么效果,我本地读取的全文本就这个样子,凡是嵌入的字体都识别不出来,只能识别宋体和数字部分的

输入图片说明

我更新到centos服务器上。还是没有办法识别,
我很好奇为啥你对外提供的服务我试了是可以识别的,好诡异

找到问题了。。。我以前引入的pdfbox是2.0.11版本的。
后面我又核对了下,示例中的是2.0.25版本的。
换了之后就正常了。我醉了呀~~~~ :joy:

#I2M9HW:河南省的通信费发票识别问题
之前也有人反馈不同版本存在差异 以前用2.0.8的时候 避免了后面版本的坑 后来升级2.0.25的时候 避免了前面版本的坑 :sweat_smile:

sanluan 任务状态待办的 修改为已完成

登录 后才可以发表评论

状态
负责人
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
参与者(2)
481020 sanluan 1578925218
Java
1
https://gitee.com/sanluan/einvoice.git
git@gitee.com:sanluan/einvoice.git
sanluan
einvoice
einvoice

搜索帮助

344bd9b3 5694891 D2dac590 5694891