# 账记性_API期末项目报告 **Repository Path**: penwey/API ## Basic Information - **Project Name**: 账记性_API期末项目报告 - **Description**: 制作一个关于记账类的产品文档。 - **Primary Language**: Unknown - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-06-19 - **Last Updated**: 2023-05-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 产品前置说明 迭代一与迭代二的改进如下: 1修改了界面的布局 2增加用户画像及用户场景分析 3完善增加界面流程图 4更改了学习心得与感谢 5.为了防止泄露信息将部分的代码信息打码 6.增加关键智能api使用操作界面 详细请看:[迭代一与迭代二更新对比视图](https://gitee.com/penwey/API/compare/acf93fd62dca60149ab418e02a249d1b5bf7f951...fcca24c86aed06a1771d6295f62a3959c8169ed7) --- # 项目名称 ## 1.账记性 ### 简述 - 一句话版本:让用户便捷记账,养成理财好观念 - 一分钟版本(**加值宣言**):许多用户在日常的消费过程中,有记账的需要,但是往往市面上很多记账类的软件操作步骤过于繁琐,而此款app则是利用通用文本识别api,用户通过上传账单图片,系统就会提取相关的文本信息通过语义分析api功能自动完成记账;还利用了语音识别api的功能,用户只需语音口述相关的消费情况,便可完成相关的操作 - 目标用户:大学生群体、毕业的实习生、记录日常消费的中年更年期家庭妇女。想要省钱的用户 - 对于当前移动端的手机便捷支付已经成为人们日程生活消费的主要支付工具,对此,金融理财类的app发展前景巨大。本项目主打打的的功能是便捷的记账程序。基于类似“随手记”等记账软件,利用语音识别api识别用户叙述的账单,然后通过自然语言处理自动的帮助完成一笔账单的记录,同理通过图像识别api,用户通过拍照或是账单图片上传便可以自动的识别出来,简便传统的手动记账,让用户拥有理财的概念。 ## 2、问题表述与需求列表 1. **产品背景**:随着支付手段及购物场景的日趋多样化,人们对于自己的开支消费未能有着很好的整体把握,而单纯的采用记事本记账,条目繁多而杂乱。用户对于收支记账有着较大的需求。而专业的记账软件,通过良好的归类和便捷的记账功能,让用户方便的记下自己的每一笔开支,并且通过图表形式,清晰的了解自己的收支情况和变化趋势。 2. **产品市场**:经过对市面上众多记账类APP的调查,虽然线上的记账app能基本满足用户的使用需要,但总体来说使用流程繁琐,手写输入是挺麻烦的,以致于众多用户流失,通过研究可得,如果在记账过程中,通过语音识别输入,账单的图片文字识别,以及自然语言处理等能力,可以加快用户日常普通记账的速度,简化记账流程。增加用户的粘度。 3. **产品目标**实现用户的快速记账,增加用户的粘度。 - 此款产品针对的是需要进行日常记账的大学生群体、毕业的实习生、家庭妇女、以及想要省钱的用户。因为当今的青年群体大多是多于浮躁,同时因为每月的开支有限,就需要有一款可以提供记账的app,他们认为这些产品或许可以约束他们日常的消费,养成勤俭节约的习惯,但是现在市面上的记账类app普遍是操作繁琐,用户体验很糟糕,而本项目则是可以为用户提供便捷的记账方式(语音和文本识别),在满足用户记账的前提下,简便记账的流程,提升用户体验,从而满足用户需要记账而且记账功能强大却易操作的需求 - **价值主张**:让记账更简单,让用户有计划的消费,账记性,随时记。 ### (一)问题表述:传统记账工具操作复杂 - 用户画像 - ![输入图片说明](https://images.gitee.com/uploads/images/2020/0720/225714_bb619251_2229424.png "屏幕截图.png") - **用户使用场景**:中大南方大一学生张国章,每月仅有1500元的生活费,但是她平常热衷于逛超市商场,学吃喝玩乐,导致每月的开支都很紧俏,迫于现实的压力,想要记录自己的日常开支情况,之前有使用过记账类的app产品,但是就很反感那些产品繁琐的操作步骤以及功能,这时候如果有一款简便的记账类app产品,便可使得她的用户体验上升,从而达到省钱的目的。 - **痛点**:1.(App图形用户界面)的多步骤点击输入的记账方式,繁琐的操作是用户长期记账的很大痛点,即便用户深知记账的高价值属性,亦难以坚持如一的使用其产品;2.手动汇总收支状况需要花费较大的时间成本;3.缺乏养成长期记账习惯的动力;4.理财意识及知识能力薄弱,缺乏让自己资产增值的理财投资。 - **增长**:如果有一款可以直接语音输入消费信息,或是直接拍照识别账单的记账软件,并能够准确识别信息,简单的操作步,那么王小英就可随时随地的记录她的消费信息了。 - **任务**:王小英只要在需要记录消费情况的时候,打开"账记性"app,通过语音口述消费状况或是图片上传账单的方式,系统会在后台自动识别用户的数据,并通过自然语言处理或图片文字识别的方式,自动生成消费情况,并展示给王小英,若王小英确认账单正确,则记账成功。 ### (二)需求列表 优先级 | 需求 | 智能价值 | API类型 ---|---|---|--- 1 | 自动识别账单 | 是 | 文字识别 2 | 自动填写账单 | 是 | 语音识别 3 | 位置获取 |否 | 高德地图 ## 3、“账记性”解决方案原型表述 - **一、商业可行性**:1.根据Analysys易观智库发布[《中国记账理财APP移动市场季度监测报告2016年第4季度》](https://www.analysys.cn/article/detail/[1000565](https://note.youdao.com/)[link](https://note.youdao.com/))数据显示,中国记账理财APP活跃用户总数大幅度增长,用户数量已经达1600万,而到2016年第1季度,记账理财APP活跃用户人数总量为2116.43万人,环比2015年四季度增长30.56%,可见记账理财APP有整体向上的趋势,有非常好的市场前景。![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/165638_d2484d39_2229424.png "屏幕截图.png") 2.根据易观的[《2019年第3季度记账理财发布》](https://www.analysys.cn/article/detail/20019558)的报告,可以看出记账理财行业头尾应用在用户规模、增长幅度、应用时长等存在较大差距,头部聚集效应仍十分明显,行业内不时会有创新类应用涌入,成为有力竞争者。![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/165847_e3da4dce_2229424.png "屏幕截图.png") 经过市场调研发现,当前市面上很少有语音识别功能的记账软件,少部分有拍照图像识别的,记账类的app可以后续与理财投资类产品形成一种产业链,通过数据分析,引导用户进行相应的理财投资,形成一种渠道,扩大产品的宁活性,在经过完全开发后,此款app可以计划通过售卖以及与理财投资类平台app进行合作盈利。一下附上个部分平台对于语音识别和图像识别的有关费用。 - 竞品分析:目前对于市面上的记账类app有很多,期中“随手记”占据了市场的很大份额,具有上传图片的功能,另一个巨头“挖财”app则是除了上传图片外,也同样支持语音识别的功能,下面我们就以“随手记”app,“挖财”app,以及本产品进行相应的分析比较 软件对比 | 随手记记账 | 挖财记账 | 账记性记账 ---|---|---|--- 手动记账 | 支持 | 支持 | 支持 图片上传记账 | 只能上传图片,不能识别图片内容 | 只能上传图片,不能识别图片内容 | 支持识别图片上的文字 语音识别记账 | 不支持 | 支持 | 支持 - **二、技术可行性**: 1. 用户通过开启手机上的麦克风:1.收集用户口述的语音数据转换成文本形式;2.通过自然语言处理语词分析的功能,将文本装换成相应账单数据,然后再数据结构化的呈现给用户确认。 2. 用户通过开启手机自带的摄像机,或者是图库上传图片的方式,将有关消费记录的照片提供给app的后台:1.进行图像文字识别的功能,将文字提取出来,2.而后通过自然语言处理语义分析功能,进行相应的账单数据处理。 3. 以上单独的步骤只需调用相应的api能力即可实现,app只需将调用api产生的数据进行后台的处理议价加载,构建相应的数据库,前端框架以及其他相应的技术支持,总的来说技术性的难度不是很大。 - **三、用户可欲性**:对于常规的记账类app如当下市场占有率最多的‘随手记’提供的记账方式都是用户自己手动输入消费记录,然后再自己人工将信息分类,偶尔会有拍照上传信息的交互,从以人为本的点出发,这些操作步骤有些许的繁琐。换个角度思考,既然用户选择用记账app进行日常消费的记录,肯定是想要一个简便的操作过程,最好是一两步就能完成的工作,那我何不如直接让用户简便的口述自己的消费情况,通过app后台的语音识别和自然语言处理的能力,一步帮助用户定位当次的消费开支情况,没有繁琐的操作过程,提升用户体验。同时此款软件也加入“图像文字提取”功能,当口述不方便的时候可以通过拍照上传的方式进行记录。语音交互功能让用户真正的解放了双手,提升了便利性的同时又省时有趣。在满足记账业务需求和用户体验方面, ## 4、界面流程及关键的智能交互 ### [账记性APP原型](https://modao.cc/app/dc397efbc7c9431c421096f5ba5d4f810c20b41c?simulator_type=device&sticky) - 首先注册登录aqp,进入页面后用户一开始要设定自己的月预算金额,之后就可以正常的使用软件了:当用户需要进行记账理财的时候,进入app的首页界面,点击主屏幕下边缘的“+”按钮,选定此次记账的记账方式1.有三种记账的方式,第一种为常规的手动记账:用户通过界面选定此次记账的具体类型,然后手动的输入信息数据以完成记账,此种方式较为繁琐,会花费较多的时间精力;这是若用户觉得这种方式麻烦则可以选择下面两种方式进行后续的记账工作2.第二种方式为拍照上传识别信息记账,点击“相机”按钮,选择拍摄或是直接图库上传照片的方式,提供给软件后台进行api功能的处理,后台通过识别图片上的文字,进行语义分类,一次性的帮助用户填写数据信息,然后以小窗的方式展示在页面上,供用户进行确认,若是识别有偏差,则可以给用户提供再次修改的权限,待确认准确无误的时候,则可以点击确定以完成本次的记账;3.很多时候,在日常的消费中是没有小票提供的,这是就可以用到语音输入的方式,用户开启手机的麦克风,点击说话按钮,可以将自己消费过的数据信息以一句话(不超过1分钟)的方式口述出来,同样软件通过api的能力识别用户所描述的信息,通过数据处理,自动帮助用户填充记账的信息,方便简单,尔后同样以小窗口的方式,供用户确定信息,用户也是可以自己进行相应的编辑或是修改,这样就可更加便捷的记录自己的消费情况。正常来说通过语音识别以及图像文字识别的方式,准确率很高,同时也是加入以人为本的概念,若是用户觉得识别的数据信息太对,也可以自己手动修改编辑,以用户的满意程度为准。 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/030930_2be69475_2229424.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/031003_fc5982a6_2229424.png "屏幕截图.png")![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/031024_6914ae97_2229424.png "屏幕截图.png")![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/031051_7cd9a565_2229424.png "屏幕截图.png")![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/031121_44078aed_2229424.png "屏幕截图.png")![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/031146_9fa88db9_2229424.png "屏幕截图.png")![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/031209_7304055b_2229424.png "屏幕截图.png")![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/033014_de95dd76_2229424.png "屏幕截图.png") ### 工作流 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0717/123653_1fce3cb7_2229424.png "屏幕截图.png") ### 关键智能api加值使用界面 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0724/213956_48b2dc87_2229424.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0724/214016_8e7b99c0_2229424.png "屏幕截图.png") --- ## 数据流程及关键智能api使用 - 产品结构图![输入图片说明](https://images.gitee.com/uploads/images/2020/0720/234107_9148be18_2229424.png "屏幕截图.png") - 用户流程图![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/215221_bef6b233_2229424.png "屏幕截图.png") - 核心功能数据结构实现![输入图片说明](https://images.gitee.com/uploads/images/2020/0717/023328_e33e3d00_2229424.png "屏幕截图.png") - 首先,用户打开账记性APP,注册好相关的账号,在使用前系统会提醒用户设置每月的预算金额,用来督促用户勤俭节约。当用户完成消费的动作 后,打开app进行记账,APP提供三种记账的方式,一个是常规手动输入记账,用户只需将消费的数据,录入软件后台,然后选定账单的类型,准备完后后台会提醒用户此次的记录知否正确无误,然后再确认此次的账单,以上的这种情况是无智能加值的流程操作。此款APP的独特之处是通过语音识别:和图像文字识别的技术的智能加值,简化记账的流程,节省用户的时间花费,具体的数据流程操作为:1.用户在首页选择“图像记账”的方式,通过账单图像上传给软件后台,后台通过通用文本识别api的功能,进行相应的语义分析后,自动生成相应的初步的账单信息,供用户确认信息的完整性,信息正确则可以直接完成本次的记账操作,如若识取错误(api技术不能确保百分百的成功,难免有时候会出现相应的小偏差),则是可以给用户提供手动修改的能力,用户或许只需修改部分的错误信息便可完成记账操作。同理2.使用语音记账的方式,用户打开手机的麦克风,口述少于一分钟的音频,通过后台的语音识别api和自然语言处理的的功能自动生成用户的账单信息供用户确认,若出现数据的偏差(概率很小)同样也是可以通过用户手动修改数据信息然后再提交完成账单记录。总的来说数据的流程不是很复杂,主要是运用语音识别api,图像文字识别api,以及自然语言处理的能力来实现。 ### API的运用 #### (一)核心功能的输入输出 1. [百度云通用文字识别api技术文档连接](https://ai.baidu.com/ai-doc/OCR/zk3h7xz52) - 接口描述:基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一。 - 请求说明:HTTP 方法:POST - 接口地址:https://aip.baidubce.com/rest/2.0/ocr/v1/general - 通用文字识别api代码示例 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0724/182711_276dd52e_2229424.png "屏幕截图.png") 2. [阿里云一句话识别api技术文档连接](https://www.alibabacloud.com/help/zh/doc-detail/84442.htm?spm=a2c63.p38356.879954.3.2f285067FdakTy) - 接口描述:对一分钟内的短语音进行识别,适用于对话聊天,控制口令等较短的语音识别场景。 - 请求说明:HTTP方法:POST - 接口地址:http://nls-gateway.cn-shanghai.aliyuncs.com/stream/v1/asr ![输入图片说明](https://images.gitee.com/uploads/images/2020/0724/182635_5d98801f_2229424.png "屏幕截图.png") #### (二)分析比较 ##### 1.通用文字识别技术 目前有多家公司提供通用文字识别技术的功能,调出三家较为突出的,如下所示: - 百度智能云-文字识别OCR-[通用文字识别](https://ai.baidu.com/ai-doc/OCR/zk3h7xz52) - 腾讯云-文字识别OCR-[通用印刷体识别](https://cloud.tencent.com/document/product/866/33526) - 阿里云-[印刷文字识别-通用文字识别](https://market.aliyun.com/products/57124001/cmapi020020.html?spm=5176.730005-56956004.productlist.d_cmapi020020.565b123ej2St0b&innerSource=search#sku=yuncode1402000000) 对比项 | 百度智能云 | 腾讯云 | 阿里云 ---|---|---|---|--- 成熟度 | 文档清晰且详细,旗下的API比较细分,能满足多方面的需求 | 文档清晰较完善,但计费较高 | 技术文档完善,但调用费用高昂 | 性价比 | 免费调用50000次,2.5-5元/千次 | 免费调用1000次,10元/千次 | 83.3元/千次 ##### 2.语音识别技术 当前同样也是有很多家公司提供一句话语音识别功能的服务,差异也是有的,各家收费也是不一样 - 阿里云-智能语音交互-[一句话识别](https://www.alibabacloud.com/help/zh/doc-detail/84442.htm?spm=a2c63.p38356.879954.3.2f285067FdakTy) - 百度云-语音技术-[短语音识别标准版](https://ai.baidu.com/ai-doc/SPEECH/Vk38lxily) 对比项 | 阿里云 | 百度云 ---|---|--- 成熟度 | 产品文档完善,支出表语言较多,且识别效率高 | 产品文档较完善,但计费较高 相加比 | 1.4美元/千次,相比较较便宜 | 24元/千次 ### API产品使用关键AI **API市场竞争程度** #### 1.阿里云一句话识别api - 阿里云一句话识别API准确率高,用其国内独特的建模,可降低20%的错误率,大幅提高语音识别的精度,同时使用LFR解码技术,在不损失识别精度的情况下,将解码速率提高了3倍以上,大幅缩短了反馈时间,提升用户体验。 #### 2.百度智能云通用文字识别api - 基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一,从性价比上来看,百度云该api的调用价格为2.5-5元/千次,相比较行业内,性价比较高。 - 定价: - 阿里云一句话识别api:1.40美元/千次 - 百度通用文字识别api:免费调用50000次,2.5-5元/千次 ### API产品的使用风险评估: 1. 对于通用文字识别目前百度智能云的通用文字识别准确率可以高达99%,但是其对于图像的画质和格式都是有要求的,所以在使用的时候尽量的提醒用户使用质量较高的图片以及选用常规图片格式(jpg、png等)。 2. 对于阿里云的一句话识别识别准确率高,国内独创的字级LC-BLSTM/DFSMN-CTC建模,相对业界传统CTC方法降低了20%的错误率,大幅提高了语音识别的精度,解码速率高,解码速率提高了3倍以上,大幅缩短了反馈时间,提升用户体验,但是其很大的缺点是只能识别一分钟以内的音频,超过一分钟的语音识别不了,而且对于吵杂的环境识别的准度可能会下降,这也是需要后期产品维护运营注意的方向。 ## 5、产品的更新迭代 1. ![输入图片说明](https://images.gitee.com/uploads/images/2020/0723/180004_1b95537d_2229424.png "屏幕截图.png") 2. 产品的未来发展路线构想: 产品始终坚持以人为本的理念,从基础功能延伸到附属功能,首先 基于“通用文字识别api“和”一句话识别api”功能的前提先满足用户花费 简短时间记账的需求,紧紧抓住便捷记账的特点,提升用户量,逐渐 增加软件的功能,根据用户的记账数据,开放线上商城和金融理财模 式,从深层次提升用户的理财意识,从而实现完整的金融记账类产品 --- ## 6、总结心得及感谢 - 通过本项目的实践,我的感悟是人工智能ai应该要造福人[聚焦| 中央政治局集体学习人工智能 推动AI造福人类](http://science.china.com.cn/2018-11/06/content_40562217.htm),从娱乐转移到实际的生活当中去,就比如本项目,利用语音识别和文本识别的api功能,考虑用户的感受,既能满足用户的‘记账’需求,又能简便其操作步骤,节约时间成本,以人为本和同理心在实际的产品研发中至关重要,关乎产品的生命线。 - 在进行此项目的过程中,特别感谢阿里云和百度智能云提供api功能,以及完整的demo,方便我们新手的学习,还有感谢CSDN用户:“[˚天霸动霸Tua](https://blog.csdn.net/kaikai0803/article/details/84630039)”提供的百度通用文字api调用代码参考 - 最后我制作的最小可行性产品是账记性APP结合多个智能api满足赢用户的记账需求的情况下,简便操作步骤,节约时间成本,让用户养成理财好观念。