# API **Repository Path**: zhousimmons/API ## Basic Information - **Project Name**: API - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-07-13 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # flowes app #### 课程项目介绍 20_api_期末项目之flowers app
项目 flowers——PRD产品需求文档
名称 flowers 开始时间 2020-7-1
编写员 周子濠 截止时间 2020-7-19
课程 api、机器学习与人工智能 课程老师 廖汉腾、许志超
文档管理 目录 共十二点 版本总数 共3个 版本 V1.0
链接 https://gitee.com/zhousimmons/API
价值主张版本(一句话) 让人们可以一秒就能识别植物,为你准备全球植物景点攻略。
## 一、项目加值宣言 该App使用到的人工智能技术有菜品识别api技术、语音翻译api技术与图片翻译api技术,这些技术的综合运用能更好更有效的解决部分家长、教师、摄影爱好者、旅游爱好者或者小朋友在出门游玩时对景点的植物缺乏认识的难题,帮助他们快速认识花草、答疑解惑、学习植物知识。 ## 二、需求概述 ### 1. 产品背景 随着中国GDP近几年的快速提高,中国许多地方逐渐成为了旅行的热门目的地,例如海南,重庆,湖南,并且由于各大媒介对中国景点的广泛传播,中国旅游景点在世界各国的名气越来越大。但与此同时,由于**在许多景点中,都会有独特少见的植物,使旅客在游玩观赏过程中,给游客造成了植物认识上的困扰,尤其是处于知识吸收最快速阶段的小孩子,缺乏了可以让他们智力发育的渠道**。 ### 2. 产品市场 经过对市面上植物类APP、翻译类APP的调查,发现对植物扫描获知内容进行翻译并不难,但是将这些内容进行整合去解决该类用户的痛点。**另外人工智能和识别技术已经广泛应用于拍照识图类APP上,已能解决人们日常生活需要**,但在**植物类应用的领域,对于植物进行识别翻译的应用程序依旧处于起步阶段。** ### 三、用户画像 #### 3.1 目标用户群体: * 核心用户:植物爱好者、花卉养护者、园林工作者、花艺爱好者、孩子家长、教育者、旅行者、摄影爱好者、文艺小青年以及任何热爱生活喜欢植物的人。 * 主要用户:旅行者、喜欢植物的人 * 次要用户:花卉养护者、园林工作者、花艺爱好者、孩子家长、教育者 #### 3.2 用户画像及使用场景 ![旅行者用户画像输入图片说明](https://gitee.com/zhousimmons/API/raw/d98f8c83f18671c723f14f55ceb9177c642421b6/Simmons.jpg) 使用场景:simmons是一个热衷于出外旅行的年轻人,虽然喜欢满世界游玩,但是在对美丽的景色进行抓取拍摄的时候,总是会对拍摄的植物是什么产生疑问。于是他打开flowers app,将植物扫描了一下,得到了自己想要知道的植物的信息。 ![医生用户画像输入图片说明](https://gitee.com/zhousimmons/API/raw/master/%E5%8C%BB%E7%94%9F.jpg) 使用场景:jennie是一名外国医生,平时闲来无事会和同事去周围城市,例如重庆,湖南等地旅游,但是在观赏美景时不知道所欣赏的植物名称,当地导游也不能英语翻译。她打开flowers app对植物进行扫描,随即出现了有关自己感兴趣的植物的详细信息。 ### 四、人工智能概率性与解决方式 > 根据《2018 年中国生物识别市场分析报告-行业深度分析与发展前景预测》,2017年生物识别技术全球市场规模上升到了 172 亿美元,到 2020 年,预计全世界的生物识别市场规模有可能达到 240 亿美元。自 2015 年到 2020 年,人脸识别市场规模增长了 166.6%,在众多生物识别技术中增幅居于首位,预计到 2020 年人脸识别技术市场规模将上升至 24 亿美元。——中国报告网(CSDN博主冲动的MJ) **百度开放平台**提供的植物识别api可以识别超过2万种通用植物和近8千种花卉,接口返回植物名称,并获取百科信息,适用于拍照识图类APP中。通过各大论坛植物爱好者征集花草图片数据,以及自身团队的亲自采集收集信息,不断增加训练数据,而当数据量不断增加后,再对其进行清洗和标注,提高识别准确率,让用户在对植物进行扫描时,设备会采集植物信息,从数据库中查找信息,最后返回字符结果。 百度开放平台的植物识别技术有以下优势: |自然语言翻译技术优势| |:--:| |1. 物种丰富:支持识别超过2万种通用植物和近8千种花卉,接口返回植物的名称,并获取百科信息,适用于拍照识图类APP中| |2. 技术优:训练数据集数据丰富,预处理的过程包括了光线调整、颜色反转、曝光度、裁剪出关键部位等——提高翻译的准确性| **总结:** 该产品利用植物识别功能将在现场拍下的植物照片进行识别并展示出植物信息,其技术原理比较简单,主要就是图像识别及检索,即通过图片特征的提取,而后进行搜索匹配,最终输出结果。需要注意的是,该技术只针对单一植物的图片进行识别,但这项功能的扫描,搜索精确性较高(排除因图片过于模糊而扫描出现差别的情况) **识别准确度完善方案:用户不断提供数据完善神经网络,机器深度学习** ## 五、需求列表 |序号|API技术|用户场景|优先级| |--|--|--|--| |1|百度AI中的植物识别|快速知道植物属于什么种类|A(重要)| |2|有道智云AI的实时语音识别|实时解决用户了解植物的需求|A(重要)| |3|讯飞AI的图片翻译|迅速对扫面的植物进行翻译|B(次重要)| ## 从商业可行性的角度分析, 2017年全年,国内旅游人数50.01亿人次,比上年同期增长12.8%。纵观2012-2017年国内旅游市场数据,增长十分迅速。六年间中国国内游客人数增加了20亿人次,旅游收入翻了一番。 而国内游大热的,代表景点客流量人数的不断上升,在人们旅游过程中,有很多不同职业的人:老师,植物爱好者,摄影爱好者等等。虽然职业不同,但是出门在外旅游,都一样会对周围的景色,景物产生兴趣,想了解这些景物。那么,该APP就会对这些人起到重大作用,帮助他们了解更多植物,我觉得随着国内GDP的不断上升,国内,外旅客的不断增多,该APP的使用量将会越来越多。 ## 从商业可行性的角度分析, 2017年全年,国内旅游人数50.01亿人次,比上年同期增长12.8%。纵观2012-2017年国内旅游市场数据,增长十分迅速。六年间中国国内游客人数增加了20亿人次,旅游收入翻了一番。 而国内游大热的,代表景点客流量人数的不断上升,在人们旅游过程中,有很多不同职业的人:老师,植物爱好者,摄影爱好者等等。虽然职业不同,但是出门在外旅游,都一样会对周围的景色,景物产生兴趣,想了解这些景物。那么,该APP就会对这些人起到重大作用,帮助他们了解更多植物,我觉得随着国内GDP的不断上升,国内,外旅客的不断增多,该APP的使用量将会越来越多。 ## API加值图 ![API加值图](https://gitee.com/zhousimmons/API/raw/master/API%E5%8A%A0%E5%80%BC.png) ## 六、产品结构图 1. 产品功能结构图 ![flowers产品功能结构图](https://gitee.com/zhousimmons/API/raw/master/%E6%9C%AA%E5%91%BD%E5%90%8D%E6%96%87%E4%BB%B6.png) 2. 用户流程图 ![flowers用户流程图](https://gitee.com/zhousimmons/API/raw/master/%E7%94%A8%E6%88%B7%E4%BD%BF%E7%94%A8%E6%B5%81%E7%A8%8B.png) ## 七、产品原型及交互设计 ##### [原型文档下载区](https://gitee.com/zhousimmons/API) ##### [原型文档交互展示](http://nfunm032.gitee.io/savor) 1. 启动及登录界面 ![启动界面](https://gitee.com/zhousimmons/API/raw/master/%E5%90%AF%E5%8A%A8.png) ![登陆界面](https://gitee.com/zhousimmons/API/raw/master/%E7%99%BB%E5%BD%95%20%E2%80%93%201.png) 2. 核心页面——植物识别功能 ![植物识别功能图1](https://gitee.com/zhousimmons/API/raw/master/%E6%89%AB%E6%8F%8F.png) ![植物识别功能图2](https://gitee.com/zhousimmons/API/raw/master/%E7%BB%93%E6%9E%9C.png) ![植物识别功能图3](https://gitee.com/zhousimmons/API/raw/master/%E7%BB%93%E6%9E%9C%20%E2%80%93%201.png) 用户通过植物扫描界面,通过相机或相册输入植物图片,APP会对植物图片进行扫描,然后输出搜索到的植物相关信息给用户,另外还会给用户分享好友或者把结果保存相册的服务。 ### 数据流程图 ![数据流程图](https://gitee.com/zhousimmons/API/raw/master/%E6%95%B0%E6%8D%AE%E6%B5%81%E7%A8%8B%E5%9B%BE.png) ### 八、API的运用 ###### (一)图像识别 1. 百度AI开放平台——植物识别(本产品使用的API平台) - 接口描述:该请求用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出植物识别结果。 - 接口地址 :https://aip.baidubce.com/rest/2.0/image-classify/v1/plant - 请求方法:POST **(1)首先需要通过API Key和Secret Key获取access_token** **(2)接着对植物进行辨别** ![植物识别](https://gitee.com/zhousimmons/API/raw/master/%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20200717101549.jpg) - 案例: - 输入:单一清晰植物,将返回三个置信度最高的结果 ![单张图片](https://gitee.com/zhousimmons/API/raw/master/147.png) 2. 腾讯AI开放平台——图片识别 - 案例: - 输入:上传单张较模糊植物图片,能识别一个图像是否为植物图像。 ![植物图片识别](https://gitee.com/zhousimmons/API/raw/master/148.png) ###### **百度AI与腾讯AI比较** 1. **[百度植物识别API](https://ai.baidu.com/tech/imagerecognition/plant)**:只能对清晰图片识别多种植物,并返回植物的名称,图片中占比等综合信息。 2. **[腾讯AI](https://ai.qq.com/product/visionimgidy.shtml#fuzzy)**:能对模糊图片进行判断其是和种类和名称,不能提供关于植物的详细信息。 - **总结分析**:通过对百度与腾讯API的调用,了解,认识其功能。我个人认为腾讯AI的图片识别API仅能对图片进行高清辨别处理,未能给予详细信息,用处不大。但百度AI的植物识别API功能,我认为可以改进,例如想办法解决模糊植物图片识别的缺点。 **(二)语音翻译** 讯飞AI开放平台(实时语音翻译) - 接口描述:实时语音转写(Real-time ASR)基于深度全序列卷积神经网络框架,通过 WebSocket 协议,建立应用与语言转写核心引擎的长连接,开发者可实现将连续的音频流内容,实时识别返回对应的文字流内容。 - 接口地址:ws[s]: //rtasr.xfyun.cn/v1/ws?{请求参数}注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用 - 请求方法:POST ### 九、API的使用价格 - [百度的植物识别价格](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/gk3bcx9n1): 每日500次免费调用额度,免费额度用尽后按照如下价格进行计费。如需付费使用,可开通按调用量后付费或者预购单价更低的次数包进行抵扣。 ![百度的植物识别价格](https://gitee.com/zhousimmons/API/raw/master/%E6%A4%8D%E7%89%A9%E8%AF%86%E5%88%AB%E4%BB%B7%E6%A0%BC.png) - [有道的语音翻译价格](https://ai.youdao.com/DOCSIRMA/html/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E7%BF%BB%E8%AF%91/%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7/%E8%AF%AD%E9%9F%B3%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1/%E8%AF%AD%E9%9F%B3%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1-%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7.html): ![有道的语音翻译价格](https://gitee.com/zhousimmons/API/raw/master/%E6%9C%89%E9%81%93%E6%99%BA%E4%BA%91AI%E8%AF%86%E5%88%AB%E4%BB%B7%E6%A0%BC.png) - [讯飞图像翻译价格](https://www.xfyun.cn/services/object-recg) ![讯飞图像翻译价格](https://gitee.com/zhousimmons/API/raw/master/%E8%AE%AF%E9%A3%9E%E7%BF%BB%E8%AF%91%E4%BB%B7%E6%A0%BC.png) ### 十、API使用风险评估 > 我们对文明所爱的一切都是智慧的产物,所以用人工智能增强人类智能有促进文明走向前所未有的兴盛的潜力。但,前提是能我们保持这项技术有利无弊。” ——未来生命研究所总裁 马克斯·泰格马克 - 错误现象及处理办法: 1. 未能对拍摄植物进行精确识别:需要具备更完善的植物收集库,通过平台的训练数据,后续的经验积累、调参优化,提高最终平台的识别准确率;或者开通用户反馈渠道,进一步搜集用户上传的图片,用于算法的迭代训练。 2.识别范围较小:可以基于在植物花草上技术的积累,引入新的品类“瓜果蔬菜”作为训练数据,重新调整模型的参数,使得整体识别的准确率得到良好的扩展。 ### 十一、市场竞争 在“智能植物识别类APP”中,以“植物识别”为关键词,找到使用量较多的APP:微软亚洲研究院携手中国科学植物研究所联合出品的智能识别花卉品种的微软识花APP,以及较全的多肉植物指南APP好多肉。 **微软识花APP**:扫描识别后照片上显示了大量无效信息,APP的识别准确度有点低,大概60%的准确率。 **好多肉APP**:与用户的互动功能做得比较完善,但是因此功能也变得复杂起来,有用户表示“挺多淘宝商家也在这里发布内容” ### 十二、产品未来的发展构想 发展构想:不断增加功能丰富程度,带给用户更好的使用体验,首先满足基本的植物识别功能,注重把AI技术用在身边最常见的场景里,解决人们精神需要,让用户感受到大自然的美好。 ##### (一)产品的更新迭代过程 - **V1.0** 1. 实现植物识别功能,满足基本的识别需求; 2. 实现语音翻译功能,满足用户的交流需要; 3. 实现图片翻译功能,满足用户对植物的了解需求。 - **V2.0** 1. 加强扫描识别处理能力,对模糊照片也能做到清晰分辨; 2. 完善反馈机制,通过用户提供的反馈优化算法。 - **V3.0** 1. 加入植物地图功能,让用户了解身边植物; 2. 加入果蔬识别功能,果蔬,植物都可以了解。 ### 项目描述版本 * **一句话版本**
让人们可以一秒就能识别植物,为你准备全球植物景点攻略。 ##### 1分钟版本 如今市面上有植物识别类App的存在,但是能应用的场景较少,而且大多数扫描搜寻时间较长,这给用户造成时间上的浪费,该产品则是一款利用图片识别、植物扫描、图片翻译来帮助用户解决对植物缺乏认识的痛点,并且与用户友好的互动的APP。其中,利用到的AI技术有图像识别中的[植物识别技术](https://ai.baidu.com/tech/imagerecognition/plant)、自然语言翻译中的[语音翻译](https://ai.youdao.com/DOCSIRMA/html/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E7%BF%BB%E8%AF%91/API%E6%96%87%E6%A1%A3/%E8%AF%AD%E9%9F%B3%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1/%E8%AF%AD%E9%9F%B3%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1-API%E6%96%87%E6%A1%A3.html)和[图像识别](https://www.xfyun.cn/services/object-recg)。另外,通过对API使用风险的评估,认为该产品具有充分发展前景。最后,该产品还会通过引入“瓜果蔬菜”的识别分析,从而进一步的扩大该产品的使用范围。 ##### 总结 本文档写作进一步对“API机器学习与人工智能”课程的深化实践,结合课上知识,并引入“产品经理”和“用户视觉设计”课程的知识进行相关问题的思考和产品原型的制作。特别感谢百度AI中的植物识别API,有道智云AI的实时语音识别API和讯飞AI的图片翻译API对产品的技术支持,以解决用户的痛点、解决用户“闻其花香,不晓其名”的痛点,帮助更多人了解自然之美