# api_final project **Repository Path**: QSWing/api_final-project ## Basic Information - **Project Name**: api_final project - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-07-01 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## aninmals 产品需求文档 ### 迭代2增量改进 * 人工智能概率性部分补充了个人见解 * 用户画像更新，加入了两个新的用户画像 * 增加利害相关者信息 * 界面流程图更改、用户流程图更改 * 添加设计的用户可欲性、技术可行性、商业可行性图表 * 添加数据流程图表和分析 * 添加代码展示部分 * 添加平台对比 * 添加心得总结及感谢 * 添加了powerpoint影片介绍 ### 迭代3增量改进 * 补充了加值输入/输出细节 * 数据流程图展示加值 * 需求列表描述了api智能加值部分 * ppt更改 * 增加代码链接 * 完善心得总结 * 更换部分代码图片文档名称 | aninmals 产品需求文档 ------------ | ------------- 产品名称| animals 产品描述 | 一款可以通过拍照识别该动物的软件，并可以看到相关信息，例如：外形、行为、特征等等，可以帮助人们记录生活中看到的动物。产品版本 | 迭代进行中文件现状 | 进行中文件作者 |邱圣雯 ## 一、价值主张设计 ### 1.1 加值宣言现在人们使用网络和app也能自己学习了，animals通过使用百度开放平台提供的api接口来对动物进行识别，以及补充的文字识别。像该类app可以给那些出门旅游在外的人群提供搜索窗口，可以搜索到所见到的动物的信息，出门在外也可以随时随地的学习到关于动物的知识了。也可以给家长和孩子提供一个不一样的平台去学习动物知识。 ### 1.2 人工智能概率性与用户痛点 [图像识别前瞻](https://blog.csdn.net/Lyz879361321/article/details/84261352?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~first_rank_v2~rank_v25-2-84261352.nonecase)基于机器学习和大数据，图像识别的准确率已经很高了，识别的准确性已经很好了，这篇文章讲到的是人工智能，机器学习和深度学习的调研报告，可以给我们提供一些对于图像识别的知识。 [概率性机器学习与人工智能](https://blog.csdn.net/yeler082/article/details/78265086) [概率机器学习和人工智能](https://www.semanticscholar.org/paper/Probabilistic-machine-learning-and-artificial-Ghahramani/60e801e3dfc9812e294ed9de6d579e0293d61643?p2df) > 从这三个链接可以看到关于机器学习的瓶颈还仍然存在较多问题，主要是两个：a、概率性机器学习所完全呈现的不确定性是否重要是不确定的，人们不是很认可 b、不确定性因素太多：图像噪声及模糊性、预测模型的参数、采取何种模型（模型又分为多少层）机器学习面临的未来的数据和将来的行为引发的结果是不确定的，概率理论提供了一个框架模型去针对这种不确定性。主要应用有：语音识别、图像分类、文本预测等（并没有完全的使用概率模型） ## 二、问题需求 ### 2.1使用情景 * 动物专业的学生在学习过程中碰到第一见的动物 * 喜欢旅游的人在旅程中碰到感兴趣的动物 * 父母在家教孩子认识图册的时候看到了小动物 ### 2.2用户画像文档名称 | 用户分析 ------------ | ------------- 产品名称| animals 目标人群 |1.动物专业学生党
2.旅游的游客
3.父母或老师，可以给小孩子普及动物的知识用户画像及使用场景 | ![](/imgs/用户画像1.png) ### 2.3需求列表 api技术 | 用户场景 | 优先级 | 是否加值 | ------------ | ------------- | ------------ | ------------ 百度ai开放平台中图像识别中的动物识别 | 恰好遇见了一个小动物 | A（重要） | 是（调用了百度ai开放平台的通用物体与场景识别api，与数据库进行对比，输出置信度较高的前五个） | 百度ai开放平台中通用文字识别api | 在观看某张动物图片信息时想记下该介绍文字 | B（次重要） | 是（调用通用文字识别的api，与文字数据库进行对比，输出检索到的文字） | ### 2.4利害者相关分析 > 在该产品中，主要使用到的是百度ai开放平台中图像识别的通用物体与场景识别，该接口是该app重要的一个功能，可以满足大部分用户的需求，可以很快的在平常的生活上使用，去识别用户感兴趣的小动物。辅助api是百度ai开放平台里的通用文字识别，主要是给用户给收集到的小动物的信息的补充，不需要自己打字，只需要将图片上传识别文字。文档名称 | aninmals l利害相关者分析 ------------ | ------------- 人工智能类型| 弱人工智能系统性偏差 | 对于该部分内容，对于animals来说，持续更新是一个很重要的内容，要求我们在保持原来有的内容的基础上，还要做出修改、增删、创新。 ESG考量 | Environmental:该产品是app，一般情况下不会对环境有危害
Social：在社会方面，我们需要的人力资源比较少；在产品的责任上，我们会实事求是，动物信息的内容会认真核实，并及时更新数据库；
Governance：在治理方面我们会严格按照国家标准去执行，并在力所能及的方面去为濒危动物做一些公益活动，为物种的多样性发展出一份力。 * 相关链接：[人工智能的类型](http://www.forbeschina.com/technology/43676)、[系统性偏差](https://book.douban.com/review/9384909/)、[ESG测评](https://www.msci.com/) ### 需求概述 > [这是一款在线识别的网站](http://shibietu.wwei.cn/dongwu.html)，该网站的内容比较丰富，可以用于多种识别，但是对于喜欢带手机出门的用户来说，网站识别的话还是没有app方便。 * 产品背景目前该类app还是比较少的，很少平台把他作为一个针对识别动物的软件去开发，只是有的软件拍照功能中会自带识别动物的功能，或者公众号也会有给用户识别动物的功能，但是基本信息会比较少。 * 产品市场该类app适用于各类人群，无论是在动物专业的学生党、还是外出旅游的旅客、或者是平常对小孩的教育都可以用到 * 市场概述随着科技发展，该类app所需要的精度会越来越高，人们看到的想识别到的物种会越来越多，或者发现新的物种了，所以会要求api提供方要不断的更新数据库，以满足人们的搜索的需求 ## 三、界面流程及关键智能交互 ## [原型交互链接](https://modao.cc/app/5e458ab8f09b75bfdb1683baf449784d8a11380d?simulator_type=device&sticky) ### 3.1用户旅程交互及分析 * 界面流程图 ![](/imgs/用户旅程2.png) * 功能展示图 ![](/imgs/animals.png) * 用户流程
![](/imgs/用户流程图.png) ### 3.2设计的用户可欲性、技术可行性、商业可行性文档名称 | aninmals 三设计的要素分析 ------------ | ------------- 设计的用户可欲性| 在现在用户大多数喜欢使用手机的情况下，使用app去识别和学习是现在更多人的选择，而在平常生活的时候拍下照片就可以拿去识别照片中的你感兴趣的小动物。设计的技术可行性 | 现在有许多的开放平台，例如百度ai开放平台、阿里云开放平台等等平台都会有免费的api调用设计的商业可行性 | 现在学习的方式多种多样，而家长和学生都喜欢出去增长见识，这时候旅途过程中就可以继续学习。 * 加值输入细节：细节个数 | 描述细节 ------------ | ------------- 加值输入细节1（动物识别） |用户上传照片/用户实时拍照 --> 传入搜索框 --> 调用百度ai开放平台的通用物体与场景识别api --> 与百度数据库进行比较加值输入细节2（文字识别）| 用户上传带有文字的图片 --> 传入搜索框 --> 调用百度ai开放平台的通用文字识别api --> 与百度的文字数据库进行检索 * 加值输出细节：细节个数 | 描述细节 ------------ | ------------- 加值输出细节1（动物识别） | 用数据库对比用户上传的照片 --> 找到置信度最高的前五个 --> 输出动物类型，显示在用户界面加值输出细节2（文字识别） | 调用api识别 --> 与现有的百度文字数据库进行检索 --> 输出检索到的文字 ## 四、数据流程及关键智能api使用 ### 4.1数据流程分析和见面流程的匹配 ![](/imgs/数据流程2.png) ### 4.2数据流程设计的用户可欲性、技术可行性、商业可行性文档名称 | aninmals 数据流程三要素分析 ------------ | ------------- 数据流程设计的用户可欲性| 在animals 中，用户识别的数据可以保存在个人信息，方便用户以后观看数据流程设计的技术可行性 | 在百度ai开放平台调用图像识别和文字识别的api接口数据流程设计的商业可行性 | 每天成千上万的用户使用的数据，不仅可以看到动物具体出现在哪里，或者有没有什么新物种 ### 4.3代码及数据展示加值 [代码链接](https://gitee.com/QSWing/api_final-project/tree/master/%E4%BB%A3%E7%A0%81) ![](/imgs/动物识别1.jpg) ![](/imgs/动物识别2.jpg) ![](/imgs/文字识别1.jpg) ![](/imgs/文字识别2.jpg) ### 各平台调用api对比 * [百度ai开放平台](https://ai.baidu.com/) ![](/imgs/百度计费1.png) ![](/imgs/百度计费2.png) ![](/imgs/百度计费3.png) ![](/imgs/百度计费4.png) * [阿里云开放平台](https://open.aliyun.com/) ![](/imgs/阿里云计费1.png) ![](/imgs/阿里云计费2.png) > 总结：之所以选择百度ai开放平台的原因是，百度平台的计费比较完善，很多细项都裂了出来，方便我们去查找。而且很多api调用只要注册了可以免费调用，对于我们一个还在初步编写方案的产品来说，每天的调用次数是足够的了；而阿里云开放平台的许多api调用都是免费的，但是计费项目并没有完全列出来，调用的时候也没有完全现成的python代码，所以我建议新手还是选择百度平台。 * 人工智能概率性的参考 [概率性机器学习与人工智能](https://blog.csdn.net/yeler082/article/details/78265086) [概率机器学习和人工智能](https://www.semanticscholar.org/paper/Probabilistic-machine-learning-and-artificial-Ghahramani/60e801e3dfc9812e294ed9de6d579e0293d61643?p2df) > 机器学习面临的未来的数据和将来的行为引发的结果是不确定的，概率理论提供了一个框架模型去针对这种不确定性。主要应用有：语音识别、图像分类、文本预测等（并没有完全的使用概率模型） ## 五、心得总结及感谢 * 心得总结1：在本学期我们初步学习了api的知识，并在老师的指导下调用了多个平台的api去实现我们现在常用的一些功能，比如：图像识别、路程规划、文字识别等，在调用实现代码的时候还是很兴奋的，特别感谢[百度ai开放平台](https://ai.baidu.com/)、[百度ai开放平](https://ai.baidu.com/)、[高德开放平台](https://lbs.amap.com/)，这些平台为我们提供了免费调用api的机会，让我们可以在学习api的知识上获得更多帮助，真的谢谢这些开放平台。 * 心得总结2：在编写这篇文档的时候，因为自己的文字还不够成熟，所以在某些段落上会参考其他同行大佬们的文字表达，也让我了解到了在api的路途上我还有很多东西需要去学习。在此感谢[师姐的产品文档](https://github.com/NFUNM032/app-of-savor)、[人工智能概率性表达的参考](https://blog.csdn.net/yeler082/article/details/78265086)。同时也感谢互评的同学给我的建议，让我继续完善了我的产品文档，让我看到了文档部分还不够完善，也看到了自己的文字表达不够专业的情况。