# API期末项目 **Repository Path**: lvhonglu/api-final-project ## Basic Information - **Project Name**: API期末项目 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-01-22 - **Last Updated**: 2021-01-25 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # API final project |文档名称|IC(image classification) 智能图像检测分类—产品需求文档| | -- |-- | |产品名称|IC(image classification) 智能图像检测分类| |产品描述 |是一款利用智能,并结合了相似、相同照片模块分类成相册;同类型照片整合分类的相册整理APP| |产品版本 |1.0| |文件现状 |进行中| |文件作者 |吕泓鹭| --- ## MVP加/价值主张宣言 #### 项目标题 IC(image classification) 智能图像检测分类:轻松归类图片,便于搜索清理相册 #### 项目简介 ##### 1. 问题情境 现代科学技术发展,随手拍摄记录自己的生活也变得越来越普通,正由于拍照方式越来越便捷,而很多人都惰于清理、分类、规整自己的相册,也就导致照片堆积越来越多,并且都堆积在一个相册中,只有每次当手机、电脑内存不足时才想起来清理相册,而此时这一个小小的相册中已经堆积几千万张图片,清理起来也很令人头疼。 ##### 2. 解决方案 智能图像检测分类就是一款对本机相册的所有图片进行分类、打标签的产品,方便用户按照分类快速找到图片,用户也能更便捷的清理、规整自己的图片。 * 运用图像主体检测api,对用户的图片进行内容分析。 ##### 3. 产品描述 IC 是一款能够智能分析并归类相册图片的app。它可以很大程度上节省用户整理与分类图库的时间。 --- ## 一、问题需求 ### 1. 使用情境与用户画象 ![使用情境与用户画象](/picture/用户画像.jpg) ### 2. 需求列表 用户需求 | 智能加值 | 使用API | 优先级 | ---- | ---- | ---- | ---- 快速对图片进行分类 | 通过计算机视觉对图片进行内容识别与分类 | 图像主体检测api | 一(最重要) 快速对相似图片进行分类 | 通过计算机视觉对图片进行内容识别与分类 | 相似图片搜索api | 二(最重要) 快速对人像图片进行分类 | 通过计算机视觉对图片进行内容识别与分类 | 人脸识别api | 三(重要) ### 3. 需求论证之利害相关者分析 #### 3.1 利害相关者 用户在使用 IC 后,其图片清理分类的效率将会大大提升,同时能更好实现内存合理利用,促进用户个人的进步和发展。 #### 3.2 关键API人工智能类型 **使用的API** 图像主体检测api、相似图片搜索api、人脸识别api **API类型** 以上API所使用的人工智能都是弱人工智能的类型。 - 目前几乎所有的人工智能系统都是弱人工智能。弱人工智能是面向单一任务,没有认知能力的人工智能。 - 这些机器只能完成其编程所赋予的任务,因此只具备非常窄的能力范围。 **对解决方案的可能关键影响** 以上API可能不足以很好地分析所有图库内容,输出一些并不属于同一类的相册,对用户造成疑惑。 #### 3.3 系统性偏差 **对解决方案的可能关键影响** 因人工智能API的识别正确率并非百分之百,存在一定的识别错误或识别失败可能性。错误的分类信息可能需要用户后期进行自行调整。 #### 3.4 关于ESG考量 - 1. 用户隐私安全,用户信息的泄露。 - 2. 简历信息保护机制,不随意泄露用户的信息。 --- ## 二、解决方案:界面流程及关键智能交互 ### 1. 原型及界面设计 - 交互原型:[体验链接](https://modao.cc/app/924906ffb617f1757c9f0e714945af359f91b3e6?simulator_type=device&sticky) ### 2.用户旅程 ![用户体验旅程地图](/picture/用户体验旅程地图.jpg) ### 3. DFV模型及商业模式、价值主张画布 #### 3.1 [DFV 模型](https://www.permissiontoplay.co/fieldnotes/lenses-of-human-centred-design-desirability-feasibility-viability/) ![dfv画布](/picture/dfv画布.jpg) #### 3.2 商业模式 ![商业模式画布](/picture/商业模式画布.jpg) #### 3.3 价值主张画布 ![价值主张画布](/picture/价值主张画布.jpg) #### 4. 加入输入/输出值 ![加值输入及输出细节](/picture/加值输入及输出细节.jpg) #### 5. 产品流程图 ![产品流程图](/picture/产品流程图.jpg) ## 三、解决方案:数据流程及关键智能API使用 ### 1. 数据流程图分析 ![数据流程图](/picture/数据流程图.jpg) ### 2. [DFV 模型](https://www.permissiontoplay.co/fieldnotes/lenses-of-human-centred-design-desirability-feasibility-viability/) ![dfv画布2](/picture/dfv画布2.jpg) ### 3. 代码及数据加值展示 [完整代码](https://gitee.com/lvhonglu/api-final-project/tree/master/code) #### 3.1、相似图片搜索api 运用了百度AI开放平台图像搜索API中的[相似图片搜索api(接口的外链url)](https://ai.baidu.com/tech/imagesearch/similar)和[相同图片搜索api(接口的外链url)](https://ai.baidu.com/tech/imagesearch/same) - 相似图片搜索和相同图片搜索都包含入库、检索、删除、更新4个子接口。 - 首先需要通过API Key和Secret Key获取access_token。 - 然后将大量图片入库,入库之后的图片,可在控制台的图库管理后台进行可视化管理,支持预览大图、更新摘要、更新分类信息、删除图片,入口在控制台-应用详情页 管理图库。 - 完成入库后,可使用检索接口实现相似图检索。 1. 相似图片搜索api: - HTTP 方法:POST - 请求URL: https://aip.baidubce.com/rest/2.0/image-classify/v1/realtime_search/similar/search 2. 相同图片搜索api - HTTP 方法:POST - 请求URL: https://aip.baidubce.com/rest/2.0/realtime_search/same_hq/search ![代码1](/picture/代码1.jpg) ![代码2](/picture/代码2.jpg) ![代码3](/picture/代码3.jpg) #### 3.2、图像主体检测api 运用了百度AI开放平台[图像主体检测api(接口外链url)](https://ai.baidu.com/tech/imagerecognition/object_detect) - 接口描述:检测图片中的主体,支持单主体检测、多主体检测。检测出图片中主体的坐标位置,并给出主体的大类标签和标签的置信度得分,对海量图片进行分类、打标签。 - HTTP 方法:POST - 单主体请求URL: https://aip.baidubce.com/rest/2.0/image-classify/v1/object_detect - 多主体请求URL: https://aip.baidubce.com/rest/2.0/image-classify/v1/multi_object_detect ![代码6](/picture/代码6.jpg) ![代码7](/picture/代码7.jpg) #### 3.3、人脸识别api 运用了百度AI开放平台[人脸识别api(接口外链url)](https://ai.baidu.com/tech/face) - HTTP 方法: POST - 请求URL:https://aip.baidubce.com/rest/2.0/face/v3/detect ![代码8](/picture/代码8.jpg) ![代码9](/picture/代码9.jpg) ### 4. 数据流程图之智能API加值数据细节展示 ![加值数据细节展示](/picture/加值数据细节展示.jpg) ### 5. 各api调用价格 - 图像搜索API——[相似图片搜索、相同图片搜索(内容介绍的外链url)](https://ai.baidu.com/ai-doc/IMAGESEARCH/Ck3bczqk2) 入库与检索接口超出 **免费额度** 后,可选择购买 **次数包** 或开通 **按调用量后付费** 两种计费方式付费使用,两种付费方式均可在控制台直接开通或购买,开通付费后默认按量后付费的方式进行阶梯计费,如有购买对应服务的次数包,则优先消耗次数包额度,抵扣完毕后自动转为按量后付费方式。 ![价格1](/picture/价格1.jpg) ![价格2](/picture/价格2.jpg) - 图像识别API——[图像主体检测(内容介绍的外链url)](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/rk3bcxa9e) 图像识别下共有9个接口能力可在控制台自助付费使用,每个接口均提供一定额度的免费调用量供测试使用,超出 **免费额度** 后,进入控制台,在"可用服务列表"中找到对应的接口,选择对应的 **付费** 方式点击开通或购买即可。 ![价格3](/picture/价格3.jpg) ![价格4](/picture/价格4.jpg) ![价格5](/picture/价格5.jpg) ### 6. 人工智能概率性 - 1. 百度智能云 - 图像主体检测API 体精度高 | 维度丰富 | 覆盖率高 | ---- | ---- | ---- 基于大数据的深度学习,计算的精确度高 | 多种维度信息,包含主题、话题、实体等多种维度标签 | 图片覆盖率可达96% | - 2. 百度智能云 - 相似图片搜索API 准确率高 | 支持多语种识别 | ---- | ---- 基于大数据的深度学习,计算的精确度高 | 多种维度信息,包含主题、话题、实体等多种维度标签 | 图片覆盖率可达96% | - 3. 百度智能云 – 人脸识别API 准确率高 | 拓展性高 | ---- | ---- 基于大数据的深度学习,计算的精确度高 | 多种维度信息,包含主题、话题、实体等多种维度标签 | 图片覆盖率可达96% | --- ## 四、心得总结及感谢 - 1. 同行/同侪参考价值 API的使用其实只需要遵守接口的规则就能轻松调用,重要的是如何更好地抓住市场、用户的痛点进行项目的构思,还有对于技术文档的阅读和理解,以及怎么改善该应用成为真正的一个功能,在已经拥有一个想法的情况下,我们需要做的只是把这个想法加以修饰并实践出来。 在做本次项目的时候,我明白想要做好一个项目,不仅要运用api这门课上所学的,还要灵活运用用户研究、产品经理、界面设计的发散思维,这些知识都是先相同的。我学会合理有效的利用图表去完善自己的想法和产品,以图表的形式展示出来使数据说明更加形象直观,运用好价值主张画布,各类流程图等等,一步步探究这个产品真正的智能加值。为了解决用户不想花时间或没有时间整理相册,但又因相片过多过杂而出现了许多痛点的问题,本次项目所做的app可以满足用户快速选择性删除相同、相似照片,快速找到需要的照片,这两大需求。 - 2. 对同行/同侪成果的尊重引用 在文档的最后,依然要诚挚感谢对这个项目提供帮助的许智超老师以及游鸽老师,在他们一个学期的教学上,我在代码以及api运用的进度从无到有,也要感谢同学们在课后对我的指导。同时需要感谢各百度智能API功能调动,墨刀的交互流程图制作的功能以及ProcessOn的制作流程图功能等等。 [视频链接](https://pan.baidu.com/s/1oHEPi0JBylGOKKQ3n2AUQA) 提取码:pdqi [ppt链接](https://gitee.com/lvhonglu/api-final-project/blob/master/api-ppt.pptx) [产品原型](https://modao.cc/app/924906ffb617f1757c9f0e714945af359f91b3e6?simulator_type=device&sticky) 有效外联链接:13个