# API_final **Repository Path**: chouyougongchang233/API_final ## Basic Information - **Project Name**: API_final - **Description**: 中大南方网新专业API课程2018级期末项目 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-02-26 - **Last Updated**: 2025-02-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 文档名称|望色识酒————产品需求文档| ----|----| 产品名称|望色识酒| 产品版本|1.5([diff链接](https://gitee.com/QiuYuAn0303/API_final/compare/31a8382468ac92e3d7169140934861354d5eebb4...f10bb52b0385129b3a1f8d1ab6de6e33e56a3d54))| 文档状态|进行中| 文档主人|181013029 邱瑜安| ## 迭代的增量改进: - 新增IDEO三要素:用户可欲性、技术可行性、商业可行性 - 新增API使用价格 - 新增竞品分析 - 新增了腾讯美食图片识别API的使用报告 - 增加了外联URL - 新增了一段总结 - 修改了发展优势 - 细化了数据流程图 ## 产品名称:望色识酒 ### 产品功能: - 一款利用[百度菜品识别API](https://ai.baidu.com/tech/imagerecognition/dish) ,通过拍照识别鸡尾酒的颜色、添加物以及杯具来判断一杯鸡尾酒的种类。 ### 价值主张: - 一句话版本:让用户扫描鸡尾酒,了解鸡尾酒,爱上鸡尾酒。 - 一分钟版本:鸡尾酒外观多变,种类繁多,许多刚接触鸡尾酒的初学者并不能很好的了解一杯鸡尾酒的具体信息。我们团队针对这个问题,决定使用美食识别API进行拍照识酒。用户只需要将自己面前的鸡尾酒拍照上传至本产品,系统就会根据美食识别API的识别结果为用户调出这杯鸡尾酒的相关信息,让刚接触鸡尾酒的用户也能了解鸡尾酒。 ### 目标: - 让初学者也能够轻松的了解种类繁多的鸡尾酒。 ## 一、需求概述 1. 产品背景:酒吧是现代年轻人中重要的消遣场所之一,无论是闹吧还是[清吧](https://baike.baidu.com/item/%E6%B8%85%E5%90%A7/7780408),酒都是不可或缺的元素。当一个初学者踏入酒吧时,必然会被琳琅满目的鸡尾酒弄晕头脑,最后只能说出一个烂大街的“长岛冰茶”。 2. 产品市场:经过对市场上酒吧相关APP的调查,发现大多数软件只是将酒吧内容作为一个点缀,它们把更多的精力放在了交友系统上,而忽略了酒这一重要元素。随着图像识别(物体)的发展,识别的精度越来越高,对于液体的识别也比以前更为简单。二是鸡尾酒在外形上的高差异度也在无形中为图像识别技术降低了识图难度。 3.市场概述(商业可行性): 3.1:市场特征: 1.目前酒吧是年轻人重要的消费场所,而清吧在整个酒吧市场的比例在不断的上升,市场前景较好。 2.目前市场上的酒吧相关软件大多数都是为一些传统的酒吧设计的,现在市面上并没有一款为清吧设计的,专攻鸡尾酒识别的APP,整个市场并不饱和。 3.2:发展优势 - 目前拍照识别酒类竞争对手很少,在相关市场我们有比较大的竞争力。 - 迎合了喜欢鸡尾酒的年轻人的需求,痛点比较明显。 ## 二.核心价值: - 着眼于为鸡尾酒入门者提供鸡尾酒信息服务,利用菜品识别API为用户提供精确高效的鸡尾酒识别服务。 ### IDEO三要素 - 用户可欲性:鸡尾酒种类繁多,许多刚入门的鸡尾酒爱好者往往难以了解到一杯鸡尾酒的完整信息。 - 商业可行性:鸡尾酒的消费者大多为年轻人,这群人消费力比较高,对鸡尾酒的了解大多数还停留在表面,对于了解鸡尾酒的口味、历史、做法有比较高的需求。 - 技术可行性:百度ai平台提供的美食识别API可以快速的辨别出鸡尾酒的种类,同时百度庞大的数据库能够更加精准的识别大量的鸡尾酒。 ### 用户痛点: - 鸡尾酒的种类繁多,新接触者很难分辨出鸡尾酒的种类。 - 鸡尾酒外观很具有欺骗性,酒精度往往和外表不相称。 - 市面上缺少一个系统了解鸡尾酒的平台。 ## 三.用户研究 #### 1. 目标用户群: - 核心用户:18~25岁的较为年轻的,对鸡尾酒比较感兴趣的城市年轻人。 - 主要用户:18~40岁的对鸡尾酒感兴趣,有一定消费能力的城市居民。 #### 2. 用户画像 1. 用户一:林立,男,20岁,大学生,刚接触鸡尾酒。 - 使用场景:林立在不久前刚接触到鸡尾酒,对鸡尾酒种类还不是特别的熟悉。在一次去酒吧消遣时,他以自己的口味要求点了一杯鸡尾酒,在尝过它的味道后,他迫切的想知道这杯酒的相关信息,于是他打开了望色识酒APP,通过里面的拍照识别功能轻松的找到了这杯酒的全部信息——不仅仅是它的名字,还有来历和做法。 2. 用户二:颜同,男,25岁,上班族,有一些关于鸡尾酒的知识,但不够深入。 - 使用场景:下班后小酌一杯或许是颜同这个年轻社畜最大的消遣了,但最近的金钱压力让他不得不减少在酒上的消费,这时候他萌生了一个念头:或许我可以在家自己调酒。在某个下班夜,他照常来到酒吧,点了一杯自己最喜欢的鸡尾酒。这时候他掏出手机,打开望色识酒APP,用里面的拍照识别功能找到了这杯酒的做法并将其收藏,而且他还通过酒类鉴赏功能找到了与这杯酒味型相似的鸡尾酒。下次他就可以在家做自己喜欢的鸡尾酒了。 ### 需求列表与人工智能API加值 标题| 使用的API | 需求列表 |重要程度 ---|---|---|--- 1 |[菜品识别API](https://aim.baidu.com/product/f7ee8543-ea10-457c-9183-1b9f2eddfcc3)|用户想要通过拍照识别获知鸡尾酒信息|重要 2 |[路径规划API](https://lbs.amap.com/getting-started/path/)|用户想要知道怎么去我们推荐的酒吧|次要 ## 四.人工智能API加持与解决用户痛点 |图像识别中的菜品识别技术优势|解决用户痛点| |---|--- |1. 丰富度:识别超过9千种菜品,接口返回菜品的名称、置信度、百科信息等综合信息| 能够识别的鸡尾酒种类非常的多| |2. 准确性高:基于百度丰富的海量数据,利用深度学习技术及精准的算法迭代模型,不断提高准确性。| 让用户能够准确了解他们上传鸡尾酒 ## 五.人工智能概率性: - 在面对多种鸡尾酒时,菜品识别API就有点不太给力————它往往会将多种鸡尾酒作为一个整体来识别,最后得出否定的答案。不过这并不影响我们的用户体验,大多数用户只会拍摄他们面前的那一杯酒。 - 在识别特定角度的图片时,菜品识别API有时候识别出错误的内容甚至直接给出都定的答案。 ## 六.产品结构图 - 产品功能结构图 ![产品功能结构图](./image/功能结构图.png) - 数据流程图 ![用户流程图](./image/用户流程图.png) - 产品结构图 ![产品结构图](./image/产品结构流程图.png) ## 七、数据推理 /| 问 | 答| ---|---|--- 1 | 页面的主要功能有哪些? |酒吧推荐,拍照识别,酒类评鉴 2 | 向用户输出的结果内容从哪里来 |去开放平台调用api,获得结果内容 3 | 如果返回的数据出现错误,该如何解决?|为用户提供反馈渠道,并将正确的数据作为机器学习数据使用 ## 八、产品原型及交互设计 - [产品原型交互界面](https://modao.cc/app/kt9nfDK3SmVM0OKbegtz2qYo0vAHhul?simulator_type=device&sticky#screen=skco8kugxsg556u) 1. 登录页与启动页 ![登录页](./image/登录页.png) ![启动页](./image/启动页.png) 2.核心功能界面 - 拍照识别功能 ![拍照识别流程图](./image/拍照识酒流程.png) - 用户可以选择通过直接拍照或者是选择自己相册中已有的照片,为APP提供扫描的数据,在调用过API分析后,产品会返回给用户鸡尾酒的名字、简介以及做法。 3.主要界面——酒吧推荐 - 点击酒吧推荐按钮,即可进入酒吧推荐页面。 ![酒吧推荐](./image/酒吧推荐.png) - 点击页面图片以及阅读更多即可进入到酒吧的详情页。 ![酒吧推荐-详细](./image/酒吧推荐-详细.png) - 点击右上角的定位按钮即可得知该酒吧所处的位置。 ![酒吧推荐-定位](./image/酒吧推荐-定位.png) 4.主要界面——酒类评鉴 ![酒类评鉴](./image/酒类评鉴.png) - 点击鸡尾酒图片以及阅读更多按钮即可进入鸡尾酒信息详情页。 ![酒类评鉴](./image/酒类评鉴-详细.png) ## 九、API的运用 - [百度AI开放平台——菜品识别(本产品使用的api平台)](https://ai.baidu.com/tech/imagerecognition/dish) - 接口使用文档:[菜品识别API文档](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/tk3bcxbb0) - 接口描述:该请求用于菜品识别。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的菜品名称、卡路里信息、置信度。 - 接口地址 :https://aip.baidubce.com/rest/2.0/image-classify/v2/dish - 请求方法:POST - 请求示例: ![获取access-token](./image/获取access-token.png) - 请求结果示例: ![识别结果](./image/识别结果.png) - 菜品识别示例: ![菜品识别结果](./image/菜品识别结果.png) - [腾讯AI开放平台——美食图片识别](https://ai.qq.com/product/visionimgidy.shtml#food) - 接口使用文档:[美食图片识别API文档](https://ai.qq.com/doc/imagefood.shtml) - 接口描述:该请求用于识别美食图片。即对于输入的一张图片(可正常解码,且长宽比适宜),输出该图片是否属于美食。 - 接口地址 :https://api.ai.qq.com/fcgi-bin/image/image_food - 请求方法:POST - 美食图片识别示例: ![美食图片识别示例](./image/腾讯美食图片识别.png) ### 总结 通过对百度菜品识别API的实践,对其功能有了一定的了解。菜品识别API在识别单一鸡尾酒时,返回的结果精确度较高,但当遇到多个菜品的图片时,返回的结果往往是识别为“非菜”。但感觉无法识别多个菜品的缺陷并不影响我们产品核心功能的实施。而腾讯美食图片识别API只能够识别一张图片是否属于美食,这很明显是不符合我们产品的要求的。所以相比于腾讯美食图片识别API,我们更愿意使用百度美食识别API. ### 十、竞品分析 - 由于使用者默认为国人,目前智能设备APP应用市场分为Apple store 与 安卓。安卓则以“[豌豆荚](https://www.wandoujia.com/)”应用下载为主体。 - 在豌豆荚上以“酒”、“酒吧”为关键词搜索,我们可以搜索到176款相关APP,在进行了筛选后我们一共得到95款竞品软件。这些竞品软件主要分为两类,第一类主要以为用户推荐酒吧,通过软件提前预约酒吧相关套餐,以及为用户提供一些拼酒小游戏为主。第二类主要是为用户提供一个安全购买酒类的平台,本质上与电商平台没什么差别。在这些产品中,有鸡尾酒相关的内容极少,至于拍照识酒功能市面上基本没有,所以我们的软件具有较大的市场空间。 ### 十一、API使用风险评估 - 仅能识别单一的鸡尾酒(百度菜品识别API):需要建立更加完善的鸡尾酒数据库,不断强化机器学习,使得其能够在识别多种鸡尾酒也能精准分析。 - 在遇到颜色比较大众的鸡尾酒时,菜品分析API往往会混淆与之相像的饮品;需要从更多的角度来实现鸡尾酒的识别,比如加入的配料、杯子外形等。 ### 十一. API使用价格 [百度菜品识别API](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/gk3bcx9n1) - 每日500次免费调用额度,免费额度用尽后按照如下价格进行计费。 #### 次数包 |规格(次)|价格(元)|QPS限制|有效期| |--|--|--|--| |1万|7|10|一年| |5万|34|10|一年| |10万|66|10|一年| |50万|320|10|一年| |100万|620|10|一年| |500万|3000|10|一年| ### 按调用量后付费 |月调用量(万次)|菜品识别(元/千次)| |--|--| |0<月调用量<=5|0.70| |5<月调用量<=10|0.60| |10<月调用量<=20|0.50| |20<月调用量<=50|0.40| |50<月调用量<=100|0.35| |100<月调用量|0.30| ### 总结 感谢百度API开放平台的菜品信息识别api,他们提供了整个api的数据开放能力,为我的项目提供了核心交互功能的代码部分。感谢所有的相关软件开发人,他们的产品为我修改我的产品提供了帮助。感谢[简书](https://www.jianshu.com/)上的各位大佬,他们关于产品文档的写作经验给了我很大的帮助。 在完成这份PDR中我学到的最重要的事就是先选定API,再来发挥创意。在你发挥头脑风暴时,你也许会想到许多很好的创意,但当你想要实践时,却发现没有API来支持你的创意,而且以你自己的技术也无法实现,所以我们要先选API,再发挥创意。 此外,判断自己的项目是否含有智能加值是一个非常重要的能力,有一些看起来很妙的创意在实践的时候并没有使用到智能相关的API。还有商业延续性,用户需求性、技术可行性的三大IDEO元素也是值得商榷的,如果一个产品在设计出来就注定要失败,那么它的存在将是毫无意义的。