# API_期末项目APP_边吃边瘦 创意轻食

**Repository Path**: runbinII/API_

## Basic Information

- **Project Name**: API_期末项目APP_边吃边瘦 创意轻食
- **Description**: API_期末项目APP_边吃边瘦 创意轻食
- **Primary Language**: Python
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 1
- **Created**: 2024-08-26
- **Last Updated**: 2024-08-26

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 项目名称：边吃边瘦 创意轻食 ———轻食减肥APP
# 产品简介 
| 文档名称 | 边吃变瘦 创意轻食-产品需求文档 |
| --- | --- | 
| 产品名称 | 边吃变瘦 创意轻食/Recorder |
| 产品描述 | 一款可以进行图像识别，语音识别果蔬，展示其营养价值以及相关烹饪轻食方法，根据用户的身体指标来推荐的相应轻食食谱以及用户时刻分享与记录轻食之旅的APP |
| 文件作者 | 胡瑞涵 |
## 一、MVP价值主张

### (一)加值宣言
- 随着经济发展，饮食丰富，生活习惯的改变，腹型肥胖的患病率逐年递增。虽然我国肥胖人口占比约6.8%，但因人口基数大，中国的肥胖人口总数已居世界第一。肥胖会导致很多疾病的发生，所以合理饮食，合理膳食，既保持了健康，也充分汲取了食材的营养。
- 在用户注册APP之后，会填写一份关于自身素质（身高、体重、血脂等）的报告，APP会根据用户的身体指标来为用户提供以及推荐每日轻食餐，如何合理膳食。
- 根据现存的食材，通过图像API搜索，语音API搜索，创意轻食APP就可以把该食材的营养价值以及相关它制作轻食的方法。既满足了用户对于现有食材的了解，也给用户提供了烹饪方法，无需再用其他网站进行相关烹饪方法，给用户带来了极大的便捷体验。

### (二)核心价值（最小可行性产品）
- 利用图像API识别，以及语音API搜索的功能，可以直接展示给顾客现有食材的营养价值以及该食材相关制作轻食的方法。将食物的营养最大化，保留营养，满足膳食需求，还可以变吃变瘦。
- 为健康饮食的用户提供了创意平台，可以随时随地分享自己做的轻食餐，可互动，也可作为轻食售卖，交易的平台。
### (三)API价值宣言
- 图像识别API，用户可以针对现有的食材，或者在购买食材时，对食材进行拍摄，为用户提供其营养价值，以及相关轻食制作方法，为用户大大地省去了在各个平台搜索的时间。
- 语音识别API，在用户不方便拿起电子设备进行搜索时，可以点击语音搜索按钮进行语音识别获取想去了解的食材。

### (四)人工智能概率性

- 人类社会随着技术的不断革新会发生很大的变革，人工智能时代其的到来将会引起社会的变化，人工智能为社会创造了极大的价值。
- 边吃变瘦，创意轻食。 APP利用智能图片识别，语音识别等功能，为健康饮食，轻食人群提供了方便快捷的平台，满足人群的搜索需求也提供了分享的机会，具有着较大的吸引力。

### (五)问题及解决方案说明
问题|解决方案|
  ----  | ----  
对于想了解减肥，但是不知道如何合理安排轻食食谱的用户|登录用户，根据您的身高、体重、体脂等一些指标为您安排推荐合适的轻食搭配
用户面在对一些不熟悉的食材，想去了解以及烹饪|进行图像API搜索，为用户展现食材的介绍，以及相关轻食烹饪方法
在用户不方便拿起手机进行图像搜索时|语音API搜索食材，同样满足顾客所需，提高搜索效率
### (六)价值主张画布展示
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%88%9B%E6%84%8F%E8%BD%BB%E9%A3%9F%E5%95%86%E4%B8%9A%E7%94%BB%E5%B8%83.png)
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E4%BB%B7%E5%80%BC%E4%B8%BB%E5%BC%A0%E7%94%BB%E5%B8%83.png)
## 二、问题需求
### (一)需求列表与人工智能API加值
| 序号 | API技术 | 用户场景 | 优先级|
| --- | --- | --- | --- |
| 1 | 实时语音识别API | 通过设备麦克风录音进行实时语音识别，展示搜索内容的相关信息 | A（重要） |
| 2 | 通用文字识别API | 通过拍照快速识别出食材的种类，营养价值，以及相关轻食的搭配 | B（重要） |
### (二)用户画像&使用情景
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E7%94%A8%E6%88%B7%E7%94%BB%E5%83%8F1.png) 
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E7%94%A8%E6%88%B7%E7%94%BB%E5%83%8F2.png) 
### (三) 需求论证之利害相关者分析
### 3.1 利害相关者  
用户在使用创意轻食之后可以定制个人化轻食菜单，对于果蔬的了解也有所提升，同时通过对收藏内容的分享，也能扩大产品的知名度，间接上增加了APP的曝光率。

### 3.2 关键API人工智能类型
**使用的API**  
果蔬识别API ，语音识别API

**API类型**  
以上API所使用的人工智能都是[弱人工智能](https://baike.baidu.com/item/%E5%BC%B1%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/10403703?fr=aladdin)的类型。
- 目前几乎所有的人工智能系统都是弱人工智能。弱人工智能并不真正拥有智能，也不会有自主意识，只是面向单一任务，没有认知能力的人工智能。
- 这些机器只能完成其编程所赋予的任务，因此只具备非常窄的能力范围。

**对解决方案的可能关键影响**  
以上API可能在一定程度上对果蔬的识别存在偏差，对一些不确定的果蔬分析不够准确，输出一些可能与事实不符的名词，对用户造成一定的迷惑。

### 3.3 系统性偏差
**对解决方案的可能关键影响**  
因人工智能API的识别正确率并非百分之百，存在一定的识别错误或识别失败可能性。且上传的图片在类型和大小上有规定，因此识别不了的图片需要用户对图片进行处理（例如：压缩）或者是更换图片重新上传识别。

### 3.4 [ESG问题](https://www.zhihu.com/question/21565680)的考量
**ESG问题**
ESG简称“责任投资”，包括环境（Environment）、社会（Society）、公司治理（Governance）三个方面。
- 用户隐私安全。用户在注册时候使用的手机号或者个人信息等若被泄露将影响用户的个人隐私安全。  

**ESG机会**  
- 建立信息保护机制，向用户承诺用户信息的绝对保密性，不随便泄露用户的信息。

---
## 三、解决方案：界面流程及关键智能交互
### (一)用户旅程图(图示)
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E7%94%A8%E6%88%B7%E6%97%85%E7%A8%8B%E5%9B%BE.png)
### (二)关键智能API思路方法
#### 1. 用户可欲性
- 功能基本满足目标用户需求，用户可欲性强
- 除解决图片识别和实时语音识别功能外还融合提供云存储、本地存储功能，后续还将提供思维导图功能。

#### 2. 商业可行性
- 智能识别市场广阔，越来越多人注重对于饮食的健康，发展前景广阔。

#### 3. 技术可行性
- 有相关的AI开放平台提供API服务，可直接调用，且技术成熟稳定（但部分API可能需要付费）
- 该产品API存在一定的技术风险，如用户数据泄露，仍需做好后台数据库安全工作，不断提高安全等级
- 对比多家API平台，选择了较为精确稳定的API对产品进行智能加值
 

### (三)加值输入/输出细节描述
- 用户需进行简单的注册，注册完毕后显示登陆界面。从登陆界面进入到最新页面，该页面是填写个人身体指标的问卷，点击确定即可等待生成一份符合该用户的定制化轻食菜谱，在后面的更新中，即会根据用户搜索内容的大数据分析来进一步更新用户的菜谱。如果用户无需此项需求，则可按右下角跳过键，直接进入首界面。如果需要搜索果蔬的相关信息，则可按首页的拍一拍键，进行图像分析，也可按说一说来进行语音搜索。下面则是用户们即时分享的轻食搭配照片。
### (四)界面流程图突出智能交互
#### 1. 交互及界面设计
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%8A%A0%E8%BD%BD%E9%A1%B5.PNG) 
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E7%99%BB%E5%BD%95%E6%B3%A8%E5%86%8C%E9%A1%B5.PNG) 
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E4%BF%A1%E6%81%AF%E5%A1%AB%E5%86%99%E9%A1%B5.PNG) 
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E4%B8%BB%E9%A1%B51.PNG) 
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E4%BA%A7%E5%93%81%E5%B1%95%E7%A4%BA%E9%A1%B5.PNG) 
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E4%B8%BB%E9%A1%B52%E3%80%81%E4%B8%BB%E9%A1%B53%E3%80%81%E4%B8%BB%E9%A1%B54.PNG) 
#### 2. 即刻记录交互演示链接
#### [点我，我是链接](https://modao.cc/app/5d2sR9Vgrdqe88oTKx3bZB)

*** 

## 四、解决方案：数据流程及关键智能API使用
### (一)数据分析流程图&用户界面流程化
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E4%BA%A7%E5%93%81%E5%8A%9F%E8%83%BD%E7%BB%93%E6%9E%84%E5%9B%BE.png)
### (二) 数据流程设计  
#### 1. 用户可欲性
创意轻食的用户定位在10-60岁对于轻食有需求的用户，有学生，家长，厨师等各行各业的人群，他们满足对于减肥，或者单纯对于轻食上的需求。

#### 2. 技术可行性   
通过调用API，创意轻食可以为用户提供图像识别和语音识别服务。

#### 3. 商业可行性
创意轻食录融资需求不高，只需打造线上平台即可，与百度AI平台达成合作关系，为调用的API付费，成本较低，商业可行性高。

### (三) 代码及数据展示加值

### 小程序实现功能以及相关代码展示(图示)
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%B0%8F%E7%A8%8B%E5%BA%8F%E5%AE%9E%E7%8E%B0%E7%95%8C%E9%9D%A2%E4%BB%A5%E5%8F%8A%E7%9B%B8%E5%85%B3%E4%BB%A3%E7%A0%811.png)
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%B0%8F%E7%A8%8B%E5%BA%8F%E5%AE%9E%E7%8E%B0%E7%95%8C%E9%9D%A2%E4%BB%A5%E5%8F%8A%E7%9B%B8%E5%85%B3%E4%BB%A3%E7%A0%812.png)
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%B0%8F%E7%A8%8B%E5%BA%8F%E5%AE%9E%E7%8E%B0%E7%95%8C%E9%9D%A2%E4%BB%A5%E5%8F%8A%E7%9B%B8%E5%85%B3%E4%BB%A3%E7%A0%813.png)
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%B0%8F%E7%A8%8B%E5%BA%8F%E5%AE%9E%E7%8E%B0%E7%95%8C%E9%9D%A2%E4%BB%A5%E5%8F%8A%E7%9B%B8%E5%85%B3%E4%BB%A3%E7%A0%814.png)
## 3.1百度智能云 - [果蔬识别API](https://cloud.baidu.com/product/imagerecognition/ingredient) 
### 接口描述
该请求用于识别一张图片，即对于输入的一张图片（可正常解码，且长宽比较合适），输出果蔬识别结果。  

#### 请求说明
HTTP方法：```POST```  
请求URL：```https://aip.baidubce.com/rest/2.0/image-classify/v1/classify/ingredient```
- 运行代码示例 
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E8%AF%86%E5%9B%BE%E5%8A%9F%E8%83%BD%E4%BB%A3%E7%A0%81.png)

####  功能对比

**腾讯云图像分析**  
腾讯云图像分析基于深度学习等人工智能技术和海量训练数据，提供综合性的图像智能服务，包含图像理解（解析图像中的场景、物品、人物、动物等）、图像处理（对图像进行裁剪、美化）、图像质量评估（分析图像视觉质量）等。

**百度智能云果蔬API**  
可识别近上百种水果，接口返回果蔬名称和置信度信息，支持获取识别结果的百科信息，接口返回百科词条URL、图片和描述，可自定义返回词条数。  

####  百度AI价目表
![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E6%9E%9C%E8%94%AC%E8%AF%86%E5%88%AB%E4%BB%B7%E7%9B%AE%E8%A1%A8.png)

## 3.2百度智能云 - [语音识别API](https://ai.baidu.com/tech/speech/realtime_asr) 
### 接口描述
该请求用于基于Deep Peak2的端到端建模，将音频流实时识别为文字，并返回每句话的开始和结束时间，通过文字识别出用户搜索的物品。

#### 请求说明
HTTP方法：```POST```  
- 运行流程
   - 连接
   - 连接成功后发送数据 
      - 2.1 发送开始参数帧 
	  - 2.2 实时发送音频数据帧 
	  - 2.3 库接收识别结果 
	  - 2.4 发送结束帧
      - 关闭连接
	  
- 输入代码/输出代码示例   
   - 运行文档说明   
      ![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%AE%9E%E6%97%B6%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB%E8%B0%83%E7%94%A81.png)
   - 输出
      ![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E5%AE%9E%E6%97%B6%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB%E8%B0%83%E7%94%A82.png)  
####  功能对比

**科大讯飞real_asr**  
通过体验科大讯飞的实时语音转写发现，讯飞语音读取过程的清晰度做的较好，准确度高，支持个性化热词、上下文纠错、标点智能预测的功能，但与百度相比，科大讯飞只能识别中文普通话这一语种，而百度增加了英语语种，且适用场景更加广泛。
**百度real_asr**  
通过体验百度AI开放平台的实时语音识别发现，该语音识别的准确率较高，较能满足用户的个性化需求，但是对周围环境较高（如要求环境需较安静且不能有背景音乐）。
####  百度AI价目表
 ![](https://gitee.com/hu-rui-hanhan/API_/raw/master/images/%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB%E4%BB%B7%E7%9B%AE%E8%A1%A8.png)

### (四)人工智能概率性考量
#### 1. 人工智能概率：
#### 百度AI开放平台的实时语音识别API技术和通用图像识别API技术，有以下优势：   
| 实时语音识别技术优势 | 用户痛点 | 结果 |
| --- | --- | --- |
| 1. 识别速度快：毫秒级实时识别音频流 |  用户使用此类软件时中响应等待久，体验感差 | 识别速度快，用户使用软件体验良好 |
| 2. 语种丰富：支持普通话和略带口音的中文识别；支持英文识别 | 部分用户普通话略带口音、英文无法识别 | 语言丰富可供选择，支持简单多种语言混合识别 |
| 3. 准确率高：中文普通话识别准确率达98% | 中文普通话被识别准确率低 |  识别转换准确率高，用户对识别文字内容修改次数少，用户好感度上升|
| 4. 人性化设计：对识别中间结果进行智能纠错，并根据语音的内容理解和停顿智能匹配合适的标点符号。| 用户录制音频时中间内容被识别错误，得不到纠正，标点符号无法识别 | 贴心人性化设计，增加用户好感度，“以人为本”，为人而设计|

| 通用图像识别技术优势 | 用户痛点 | 结果 |
| --- | --- | --- |
| 识别近千种水果和蔬菜的名称，适用于识别只含有一种果蔬的图片，可自定义返回识别结果数，适用于果蔬介绍相关的美食类APP中|对于进行搜索的果蔬搜索存在偏差，识别准确率低|识别速度快，准确率高，用户体验感良好
#### 2.补充说明

| 分类 | 注意因素 |
| --- | --- |
|实时语音识别技术|环境其他声音音量、离麦克风的举例、用语特殊性（专业领域）、发声人数、语速|
|    图像识别技术|图片格式、图片长宽最低限制、图片高宽最大限制、图片清晰度、图片大小|
##### PS:尽管上述的API识别准确度高，但语音和文字的识别也存在着一定的误差。对此的解决办法是，加以用户的少量“人力”例如反馈减少今后识别的误差，将人工智能的失误率降低。
***
## 五、学习/实践心得总结及感谢

- 通过本学期对API、人工智能与机器学习这门课的学习了解，我学习到，调用API之前应该仔细阅读它的官方文档中的接口描述、调用方法等。还学习到，设计一个产品，价值主张设计是非常重要的一部分，它包括价值宣言、用户需求、用户痛点等。一个好的价值主张设计要让读者看明白提供的产品和服务是什么，用户的需求是什么，要具有说服力。
- 通过学习与完成API、机器学习与人工智能的课程与期末项目后，我感触颇多。21世纪科技迅猛发展的当下，人工智能、机器学习这些词越来越多的被人们提及，同时也走进千家万户，人工智能让我们的生活越来越美好，共享单车、汽车等的普及方便了我们的出行，让出行的成本大大降低；智能辅助驾驶系统帮助人们安全驾驶，减少驾驶事故，安全出行；智能互联家居能够帮助人们对生活环境进行智能调控，对房屋进行安全监测、危险预警等，减少了煤气泄露、房屋被盗的风险；人脸、指纹、虹膜等生物特征的识别和大数据的结合，再进行实时监测，人工智能的应用能够加强公安系统的管理和安全预测；由大数据和人工智能构建起来的智慧城市工程，对城市公共安全领域进行从局部到整体的改造，让我们的生活更加安全舒适。通过学习和使用API，这些我们可以去探索、去实现。

-  从这次实践中还学到了，人工智能的API的使用必须融合人工智能概率性考量，同时也要考虑IDEO三要素（用户可欲性、技术可行性、商业可行性）。
在学习和完成本次产品的需要文档的时候，我利用互联网查阅了很多的资料，也借助了很多互联网资料，在此衷心感谢：腾讯云、百度智能云、Azure等API平台，提供了众多的免费API资源供我在学习的过程中调用；ProcessOn，提供了优秀的流程图制作工具，让我完成了众多流程图的制作；人人都是产品经理网站，里面很多文章都给了我很大的帮助，让我更好的知道了产品需求文档编写的注意事项 通过学习与完成《API、机器学习与人工智能》的课程与期末项目，我获益良多。机器学习与人工智能的能力发展与日俱增，许许多多的帮助人们更好生活与发展的技术被创造出来。通过使用智能API，我们就可以获取到这些技术和能力。
***
- 感谢：[腾讯云](https://cloud.tencent.com)、[百度智能云](https://cloud.baidu.com)、[Azure](https://azure.microsoft.com/zh-cn/)、[有道智云](http://ai.youdao.com/)等API平台，提供的API产品与免费的API调用额度，让我有机会完成该产品与学习智能API的相关知识
- 感谢许智超老师对我学习这门课程的帮助

- 感谢[百度AI开放平台](https://ai.baidu.com/)提供的API接口
- 感谢[Process on](https://www.processon.com/diagrams)提供的优秀绘图软件
- 感谢[人人都是产品经理](http://www.woshipm.com/)关于产品设计的经验分享
- 感谢[墨刀](https://modao.cc/brand/promote/main?utm_source=baidu&utm_term=modao&f=baidu2&renqun_youhua=2326761&bd_vid=9550823763310875098)提供的关于产品原型设计与制作的技术支持

***