同步操作将从 胡瑞涵/API_期末项目APP_边吃边瘦 创意轻食 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
文档名称 | 边吃变瘦 创意轻食-产品需求文档 |
---|---|
产品名称 | 边吃变瘦 创意轻食/Recorder |
产品描述 | 一款可以进行图像识别,语音识别果蔬,展示其营养价值以及相关烹饪轻食方法,根据用户的身体指标来推荐的相应轻食食谱以及用户时刻分享与记录轻食之旅的APP |
文件作者 | 胡瑞涵 |
问题 | 解决方案 |
---|---|
对于想了解减肥,但是不知道如何合理安排轻食食谱的用户 | 登录用户,根据您的身高、体重、体脂等一些指标为您安排推荐合适的轻食搭配 |
用户面在对一些不熟悉的食材,想去了解以及烹饪 | 进行图像API搜索,为用户展现食材的介绍,以及相关轻食烹饪方法 |
在用户不方便拿起手机进行图像搜索时 | 语音API搜索食材,同样满足顾客所需,提高搜索效率 |
序号 | API技术 | 用户场景 | 优先级 |
---|---|---|---|
1 | 实时语音识别API | 通过设备麦克风录音进行实时语音识别,展示搜索内容的相关信息 | A(重要) |
2 | 通用文字识别API | 通过拍照快速识别出食材的种类,营养价值,以及相关轻食的搭配 | B(重要) |
用户在使用创意轻食之后可以定制个人化轻食菜单,对于果蔬的了解也有所提升,同时通过对收藏内容的分享,也能扩大产品的知名度,间接上增加了APP的曝光率。
使用的API
果蔬识别API ,语音识别API
API类型
以上API所使用的人工智能都是弱人工智能的类型。
对解决方案的可能关键影响
以上API可能在一定程度上对果蔬的识别存在偏差,对一些不确定的果蔬分析不够准确,输出一些可能与事实不符的名词,对用户造成一定的迷惑。
对解决方案的可能关键影响
因人工智能API的识别正确率并非百分之百,存在一定的识别错误或识别失败可能性。且上传的图片在类型和大小上有规定,因此识别不了的图片需要用户对图片进行处理(例如:压缩)或者是更换图片重新上传识别。
ESG问题 ESG简称“责任投资”,包括环境(Environment)、社会(Society)、公司治理(Governance)三个方面。
ESG机会
创意轻食的用户定位在10-60岁对于轻食有需求的用户,有学生,家长,厨师等各行各业的人群,他们满足对于减肥,或者单纯对于轻食上的需求。
通过调用API,创意轻食可以为用户提供图像识别和语音识别服务。
创意轻食录融资需求不高,只需打造线上平台即可,与百度AI平台达成合作关系,为调用的API付费,成本较低,商业可行性高。
该请求用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出果蔬识别结果。
HTTP方法:POST
请求URL:https://aip.baidubce.com/rest/2.0/image-classify/v1/classify/ingredient
腾讯云图像分析
腾讯云图像分析基于深度学习等人工智能技术和海量训练数据,提供综合性的图像智能服务,包含图像理解(解析图像中的场景、物品、人物、动物等)、图像处理(对图像进行裁剪、美化)、图像质量评估(分析图像视觉质量)等。
百度智能云果蔬API
可识别近上百种水果,接口返回果蔬名称和置信度信息,支持获取识别结果的百科信息,接口返回百科词条URL、图片和描述,可自定义返回词条数。
该请求用于基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,通过文字识别出用户搜索的物品。
HTTP方法:POST
运行流程
输入代码/输出代码示例
科大讯飞real_asr
通过体验科大讯飞的实时语音转写发现,讯飞语音读取过程的清晰度做的较好,准确度高,支持个性化热词、上下文纠错、标点智能预测的功能,但与百度相比,科大讯飞只能识别中文普通话这一语种,而百度增加了英语语种,且适用场景更加广泛。
百度real_asr
通过体验百度AI开放平台的实时语音识别发现,该语音识别的准确率较高,较能满足用户的个性化需求,但是对周围环境较高(如要求环境需较安静且不能有背景音乐)。
实时语音识别技术优势 | 用户痛点 | 结果 |
---|---|---|
1. 识别速度快:毫秒级实时识别音频流 | 用户使用此类软件时中响应等待久,体验感差 | 识别速度快,用户使用软件体验良好 |
2. 语种丰富:支持普通话和略带口音的中文识别;支持英文识别 | 部分用户普通话略带口音、英文无法识别 | 语言丰富可供选择,支持简单多种语言混合识别 |
3. 准确率高:中文普通话识别准确率达98% | 中文普通话被识别准确率低 | 识别转换准确率高,用户对识别文字内容修改次数少,用户好感度上升 |
4. 人性化设计:对识别中间结果进行智能纠错,并根据语音的内容理解和停顿智能匹配合适的标点符号。 | 用户录制音频时中间内容被识别错误,得不到纠正,标点符号无法识别 | 贴心人性化设计,增加用户好感度,“以人为本”,为人而设计 |
通用图像识别技术优势 | 用户痛点 | 结果 |
---|---|---|
识别近千种水果和蔬菜的名称,适用于识别只含有一种果蔬的图片,可自定义返回识别结果数,适用于果蔬介绍相关的美食类APP中 | 对于进行搜索的果蔬搜索存在偏差,识别准确率低 | 识别速度快,准确率高,用户体验感良好 |
分类 | 注意因素 |
---|---|
实时语音识别技术 | 环境其他声音音量、离麦克风的举例、用语特殊性(专业领域)、发声人数、语速 |
图像识别技术 | 图片格式、图片长宽最低限制、图片高宽最大限制、图片清晰度、图片大小 |
通过本学期对API、人工智能与机器学习这门课的学习了解,我学习到,调用API之前应该仔细阅读它的官方文档中的接口描述、调用方法等。还学习到,设计一个产品,价值主张设计是非常重要的一部分,它包括价值宣言、用户需求、用户痛点等。一个好的价值主张设计要让读者看明白提供的产品和服务是什么,用户的需求是什么,要具有说服力。
通过学习与完成API、机器学习与人工智能的课程与期末项目后,我感触颇多。21世纪科技迅猛发展的当下,人工智能、机器学习这些词越来越多的被人们提及,同时也走进千家万户,人工智能让我们的生活越来越美好,共享单车、汽车等的普及方便了我们的出行,让出行的成本大大降低;智能辅助驾驶系统帮助人们安全驾驶,减少驾驶事故,安全出行;智能互联家居能够帮助人们对生活环境进行智能调控,对房屋进行安全监测、危险预警等,减少了煤气泄露、房屋被盗的风险;人脸、指纹、虹膜等生物特征的识别和大数据的结合,再进行实时监测,人工智能的应用能够加强公安系统的管理和安全预测;由大数据和人工智能构建起来的智慧城市工程,对城市公共安全领域进行从局部到整体的改造,让我们的生活更加安全舒适。通过学习和使用API,这些我们可以去探索、去实现。
从这次实践中还学到了,人工智能的API的使用必须融合人工智能概率性考量,同时也要考虑IDEO三要素(用户可欲性、技术可行性、商业可行性)。 在学习和完成本次产品的需要文档的时候,我利用互联网查阅了很多的资料,也借助了很多互联网资料,在此衷心感谢:腾讯云、百度智能云、Azure等API平台,提供了众多的免费API资源供我在学习的过程中调用;ProcessOn,提供了优秀的流程图制作工具,让我完成了众多流程图的制作;人人都是产品经理网站,里面很多文章都给了我很大的帮助,让我更好的知道了产品需求文档编写的注意事项 通过学习与完成《API、机器学习与人工智能》的课程与期末项目,我获益良多。机器学习与人工智能的能力发展与日俱增,许许多多的帮助人们更好生活与发展的技术被创造出来。通过使用智能API,我们就可以获取到这些技术和能力。
感谢:腾讯云、百度智能云、Azure、有道智云等API平台,提供的API产品与免费的API调用额度,让我有机会完成该产品与学习智能API的相关知识
感谢许智超老师对我学习这门课程的帮助
感谢百度AI开放平台提供的API接口
感谢Process on提供的优秀绘图软件
感谢人人都是产品经理关于产品设计的经验分享
感谢墨刀提供的关于产品原型设计与制作的技术支持
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。