# API_ML_AI **Repository Path**: NFUNM068/API_ML_AI ## Basic Information - **Project Name**: API_ML_AI - **Description**: 动物学前班APP高保真原型 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: http://nfunm068.gitee.io/api_ml_ai - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2019-12-02 - **Last Updated**: 2024-05-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 项目名称:动物学前班 # Product Requirement(产品说明文档) | Title | Content | | ------------------------- | ------- | | Target release(发布日期) | 2019/11 | | Epic(史诗名称) | 动物学前班 | | Document status(文档状态) | 进行中 | | Document owner(文件主人) | 潘卓祺 | | Designer(领头的设计师) | 潘卓祺 | | Developer(领头的开发者) | 潘卓祺 | | QA(领头的测试者) | 潘卓祺 | # Catalogue(目录) - [Part1 PRD价值主张设计](#价值主张设计) - [PRD1加值宣言](#加值宣言) - [PRD2核心价值](#核心价值) - [PRD3用户痛点](#用户痛点) - [PRD4人工智能概率性与用户痛点](#人工智能概率性与用户痛点) - [PRD5需求列表与人工智能API加值](#需求列表与人工智能API加值) - [Part2 原型](#原型) - [交互及界面设计](#交互及界面设计) - [信息设计](#信息设计) - [原型文档](#原型文档) - [Part3 API产品使用关键AI或机器学习之API的输出入展示](#API产品使用关键AI或机器学习之API的输出入展示) - [API使用水平](#使用水平) - [API使用比较分析](#使用比较分析) - [API使用后风险报告](#使用后风险报告) - [API加分项](#加分项) ## 价值主张 ![价值主张画布](https://images.gitee.com/uploads/images/2019/1217/165220_f4ca29f8_1532279.png "屏幕快照 2019-12-17 16.51.48.png") ## 产品定位 “动物学前班”帮助3到8岁的幼年儿童为开学做好准备而设计的动物科普类软件,皆在为培养3-8岁幼年儿童的认知能力、逻辑能力和耐心等。 - 对象为3-8岁的幼儿,不需要具备阅读能力,适合婴幼儿到更大的一些孩子。 - 游戏的规则简单,可以让孩子自己玩或和父母一起玩。 - 有许多好听又可以互动的声音和画面。 ## 背景 - 3-8岁的幼年儿童正处于思维发展的关键时候的时候,对外界的一切因素都感到非常的好奇。美国著名心理学家[本杰明·布鲁姆Benjamin Bloom](https://baike.baidu.com/item/%E5%B8%83%E9%B2%81%E5%A7%86/19755801)的研究认为,**若人在17岁所达到的智力水平为100%,那么儿童在4岁时已具备了其中的50%,4~8岁期间获得30%,而8~17岁这一阶段只增加了20%。** 可以看出,孩子的脑发展(智力发展),关键的节点出现在8岁之前。 ![智力](https://images.gitee.com/uploads/images/2019/1204/142736_300a5930_1532279.png "屏幕快照 2019-12-04 14.27.20.png") - 有时候家长因为不了解/不知道/缺乏经验而不能解决幼年儿童的问题(如:这是什么动物),减轻家长教育孩子的负担。 - 通过对一系列的识别类APP调查,几乎所有的识别类APP与科普类APP的目标用户都偏向大龄儿童以上,没有一款是针对幼年儿童设计的APP,同时科普类APP不支持拍照识别的功能。对于幼年儿童来说,年龄较低的儿童,识字能力有限,不具备良好的阅读能力。目前市场上有几个下载量比较大的识别类/科普类的APP: - “动物识别器APP”:只能通过拍照识别动物,不能通过文字搜索动物。点开了解动物详情后,页面跳转到百度百科。 - “全能识别王APP”:百度AI上的图像识别功能几乎都用上了,也是只能通过拍照识别,不支持文字搜索。 - “科普中国APP”:目标用户为各年龄阶层。科普的内容为天文地理,知识过于广泛,幼年儿童在理解上有一定的困难。 ## 目标 - 通过使用百度AI(动物识别、语音合成)的功能,让幼年儿童在外游玩的时候能过通过本产品进行科普学习。 - 在室内的时候,又能通过本产品的游戏对学习的内容进行二次回顾。 **游戏互动:** - 动物影子游戏:使用动物识别API,将识别过的动物汇集到一起,弄成一个动物影子游戏,提高幼年儿童的认知能力。 - 画画游戏:使用动物识别API,将识别过的动物汇集到一起,弄成一个动物绘本游戏,提高幼年儿童的认知能力与书写技能。 # 价值主张设计 ## 加值宣言 本产品皆在通过使用人工智能的部分功能(图像识别)来实现更好的科普效果,培养3-8岁幼年儿童的认知能力、责任感和耐心等。 - (主要)百度AI的动物识别API对本产品加值部分在于:识别近八千种动物,接口返回动物名称,并获取百科信息,适用于拍照识图类APP中。 - (辅助)百度AI的语音合成API对本产品加值部分在于:提供高度拟人、流畅自然的语音合成服务,让应用、设备开口说话,更具个性。 ## 核心价值 - 动物识别:最小可用产品为拍照/上传动物的图片,检测用户上传的动物图片,返回动物名称、置信度信息。 - 语音合成:最小可用产品为能准确朗诵出一个句子。 ## 用户痛点 - 在外活动的时候,家长想教育孩子一些知识时偶尔会遇到无法回答的问题,无法给孩子进行详细的说明。 - 家长想用更加有趣的方式给孩子进行动物科普,而不想用枯燥的传统方式给孩子进行教育。 - 找不到一款适合幼年儿童使用的科普类app。 - 在幼年儿童单独使用的时候,会遇到不认识的字。 ## 人工智能概率性与用户痛点 - 照片清晰度较好的时候 - 照片模糊,同类型不同品种的动物识别成功率较低,对于在移动中的用户来说不太友好。 - 用户拍摄的照片中动物种数多,识别结果的准确度比较低。 - 一只西伯利亚虎原图 ![动物识别](https://images.gitee.com/uploads/images/2019/1203/204953_342b473c_1532279.png "屏幕快照 2019-12-03 20.49.27.png") - 模糊后 ![模糊后](https://images.gitee.com/uploads/images/2019/1203/205627_4bfb5eee_1532279.png "屏幕快照 2019-12-03 20.55.57.png") - 多只相同的动物,识别结果也是没问题。 ![cats](https://images.gitee.com/uploads/images/2019/1205/235044_89579d85_1532279.png "屏幕快照 2019-12-05 23.49.46.png") - 当两个品种不一样的时候,猫的占比非常小,应该与画面的占比有关,而且该猫的品种为橘猫,百度动物识别将它归为亚洲猫。 ![金毛和橘猫](https://images.gitee.com/uploads/images/2019/1205/235625_ae87759a_1532279.png "屏幕快照 2019-12-05 23.56.03.png") ## 需求列表与人工智能API加值 需求列表 | # | User Story(用户案例) | Importance(重要性) | Notes(笔记) | 技术 | | --- | ------------------------------------------------------------------------------ | -------------------- | ------------- | -------- | | 1 | 李女士带小明在外游玩,小明问李女士这是什动物,李女士不清楚,无法回答小明的问题 | 极其重要 | 核心功能 | 动物识别 | | 2 | 小明在使用的时候想听许多好听的声音 | 重要 | 核心功能 | 语音合成 | ## 产品架构图 ![产品架构图](https://images.gitee.com/uploads/images/2019/1210/224305_54ccd35f_1532279.jpeg "api产品架构图.jpg") # PART2 原型 ## 交互及界面设计 - [动物学前班产品原型](https://u9mcwq.axshare.com),若该链接加载过慢,请[点击此处](http://nfunm068.gitee.io/animal_preschool_app) - 百度AI动物识别API:在相机处,识别动物中使用到。 - 百度AI语音合成API:在动物故事中使用到,并且添加了语速以及声音可选项。 ![输入图片说明](https://images.gitee.com/uploads/images/2019/1207/154225_4585dfaa_1532279.jpeg "IMG_6586.jpg") ## 信息设计 ![输入图片说明](https://images.gitee.com/uploads/images/2019/1207/162758_8ba14c53_1532279.jpeg "IMG_6590.jpg") ![输入图片说明](https://images.gitee.com/uploads/images/2019/1207/163123_e5e61dd1_1532279.jpeg "IMG_6594.jpg") ![输入图片说明](https://images.gitee.com/uploads/images/2019/1207/163408_7e828e1a_1532279.jpeg "IMG_6598.jpg") ![输入图片说明](https://images.gitee.com/uploads/images/2019/1207/163602_6b592b8a_1532279.jpeg "IMG_6602.jpg") ![输入图片说明](https://images.gitee.com/uploads/images/2019/1207/163706_7011a6eb_1532279.jpeg "IMG_6606.jpg") ## 原型文档 - [动物学前班原型](https://u9mcwq.axshare.com) - [动物学前班原型下载](https://gitee.com/NFUNM068/animal_preschool_app) # PART3 API产品使用关键AI或机器学习之API的输出入展示 ## 使用水平 输入+输出 - [动物识别代码下载](https://gitee.com/NFUNM068/API_ML_AI/blob/master/code/API_baidu_animals.py) - [语音合成代码下载](https://gitee.com/NFUNM068/API_ML_AI/blob/master/code/API_baidu_speech.py) - [百度AI动物识别API](https://ai.baidu.com/docs#/ImageClassify-Python-SDK/b47b02f1) ![动物识别代码调用](https://images.gitee.com/uploads/images/2019/1204/101251_c4b09712_1532279.png "屏幕快照 2019-12-04 10.08.21.png") - [百度AI语音合成API](https://ai.baidu.com/ai-doc/SPEECH/Gk38y8lzk) - [代码使用水平情况展示](https://gitee.com/NFUNM068/API_ML_AI/blob/master/code/API_baidu_speech.py) ![语音合成代码调用](https://images.gitee.com/uploads/images/2019/1205/232309_70ef1853_1532279.png "屏幕快照 2019-12-05 23.22.13.png") ## 使用比较分析 - 动物识别: | | 百度AI动物识别API | 阿里云【图像识别OCR】动物识别API | 腾讯云图像分析 | | ------ | --------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------- | | 准确度 | ☑️ | | | | 价格 | ![输入图片说明](https://images.gitee.com/uploads/images/2019/1206/094627_e5973bba_1532279.png "屏幕快照 2019-12-06 09.45.56.png") | ![阿里动物识别价格](https://images.gitee.com/uploads/images/2019/1217/170129_83333fed_1532279.png "屏幕快照 2019-12-17 17.01.01.png") | ![输入图片说明](https://images.gitee.com/uploads/images/2019/1206/095003_ff95f696_1532279.png "屏幕快照 2019-12-06 09.49.18.png") | | 成熟度 | ☑️ | | | | 性价比 | ☑️ | | | | 优点 | 能都识别出动物的种类,并且会返回识别结果的相似度 | 识别动物的准确率高达90% | 能准确分析出是什么动物 | | 缺点 | 遇到动物种类多的图片,不能都准确识别出动物的种类 | 只能识别出是什么动物,而不能识别出是什么种类 | 偶尔能够识别出动物的种类 | - 语音合成: | | 百度语音合成 | 讯飞语音合成 | 微软Azure语音合成 | | ------ | ------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 准确度 | ☑️ | ☑️ | ☑️ | | 成熟度 | ☑️ | ☑️ | ☑️ | | 价格 | ![百度语音合成价格](https://images.gitee.com/uploads/images/2019/1217/152657_540b5a6b_1532279.png "屏幕快照 2019-12-17 15.26.44.png") | ![讯飞语音合成价格](https://images.gitee.com/uploads/images/2019/1217/154502_a66a9306_1532279.png "屏幕快照 2019-12-17 15.44.50.png") | ![azure免费](https://images.gitee.com/uploads/images/2019/1217/153920_b3fd68b3_1532279.png "屏幕快照 2019-12-17 15.38.12.png") ![azure付费](https://images.gitee.com/uploads/images/2019/1217/153932_dc635289_1532279.png "屏幕快照 2019-12-17 15.38.33.png") | | 亮点 | 支持中文、英文、中英文混读合成,提供基础音库和精品音库共9种音库供您选择,让您的应用拥有个性化的声音 | 提供中英日韩等18种多语种、川豫粤等多方言、男女声多风格的选择,音量、语速、音调等参数也支持动态调整——定制专属的语音合成。 | 以自然拟人的语调和清晰的发音为你的应用赋予新的声音。借助深度神经网络,“文本转语音”功能可以使计算机的语音富有表现力,并且与自然语音几乎没有区别。 | | 缺点 | 可选择的发音人太少 | | | | 性价比 | ☑️ | | | ## 使用后风险报告 - 动物识别: - 价格:百度>腾讯云>阿里云。百度动物识别API每天会提供500次免费调用额度。阿里云【图像识别OCR】动物识别只有5次的免费调用额度,之后的收费都是在三者中最贵的,性价比也是最低的。 - 准确度:百度动物识别可以识别出动物的品种,腾讯云的图像分析偶尔能识别出动物的种类,阿里云只能识别出是什么动物。 - 本产品主要使用百度AI的动物识别API,目前市面上的动物识别API都不及百度动物识别API准确。不过百度动物识别API在识别多种类型动物的时候,不能仔细分辨出动物的品种。 - 语音合成: - 本产品的辅助API使用百度AI的语音合成功能,语音合成一篇481个字的儿童故事,需要105秒,发音准确,语调语速都可以满足幼年儿童的需求,同时用户可以根据自己的喜好选择发音人的语速语调声音。 ## 加分项 - [百度动物识别API代码片段下载](https://gitee.com/NFUNM068/API_ML_AI/blob/master/code/API_baidu_animals.py) - [百度语音合成API代码片段下载](https://gitee.com/NFUNM068/API_ML_AI/blob/master/code/API_baidu_speech.py) ## 清单 - [百度动物识别API代码片段下载](https://gitee.com/NFUNM068/API_ML_AI/blob/master/code/API_baidu_animals.py) - [百度语音合成API代码片段下载](https://gitee.com/NFUNM068/API_ML_AI/blob/master/code/API_baidu_speech.py) - [动物识别技术文档](https://ai.baidu.com/docs#/ImageClassify-Python-SDK/b47b02f1) - [语音合成技术文档](https://ai.baidu.com/ai-doc/SPEECH/2k38y8iut) - [动物学前班原型](https://u9mcwq.axshare.com) - [动物学前班原型下载](https://gitee.com/NFUNM068/animal_preschool_app)