# API-finalproject **Repository Path**: shuimushisan/api-finalproject ## Basic Information - **Project Name**: API-finalproject - **Description**: API课程期末项目，安睡小镇软件设计 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2021-01-22 - **Last Updated**: 2024-07-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # API项目——安睡小镇 ### - API+墨刀实现的APP设计 - #### PRD需求文档展示 --- > **写在前面：api调用代码如果需要调用请填入自己的apikey和secretkey噢** :smiley: ### 项目名称：“睡眠小镇”APP | 文档名称： | “睡眠小镇”APP——产品需求文档 | |---|---| | 产品名称： | 睡眠小镇 | | 产品描述： | 一款专门为关注睡眠、睡眠质量不达标并希望得到改善的人群打造的睡眠监测与社交一体的二合一APP，利用语音识别技术以及大数据分析精准记录睡梦情况，让用户更好地了解自己的身体，达到安睡的愿望。 | | 发布日期： | 2021-1-17 | | 产品版本： | 迭代二 | | 文件拥有者： | 梁颖欣 1910130034 | ### 下面是迭代一与迭代二的增量修改说明。 > [版本对比链接：点击此处进行跳转](https://gitee.com/shuimushisan/api-finalproject/graph/master) - 添加了用户画像具体图片。 - 添加了api调用的ipynb文档。 - api调用新增随机图片及随机励志语句调用接口，以及调用日期说明。 - 对推荐系统中的API接口设计图片的内容表述进行了更改。 - 新增解说ppt。 - 20*20投影片ppt视频解说。 # 一、价值主张设计 ******************** ## 1. 加值宣言随着科技的发展，人们的逐渐走向了**快节奏生活**，“时间就是金钱，效率就是生命”的观念，使得很多人在睡觉时精神都会处于高度紧绷的状态，**睡眠质量日愈下降**。本产品利用百度智能云平台精准的 **“语音识别”API** 以及网易云平台的 **“随机音乐生成”API** 进行整合并加值和优化，帮助识别、提取并分析梦话以及睡眠质量，同时提供轻柔助眠音乐随机播放，为 **失眠、难眠的快节奏生活人群** 打造友好的**睡眠分析+改善+社交**平台，在这里了解睡眠知识、改善睡眠质量、分享心得体会、结交小镇好友。 ## 2. 核心价值 #### 任务点/痛点（问题）： 1. 随着科技的发展，人们的逐渐走向了**快节奏生活**，“时间就是金钱，效率就是生命”的观念，使得很多人十分在意自己的工作效率以及完成的成果，以至于在睡觉时精神都会处于高度紧绷的状态，**睡眠质量日愈下降**。 2. 许多失眠患者不知道到什么渠道**表达**自己好，毕竟世界上**没有真正的感同身受**，和没有这种烦恼的人群交谈很难产生心理共鸣并得到心理安慰。 3. 在睡眠焦虑的烦扰下方便且便捷的集合信息指导**平台较**少，互联网信息分散且繁多，**过多的选择**反而让失眠人群难以抉择最适合自己的改善睡眠的方式。 #### 最小可行性产品（解决方案）：利用语音识别和随机音乐生成系统，为睡眠障碍人群提供一个睡眠改善+社区分享的平台，在查看自己的睡眠报告和聆听助眠音乐的过程中，了解自己的睡眠障碍来源，通过小镇社区分享沟通等方法，千里觅知音，用户与用户间互相帮助，从而达到更易入睡，更好质量的效果。 ## 3. 价值主张画布 ![价值主张画布](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/API%E4%BB%B7%E5%80%BC%E4%B8%BB%E5%BC%A0%E7%94%BB%E5%B8%83.jpg) ## 4.人工智能概率性与用户痛点 > 人工智能算法并不是万能的。”其准确度并无法达到百分之百，它向用户提供的信息有可能存在偏差。 ——蓝皮书百度智能云API开放平台的语音识别中和网易云的随机音乐生成播放器，有以下优势： | 语音识别API优势/用户痛点 | 网易云随机音乐生成/用户痛点 | |---|---| | **技术领先：** 采用领先国际的流式端到端语音语言一体化建模方法，融合百度自然语言处理技术，近场中文普通话识别准确率达98%——保证睡眠环境、梦话等音频获取的准确性，减少不必要的信息输出。 | **个性化的选择** ：歌曲榜单存在热歌榜、飙升榜、新歌榜、助眠榜等多项选择——让用户进行自由的歌曲选择，更好地根据自己喜欢的模式进行歌曲助眠 | | **多语种和多方言识别：** 支持普通话和略带口音的中文识别；支持粤语、四川话方言识别；支持英文识别。——帮助用户更好地了解自己的梦呓内容，不会因为听不懂而无法返回的后果。 | **歌单录入：** 提供了歌单录入的功能，不仅限于系统提供的随机歌曲生成——给用户更高的选择自由度，能根据自己喜欢的歌单进行睡眠音乐自疗。（自我治疗） | | **中文标点智能断句：** 使用大规模数据集训练语言模型，根据语音的内容理解和停顿智能匹配合适的标点符号（包括，。！？），使识别结果的表现方式贴合表述，更加可懂——让用户不便听语音时直接返回的语音转文字结果更加清晰易懂，减少逻辑错误 | **定期更新：** 随机音乐的api接口连接网易云端的歌库，歌曲会随着网易云更新而更新——给用户更加好的体验感，而不是听着过时的歌曲入睡，维持用户粘稠度和新鲜感 | # 二、需求概述 ********************* ## A.用户分析 1. 目标用户群： - 核心用户：各年龄层有睡眠问题并希望得到解决的人群，渴望得到倾诉平台的人群 - 一般用户：想了解自己睡眠状态和听助眠音乐的人群。 2. 用户画像及使用场景 ![用户1](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E7%94%A8%E6%88%B71.jpg) - 具体的应用场景：小娟是一个马上准备高考的高三学生，因为太关注自己的考试成绩和家人不断加给她的压力，她每天晚上都很难入睡，睡着了也容易做噩梦，睡眠质量非常差。于是她打开了“安睡小镇”APP，通过发帖宣泄感情并听着平台提供的助眠歌曲，她收到了很多善意的回复，也缓解了自己很多的焦虑，根据睡眠报告的反馈改进，睡眠质量大大提高。 ![用户2](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E7%94%A8%E6%88%B72.png) - 具体的应用场景：阿乙是一个知名企业的白领上班族，最近刚刚收到了一个工作的任务，当他刚刚做出一个自认为很完美的项目时，却被甲方一口反驳打回重做。他非常苦恼，也因为交方案日期将至，既烦闷也抑郁。于是他打开了“睡眠小镇”APP，跟“小镇居民”一起吐槽自己的遭遇，许多同样遭遇的镇民给了他很多安慰和建议，阿乙因此减轻了焦虑，伴随助眠音乐，进入了深度睡眠。 ![用户3](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E7%94%A8%E6%88%B73.png) - 具体的应用场景：达叔是一个独居老人，他的老伴刚刚去世，心里非常难过。加上儿女都是北漂族，只有过年能够回到家里，晚上回家睡觉前的时间非常孤独，内心的空虚使得他睡眠质量非常差，而且身体状况也因为年龄原因越来越差。因此，他在儿女的远程教导下学会了“安睡小镇”APP，在查看安睡报告时结合医生建议纠正自己打呼噜的坏习惯，减少睡中窒息的风险，同时，在“小镇”模块的老人社区里和其他老人也聊天聊的不亦乐乎，生活质量得到改善。 ## B.需求列表（对应人工智能加值） | 优先级 | 智能加值 | 用户场景(具体如何加值) | API类型 | |---|---|---|---| | 很重要 | 是 | 睡眠中录取用户睡眠梦呓、噪音环境等，并返回文字翻译。 | 百度智能云平台中的“语音识别”API | | 重要 | 是 | 给用户随机生成助眠音乐，帮助用户入睡 | 网易云“随机音乐”API | | 一般 | 是 | 随机生成鼓励文字，减轻用户焦虑，令首页不那么枯燥，加强用户粘合度 | “随机鼓励语句生成”API | | 普通 | 是 | 随机生成图片，美化ui，令首页不那么枯燥，加强用户粘合度 | “随机图片生成”API | | 重要 | 否 | 睡眠知识的交流社区，简单了解睡眠知识，分享睡眠经验、相互鼓励交友，减轻用户孤立无援的痛苦。 | / | ## C.核心价值与用户痛点 - 功能优先级说明 | 序号 | 用户痛点 | API加值 | |---|---|---| | 1 | 基于用户不了解自己睡眠情况，不了解睡眠环境的痛点，利用语音识别录取分贝大于正常睡眠状态的声音，并以语音转文字的功能方便用户观看。| 百度智能云平台中的“语音识别”API | | 2 | 有些用户心情焦虑到耳鸣、或者胸闷气短睡不着觉，这时一些简单舒缓的助眠音乐则能对他们有很大的安抚作用，减短入睡时间| 网易云“随机音乐”API | | 3 | 用户在进入app和退出app通常在睡前以及醒后，心情不好时可能这时会被情绪带动持续一整天，而打开app时这个随机鼓励语句也许能舒缓他们的焦虑| “随即鼓励语句”API | ## D.利害相关者分析 ### 1、人工智能系统性偏差 > 迄今最全面研究发现：即使顶级人脸识别算法，依然存在偏差 - 该APP集合了精准的语音识别+随机歌曲的API功能，满足不同需求的用户，让用户得到各自的需求满足。但是依然会存在人工智能的系统性偏差问题。 ![人工智能系统性偏差](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E7%B3%BB%E7%BB%9F%E5%81%8F%E5%B7%AE%E6%80%A7.jpg) > 参考文献：[人工智能算法歧视和偏见是固有的吗？可以被改进吗？](https://www.zhihu.com/question/347755861/answer/1349380408) # 三、界面流程及关键智能交互 *********************************** ## A. 用户旅程地图 ![用户旅程地图](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E7%94%A8%E6%88%B7%E6%97%85%E7%A8%8B%E5%9C%B0%E5%9B%BE.jpg) ## B.产品需求设计 > 失眠是因为各种原因引起入睡困难、睡眠深度或频度过短、早醒及睡眠时间不足或质量差等。 >>失眠往往会给患者带来极大的痛苦和心理负担，又会因为滥用失眠药物而损伤身体其他方方面面。 ## 1. 产品背景 - 随着经济的发展以及社会的变迁，人们的逐渐走向了**快节奏生活**，“时间就是金钱，效率就是生命”的观念，使得很多人十分在意自己的工作效率以及完成的成果，以至于在睡觉时精神都会处于高度紧绷的状态，**睡眠质量日愈下降**。**面对席卷而来的众多社会压力以及年龄增长带来的一些疾病，如何保证拥有高质的睡眠质量成为了热点话题。** - 对于失眠者来说，失眠的原因多种多样，不同的人存在不同的困扰， **也就是说从根源出发，找到自己压力根源并对症下药** 一方面希望能缓解用户的睡眠焦虑、另一方面，希望能够得到其他镇友的推荐和测评，吸引更多用户、带来更多数据例子，从而进行对睡觉状况更准确的分析。 ## 2. 产品市场（技术可行性 Feasibility）目前对于睡眠APP的分类，80%都是以分析用户睡眠质量分析报告为主的，而睡眠报告分析多数需要购买相应的睡眠枕头或者智能手表类产品才能实现监测。而“睡眠小镇”监测的方式是以用户手机的重力感应以及语音识别api里录入的呼吸频率来分析，技术更加简单又实用。 ## 3. 市场概述(用户可欲性Desirability) ##### 3.1睡眠APP类应用市场概述 >根据[中国青年网发布的《中国睡眠质量调查报告》](http://www.xinhuanet.com/gongyi/2019-03/20/c_137909697.htm)显示，16%的被调查者存在夜间睡眠时间不足6个小时，表现为24点以后才上床睡觉，并且在6点之前起床;有83.81%的被调查者经常受到睡眠问题困扰，其中入睡困难占25.83%，浅睡眠者有26.49%。 >>将近9成被调查对象认为长期睡眠障碍与慢性疾病密切相关。据了解，睡眠不足或者睡眠质量差与多种健康状况相关，包括心脏病患者风险的增加。显然，随着生活水平的提高，睡眠质量日益受到影响。而人们对生活质量的地位也越来越重视，失眠问题越来越被重视，睡眠类app应运而生，也十分受人们追捧。 ##### 3.2市场特征 - 睡眠问题日益深入人们的生活，人们对于睡眠问题日益重视，大部分用户都积极寻找缓解的方法。 - 目前国内已有领先的技术，语音识别技术的成熟，尤其是有针对睡眠环境、噪音、梦呓这类声音的专门化识别，拥有强大的睡眠声音数据库。 - 潜力巨大，睡眠改善市场大有可为。在社会发展的大背景下，人们对身体健康程度日益重视，特别是心理健康问题。 ## 4. 产品优势（商业可行性 Viability）： 1. **睡眠分析：** 通过用户手机的重力感应以及语音识别api里录入的呼吸频率来分析用户入睡过程的各项数据，并于结束录入后快速生成分析报告，速度快，质量高。 2. **随机助眠音乐：** APP内置随机音乐生成器，为用户进行助眠音乐推荐，并给与了歌单导入项，提高自由度，不用切换app也能既听歌又监测睡眠状态 3. **镇友之间交流：** 部署了社交内平台，注重用户的情感宣泄和释放，让用户于用户之间相互交流睡眠改善方案，互帮互助。 ## C.产品结构展示 1. APP功能结构图 ![功能结构图](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E5%8A%9F%E8%83%BD%E7%BB%93%E6%9E%84%E5%9B%BE.jpg) 2. 产品结构图 ![产品结构图](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E4%BA%A7%E5%93%81%E7%BB%93%E6%9E%84%E5%9B%BE.jpg) 3. 界面流程图 ![界面流程图](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E7%95%8C%E9%9D%A2%E6%B5%81%E7%A8%8B%E5%9B%BE.jpg) # 四、产品设计原型 ************************* #### A.原型文档 ## 1、[展示页面连接](https://modao.cc/app/138e2fe944b9e20a027085f6fc588fa80caa4ece?simulator_type=device&sticky) ##### 2、展示页面流程图 ![展示页面流程图](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E9%A1%B5%E9%9D%A2%E6%B5%81%E7%A8%8B%E5%9B%BE.png) #### B.交互及界面设计 1. APP页面展示 ![APP功能展示图](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E5%8E%9F%E5%9E%8B%E5%9B%BE.png) 2. 核心页面——睡眠分析功能、随机音乐功能 ![睡眠](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E5%AE%89%E7%9D%A1%E6%8A%A5%E5%91%8A.png) ![音乐](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E5%85%A5%E7%9D%A1.png) 3. 主要页面——红酒垂直社交平台 ![主要页面](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E4%B8%BB%E8%A6%81%E9%A1%B5%E9%9D%A2_%E7%94%BB%E6%9D%BF%201.png) 4. 核心界面交互流程 - 【睡眠】交互流程 ![睡眠](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E6%A0%B8%E5%BF%83%E6%B5%81%E7%A8%8B%E5%9B%BE_%E7%94%BB%E6%9D%BF%201.png) - 【音乐】交互流程 ![音乐](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E9%9A%8F%E6%9C%BA%E9%9F%B3%E4%B9%90%E6%B5%81%E7%A8%8B%E5%9B%BE.png) # 五、数据流程图 --- ![数据流程图](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E6%95%B0%E6%8D%AE%E6%B5%81%E7%A8%8B%E5%9B%BE.jpg) # 六、API使用可行性 --- #### API风险使用报告 ![DVF模型](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/DVF%E6%A8%A1%E5%9E%8B.jpg) # 七、API 产品使用及输出展示 ***************************** ### 1、API展示说明及输出 **（1）语音识别API（百度智能云开放平台）** - 接口描述：语音识别可将语音识别为文字，适用于手机应用语音交互、语音内容分析、智能硬件、呼叫中心智能客服等多种场景。 - 平台接入网址：[语音识别](https://cloud.baidu.com/doc/SPEECH/s/Ek39uxgre) - HTTP 方法：POST - 请求URL： http://vop.baidu.com/server_api - **源代码展示**：[点击此处跳转链接](https://gitee.com/shuimushisan/api-finalproject/blob/master/%E7%9D%A1%E7%9C%A0api%E8%B0%83%E7%94%A8.ipynb) - 1. 调用前进行认证授权代码输入：[Access Token获取](https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjhhu) - 代码片段展示 - **TOKEN获取：** ``` # 调用api的key值 API_KEY = 'scl5SsohgvSGHfsHLdHkUNcd' SECRET_KEY = 'xRqBv3T1W2YzA1ndaUdYZUNt6zcZDMB2' # 需要识别的文件，地址以具体文件为准 AUDIO_FILE = 'C:/Users/dell/Desktop./beijing.wav' # 只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式 # 文件格式 FORMAT = AUDIO_FILE[-3:]; # 文件后缀只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式 CUID = '123456PYTHON'; # 采样率 RATE = 16000; # 固定值 # 普通版 DEV_PID = 1537; # 1537 表示识别普通话，使用输入法模型。根据文档填写PID，选择语言及识别模型 ASR_URL = 'http://vop.baidu.com/server_api' SCOPE = 'audio_voice_assistant_get' # 有此scope表示有asr能力，没有请在网页里勾选，非常旧的应用可能没有 # 返回值 {"access_token":"25.8ef86d015da2b722b22308b772988970.2592000.1598114062.282335-19771877","session_key":"9mzdA8+Wn4TtNhOrmr+ctLL1FkFSigryZb8tJdS8QlSV2ujn1rh6o1lKf2qjQO4P358e+wywS8RuHC8sLH1DlBulJ5bdUQ==","scope":"brain_speech_realtime audio_voice_assistant_get brain_enhanced_asr audio_tts_post public brain_all_scope picchain_test_picchain_api_scope brain_asr_async wise_adapt lebo_resource_base lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian ApsMisTest_Test\u6743\u9650 vis-classify_flower lpq_\u5f00\u653e cop_helloScope ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey smartapp_swanid_verify smartapp_opensource_openapi smartapp_opensource_recapi fake_face_detect_\u5f00\u653eScope vis-ocr_\u865a\u62df\u4eba\u7269\u52a9\u7406 idl-video_\u865a\u62df\u4eba\u7269\u52a9\u7406","refresh_token":"25.cc737f39731cd169883db7f56bbcf271.315360000.1910882062.282335-19771877","session_secret":"4d039ab02c4a0ab50b95dba4778fe919","expires_in":2592000} ``` - **调用API输入：** ``` TOKEN_URL = 'http://openapi.baidu.com/oauth/2.0/token' def fetch_token(): params = {'grant_type': 'client_credentials', 'client_id': API_KEY, 'client_secret': SECRET_KEY} post_data = urlencode(params) if (IS_PY3): post_data = post_data.encode('utf-8') req = Request(TOKEN_URL, post_data) try: f = urlopen(req) result_str = f.read() except URLError as err: print('token http response http code : ' + str(err.code)) result_str = err.read() if (IS_PY3): result_str = result_str.decode() print(result_str) result = json.loads(result_str) print(result) if ('access_token' in result.keys() and 'scope' in result.keys()): if SCOPE and (not SCOPE in result['scope'].split(' ')): # SCOPE = False 忽略检查 raise DemoError('scope is not correct') print('成功使用token: %s ; EXPIRES IN SECONDS: %s' % (result['access_token'], result['expires_in'])) return result['access_token'] else: raise DemoError('可能是API\u密钥或SECRET\u密钥不正确：在令牌响应中找不到访问\u令牌或作用域') """ TOKEN end """ if __name__ == '__main__': token = fetch_token() """ httpHandler = urllib2.HTTPHandler(debuglevel=1) opener = urllib2.build_opener(httpHandler) urllib2.install_opener(opener) """ speech_data = [] with open(AUDIO_FILE, 'rb') as speech_file: speech_data = speech_file.read() length = len(speech_data) if length == 0: raise DemoError('file %s length read 0 bytes' % AUDIO_FILE) params = {'cuid': CUID, 'token': token, 'dev_pid': DEV_PID} #测试自训练平台需要打开以下信息 #params = {'cuid': CUID, 'token': token, 'dev_pid': DEV_PID, 'lm_id' : LM_ID} params_query = urlencode(params); headers = { 'Content-Type': 'audio/' + FORMAT + '; rate=' + str(RATE), 'Content-Length': length } url = ASR_URL + "?" + params_query print("url is", url); print("header is", headers) # print post_data req = Request(ASR_URL + "?" + params_query, speech_data, headers) try: begin = timer() f = urlopen(req) result_str = f.read() print("Request time cost %f" % (timer() - begin)) except URLError as err: print('asr http response http code : ' + str(err.code)) result_str = err.read() if (IS_PY3): result_str = str(result_str, 'utf-8') print(result_str) with open("result.txt", "w") as of: of.write(result_str) ``` - 测试其它音频文件,只需要修改以下参数： ``` # 需要识别的文件 AUDIO_FILE = "./16k.pcm"; # 文件格式 FORMAT = "pcm"; # 文件后缀 pcm/wav/amr/m4a 格式 # 根据文档填写PID，选择语言及识别模型 DEV_PID = 1537; # 1537 表示识别普通话，使用输入法模型。 ``` - 输出结果： > windows 下显示可能产生乱码，请打开result.txt ``` {"corpus_no":"6595003755536106531","err_msg":"success.","err_no":0,"result":["北京科技馆，"],"sn":"611278720461535518969"} ``` **(2)网易云随机音乐API** > 参考文档：[网易云随机音乐API文档链接](http://api.uomg.com/doc-rand.music.html#api) - HTTP方法：GET - 请求url：https://api.uomg.com/api/rand.music - 调用API代码片段 ``` # 利用网易云接口 import requests # 接口地址 url = 'https://api.uomg.com/api/rand.music' params = { 'sort':'飙升榜', # 分类为[热歌榜|新歌榜|飙升榜|抖音榜|电音榜]，为空输出热歌榜 'mid':'486899256', # 网易云歌单ID 'format':'json' # 输出格式[json|mp3] } response = requests.get(url,params=params) results = response.json() results ``` - 返回结果 ``` {'code': 1, 'data': {'name': '崖上的波妞', 'url': 'http://music.163.com/song/media/outer/url?id=1805289566', 'picurl': 'http://p4.music.126.net/7Rd9sc5WiAAvOULyb3_5lw==/109951165549267429.jpg', 'artistsname': '久石譲'}} ``` **(3)随机图片API** - HTTP方法：GET - 请求url：http://api.mtyqx.cn/api/random.php - 调用API代码片段 ``` import requests url = 'http://api.mtyqx.cn/api/random.php' # 直接打开url即可获取图片 response = requests.get(url) results = response results ``` - 返回结果 > 无需参数打开url即可 ``` ``` **(4)随机祝福API** - HTTP方法：GET - 请求url：https://abc.mcloc.cn/abc/api/words?type=json - 调用API代码片段 ``` # 方法一 # 接口地址 url = 'https://abc.mcloc.cn/abc/api/words?type=json' # 无需具体参数 response = requests.get(url,params=params) results = response.json()['data'] results # 方法二 # 接口地址二 url = 'https://nigansha.com/api/json?t=&n=3' params = { 't':1, # 0=动漫，1=哲理，2=名言，3=诗句，4=其他，空值=所有 'n':1, # 仅JSON、JSONP调用有效。默认获取1条，最多10条。 } response = requests.get(url,params=params) results = response.json()['result'][0]['txt'] results ``` - 返回结果 ``` # 返回结果一 '美丽的不是这个世界，而是接受了这个世界的你的眼睛。' # 返回结果二 '坚强不是结果，是朝某个目标努力的过程！——朝田诗乃《刀剑神域2》' ``` ### 2、语音识别API比较分析 #### 讯飞：语音识别和百度智能云：语音识别的对比 | | [讯飞语音识别](https://www.xfyun.cn/services/lfasr?ch=bd01-b&b_scene_zt=1&bd_vid=7153057136108663154) | [百度智能云：语音识别](https://cloud.baidu.com/product/speech/asr) | |---|---|---| | 优势 | **1.行业先进的准确率：** 讯飞开放平台拥有先进的语音识别技术，核心技术达到先进水平，语音识别准确率已经达到实用标准 **2.支持个性化热词：** 用户可将一些非常见的词汇上传至识别引擎，当实时转写的音频流中出现该词汇时，引擎可识别出来，提高专业用语识别准确率。 **3.智能标点预测：** 运用超大规模的语言模型，智能预测语境，提供智能断句和标点符号的预测。 | **1.技术领先：** 采用领先国际的流式端到端语音语言一体化建模方法，融合百度自然语言处理技术，近场中文普通话识别准确率达98%。 **2.多语音多方言：** 支持普通话和略带口音的中文识别；支持粤语、四川话方言识别；同时也支持英文识别。 **3.数字格式智能转化：** 根据语音内容理解可以将数字序列、小数、时间、分数、基础运算符正确转换为数字格式，使得识别的数字结果更符合使用习惯，直观自然。 | 操作简易 | 创建讯飞账号→免费测试 | 注册百度智能云账号→语音识别无需申请开通，可直接接入测试 | #### 总结分析： > 通过对讯飞语音识别和百度智能云语音识别的文档对比，我对这两款推荐系统的功能有了大致的了解。 1. 在技术文档的说明下，我认为 **百度智能云的官方文档要比讯飞智能云的技术文档要详细** ，对于未使用过推荐系统的人来说，比较友好。 2. 在操作简易程度上，很明显，在准备工作，百度云的准备工作要比讯飞的简单。而在调用API的使用流程上， **个人认为讯飞的要比百度云简单** 。 3. 在两者之间的优势对比中，两者都各有优势。百度云有强大的用户数据库，相比讯飞在功能转换中，速度更快。而选择百度智能云 **主要是考虑到毕竟是睡眠报告分析，准确性比速度更重要，而且官方文档更详细的介绍更方便后期的维护和升级，从而给客户更好的功能体验** ，而且百度服务稳定高效企业级稳定服务保障，专有集群承载大流量并发高效灵活，以及99.9%服务稳定性保障，中文输入法模型可在语音自训练平台上零代码自助训练，上传文本语料即可有效提升业务词汇的识别准确率5-25%，也很符合客户痛点解决的需求。 ### 3、人工智能概率性考量：API精准度测试 ##### 选用不同文件格式以及不同频率的语音音频，测试语音识别api的准确度 ### - 测试实验组：（3个范例音频） 1. 语音1：为wav格式，16.bit单声道，普通话 2. 语音2：为pcm格式，8.bit单声道，北京话 3. 语音2：为arm格式，16.bit单声道，粤语 > 语音内容皆为“北京科技馆”。 ### - 输出结果 - 语音1 ```{"corpus_no":"6595003755536106531","err_msg":"success.","err_no":0,"result":["北京科技馆，"],"sn":"611278720461535518969"}``` - 语音2 ```{"corpus_no":"6595003755536106531","err_msg":"success.","err_no":0,"result":["北京科技馆儿，"],"sn":"611278720461535518969"}``` - 语音3 ```{"corpus_no":"6595003755536106531","err_msg":"success.","err_no":0,"result":["北经科技管，"],"sn":"611278720461535518969"}``` - 分析： 1. 由语音1、2输出结果来看，在普通话和北京话的输出还是很准确的，各别会带一点方言口音。 2. 由语音3输出结果看，虽然能够识别大致的音准，但是具体的字也许会存在一定误差，但是总体误差不大。 :bangbang: **总结：从上述的识别结果来看，用户在进行梦呓录制时，对方言包容度稍小于标准的普通话，但是经历长时间的学习，这些误差能够相对降低。** ### 4、API使用价格 #### 免费额度 > [百度语音产品价格文档](https://cloud.baidu.com/doc/SPEECH/s/ck38lxnx8) 语音识别下各个能力都具有免费调用额度，开通付费后，免费调用额度仍保留。开始产生调用次数时，优先抵扣免费额度，超出免费额度后按次计费。免费额度如下： ![免费额度](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E5%85%8D%E8%B4%B9%E9%A2%9D%E5%BA%A6.png) #### 语音识别API价目表 QPS叠加包是指已经开通付费（或购买次数包）的情况下，在默认10QPS的基础上继续购买获得更多的QPS并发量。请注意：调用量依然按次计费。（QPS：每秒可发送请求数） ![语音识别API价目表](https://gitee.com/shuimushisan/api-finalproject/raw/master/image/%E8%B0%83%E7%94%A8%E6%AC%A1%E6%95%B0.png) # 八、该产品未来的发展路线构想 ********************************** 1. 后续可以增加“电商”模式，与各大睡眠类产品电商平台进行合作 2. 继续优化和丰富睡眠音频分析库以及随机音乐推荐库 3. 增加用户的使用量，提高推荐系统的准确性 # 九、学习/实践心得总结及感谢 ******************************** - **心得总结：** 通过这次项目的实践操作，在不同的开发过平台进行API的对比和测试，对它们有了更加深刻的了解。安睡小镇利用百度智能云平台精准的 “语音识别”API 、网易云随机歌曲API、随机语句API和随机图片API 进行整合并加值和优化，过程中对它们的分析，让我更加懂得PRD文档撰写的流程，并且分清楚了功能结构图、产品结构图和用户旅程地图等一系列图的区别，产品经理的知识更加充实，学习过程十分愉悦。 - **感谢：** 本项目通过参考[b站产品经理Q&A第三期 | 产品文档指南 | A Guide For PRD](https://www.bilibili.com/video/BV1z4411p73c?from=search&seid=16084132214169005129)和优秀案例[18学姐文档结构](https://gitee.com/LiangShanYi/API)在线学习网站上的产品需求文档的大纲撰写而成。在调用API的使用中，参考了[百度智能云demo](https://github.com/Baidu-AIP/speech-demo)的代码，在一些API等对比中，参考了平台提供的官方的文档（详细可查看下面目录）。感谢官方文档上的开源代码以及详细的解说注释，帮助了我解决了调用API的问题。 - **所用的AI功能文档** > 1. [UOMGAPI网站](http://api.uomg.com/) > 2. [百度智能云推荐系统介绍](https://cloud.baidu.com/doc/BRS/s/ajwvxjo4j) > 3. [百度智能云平台：语音识别](https://cloud.baidu.com/product/speech/asr) > 4. [百度语音产品价格文档](https://cloud.baidu.com/doc/SPEECH/s/Jk38lxn2j) > 5. [讯飞语音识别](https://www.xfyun.cn/services/lfasr?ch=bd01-b&b_scene_zt=1&bd_vid=7153057136108663154) > 6. [随机祝福](https://nigansha.com/) - **其他参考文献** > 1. [中国青年网发布的《中国睡眠质量调查报告》](http://www.xinhuanet.com/gongyi/2019-03/20/c_137909697.htm) > 2. [人工智能算法歧视和偏见是固有的吗？可以被改进吗？](https://www.zhihu.com/question/347755861/answer/1349380408) > 3. [有哪些好玩免费的API接口](https://www.zhihu.com/question/32225726/answer/1341443803) > 4. [人工智能算法误导孩子学习谁负责？专家：机器也会出错](https://baijiahao.baidu.com/s?id=1616942035646124225&wfr=spider&for=pc) > 5. [python关于调用百度语音识别api的操作~](https://www.cnblogs.com/kunixiwa/p/8609843.html) > 6. [python实现百度语音识别api](https://www.jb51.net/article/138047.htm) - **原创性图和表** [（17个，点击此处查看源文件）](https://gitee.com/shuimushisan/api-finalproject/tree/master/image) ******************************** # 附件： - 20*20秒PPT[（点击此处跳转下载）](https://gitee.com/shuimushisan/api-finalproject/blob/master/%E5%AE%89%E7%9D%A1%E5%B0%8F%E9%95%8720x20%E8%A7%A3%E8%AF%B4ppt.pptx) - 20*20秒音频[（点击此处跳转下载）](https://gitee.com/shuimushisan/api-finalproject/tree/master/ppt%E8%AE%B2%E8%A7%A3%E5%BD%95%E9%9F%B3) - 20*20秒录屏[（点击此处跳转下载）](https://gitee.com/shuimushisan/api-finalproject/blob/master/ppt%E8%AE%B2%E8%A7%A3%E5%BD%95%E5%B1%8F.mp4) **************************************** ### 下面是迭代一与迭代二的增量修改说明。 > [版本对比链接：点击此处进行跳转](https://gitee.com/shuimushisan/api-finalproject/graph/master) - 添加了用户画像具体图片。 - 添加了api调用的ipynb文档。 - api调用新增随机图片及随机励志语句调用接口，以及调用日期说明。 - 对推荐系统中的API接口设计图片的内容表述进行了更改。 - 新增解说ppt。 - 20*20投影片ppt视频解说。