# API期末项目 **Repository Path**: liyu00/api-final-project ## Basic Information - **Project Name**: API期末项目 - **Description**: API课程期末项目 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-01-21 - **Last Updated**: 2021-01-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # API期末项目 # 晚安app产品文档 #### [20*20 PPT说明](https://pan.baidu.com/s/1Qi4RlxSV5ZrI87NWpSwPgw) 提取码:n3ib #### 原型详细说明 |文档名称|晚安产品需求文档| | -------- | -----: | |产品描述|通过语音识别API、语音转写功能及情感分析,有效解决深夜失眠族的睡眠问题| |文件现状|进行中| |作者|李茜谕| |版本|1.0| |更新|2021.1.20| --- ## 目录 - [迭代增量](#迭代增量) - [价值主张宣言](#价值主张宣言) - [一.需求概述](#一需求概述) - [二.核心价值(最小可行性产品)](#二核心价值最小可行性产品) - [三.用户画像](#三用户画像) - [四.核心价值与用户痛点](#四核心价值与用户痛点) - [五.人工智能概率性与用户痛点](#五人工智能概率性与用户痛点) - [六.需求列表](#六需求列表对应人工智能加值) - [七.产品结构](#七产品结构) - [八.数据推理](#八数据推理) - [九.原型](#九产品原型之核心功能展示) - [十.API运用](#十API运用) - [十一.API使用价格](#十一API使用价格) - [十二.API使用风险评估](#十二API使用风险评估) - [十三.竞品分析](#十三竞品分析) - [十四.该产品未来的发展路线构想](#十四该产品未来的发展路线构想) - [十五.心得与感谢](#十五心得与感谢) --- ### 迭代增量 ##### 迭代二--[diff链结](https://gitee.com/ltco/API/compare/e485b0685550ecb434791f31090d3ef7cfa44d24...d94ead1be5cec044d0474ed5e7ce5d3b2ebb47b2): - 添加原型交互 - 添加价值主张项目标题及IDEO三要素 - 添加产品界面流程图及数据流程图 - 添加界面流程及关键智能交互 - 添加用户旅程地图 ##### 迭代三--[diff链结](https://gitee.com/ltco/API/compare/d94ead1be5cec044d0474ed5e7ce5d3b2ebb47b2...cea39231394992c4c2e0d5d7a9ffe5625009830e): + 添加文档目录,方便读者阅读 + 添加利害相关者分析 + 添加ESG考量 + 完善需求列表 + 完善心得总结及感谢 ----------------- ### 价值主张宣言 #### “听完故事就晚安” ----------------- - 随着生活水平的提高,科学技术的发展,很少再看到往日日出而作,日落而息的生活模式了。失眠是每个现代人都会遇到的问题,当很多人想睡个好觉的时候,发现自己难以睡着了。失眠虽然不是什么大问题,但是长久的失眠会让人痛苦不堪,严重影响人的工作与生活。皇帝内经中,帝曰:人有卧而有所不安者,何也?歧伯曰:脏有所伤,及精有所之寄则安,故人不能悬其病也。由此可见,睡不安稳的的原因有二:一是五脏有损伤,二是精神无所寄托,精神安稳才能睡得安稳,所以人不能心事重重。 - 最典型的失眠情况就是想得太多,难以放轻松。睡前有声读物能在一定程度下,能改善用户的心理状态 - app通过运用百度的语音识别API进行语言识别。同时使用音频转写完成对该状态下用户的情感状态以及需求,通过条件检索出喜马拉雅以及猫耳fm中相对应有声读物并进行播放,减少夜间手机强光照射影响睡眠质量的同时,播放情感所需的晚安故事,缓解睡前焦虑,改善睡眠质量。 - 以上技术的综合运用能够有效缓解用户在如今快时代中深夜焦虑,改善睡眠状况,精神充沛,生活饱满自信。 ### 一.需求概述 ---------------------------- #### 1. 产品背景 随着生活水平的提高,科学技术的发展,很少再看到往日日出而作,日落而息的生活模式了。失眠是每个现代人都会遇到的问题,当很多人想睡个好觉的时候,发现自己难以睡着了。失眠虽然不是什么大问题,但是长久的失眠会让人痛苦不堪,严重影响人的工作与生活。很多人现在习惯在睡前玩玩手机。其实这是很影响睡眠的,在睡前玩手机对眼睛也非常不好,不如每次在睡前听听书。即丰富了自己的知识,只要注意选择好书单还能改善睡眠质量。 睡前读物能在一定程度转移人们思考注意力,从而提高入睡率,降低失眠率。 #### 2.产品市场 目前,市面上专注改善失眠状况的有声读物推广为主要内容app较少,与语音识别与智能ai搜索功能结合,能减少在夜晚失眠的状况点开手机后强光照射。APP希望借助人工智能API节约人力成本,优化检索睡前有声读物的准确率及效率。 #### 3.市场概述 ##### 3.1睡前读物应用市场概述 > 世界卫生组织统计:全球27%的人存在睡眠问题;全世界每天有3000人因为打鼾导致死亡。中国睡眠研究会数据显示:我国24.6%的居民(约3亿)睡眠有问题,我国成年人失眠发生率为38.2%。并且国际社会上也公认:充足的睡眠、均衡的饮食和适当的运动,是健康的三项标准。从某种意义上说,睡眠质量决定着生活质量! 从目前来看,人们能够认识并重视失眠的严重性,提高睡眠质量,改善睡前焦虑拥有良好睡眠是当今人们迫切所需 ##### 3.2市场特征 + 睡前有声读物类app需求大、市场广阔,目前处于行业发展的初期,仍未有知名度极高的权威性产品。 + 目前行业内产品为单一有声读物或是“虚拟男友”,实用性不强,使用人数尚未达到规模化流量,效率也有很大的提升空间。 + 睡前有声读物产品注重实用性与适用性,需要根据用户不同的情感需求进行推荐与分析。 ##### 3.3发展优势 + 目前的睡前有声读物产品较少,且功能局限性强,市场竞争小,没有行业龙头,进入成本低。 + 人工智能API的运用能够大大节约人力成本,提高检索效率。 + 通过语音唤醒、人工智能鉴别情感需求,能够让用户的情感需求相对应,减少睡前强光,提高睡眠质量 ----------------------------------- ### 二.核心价值(最小可行性产品) 着眼于解决当人睡前焦虑的问题,晚安app将有声读物app的基础上优化助眠应用,提供语音唤醒及人工智能情感分析、检索鉴别功能。 ##### 用户痛点宣言 - 在睡前使用手机。其实这是很影响睡眠的,在睡前玩手机对眼睛也非常不好。 - 不知道该选择怎样的睡前读物,个人需求不了解。 - 睡前焦虑问题找不到倾述对象,导致内心焦躁或者思考过多,影响睡眠质量从而影响身体健康。 ---------------------------------。 ### 三.用户画像 ##### 1. 目标用户分析 - 核心用户:16岁-50岁工作或学习压力大的中青年 - 主要用户:16-80岁的智能手机用户 ##### 2、用户画像及使用场景: ![晚安app用户画像](https://images.gitee.com/uploads/images/2021/0121/022122_b7a1c903_5329207.jpeg "晚安app用户画像.jpg") |使用场景|功能|API加值| | -------- | -------- | -----: | |深夜失眠,辗转反侧|语音唤醒app,通过检索播放晚安故事| 百度音频转写API| |睡前想听睡前故事,但懒得输文字|语音唤醒app,通过检索播放晚安故事| 百度音频转写API | |深夜焦虑,无人倾述|根据用户倾诉分析用户情感状态并推荐相关故事| 人工智能API、情感分析| |无视力或视力弱、夜视力弱用户|语音输入| 百度短语音识别API| -------------------------- ### 四.核心价值与用户痛点 |用户痛点|API加值| |--|--| |不知道该听怎样的睡前故事|百度情感倾向分析API| |倾述故事,寻求安慰|情感倾向分析| |希望睡前减少手机使用 |讯飞语音转写API| |无视力或视力弱、夜视力弱用户想听晚安故事 |百度短语音识别API| -------------------- ### 五.人工智能概率性与用户痛点 > 人工智能已成为新一轮科技革命的核心驱动力,**技术的进步为经济、社会、生活带来积极影响。**人工智能助力产业智能化升级,商业价值巨大,2019年预计贡献收入近570亿元。 -----艾瑞网 本项目运用了百度API开放平台之音频文件转写API ,具有以下优势 |百度情感倾向分析API之优势--用户痛点|百度开放平台音频文件转写API之优势--用户痛点| |--|--| |通过用户倾述内容以及日常推荐浏览推荐适合用户的晚安故事,针对缓解用户焦虑所在、影响睡眠质量的问题,有效减少失眠,提高睡眠质量|可以将大批量的音频文件异步转写为文字。适合批量录音质检、会议内容总结、录音内容分析等场景。将视频中的音频进行语音识别,自动切分无语音部分,对每句话标记时间戳,通过时间戳生成对应字幕。--短视频内容的内容质量得到审核与保证。| 所以,该产品利用情感倾向分析功能为用户提供适合自己的晚安故事,给出较为合适用户需求的晚安故事内容。然而,该情感倾向分析API主要基于关键词词袋进行文本的识别审核,对新产出的新词汇可能存在分析错误的风险。 在音频文件转写方面,能够做到比较好的音频还原,完成度和准确度都较高。但因为视频音频类文件的资源较大,在转写速度 方面对用户体验有一定的影响。 -------------------- ### 六.需求列表(对应人工智能加值) 序号|API技术|用户场景|智能加值|优先级 --|:--:|--:|--:|--:| 1|情感倾向分析|倾述故事,寻求安慰|分析用户情感状态,提供适合用户的内容|(A)重要| 2|语音转写|深夜焦虑用户的迫切需求|快速实现查找需求|(A)重要 | 3|短语音识别|夜间不适宜使用手机时间过长|利用语音输入进行搜索|(B)次重要 | #### 需求论证展示利害相关者分析 **利害相关者:** 焦虑的中青年+有声读物平台 + 焦虑的中青年:不想失眠,希望在一天忙碌之后能睡个好觉,迎接美好的明天,但不知道该听怎样的睡前故事。 + 有声读物平台:增加内容含量,减少集齐内容成本。 **关键API人工智能类型:** 情感倾向分析、语音识别 + 对解决方案的可能关键影响:时代发展出的新词汇、新社会情况可能会对用户的情感分析的结果产生影响,需要更加大量且及时的机器学习来维持情感倾向分析结果的准确度。 **ESG考量** |用户旅程地图| ESG问题|ESG机会 | | -- | -- | -- | |关联第三方账号阅读历史|用户隐私数据泄露,存在信息安全隐患|及时推送分析结果;设置数据信息访问权限| |倾诉内容过长|文件较大,获取结果速度慢 |通过与第三方合作,边记录用户情感内容提前预分析查找结果 | |查阅阅读历史|历史阅读记录过多导致查询困难;缓存过多造成使用卡顿|增加历史阅读记录的按照关键字或阅读日期搜索功能;提供定期清除缓存或删除个别记录的选项| -------------------- ### 七.产品结构 #### 界面流程及关键智能交互 + 关键智能交互:用户倾述内心需求,API处理数据后返回符合需求的晚安故事。 + 关键智能API:情感倾向分析API ##### 用户旅程地图 ![晚安app用户旅程地图](https://images.gitee.com/uploads/images/2021/0121/032222_e769a55b_5329207.jpeg "晚安app用户旅程地图.jpg") ##### IDEO三要素&智能交互 |要素|加值| |--|--| |商业可行性|时代快速发展的当下,深夜焦虑失眠用户增加,失眠用户对睡前读物的渴望增加| |技术可行性|语音搜索普遍运用于各大产品,易于实现;情感倾向分析功能已有可用API可供调用实现| |用户可欲性|当代人的焦虑心理状况,对睡前有声读物有较大需求| ##### 界面流程图 + 初次使用流程 ![初次登陆](https://images.gitee.com/uploads/images/2021/0121/112608_bd35cb21_5329207.png "初次登陆_200%.png") + 普通输入流程 ![普通输入流程](https://images.gitee.com/uploads/images/2021/0121/112640_f85f9bb6_5329207.png "普通使用_200%.png") + 语音唤醒使用流程 ![语音唤醒](https://images.gitee.com/uploads/images/2021/0121/112717_f6fd92d7_5329207.png "语音唤醒_200%.png") ##### 功能结构图 ![晚安app功能结构图](https://images.gitee.com/uploads/images/2021/0121/114845_636ad51d_5329207.png "晚安app功能结构图.png") ##### 数据流程及关键智能API使用 ![数据流程及关键智能API使用](https://images.gitee.com/uploads/images/2021/0121/115842_925c30be_5329207.png "数据流程及关键智能API使用.png") ##### IDEO三要素&数据流程 |要素|加值| |--|--| |商业可行性|API价格在可接受范围内,且有优惠和免费调用机会,详见后文API价格说明| |技术可行性|人工智能API、情感倾向分析API、短语音识别API及语音转写API相对成熟,已被各大产品调用实现功能| |用户可欲性|用户只需要通过简单交互输入即可获得数据输出| -------------------- ### 八.数据推理 |问题与回答 |页面| |--|--| |问题1|我们在页面呈现什么内容| |回答1|睡前有声读物推荐| |问题2|向用户输出的结果内容从哪里来| |回答2|API开放平台、喜马拉雅猫耳fm有声书平台| |问题3|请求从哪里来| |回答3|失眠用户寻求帮助| |问题4|如果页面出现识别错误,应该如何获取并处理数据,正确数据的信息从哪里来| |回答4|将用户反馈纳入知识库,通过机器学习优化对数据信息的处理| -------------------- ### 九.产品原型之核心功能展示 - [原型交互链接](https://modao.cc/app/05c5b6a5f9350ccc5f482cedd1806da1c4d3bf43?simulator_type=device&sticky) ![产品原型](https://images.gitee.com/uploads/images/2021/0121/120700_8bd53e34_5329207.png "工作流 4_200%.png") ### 十.API运用 ### (一)语音转文字 ### a .百度开放平台——语音转写API |API基本信息|说明| |--|--| |价值主张|音频文件转写接口可以将大批量的音频文件异步转写为文字。适合批量录音质检、会议内容总结、录音内容分析等场景,支持中文普通话的16k与8k模型及英语识别。| |接口描述|根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务| |调用方法|POST| |调用URL|https://aip.baidubce.com/rpc/2.0/aasr/v1/create| |请求参数(必填)|access_token、text| ### b.讯飞语音转写API(应用) |API基本信息|说明| |--|--| |价值主张|可以从转写出的文字结果中搜索匹配相关词类,对黄暴/涉政内容进行高效鉴别| |接口描述|根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务| |调用方法|POST| |调用URL|http[s]://raasr.xfyun.cn/api/prepare| |请求参数(必填)|access_token| + API测试图 ![api调用图](https://images.gitee.com/uploads/images/2021/0121/140953_29b5fe5d_5329207.png "004144_cc29797f_2228512.png") ### (二)短语音识别API ### a.百度开放平台——短语音识别API |API基本信息|说明| |--|--| |价值主张|为用户提供语音输入的便捷选择,解决夜间减少手机使用的痛点,提高用户体验| |接口描述|将60秒以下的音频识别为文字,适用于语音对话、语音控制、语音输入等场景| |调用方法|POST| |调用URL|https://aip.baidubce.com/rpc/2.0/aasr/v1/create| |请求参数(必填)|access_token| ### (三)情感倾向分析 |API基本信息|说明| |--|--| |价值主张|分析用户的情感需求,为用户提供适用的产品内容回馈| |接口描述|对只包含单一主体主观信息的文本,进行自动情感倾向性判断(积极、消极、中性),并给出相应的置信度。为口碑分析、话题监控、舆情分析等应用提供基础技术支持,同时支持用户自行定制模型效果调优| |调用方法|GET/POST| |调用URL|https://aip.baidubce.com/rpc/2.0/nlp/v1/sentiment_classify| |请求参数(必填)|key、access_token、Content-Type、text | + API测试图 ![情感倾向分析](https://images.gitee.com/uploads/images/2021/0121/140759_9258fc97_5329207.png "微信截图_20210121135721.png") -------------------- ### 十一.API使用价格 + 百度短语音识别价格 ![包](https://images.gitee.com/uploads/images/2021/0121/141121_7893778d_5329207.png "004145_5f38306c_2228512.png") ![按包付费](https://images.gitee.com/uploads/images/2021/0121/141201_4ef355c9_5329207.png "004143_b1c32c1f_2228512.png") ![调用量付费.png](https://images.gitee.com/uploads/images/2020/0718/004149_5a553e02_2228512.png) + 讯飞语音转写API ![讯飞产品价格.png](https://images.gitee.com/uploads/images/2020/0718/004146_211f98bb_2228512.png) -------------------- ### 十二.API使用风险评估 >AI随着计算机的计算能力的增强,已经有了重大进展(Buchanan,AI Magazine,2005)。AI和神经网络可以在更短的时间内完成比人类更多的工作。他们也不需要休假,也不会生病。一旦编程,它们的错误率就很小,并且如果有错误,通常是在编程中,这是人为错误。 ——Excelsior College + 错误现象以及处理方法: 1. 当对语音鉴别结果不确定时,返回“鉴别结果有待考核”的信息,并在人工审核后将用户反馈结果纳入知识库进行机器学习,优化产品性能。 2. 在嘈杂的环境中语音输入的结果可能受到影响,以震动及提示音的形式提醒用户到稍微安静的环境再次输入。 3. 对语音的鉴别局限于已缓存文件,影响新内容的鉴别速率,后期通过与有声读物平台达成合作,在更多更适合的作品中综合分析之后为用户提供最优作品。 -------------------- ### 十三.竞品分析 1. 寻找竞品对象的主要途径为手机应用市场,“有声书”“晚安电台”为关键词进行竞品搜索,综合得出竞争力较强的应用有猫耳fm、喜马拉雅等有声平台 2. 作为以情感分析提供睡前有声读物为核心业务的产品,猫耳fm、喜马拉雅等都专注于提供不同类型有声读物的平台并不专注助眠这一项,同时都有提供关键字搜索。 3. 猫耳fm的特色功能在于与提供大量优质广播剧,喜马拉雅则专注于有声读物,都能够给声音爱好者能够提供不同内容的有声读物。有声作品的丰富性能为用户提供可加入第三方的不同的选择。 两个产品都提供关键字搜索及喜好的服务,在定位上又略有不同,各有千秋,同时都是专注于有声读物的产生,但二者在助眠这一环节上都缺乏对用户倾诉的主动权及获用户情感的分析和适用性。 ##### 总结:目前的睡前有声读物产品并未大量且长期曝光在人们的视野,使用有声读物产品的用户量仍然占据少数。而人工智能API、情感倾向分析的运用能够在为检索用户需求上更加人性化,提高鉴别效率,开辟新市场。 -------------------------------------- ### 十四.该产品未来的发展路线构想 发展理念:首先实现与第三方机构的合作,完成最基本的有声作品发布及关键字搜索功能,继而加入与微信、QQ、微博等第三方合作,通过已听有声读物以及近日动态分析的联动自动推送用户适用有声作品,在联系第三方的过程中努力实现语音搜索的优化,提升“银发族”的用户体验。 **(一)产品的更新迭代过程**
+ V1.0 1. 实现与较真等第三方机构的合作,获取基本的内容资源; 2. 实现语音搜索功能,辅助用户搜索 3. 大IP优秀作品入驻,吸引流量用户。 + V2.0 1. 实现有声内容的分类,方便用户查找。 2. 新增积分兑换功能,吸引流量并促进与第三方的合作。 + V3.0 1. 实现与微信、微博的合作联动,获取用户浏览数据,简化分析程序。 2. 实现语音倾听功能,提高情感分析效率,将寻找主动权交予用户。 3. 实现自动唤醒服务,减低产品使用时可能会影响用户的睡眠质量的可能性。 + V4.0 1. 针对上个版本进行优化。 2. 添加举报功能,尝试开发社交功能。 + V5.0 1. 开设“晚安喵”商城,探索收益模式。 **(二)产品的盈利模式**
+ 广告收费+流量变现+有声产品付费 **(三)产品的业务模式**
+ 前期寻求与第三方机构合作,完成睡前有声读物发布的基础功能;获得一定用户基础后,致力于大型企业合作,获取读者阅读信息,形成联动,增加用户粘性与使用的便捷度; + 中期通过语音转写实现对寻找作品功能优化; + 后期调用人工智能API、情感分析倾向,是产品更加人性化,吸引更多用户。 #### 所使用的人工智能API功能链接 + [百度AI-语音技术-短语音技术极速版](https://ai.baidu.com/tech/speech/asrpro) + [讯飞开放平台-语音识别-语音转写](https://www.xfyun.cn/services/lfasr) + [百度AI-情感倾向分析](https://cloud.baidu.com/product/nlp_apply/sentiment_classify) -------------------------------------- ### 十五.心得与感谢 + 心得:在为期十八周的API学习实践中,时间过得太快总感觉自己抓住的东西并不多,但也不断提醒自己智能加值的部分,去审视一个项目是否有意义,产品实现的可能性。在实践中,不断地回顾数据流程图、用户旅程地图及价值主张画布的要素,努力将想法表达得更精简直观。我是个想法很多的人,喜欢声音,喜欢配音,希望在自己力所能及的地方为配音行业未来的发展提供一席之地,因此有了我的这个项目企划,希望日后自己的这个项目的想法能够更加完善,对得起自己的爱好还有曾经学习过的知识。 + 很感谢这一段时间里每天晚上深夜4~5点一起相互鼓励的网新小伙伴们,能够坚持下来完成这一个项目,离不开他们。感谢我的伙伴们。 + 同时感谢[百度大脑](https://ai.baidu.com/)、[讯飞开放平台](https://www.xfyun.cn/)及[百度智能云](https://cloud.baidu.com/)为我提供了API调用学习实践的机会,作为API的使用者,我希望能够努力获得更多更好的想法为人类社会做出一点点向善的改变。