# 人工智能API **Repository Path**: yichenting/ai_api ## Basic Information - **Project Name**: 人工智能API - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2020-04-01 - **Last Updated**: 2021-06-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # API期末项目 --- [Gitee的diff连结](https://gitee.com/yichenting/ai_api/compare/1906f76297e5477288dc9ec341b7ac34c07be01b...3156f746f78f7c4721d7032d8a0cddbfa57a0ace) #### 麻烦请点开“加载差异”看🆗 ![迭代](https://images.gitee.com/uploads/images/2020/0724/140412_44ab788a_2231122.jpeg "迭代.jpg") **迭代:** 此时版本即将更新至1.2——添加新功能:实现人机对话,争取可以语言通话。由于技术不太够,加上现在原型中挺难实现的,还需要一定的时间才能做到这个功能。 **迭代的增量改进:** 文档中更改了多处的排版,添加了数据流程图、IDEO三要素和用到的API文档的链接。 [**产品的介绍PPT** ](https://gitee.com/yichenting/ai_api/blob/master/%E5%90%AC%E4%BD%A0%E8%AF%B4App%E4%BA%A7%E5%93%81%E4%BB%8B%E7%BB%8D.pptx) --- ### 听你说APP | 文档名称 | 听你说—产品需求文档 | |------|------------------------------------------------------------| | 产品名称 | 听你说 | | 产品描述 | 一款帮助那些身边缺少朋友,有情绪却不知道和谁说的人解决内心的小秘密。 | | 产品版本 | 1.2 | | 文件现状 | 进行中 | | 文件作者 | 陈婷 | ## 一、价值主张设计 ### 一、加值宣言 我认为针对缓解用户情绪的应用还没有在市场上出现,而听你说就是针对该漏洞对现有的小度机器人、天猫精灵与变声器合并加值优化。其中该APP使用到的人工智能技术有[自然语言处理的情绪识别API](https://cloud.tencent.com/document/product/271/35497) 和[对话机器人API](https://cloud.tencent.com/document/product/271/39416) ,[语言合成TTS API](https://cloud.tencent.com/product/tts) 等,这些技术的综合运用能满足现代人对陪伴的需求,能够让用户的情绪得到倾述,从而解决情绪问题。 ### 二、核心价值(最小可行性产品) 着眼于解决人们社交中的倾述问题,听你说APP将为此类用户提供“陪伴式回应”。 ### 三、用户分析 1. 目标用户群 **核心用户** :18-23岁的年轻人 **主要用户** :24-40岁有工作的人 2. 用户画像及使用场景 ![小月](https://images.gitee.com/uploads/images/2020/0717/212755_86fc916d_2231122.png "用户画像 (1).png") 使用场景:小月平时是一个比较活泼的人,为人正直、爱抱打不平,喜欢指出别人的错误(在适当的情况下),但是有个老师的上课模式她很不喜欢,其实也有挺多同学不喜欢那个老师的上课模式,但小月不知道她们中间会不会有站老师那方的人,所以她不敢向同学们吐露心声,又不敢向老师直接指出她的不足。这时,她就打开“听你说”APP,找了“楠楠”朋友,向她倾诉了一切,楠楠安慰了她,最后楠楠给她讲了一个故事,她的烦恼就没有了。 ![小薛](https://images.gitee.com/uploads/images/2020/0717/212820_972e133e_2231122.png "用户画像 (2).png") 使用场景:小薛是一个刚入社会的实习生,平时做事认真负责。但是由于上级分派的任务没有说明白要求,当报告拿给上级看的时候,上级就批评她没有按要求来,不断叫她更改,面对这些情况小薛很是无奈。下班回到家后的小薛打开“听你说”APP,和“玺子”说了这件事后,玺子安慰她,并且唱了一首小薛很喜欢的歌。小薛的委屈没有了。 #### **用户痛点:** 1. 出门后天气状况突然发生改变,无法回家改变家居状态。 2. 离家时,忘记切掉某处的开关或者电源,出现无法弥补的严重后果。 3. 想在回家后直接享受家居服务,而不需要花时间等待。 ### 核心价值与用户痛点 | 用户痛点 | API加值 | |----------------------|---------------------| | 深夜烦恼的时候不知道该和谁聊天 | 腾讯云自然语言处理的对话机器人API | | 在和重要的人聊天的时候不知道说的话是正能量还是负面的 | 腾讯云自然语言处理的情感分析API | | 有时候觉得孤独的时候,因为身边都没有可以讲话的人,可以交流的人 | 腾讯云自然语言处理的对话机器人API和语音合成tss API | ## 四、人工智能概率性与用户痛点 腾讯云自然语言处理的情感分析和对话机器人,语音合成TSS,有以下优势: | 腾讯云自然语言处理的情感分析和对话机器人/用户痛点 |语音合成TSS /用户痛点 | |-----------------------------------------------------------|---------------------------------------------------------------------------------| | 1.识别性:对带有情感色彩的主观性文本进行分析、处理、归纳和推理,识别出用户的情感倾向,是积极还是消极,并且提供各自概率 | 1. 高拟真度:语音合成系统使用业界领先技术构建,具备合成速度快、合成语音自然流畅、合成语音拟真度高等特点,可用于多种应用场景,让设备和应用轻松发声,人机语音交互效果更加逼真。 | | 2. 灵活性:机器人通过前面的情感识别得知用户的情感,巧妙地和用户聊天 | 2. 灵活设置:支持中文、英文,可以合成中英混读语音。支持业务自选满足需求的音量、语速等属性。支持基础音频文件和实时音频流两种合成格式。支持电话、移动 App 等多种场景和合成效果选择。 | | 3.及时性:对话机器人运行的速度很快,所以当用户在发送文本的时候,机器人很快就做出响应 | 3. 多发声人:语音合成支持多种音色的男声、女声选择,覆盖电话客服、小说朗读、消息播报等多样化应用场景。 | 从上述表述中,可以知道该产品利用情感识别识别出用户的情绪,机器人系统根据情感识别出的正负面情绪来做出回复,但是机器人的词库里可能不会那么快更新“网络词”所以有时候不会100%的解决用户的烦恼。 **识别不准确的方法:多方因素共同作用导致事件具有不确定性** ## 五、需求列表(对应人工智能加值) | 序号 | api技术 | 用户场景 | 优先级 | |----|--------------|---------------------------|--------| | 1 | 对话情绪识别API | 通过用户输入的文字识别用户当时的情绪 | A(重要) | | 2 | 对话机器人 | 用户希望有人能和自己说说话 | A(重要) | | 3 | 语音合成API | 用户选择自己喜欢的声音来对自己讲话 | B(次重要) | ### 利害相关者分析 | 需求论证 | 详情 | | -- | -- | | 人工智能类型 | 人工智能机器人 | | 系统性偏差 | 机器人系统有时候检测不到用户说的是什么意思 | | ESG考量 | S:通过机器人的通话来解决那些有社交恐惧症的人的社交问题(类似再现实生活中社交) | ## 六、需求概述 #### 产品背景 随着生活节奏的加快,人们更多的时间都花在拼搏和忙碌的过程中,但是在这过程中,她们有着许多的喜怒哀乐、但是由于每个职业的工作时间不同,所以有部分的人即使身边有很好的朋友,也不敢打扰到别人,这是她们只能“自我消化”,但随着这种情绪的累计,慢慢地变成了心理疾病甚至是精神疾病,当前最普遍的就是——“抑郁症”。为了减少这种事情——“抑郁症”的发生,“数洞”就会成为她们的选择。但现今市场上的“树洞”一般都是只有用户的“输出”,没有“响应”。 #### 产品市场 经过搜索发现市场上有好几家都是主打“树洞”,类似在知乎上匿名发表话题,别人匿名回答类似,但是这些app只要是用户看见了就可以评论,所以难免会出点毛病——恶评,所以面对这些恶评,用户不但没有解决内心的问题,反而增加了消极的情绪。所以用户需要的是一个专属的“好朋友”,而且这些“好朋友”不单单是看用户发的文字,还是会和用户互动的。 #### 市场概述 * 心理情绪类产品的市场概述 “2019年,4月27日盖洛普发布了2019年《全球情绪状况报告》,发现世界各地的人们比以往任何时候都更丧了。盖洛普公司是1930年代美国著名的社会科学家乔治·盖洛普博士创立的,如今已是全球知名的民意测验和商业调查/咨询公司,2006年以来每年都会发布情绪报告。去年盖洛普对142个国家的成年人进行了151,000次采访,问到他们采访的前一天是否经历过负面情绪,其中39%表示担忧过,24%表示悲伤过,22%表示愤怒过,这三者数据相比往年都创下了新高。”——[《全球情绪状况报告》显示,全球人民都比从前更丧气了](https://new.qq.com/omn/20190427/20190427A07M3N.html) 如今心理情绪服务类APP层出不穷,各类心理咨询室也慢慢出现,而本项目APP就凸显出了其独特优势。与其它心理情绪服务类APP相比,本项目APP更加具有专业性、多样性。其他情绪心理服务类产品服务的主打功能是匿名化、树洞模式、很多都是但并没有虚拟机器人。 #### 市场特征 - 心理情绪类的市场广阔,因为目前人们的情绪问题是社会上的严重问题。 - 心理情绪类的产品种类杂并对品种单一,所以“听你说”app的发展空间广阔。 - 对产品技术要求较高,需要根据特殊情绪做出特殊的应对措施。 #### 发展优势 - 可以为独居、生活节奏快人群解决问题,会受此类人群的欢迎。 - 适应智能化时 代发展的需求,市场广阔,开发潜力大,具有开发价值。 - 目前市场已出现相关产品,可以借鉴学习。 ## 二、产品设计原型 1. 产品功能结构图 ![产品功能图](https://images.gitee.com/uploads/images/2020/0718/001402_c6ee8f69_2231122.png "原型流程图.png") 2. 用户流程图 ![用户操作流程](https://images.gitee.com/uploads/images/2020/0718/213336_310fa47c_2231122.jpeg "用户操作流程图.jpg") 3. 产品结构图 ![原型操作界面](https://images.gitee.com/uploads/images/2020/0718/213215_c4b847a0_2231122.jpeg "原型模式.jpg") 4. 数据流程图 ![数据流程图](https://images.gitee.com/uploads/images/2020/0724/125048_972b973e_2231122.jpeg "数据流程图.jpg") ### 5、产品原型机交互设计 #### 原型:[ **听你说** ](https://pil9bt.axshare.com) 1. 核心页面 ![核心](https://images.gitee.com/uploads/images/2020/0719/233518_6e55d9a4_2231122.png "主.png") 2. 主要页面 ![主页面](https://images.gitee.com/uploads/images/2020/0719/233539_d3d63259_2231122.jpeg "页面.jpg") ## 三、数据推理 | 问题/回答 | 内容 | |-------|-------------------------------------| | 问题1 | 我们在页面上呈现什么内容 | | 回答1 | 主要是通过用户发送的信息,然后情感识别得出的正负情绪;然后还有机器人回复的信息,若用户开启了语音回答,还有一段语音信息 | | 问题2 | 向用户输出的结果内容从哪里来 | | 回答2 | 去开放平台调用api,获得结果内容 | | 问题3 | 请求从哪里来 | | 回答3 | 用户通过设置来选择人物和语言就可以获得请求了 | | 问题4 | 如果页面出现识别错误,应该如何获取并处理数据,正确数据的信息从哪里来 | | 回答4 | 通过用户的反馈进行信息获取,通过用户的自愿反馈扩大数据库,强化机器学习 | * 数据IDEO三要素 | 数据流程三要素 | 体现 | |----------|---| | 技术可行性 | 由于现在人工智能技术的逐渐成熟,智能应用的正确率不断提高,所以用人工智能来解决用户的简单的情绪问题是可行的 | | 商业可行性 | 通过引入一些兼职心理的医生来获得专业性,对于那些学心理学专业的大学生再有空闲时间的时候做兼职 | | 用户可欲性 | 因为产品会有通过推荐新用户使用来获取福利——新角色/新音色,所以这种白嫖的福利是很诱惑用户的 | ## 四、产品使用可行性 ### IDEO三要素 ### 1、用户可欲性 * 功能基本满足目标用户需求,用户可欲性强 * 除识别用户的情绪外,用还可以自行选择自己喜欢的语音 * 界面设计符合产品调性 ### 2、商业可行性 * 对于情感类的产品在APP市场上会比较少,但当今社会上人们的情绪越来越复杂,所以开发情感类的市场前景较好 * 该产品具有明确的核心价值和使用需求,产品的市场未来需求趋势逐步增长 * 除默认的人物外,用户可通过购买或完成任务来获得声音或人物 ### 3、技术可行性 * 有平台可以直接调用相关API,且技术成熟稳定 * 该产品API存在小概率的技术风险,但是此小概率风险对用户体验的负面影响不会压过正面影响的机率 * 对比了多家平台的API,选择了较为精确稳定的API对产品进行加值 ## 五、API产品使用及输出展示 ### 一、API的运用 (一)情感识别和对话机器人 腾讯云平台(自然语言处理里情绪识别API和对话机器人) [情感分析的使用说明](https://cloud.tencent.com/document/product/271/35497) [对话机器人的使用说明](https://cloud.tencent.com/document/product/271/39416) 情感分析的接口描述:情感分析接口能够对带有情感色彩的主观性文本进行分析、处理、归纳和推理,识别出用户的情感倾向,是积极还是消极,并且提供各自概率。 对话机器人的接口描述:闲聊服务基于腾讯领先的NLP引擎能力、数据运算能力和千亿级互联网语料数据的支持,同时集成了广泛的知识问答能力,可实现上百种自定义属性配置,以及儿童语言风格及说话方式,从而让聊天变得更睿智、简单和有趣。 接口请求域名: nlp.tencentcloudapi.com 请求方法:GET、POST 输入与输出的源代码截图 ![情绪识别](https://images.gitee.com/uploads/images/2020/0718/234740_d827edf9_2231122.jpeg "识别情绪.jpg") (二)语言合成TTS 腾讯云开放平台(语言合成TTS) [语言合成TTS](https://cloud.tencent.com/product/tts) [使用说明](https://cloud.tencent.com/document/product/1073/34087) 接口描述:腾讯云语音合成技术(TTS)可以将任意文本转化为语音,实现让机器和应用张口说话。 腾讯 TTS 技术可以应用到很多场景,例如,移动 App 语音播报新闻,智能设备语音提醒,支持车载导航语音合成的个性化语音播报。本接口内测期间免费使用。 接口请求域名:tts.cloud.tencent.com/stream 请求方法:POST 输入与输出的源代码截图 ![语言输出](https://images.gitee.com/uploads/images/2020/0719/232120_8762f369_2231122.png "语音输出.png") ![声音合成](https://images.gitee.com/uploads/images/2020/0718/234813_48563ade_2231122.png "多种声音.png") ### 二、API对比 * [腾讯语音合成](https://cloud.tencent.com/product/tts) 腾讯云语音合成满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多种音色选择——共有12种音色,支持自定义音量——可调节0-10音量、语速——可调节0至2倍速,让发音更自然、更专业、更符合场景需求。语音合成广泛应用于语音导航、有声读物、机器人、语音助手、自动新闻播报等场景,提升人机交互体验,提高语音类应用构建效率。此外,腾讯云支持为企业客户定制发声人。 * [百度AI语言合成](https://ai.baidu.com/tech/speech/tts_online) 百度百度的语音合成拟人度高,读取过程流畅自然,准确度高,在标点停顿方面都做的较好,且支持多种参数配置,可根据场景需求对音库的语速——最高可达15倍、音调、音量进行灵活设置,满足个性化需求,童声提供基础音库5种,其中情感女声2种,情感男声1种,女童声1种,男童生1种,发音人的音色各不相同,能很好满足不同性别的儿童和成人的需求;但百度语音合成有一点是其中文播报的音色和英文播报的音色不同,当在念中文时突然出现英文会出现音色不同的现象 **总结分析**:总体来说,腾讯云开放平台的语言合成的在线语音合成更胜一筹,其流畅度和拟人度都较高,且在发音人的选择上更契合本产品的需求,它还可以满足文本转化成人化语音,这可以减少使用一个文本转换语音的API。 ### 三、API的使用价格 自然语言处理(对话机器人和情感分析)价格 ![自然语言](https://images.gitee.com/uploads/images/2020/0719/233912_bb87a321_2231122.png "自然语言价格.png") 语音合成TTS价格 ![语音合成](https://images.gitee.com/uploads/images/2020/0719/234009_c2649ec7_2231122.png "合成语言.png") ### 四、API使用风险评估 **产品使用可行性:** 1. 技术方面可行性 * 该产品具有明确的核心价值和使用需求 * 该产品中的关键功能部分,选择了精准度高、符合用户痛点的API加值 * 调用的API技术风险小,且存在的小概率风险对用户体验的负面影响不会压过正面影响的概率 2. 市场方面可行性 * 用户需求明显,最小可行性功能能满足用户需求 * 用户群体广泛,青少年、成年人、中年人和老年人都可以使用,产品的市场未来需求趋势逐步增长 **错误现象及处理办法:** 1. 情感识别识别出用户的情绪,机器人系统根据情感识别出的正负面情绪来做出回复,但是机器人的词库里可能不会那么快更新“网络词”所以有时候不会100%的解决用户的烦恼,所以需要后续功能的完善 2. 在圈子评论别人的贴子可能会引起别的用户不开心。这时需要app运营人员来圈子“净化环境” ### 五、竞品分析: | 竞品 | 简介 | 产品定位 | 功能体验 | 优势 | |----|----|------|------|----| | 松果倾诉app | 松果倾诉是一款通过智慧共享模式,提供C2C付费倾诉服务的APP软件,主打情感倾诉和泛心理行业咨询,能够为需要倾诉的用户,提供情感、恋爱、婚姻、家庭、心理、生活、亲子、教育、职场、校园、健康等问题咨询服务。| 松果倾诉将倾诉者和倾听者连接在一起,为倾诉者提供多种情绪倾诉服务,以及多种问题咨询服务。同时帮助拥有专业资质的导师,和过往经验的过来人,获得价值肯定和提供就业机会。 | 应用上拥有不同专业的倾听者:情感咨询师、婚姻家庭咨询师、心理咨询师、职业规划师、催眠师、律师、各种背景过来人(海归、创业者、超能妈妈、教育达人、同性友人···)等,为用户在线提供情感、恋爱、婚姻、家庭、心理、生活、亲子、教育、职场、校园、健康等问题咨询服务。 | 1. 保障隐私 2. 多种话题3. 倾听专业 | | 随喵app | 随喵是国内首款在线匿名随机聊天陌生人社交app工具,你可以通过随喵找到同一时间跟你一样无聊的人进行聊天。不需要注册,不提供个人资料信息,所有人均以系统默认设定的名字进行聊天,所有人都不知道对方是谁。 | 随喵是随梦网络开发的首个基于iPhone的手机应用,有别于微信、微博、QQ、陌陌等手机社交软件。不需要注册,没有个人资料,不能问性别,不看脸,形成纯粹、干净、轻松的聊天环境。 | 1、提供实时在线随机聊天 2、所有聊天均在匿名的情况下,谁都不知道对方是谁 3、可以吐槽任何不开心的事,可以分享你的喜怒哀乐,匿名的朋友圈。 | 1、实时在线随机 2、不需要注册 3、没有个人资料 4、树洞,喵趣功能 5、跨地域 | #### 竞品与本产品的差异: | 竞品 | 本产品 | |----|----| | 付费 | 可免费(可通过完成任务来免费获得一些功能) | | 真人回复 | 机器人回复 | | 不需要注册 | 需注册 | * 总结:竞品和本产品都有各自的优势,但是本产品充分利用人工智能——机器人,所有在很大程度上减少了成本(对于松果倾诉app)。注册是为了保证用户的圈子的干净。 ### 六、该产品未来的发展路线构想 * 发展理念:由于用户在使用的时候需求会不断的涌出,所以可以通过用户的反馈集合来完善并开发新功能。 #### 产品迭代过程构思 | 版本 | 内容 | |-------|-------------------------------------| | v1.0 | 完善功能:实现机器人和用户之间的简单聊天 | | v1.1 | 完善功能:添加不同机器人的性格,完善界面 | | v1.2 | 添加新功能:实现人机对话,争取可以语言通话 | | v2.0 | 添加新功能:机器人主动向用户问候 | | v2.1 | 完善功能:用户可以通过推荐新用户使用,那么用户可以集人物,而不用付费 | ### 七、心得总结及感谢 总结:正真学到的东西就是通过看api文档学会了调用了api,由于作业要求要使用Axure软件,所以在短时间内摸索到了Axure软件。这学期知道很难,那些“文字课”知道完全听不懂,听不懂还要提交任务真的太难了。(真心说这门课积极的内容我是真的想不到了) 感谢:谢谢这个期末作业的要求让我意识到我的理解能力有太差了!还有就是不逼自己一把也不知道自己有多能熬夜甚至通宵!