# API-Light **Repository Path**: SuSC/API-Light ## Basic Information - **Project Name**: API-Light - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2020-07-16 - **Last Updated**: 2025-12-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 迭代的增量改进 1.完善了用户旅程地图的内容 2.完善了学习/实践心得总结及感谢，对使用他人资源说明清楚合理，感谢语展示了对同行/同侪成果的尊重 3.新增了高水平原创图表 4.修改了ppt的内容 |文档名称|Light—产品需求文档| |--|--| |产品作者|苏健星| |产品名称|Light| |产品描述|一款利用英语作文批改、机器翻译来帮助英语自学者解决在学习英语时无人批改英语作文、看不懂无字幕视频的痛点，并且全面提高英语能力的APP| |产品加值|英语作文批改（图像识别）api + 英语作文批改（文本输入）api技术 + 语音翻译api技术 + 图片翻译api技术| |产品原型链接|Light| # Light ## 加值宣言我认为目前市场上能对英语自学者的作文进行批改和发音的指正进行有效及高效整合的产品还没有出现，Light APP就是针对该漏洞对现在已有的英语作文类APP和英语翻译类APP进行整合并加值和优化。其中，该APP使用到的人工智能技术有英语作文批改（图像识别）api技术、英语作文批改（文本输入）api技术、语音翻译api技术、图片翻译api技术，这些技术的综合运用能更好更有效的解决英语自学者在学习英语时无人批改英语作文、看无字幕视频时遇到的困难。 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0717/231145_2df5f3c2_2229263.png "屏幕截图.png") ### 核心价值宣言（最小可行性产品）着眼于解决英语自学者能够批改英语作文和语音翻译的最基本需求。Light将提供用户英语作文批改（文本输入）和英语作文批改（图像识别）、语音和图片翻译的服务功能，**以用户为中心，帮助用户走对路、走好路**。 ## 人工智能概率性 > 机器翻译是人工智能的一个重要领域，英语作文批改技术也逐渐走进人工智能的大舞台，有以下优势： |机器翻译中的语音翻译技术优势/用户痛点|英语作文批改技术优势/用户痛点| |:--:|:--:| |1. 语种丰富：提供27种语言高质量翻译服务，覆盖中、英、日、韩、俄、葡等热门语种——保证用户与外国友人之间的有效沟通|1.批改速度快：英语作文批改速度极快——能让用户快速得到作文批改结果，比人工批改要快许多| |2. 准确性高：基于有道云丰富的海量数据，利用深度学习技术及精准的算法迭代模型，不断提高准确性——提高翻译的准确性|2.准确性高：基于有道云丰富的海量数据，利用深度学习技术及精准的算法迭代模型，不断提高准确性——能让用户清晰的了解作文的优点和缺点| |3. 翻译速度快：语音识别的速度极快——保证用户在用来翻译外国友人说的话时不需要等待太久|3.图像识别批改：很好的识别英语——已经写好的作文可以直接拍照识别批改，不需要再次打字上去批改| 所以，该产品利用机器翻译中的语音翻译功能可以让我们与外国友人聊天时通过及时的翻译来进行正常沟通，翻译速度和准确率非常高，仅存在少部分用户由于发音过于不标准或模糊等因素而导致翻译不出来，这种情况为少概率事件，在普遍情况下都可以使用。另外，英语作文批改功能在批改作文时速度快，且能清楚的解剖作文的优缺点，还能进行图像识别修改，仅存在少部分由于字体模糊潦草的情况识别不出来，这也是概率较小的事件，对正面影响并不大。翻译和识别不准确的方法：机器自身的深度学习 ## 问题表述与需求列表 API驱动之智能产品，为产品进行智能加值，以“以人为本”的思维进行产品研发，满足用户的需求，解决用户痛点 ### 问题表述 **用户画像1** 使用场景：啊鑫是高三学生，英语作文分数不高。平时作文练习和考试分数都不高，但是老师也没有给评语，不知道自己的作文的问题到底出在哪里。于是他打开Light APP，把作文扫了一遍，成功的找到了作文的语法和句式错误并加以改正。群体：学生场景：需要学习英语年龄：18岁增长/益点：想学到不同的作文好词金句痛点：高考英语作文分数占比较高，而老师批改作文时又不是非常仔细。 --- **用户画像2** 使用场景：啊智平时有空的时候就看英语单口相声，但是有个地方观众都在大笑，而他却因为没听出来英文而不能理解笑点在哪。于是他打开Light APP，录下那一段的声音，得到了那段录音的翻译之后他哈哈大笑，又继续开心的看起来。群体：工作者场景：喜欢看英语单口相声年龄：33岁增长/益点：能在不同英语口语语速下练口译痛点：有些笑点由于听不出是什么意思导致理解不到经过对市场上英语作文类APP和机器翻译类APP的调查，虽然各自都能满足各自的用户需求，但是有许多用户是同时使用这两种APP的，然而将这些内容进行整合并将中国英语自学者作为核心用户的APP少之又少。另外，虽然人工智能和人工神经网络技术的发展极快，但在作文批改的领域，对于作文的拍照识别批改和文本批改的应用程序依旧处于起步阶段，从而出现以下**用户痛点（问题）**： |序号|用户痛点（问题）| |--|--| |1|在自学过程中因无人批改英语作文而不知句式语法是否正确| |2|批改英语作文的APP较少，且分析的较为粗糙，难以真正理解如何修改更好| |3|自己在练习无字幕视频口译的时候，不知翻译内容是否正确| |4|看到优秀的英语范文，不知道还能不能修改的更好| **用户旅程地图---使用阶段** * 用户旅程图节选“使用”阶段，更好地突出用户在使用过程中的感受等方面，快速了解用户需求，并作出相对应的解决方案 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0723/105112_0e3e6dcf_2229263.png "屏幕截图.png") ### 需求列表 * 需求优先级 |优先级|需求|智能加值？|API类型| |:--:|:--:|:--:|:--:| |1|翻译美剧中无字幕的语音|是|有道云AI中的语音翻译| |2|拍照优秀的英语范文，学习范文的优点|是|有道云AI的英语作文批改（图像识别）| |3|在网上看到英语美文却看不懂，进行图片翻译|是|有道云AI的图片翻译）| |4|用户在电脑上写的作文进行批改|是|有道云AI的英语作文批改（文本输入）| **API产品对比** - [有道的图片翻译价格](https://ai.youdao.com/DOCSIRMA/html/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E7%BF%BB%E8%AF%91/%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7/%E5%9B%BE%E7%89%87%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1/%E5%9B%BE%E7%89%87%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1-%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7.html) ![有道的图片翻译价格](https://images.gitee.com/uploads/images/2019/1223/162646_d7592ab3_1648222.png) - [百度的图像识别价格](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/gk3bcx9n1)：每日500次免费调用额度，免费额度用尽后按照如下价格进行计费。如需付费使用，您可开通按调用量后付费或者预购单价更低的次数包进行抵扣。 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/000924_a8800679_2233429.png "微信图片_20200716000909.png") - [有道云的语音翻译价格](https://ai.youdao.com/DOCSIRMA/html/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E7%BF%BB%E8%AF%91/%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7/%E8%AF%AD%E9%9F%B3%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1/%E8%AF%AD%E9%9F%B3%E7%BF%BB%E8%AF%91%E6%9C%8D%E5%8A%A1-%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7.html)： ![输入图片说明](https://images.gitee.com/uploads/images/2019/1223/162645_21464dd8_1648222.png) - [百度的语音识别别价格](https://ai.baidu.com/ai-doc/SPEECH/Jk38lxn2j)：分段阶梯后付方式，调用单价随用户当前自然月累积调用量所落阶梯区间而变化。月初，用户累积调用量清零，同时重新开始累计调用量。系统按用户实际使用实时扣费，具体价格如下： ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/001707_fd59707e_2233429.png "微信图片_20200716001652.png") - [有道云的英语作文批改价格](http://ai.youdao.com/DOCSIRMA/html/%E4%BD%9C%E6%96%87%E6%89%B9%E6%94%B9/%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7/%E8%8B%B1%E8%AF%AD%E4%BD%9C%E6%96%87%E6%89%B9%E6%94%B9/%E8%8B%B1%E8%AF%AD%E4%BD%9C%E6%96%87%E6%89%B9%E6%94%B9-%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7.html): ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/151151_67d9b863_2229263.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/151202_fa2eb521_2229263.png "屏幕截图.png") - [百度的作文检索价格](https://ai.baidu.com/ai-doc/KG/zk3hbfg55)： ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/150935_1be315a7_2229263.png "屏幕截图.png") ## 解决方案原型表述 **问题1：该产品如何做界面及数据流程的设计？** 答：根据用户痛点、“以人为本”的观念进行产品的研发，根据“问题表述和需求列表”栏中描述的问题和需求，对问题进行方法分析以及智能加值的运用，数据流程该部分以创新思维、数智思维来考虑相关问题，做到解决用户需求、满足用户体验。使用界面原型制作工具—墨刀，进行原型构建；使用processon流程图缕清界面和数据思路。 **问题2：该产品智能流程中是什么关键智能交互及什么关键智能API结合，进而解决谁的问题？** 答：运用四种关键智能API，分别是英语作文批改（文本输入）API、英语作文批改（图像识别）api、图片翻译API和语音翻译API。关键智能交互分别是，在调用英语作文批改API时，可以直接在APP中的“作文批改”页面上选择“拍照作文批改”或“输入作文批改”，识别作文后反馈相应数据；在调用翻译API时，可以在“翻译”页面选择“语音翻译”或“输入文本翻译”，识别内容之后反馈相应数据。解决问题：调用翻译API解决用户“看不懂无字幕视频”的痛点；调用英语作文批改API解决用户“无人批改自己写的英语作文”的痛点。 ### 界面及关键智能交互 **界面流程图** ![输入图片说明](https://images.gitee.com/uploads/images/2020/0718/002850_5b89d30d_2229263.png "屏幕截图.png") 从IDEO三要素（商业可行性、技术可行性、用户可欲性）的角度来论证其MVP加值从**商业可行性**的角度分析，2018年至2019年，翻译行业全球前100强企业收入增长11.5%，相比之下，2017年至2018年为17.5%。前十名中，与2018年相比增长11.8%，前50名增长9.7%，排名50至100的其他球员增长15.8%。与去年的排名相比，宏观经济因素为媒体和娱乐（M&E）以及整体贸易等部分行业创造了一种观望模式。尽管增长放缓，但对于这样一个规模的行业来说，市场仍在以健康的速度增长。就目前的形式来看，全球变化较快且不可预测，未来在英语作文批改行业发展将充满更多变数，需要密切关注市场的发展动态。此外，5G将允许物联网（IoT）正常启动。这将产生更多的内容，这也将影响英语作文批改，一旦5G普及，英语作文批改的市场将进一步增长。从**技术可行性**的角度分析： |有道云AI开放平台中的语音翻译的技术优势/用户痛点|有道云AI开放平台中的图片翻译的技术优势/用户痛点|有道云AI开放平台中的英语作文批改的技术优势/用户痛点| |:--:|:--:|:--:| |可识别语种多：支持识别粤语、普通话、英语、法语等35种语种|可识别语言多：支持识别中文、日文、英语等14种语言|可识别内容广泛：支持识别小学、初中、高中、四级、六级、考研、托福、GRE、雅思等级别的英语作文| |反馈数据可靠|反馈数据可靠|反馈内容详细，并且有针对性| |可以快速进行中英文互译：支持自动识别中文、英文|输入效率高：基于文字识别与文本翻译技术，结合组段和渲染技术，满足用户翻译图片文字的需求|| 从**用户可欲性**的角度分析，从目前来看，翻译技术和英语作文批改技术市场份额逐年增长，越来越多的相关产品层出不穷，也不断满足人们日益增长的需求，但在一些较为专业的、需要较高精确度的领域需要实现无差错的翻译或者批改，还是有一定难度的。在英语作文批改APP应用领域，目前已有一些相应的应用程序，但是数量相对其他领域来说还是比较少的，依旧处于起步阶段。 ### 数据流程及关键智能API使用 **数据流程图** * 数据流程图说明：数据流程大致分为三大部分，分别是“英语作文批改（图片识别）”、“英语作文批改（文本输入）”和“翻译”。“作文批改”界面的数据流程是通过选择“拍照作文批改”或“输入作文批改”，若选择“拍照作文批改”，可以通过拍照或者图片上传图片，触发有道云AI开放平台英语作文批改（图片识别）（智能加值）的调用，进行缓冲识别，识别成功后，反馈英语作文批改结果数据（智能加值），该部分数据解决用户“无人批改英语作文”的痛点；若选择“输入作文批改”则通过一篇英文作文，选择对应的英文级别，触发有道云AI开放平台英语作文批改（文本输入）（智能加值）的调用，进行缓冲识别，识别成功后，反馈英语作文批改结果数据（智能加值），该部分数据解决用户“无人批改英语作文”的痛点；“翻译”界面的数据流程是通过选择“语音翻译”或“图片翻译”，触发有道云AI开放平台语音翻译或图片翻译（智能加值）的调用，进行缓冲识别，识别成功后，反馈目标语言的翻译（智能加值），该部分数据解决用户“看不懂无字幕视频”的痛点。 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0718/204448_a608b4d6_2229263.png "屏幕截图.png") |数据来源|数据方案| |:--:|:--:| |有道云AI开放平台英语作文批改（图片识别）API|快速批改作文| |有道云AI开放平台英语作文批改（文本输入）API|快速批改作文| |有道云AI开放平台语音翻译API|快速对英语语音进行翻译| |有道云AI开放平台图片翻译API|快速对英语图片进行翻译| 以上两种智能加值主张中，从IDEO三要素（商业可行性、技术可行性、用户可欲性）的角度来论证其MVP加值。从**商业可行性**的角度来说，所反馈的数据结果的收集有一定的可持续、循环价值，即再次反馈给用户加深记忆；同时，有一定的商业价值，即储存数据，用数据变现，出售给相关英语产业（电商等）。从**技术可行性**的角度来说，有道云AI开放平台的英语作文批改API及翻译API后台相关数据库强大，所储存数据多类，反馈数据全面且清晰，具有借鉴意义。从**用户可欲性**的角度来说，结合用户痛点，调用API数据（智能加值），对反馈数据结果进行数据储存和再加值，使用户充当“使用数据”和“再使用数据”的角色。 **代码块** 有道云开放平台——语音翻译（本产品使用的api平台） - 接口描述：语音翻译API接口提供上传音频，将音频进行语音识别并翻译成文本的服务，目前开放中英互译的语音翻译服务。您只需要输入一段完整的语音，通过对应一个SessionUuid，语音分片内容进行 Base64 编码后，通过POST请求方式，就可以进行翻译。 - 请求方法：POST **api输入与输出** ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/142715_71a06de8_2229263.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/142733_6e27b065_2229263.png "屏幕截图.png") 有道云开放平台——图片翻译（本产品使用的api平台） - 接口描述：图片翻译API接口提供有道的图片文字识别翻译服务。您只需要通过调用图片翻译API，传入图片的Base64编码，指定源语言与目标语言，通过POST请求方式，就可以识别图片中的文字并进行翻译。 - 请求方法：POST **api输入与输出** ![输入图片说明](https://images.gitee.com/uploads/images/2020/0716/142351_2a30a5ef_2229263.png "屏幕截图.png") ## 学习/实践心得总结及感谢随着智能化时代的到来，许多产品陆续引入API技术，使其变得更加智能与便捷。“API机器学习与人工智能”课程的开设，让我对API相关知识有些许了解，从课上的实践项目中，也尝试过“人脸识别”和“图像识别”API的操作与使用，在当中体验到API技术的强大。课上的知识点也设计API产品的设计思维，由于技术有限，对部分内容了解不是很到位，会通过后续学习，慢慢完善相对应的内容。本文档写作进一步对“API机器学习与人工智能”课程的深化实践，结合课上知识，并引入“产品经理”和“用户视觉设计”课程的知识进行相关问题的思考和产品原型的制作。特别感谢有道云AI开放平台提供的语音翻译服务API，图片翻译服务API，英语作文批改（图像识别）API和英语作文批改（文本输入）API代码对产品的技术支持。调用四种API，解决用户“看无字幕美剧”的痛点、解决用户“无人批改英语作文”的痛点。同时感谢这一学期老师的指导与同学的协助，收获彼多，感激不尽。 * 产品原型 * * * * * * * * * * * * * * * * * * 此文档写作参考文献： * [英语学习APP研发市场需求分析](http://www.cnki.com.cn/Article/CJFDTotal-XZHH201804007.htm) # 迭代的增量改进 * [diff链接](https://gitee.com/SuSC/API-Light/compare/88d90c9b89667b9fcbd957565f0b08d851104705...cb36427440a0b90fc31eccedfba28729cea7c4ac)