# API learning-note **Repository Path**: zhou-yunpeng/api-learning-note ## Basic Information - **Project Name**: API learning-note - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-03-28 - **Last Updated**: 2022-07-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # API_期末项目 |文档名称|氚锶镭铽 智能视频翻译软件— 产品需求文档| |:--:|:--| |产品名称|氚锶镭铽| |产品描述|一款能够对没有字幕的外语视频进行中文翻译并产生字幕的智能化翻译APP| |产品版本|1.0| |文件作者|周云鹏| ## 一丶MVP加/价值主张宣言 #### 项目简介 ##### 1.APP介绍 “氚锶镭铽”,是英语单词translate的中文音译,也就是翻译的意思,它是一款智能视频翻译软件。 ##### 2. 问题情境 在日常生活中,有许多人热衷于看美剧、日剧、泰剧、韩剧等外语电视剧,或者是喜欢看一些国外的教学视频。
其实,一句话概括来说,就是国内对于外语视频的需求是非常广的,这也就衍生了很多字幕组专门去从事对外语视频的翻译工作。
但是人毕竟不是机器,不能每时每刻都在工作,而群众又想更快地看到带有字幕的外语视频,因此字幕组在“快速”满足群众的字幕需求这一点上,还是存在局限性的。
并且,也不是所有的外语视频都有字幕组去翻译,而刚好这些没字幕组翻译的视频也有自己的受众,这就造成了一个“翻译缺口”。
所以,群众需要一个能够更快速,更自主的方式来获取带有字幕的视频。 ##### 3. 解决方案 通过调用语音翻译、文本纠错、依存句法分析、DNN语言模型等API功能,让群众能够随心所欲地使用“氚锶镭铽”对外语视频进行智能化、精准化的翻译。 ![解决方案](image/解决方案.png) --- ## 二、问题需求 ### 1. 使用情境与用户画象 ![使用情境与用户画象](image/用户画像和使用场景.png) ### 2. 需求列表 - “优先级”由“A”到“D”依次降低,既“A”最高,“D”最低。 - “优先级”的评分为“相对值”而非“绝对值”,以下所提到的每一个用户需求与API功能都同样重要,只是彼此之间相对而言优先级不一样。 用户需求 | 智能加值 | 使用API | 优先级 | ---- | ---- | ---- | ---- 快速获取带有中文字幕的外语视频 | 通过机器翻译将视频中的声音进行语音识别并翻译成中文文本 | 语音翻译API| A 生成的字幕匹配度要高| 通过语言处理技术来提高字幕的匹配度 | DNN语言模型API | B 生成的字幕结构要完整,语句要通顺| 通过自然语言处理来分析字幕结构 | 依存句法分析API| C 对错误的字幕进行纠错 | 通过自然语言处理来识别错误的字幕并进行纠错 | 文本纠错API | D ### 3. 需求论证之利害相关者分析 #### 3.1 利害相关者分析图 ![利害相关者分析图](image/利害相关者分析图.png) #### 3.2 关键API人工智能类型 **使用的API** 语音翻译、依存句法分析、DNN语言模型、文本纠错等API **人工智能类型** 弱人工智能。 **对解决方案的可能关键影响** 以上API功能结合在一起能够起到快速、精准的翻译外语视频内容的作用。
不过,字幕在一定程度上是文化的反映,以上API功能都是弱人工智能,它们受限于其薄弱的认知能力,难以完全地了解到视频背后所蕴含的文化。
因此通过它们翻译出来的字幕难免会存在些许纰漏,这是无法避免的。 **系统性偏差** 比起人工翻译,虽然机器翻译会更快,但是在准确率上还是难以完全和人工相比的。
不过随着技术的不断进步以及产品的不断优化,在未来,该产品的翻译功能会越来越强,产出的字幕质量一定也会越来越高。 #### 3.4 ESG考量 **ESG问题** - 使用APP时,APP需要获取用户手机的后台权限,在一定程度上,用户的隐私安全会存在隐患。 **ESG机会** - 撰写承诺书,并建立信息保护机制,承诺不泄露、不盗用用户的后台信息,保护用户的隐私安全。 --- ## 三、解决方案:界面流程及关键智能交互 ### 1. 原型及界面设计 - 交互原型:[体验链接](https://v6test.ao.cc/app/design/pbkkc6lxqllnkme) ### 2. 用户旅程 ![用户旅程](image/用户旅程地图.jpg) ### 3. 关键智能API思路方法之DFV模型及商业模式、价值主张画布 #### 3.1 用户可欲性 Desirability APP提供的视频翻译功能能够满足国内庞大的观看需求,并且APP的操作十分简单,不会过于繁琐,只需要用户将下载的外语视频上传至APP,APP便会在短短几分钟内使用API功能识别视频中的语言,并对其进行翻译,之后便在视频底端生成高质量的字幕,让用户的观看体验得到质的飞跃。 #### 3.2 技术可行性 Feasibility 通过调用API的语音翻译、依存句法分析、DNN语言模型、文本纠错等,在满足用户“有字幕”的需求的前提下,进一步优化字幕的质量,让字幕能够更好地与视频内容相匹配,令用户享受到更好的观看体验。 #### 3.3 商业可行性 Viability 作为我们调用API的主要平台,腾讯云和百度智能云能够为我们提供一定数量的免费API调用额度以及便宜实惠的额度套餐服务,这大大降低了我们调用API功能的成本,让我们可以把更多部分的财力与精力放在“加强字幕质量”上。
在盈利模式上,我们会开设会员制度,喜欢我们产品的人可以选择自愿充值会员支持我们,我们也会给予会员更多的优质服务,例如“字幕样式diy”,“视频支持蓝光画质”等等。这也在一定程度上降低了我们的运营成本,以及提升用户的黏性。 #### 3.4 商业模式画布 ![商业模式画布](image/商业模式画布.jpg) #### 3.5 价值主张画布 ![价值主张画布](image/价值主张画布.jpg) ### 4. 界面流程图 ![界面流程图](image/界面流程图02.jpg) 。 --- ## 三、解决方案:数据流程及关键智能API使用 ### 1. 数据流程图分析 ![数据流程图](image/数据流程图.png) ### 2. 产品设计成果之DFV模型 #### 2.1 用户可欲性 Desirability 功能简单且强大,用户只需将下载的视频上传至APP,耐心稍等几分钟后便能享受到新鲜出炉的“熟肉”视频了,对于用户来说非常快捷方便。 #### 2.2 技术可行性 Feasibility 腾讯云和百度智能云提供的API功能十分强大且稳定,通过识别、翻译、完善语言结构、对语言进行纠错等一系列缜密的数据流程,能够保证在大多数情况下,APP生成的字幕都可以满足用户的需求。 #### 2.3 商业可行性 Viability 虽然市面上已经盛行了许多翻译的软件,但是都是偏向于纯文本或者是图片文本翻译,至今还没有出现一款主攻视频内容翻译的智能化翻译软件,结合国内有大量的热爱观看国外视频的用户的情况,可以得出国内在视频内容翻译这一块儿领域里还存在着庞大的市场的结论。 ### 3. API代码 [代码测试链接](https://gitee.com/zhou-yunpeng/api-learning-note/blob/master/API%E4%BB%A3%E7%A0%81%E6%B5%8B%E8%AF%95.py) #### 3.1 腾讯云 - [语音翻译](https://cloud.tencent.com/document/product/551/16611) ##### 作用:翻译视频中声音的内容。 ##### 范例 输入: ```python import json from tencentcloud.common import credential from tencentcloud.common.profile.client_profile import ClientProfile from tencentcloud.common.profile.http_profile import HttpProfile from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException from tencentcloud.tmt.v20180321 import tmt_client, models try: cred = credential.Credential("AKIDnRvQlxzUebS8aowOjqhOWieJ5SbViLOC", "iFeqxoNjqiRGyWzTq9qX9bt1yDIRXTEo") httpProfile = HttpProfile() httpProfile.endpoint = "tmt.tencentcloudapi.com" clientProfile = ClientProfile() clientProfile.httpProfile = httpProfile client = tmt_client.TmtClient(cred, "ap-guangzhou", clientProfile) req = models.SpeechTranslateRequest() params = { "SessionUuid": "2", "Source": "en", "Target": "zh", "AudioFormat": 83886080, "Seq": 0, "IsEnd": 1, "Data": "//uUBAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAWGluZwAAAA8AAAE0AAGKgAAAAQIDBQcJCgwOEBITFBQVFhcXGBocHiEmKCstMTM2Oj1AQ0VJTE5SVVhcYGRoa21wc3d5fYKFiY6QlZean6Wqr7G1uby/xMjMz9LW2Nzh5ejr7vDx8/X39/j5+vr7/P39/v8AAAAoTEFNRTMuOTlyBKUAAAAAAAAAADUgJAPAhQABuAABioAR/3e2AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA//sUBAAP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAETEFNRTMuOTkuNVVVVVVVVVVVVVVVVVVVVVVVVVVMQU1FMy45OS41VVVVVVVVVVVVVVVVVVVVVVVVVVVV//sUBB4P8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVMQU1FMy45OS41VVVVVVVVVVVVVVVVVVVVVVVVVVVV//sUBDwP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVMQU1FMy45OS41VVVVVVVVVVVVVVVVVVVVVVVVVVVV//sUBFoP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVtxhpSfwAEmZ41VkLgYMGd5wUabi9zwYjY9qZxAZeQ//sUBHgP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEYukXHBDx4ZDMPDD3mdwbcYaUn8ABJmeNVZC4GDBnecFGm4vc8GI2PamcQGXkGLpFxwQ8eGQzDww95ncF//sUBJYP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEIVLvltV62mXKhOSYlrJxKceygRTt8RKGwPrkxXPmnP2kEQ+rSkQVxMxZohrCQFZLg6kblfmzo8CAwgoU//sUBLQP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEbZ//7EqQqXfLar1tMuVCckxLWTiU49lAinb4iUNgfXJiufNOftIIh9WlIgriZizRDWEgKyXB1I3K/NnR//sUBNIP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAE4EBhBQo2z//2JZLZK2kAnAAAyRDU4jAgRBUHD6NUmcMQNMsLc1Zl1N4ZZoo7ywtCgOEbtEuMUk39uP+L//sUBOGP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEJbJW0gE4AAGSIanEYECIKg4fRqkzhiBplhbmrMupvDLNFHeWFoUBwjdolxikm/tx/xbY7bIUQpBAAkAb//sUBOGP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEAOlScJwnMiWLCgSODDQZGsTyU8Pj8MuDB0czf0UGBlxpQRsOhcwtKWWf9Zg3fWxVsdtkKIUggASANgHS//sUBOGP8AAAaQAAAAgAAA0gAAABAAABpAAAACAAADSAAAAEpOE4TmRLFhQJHBhoMjWJ5KeHx+GXBg6OZv6KDAy40oI2HQuYWlLLP+swbvrYpd7bdkkgpWwAvEHQ1Yez//sUBOGP8AAAaQAAAAgAAA0gAAABAAAB/gAAACAAAD/AAAAEpIfro00CqWBFsyUxjYMrpy1DLSKbE8hn3ymMtY5BgJnxEIXg3Uxmz/2b227JJBStgBeIOhqw9nSQ/XRp//tkBP+BEWoYTWGIMjotQwmsMQZHSCR3LSelhwEEjuWk9LDgoFUsCLZkpjGwZXTlqGWkU2J5DPvlMZaxyDATPiIQvBupjNn/smkj0RIBdcAHZxhotVQyQq40ACOiYA5apEzSrwkOHk1/6Kq9Lkg8ELD8yOQoXMWdPgKaFfdpsNrPMdFSYnmkj0RIBdcAHZxhotVQyQq40ACOiYA5apEzSrwkOHk1/6Kq9Lkg8ELD8yOQoXMWdPgKaFfdpsNrPMdFSYnVlrrrhSBVsAEVhnUCxIjkNE608q3qsSrkwyR3rsAVFOHVQ6GTUxzUs3PlM/vn//tkBPcAAY8YTmmJGcIx4wnNMSM4RzxfO6YYasDni+d0ww1YU/jApGMKk/VHoVrf6v/W50G5VxqktddcKQKtgAisM6gWJEchonWnlW9ViVcmGSO9dgCopw6qHQyamOalm58pn986n8YFIxhUn6o9Ctb/V/63Og3KuNUmurraZBkkAFcsg3zgUiEn6dLEqV9aYCLJvmkqOzDGTf2TJ4kyzR3Fn+dxCounwYg6w9upFdnulyKACKTXV1tMgySACuWQb5wKRCT9OliVK+tMBFk3zSVHZhjJv7Jk8SZZo7iz/O4hUXT4MQdYe3Uiuz3S5FAB//t0BPEAAbsYT2npGyA3YwntPSNkB5iDO6ekZwDzEGd09IzgFN5q9EQD3AMlwMQpHRKGJ+EQ9CebAxIWVAMjOA3rlP+lHYa+Txnc0N57kjSjB3RX6IY/bUma3/1X70t6x0g2+feavREA9wDJcDEKR0ShifhEPQnmwMSFlQDIzgN65T/pR2Gvk8Z3NDee5I0owd0V+iGP21Jmt/9V+9LesdINvnt1lz0SCdkAGlYThaThIy2O0Q7CthZCJacGaaXUYU6aGbORNydn0YSos2P2rvkZ2MJeomswYPFmv5XiFyG3PKW6y56JBOyADSsJwtJwkZbHaIdhWwshEtODNNLqMKdNDNnIm5Oz6MJUWbH7V3yM7GEvUTWYMHizX8rxC5Db//t0BPqAAg0gz2kvGVJBpBntJeMqR2yDP6ekaoDtkGf09I1QnlG6Oa1poFwQAUIIAI7+oAodjwZByfNHJKx15Z8Lb3dEAis+4RamawjjE5k/lllRb2BN2Pq/62isgh8WujmtaaBcEAFCCACO/qAKHY8GQcnzRySsdeWfC293RAIrPuEWpmsI4xOZP5ZZUW9gTdj6v+torIIfFtbLJIUn7YSArTddPzgfWgaC85xhQdkMSae62OsqfNDzDgiG/IOTZ91a7tNa2WSQpP2wkBWm66fnA+tA0F5zjCg7IYk091sdZU+aHmHBEN+Qcmz7q13aabLLJESQ4wABAUR8rBJ0PHZCXlOLncJBYukwzPLN5JV1ty88MKTH8vXLddNZZZIi//t0BPuAAfoez+GGGqo/Q9n8MMNVR+SDPaekaMD8kGe09I0YSHGAAICiPlYJOh47IS8pxc7hILF0mGZ5ZvJKutuXnhhSY/l65brptbbK6mhLKFYyDRW2IA5Ij1MSmLxvOpLwxNf0ttUioI36inBBRcg9kMgbvP/81tsrqaEsoVjINFbYgDkiPUxKYvG86kvDE1/S21SKgjfqKcEFFyD2QyBu8//xEkaiaaCgAAA4EImFURwGvEg4P3BxTMTBER83yjX3vm7qO6Y2Pkv6qW7Z/nZsjB9Ff///6hJGommgoAAAOBCJhVEcBrxIOD9wcUzEwREfN8o1975u6jumNj5L+qlu2f52bIwfRX///+qRxyxBmqQi+NKZEsP3jpGPZVOY//tkBPsBEdAeT2mCHJA6A8ntMEOSBWw1O4exIsithqdw9iRZXfM3W8EbMJMIUlzIO5UqFcMrGu1SOOWIM1SEXxpTIlh+8dIx7KpzC75m63gjZhJhCkuZB3KlQrhlY12pbckkRaKibAFbh2Y88H4+EBSFARAjsEEGoJVmyJVjR/Jyp59BiwrwIsBjAF/zxIVjAiSihdgwAkAqA23tuSSItFRNgCtw7MeeD8fCApCgIgR2CCDUEqzZEqxo/k5U8+gxYV4EWAxgC/54kKxgRJRQuwYASAVAbb5W5Gy0gY4gBQnBTMjjpABgDJwIMoIvRxJu//tUBPuBEVkLTunsGgIrIWndPYNARZhlPaYEcoizDKe0wI5RqBwR0mp02MlfHxoptuLNE94C7f//8zTpt8OF7N9ha7tKclbkbLSBjiAFCcFMyOOkAGAMnAgygi9HEm6oHBHSanTYyV8fGim24s0T3gLt///zNOm3w4Xs32Fru0pxjabbJO3qAoA0QnEDwWJCcHwaJBOHzapsxJNUACe8fqVHxCodiV2gYkcHGQjYqRAceQRXlX2E0sQuY0iBDj0b//tkBPGBEaAfTWgMMFA0A+mtAYYKBOxdN2YEcKCdi6bswI4UTbZJ29QFAGiE4geCxITg+DRIJw+bVNmJJqgAT3j9So+IVDsSu0DEjg4yEbFSIDjyCK8q+wmliFzGkQIceKbjgKM3yBEFQ5QjqpF4kE59gmuD+HRHQMFos9557J7HFMq0CghjDcsIgLSH1CmnpVEwoF9iNRAau8puOAozfIEQVDlCOqkXiQTn2Ca4P4dEdAwWiz3nnsnscUyrQKCGMNywiAtIfUKaelUTCgX2I1EBq71yy2RBEuNoAarHtpIJwoOBzE4dDAsRPu7r8MYC//tkBPwAAdsXzemGGiA7Yvm9MMNEB2AxN6ekYwjsBib09IxhxMKVjKhTfrAoAkUjouh137dymTvGKyLllsiCJcbQA1WPbSQThQcDmJw6GBYifd3X4YwFiYUrGVCm/WBQBIpHRdDrv27lMneMVkXJJIyEDhoKzhhsrCuVYzJZgfL7O0AxFHKO9nCj/nERFr0bTUdL/lceMLOSSRkIHDQVnDDZWFcqxmSzA+X2doBiKOUd7OFH/OIiLXo2mo6X/K48YWVKNNpJDYAFDwZ45SvHiRRKRFwYMRzTTxdjpRTi7OqP4mF5HYY6AsuZCfcx+CUa//t0BOuAAe8YTWEjNDA94wmsJGaGBzBhNYCwYUDmDCawFgwobSSGwAKHgzxylePEiiUiLgwYjmmni7HSinF2dUfxMLyOwx0BZcyE+5j8JXI64XFjBRAGHqhSAdCUi4OFzEc31iVu3sG0EJl5oThT9g7A61drjErkdcLixgogDD1QpAOhKRcHC5iOb6xK3b2DaCEy80Jwp+wdgdau1xhRtONJJwAHYiZQiINoDJdQTMLh9eYPj6qSwQPrfdvPrzKMXjCBbm2sRI1qNpxpJOAA7ETKERBtAZLqCZhcPrzB8fVSWCB9b7t59eZRi8YQLc21iJGspNJRBrRXbN2lVEyiUEwychVxtMgIY5MJZpUlFf52bHT3Zf9pBCQ658WR///0//tkBPIBEZcYzmmBHDAy4xnNMCOGBTxhNYM8YWinjCawZ4wt7yk0lEGtFds3aVUTKJQTDJyFXG0yAhjkwlmlSUV/nZsdPdl/2kEJDrnxZH///TvVal6mFAA50b64TX3bKCe5BlGKCEbW2QlYt6Wx5juHY5UWarBc6W///70fral6mFAA50b64TX3bKCe5BlGKCEbW2QlYt6Wx5juHY5UWarBc6W///70frklijSaBjCACA+IQUD6DcDAOgzbOFBiRjF99xhmiynvbABAOoXCJIRggkEDu4zECj+tH/79N7WySxRpNAxhABAfEIKB9BuB//tUBPsBEWEWTOHoGlIsIsmcPQNKRPxdN4YEcMCfi6bwwI4YgHQZtnCgxIxi++4wzRZT3tgAgHULhEkIwQSCB3cZiBR/Wj/9+m9rVdtFI2Yw7QwBQjK+T2KTEolS6RA4o8gsaqjWO8Jbqg4RLewUrllOO4GEYz8tmzPBgcgdGZj//d2baKRsxh2hgChGV8nsUmJRKl0iBxR5BY1VGsd4S3VBwiW9gpXLKcdwMIxn5bNmeDA5A6MzH/+7sljciRRC//tUBPUBEVMYTOHpGOAqYwmcPSMcBchfMYewxsC5C+Yw9hjYjaAGEA3EY8eFoklw2Fti4fK6HxUM1jT1/k0B+QwVBBEQyuPrCjZg2LnHGEs6kfRT/ciWNyJFEKNoAYQDcRjx4WiSXDYW2Lh8rofFQzWNPX+TQH5DBUEERDK4+sKNmDYuccYSzqR9FP9yFbtU6SmwJQgBU4gjCEFARgoQBJOBsjBAGTLS65WrdgxAmxx029BMou7cYS0ToGXtAH////tkBOoAAVYZTEmJGcAqwymJMSM4Btw3N6QxgADbhub0hjAA4vdqnSU2BKEAKnEEYQgoCMFCAJJwNkYIAyZaXXK1bsGIE2OOm3oJlF3bjCWidAy9oA///F/bY41Iwbno/CsSeAqNRsUh1JZbRk1v4kTDLnLWb41yh2GfJ2SVWH1/vzpBJhTf+jURe2xxqRg3PR+FYk8BUajYpDqSy2jJrfxImGXOWs3xrlDsM+TskqsPr/fnSCTCm/9GoiWHhEVhJWqGAoASCeehSMjtOLyYJo6slQQyXsLK51i0DPiwrBl9ma6XiWGBuf+hKoBDHf////t0BO4AAbsfT2nsGcA3Y+ntPYM4Buh3OaYEcoDdDuc0wI5Q9KIeERWElaoYCgBIJ56FIyO04vJgmjqyVBDJewsrnWLQM+LCsGX2ZrpeJYYG5/6EqgEMd///0od4QyUiNaDLKAKEvRi2daySIsSqNJSOJvvKZAQSMopKTIpb0iaJm/S05xMFk9IIE5v4Db//niz3eEMlIjWgyygChL0YtnWskiLEqjSUjib7ymQEEjKKSkyKW9ImiZv0tOcTBZPSCBOb+A2//54s9YZkNFEDVg3CAB0Ao1ASAbw0qglPwa+bIl1WYYX14LPFA+T94UfReZAwgmFfhXhqGCB4E6f//odWShmQ0UQNWDcIAHQCjUBIBvDSqCU/Br5siXVZhhfX//tkBP0BEZsNz2nsMLAzYbntPYYWBixhQaewY8jFjCg09gx5gs8UD5P3hR9F5kDCCYV+FeGoYIHgTp//+h1ZJ2hTOBFFYE0YAp4UEZgFQyA6NQ/lCMfRAPDoB0kuXT4srHvbRindIeFwX5wNIWVKca0QOd/7FNYadoUzgRRWBNGAKeFBGYBUMgOjUP5QjH0QDw6AdJLl0+LKx720Yp3SHhcF+cDSFlSnGtEDnf+xTWGlhoRTQBRWBIEAHB7AIvEwkCoxCAyCagfD911Xj7hdcYgE63lXplxyub2EWXfaoFaRT///WX1Q0IpoAorAkCAD//tkBP4AAa4e0fmDFKA1w9o/MGKUBuBhReeZDEDcDCi88yGIg9gEXiYSBUYhAZBNQPh+66rx9wuuMQCdbyr0y45XN7CLLvtUCtIp///rL6oVVFDYTVAXigBAYlWynUpDgMZTHKhyqXSmRpoXTqI3D6REoysTDgWEZCJFYEUIQ8JxEGXz7m//5Qcg1CqoobCaoC8UAIDEq2U6lIcBjKY5UOVS6UyNNC6dRG4fSIlGViYcCwjIRIrAihCHhOIgy+fc3//KDkGleIUyQwR2XdWAMDKLzGVR+FW4AmCIFYdH81JgwcjVwzAzTvTNjnD1LHZ7//tkBPcAAcYe0XmFHAA4w9ovMKOABxBXS+YYTODiCul8wwmc/xfMxxLhgXaHY8486d/seso+PFniFMkMEdl3VgDAyi8xlUfhVuAJgiBWHR/NSYMHI1cMwM070zY5w9Sx2e/8XzMcS4YF2h2POPOnf7HrKPjxaXVrMeoGZoVBEQIXgZAVCKgAzMnhAwUQUCWIQZH6n37wJM+VSdv9U4oWIC8urWY9QMzQqCIgQvAyAqEVABmZPCBgogoEsQgyP1Pv3gSZ8qk7f6pxQsQF1bKAaRWDAAOloFAtRkIpFyAJwhoArYz0gyzFoABVjB8Y+76h//t0BOuAAase0nmJGcg1Y9pPMSM5B1w1R+W8wUDrhqj8t5goMS3VfGelP4ZpgrSWUA0isGAAdLQKBajIRSLkAThDQBWxnpBlmLQACrGD4x931CYluq+M9KfwzTBWkn0bZNsBoopAGAa0GYCR9EAgFp0jnt3IFHwimBRRFO7mJ1XuqZ6KZ1H9Xg3sTPo2ybYDRRSAMA1oMwEj6IBALTpHPbuQKPhFMCiiKd3MTqvdUz0UzqP6vBvYlZay2TIgcAAAkRAJD6I2WBwOw0D84UlyTlzrb8vRUxgbaRpI2y7mgGvSaQ0EtjLWWyZEDgAAEiIBIfRGywOB2GgfnCkuScudbfl6KmMDbSNJG2Xc0A16TSGglsbK06RWwaGw4h/nkiUC//tkBPkBEe4fUvnpGbg9w+pfPSM3BWwzRaWkxMithmi0tJiZij6OVdHYyigEA8ol9TRTWtShT2I1Wv2+dOkv6jNUIMksrTpFbBobDiH+eSJQKKPo5V0djKKAQDyiX1NFNa1KFPYjVa/b506S/qM1QgyRmtdtktIoAAHHwAQliAdAgjIBMGR0EQyysdRsQH3VrqMiiATOClscHs+t7Q9Na7bJaRQAAOPgAhLEA6BBGQCYMjoIhllY6jYgPurXUZFEAmcFLY4PZ9b2h41pNkN4ZXBTknW0UtGUfytsQOOrmpaSp3M2kZyfcECIUS8wUH41//tUBPWBEXMeT2GJGqouY8nsMSNVRZx1P6YYTQCzjqf0wwmg65g1pNkN4ZXBTknW0UtGUfytsQOOrmpaSp3M2kZyfcECIUS8wUH4165hUhRiDUCABWKP6Uz2ZFtqyZprsBfYDG6YuUUAvtSZOfTVOCwwwiHggndrUhRiDUCABWKP6Uz2ZFtqyZprsBfYDG6YuUUAvtSZOfTVOCwwwiHggndrTbaUDPJQzPKDEgFhBDSEOYTthEMq1BKq//oMFkUE//tkBOgBEWsfT2mBHLItY+ntMCOWRbBxO6eYasi2Did08w1Z724qbbSgZ5KGZ5QYkAsIIaQhzCdsIhlWoJVX/9Bgsigne3FV652soAAgDccT6akNONOlMqAjokLt0OaALkrWO6N3+IMpUszBJi3XO1lAAEAbjifTUhpxp0plQEdEhduhzQBclax3Ru/xBlKlmYJMWaoeanDI7bsWB9N7CCZY60keD2Y+yLKxF/wzd7pnoCDGqHmpwyO27FgfTewgmWOtJHg9mPsiysRf8M3e6Z6AgxW/wqmQABk5FRZaXDsqXCVt2uKgYUxG7yLkzGc4//tUBPMBEWEOz2mJGcAsIdntMSM4BPhHNYeYaMCfCOaw8w0YvrwsTf4VTIAAyciostLh2V" } req.from_json_string(json.dumps(params)) resp = client.SpeechTranslate(req) print(resp.to_json_string()) except TencentCloudSDKException as err: print(err) ``` 输出: ```python { "Response": { "RequestId": "550ef21e-5f4a-40ce-8473-6626596d44a9", "SessionUuid": "2", "RecognizeStatus": 1, "SourceText": "", "TargetText": "", "Seq": 0, "Source": "en", "Target": "zh", "VadSeq": 0 } } ``` 由于目前网络延迟原因,“SourceText”(原文文本)和“TargetText”(翻译文本)无法正常显示。 #### 3.2 百度智能云 – [依存句法分析](https://cloud.baidu.com/doc/NLP/s/nk6z52eu6) ##### 作用:分析生成的字幕结构,查看是否正确。 ##### 范例 输入: ```python def grammer(text): url = "https://aip.baidubce.com/rpc/2.0/nlp/v1/depparser?access_token="+access_token data = { "text": text } encode_data=json.dumps(data).encode('UTF-8') headers = { "content-type": "application/json" } return requests.post(url, data=encode_data, headers=headers).json() grammer("今天的天气很好") ``` 输出: ```python {'log_id': 1044481942126985336, 'text': '今天的天气很好', 'items': [{'postag': 't', 'head': 2, 'word': '今天', 'id': 1, 'deprel': 'DE'}, {'postag': 'u', 'head': 3, 'word': '的', 'id': 2, 'deprel': 'DE'}, {'postag': 'n', 'head': 4, 'word': '天气', 'id': 3, 'deprel': 'SBV'}, {'postag': 'a', 'head': 0, 'word': '很好', 'id': 4, 'deprel': 'HED'}]} ``` #### 3.3 百度智能云 – [DNN语言模型](https://cloud.baidu.com/doc/NLP/s/0k6z52fb4) ##### 作用:判断生成的字幕是否符合语言表达的习惯。 ##### 范例 输入: ```python def dnn(text): url = "https://aip.baidubce.com/rpc/2.0/nlp/v2/dnnlm_cn?access_token="+access_token data = { "text" : text } encode_data=json.dumps(data).encode('UTF-8') headers = { 'Content-Type':'application/json' } return requests.post(url,headers=headers,data=encode_data).json() dnn("床前明月光") ``` 输出: ```python {'log_id': 1604971856663849336, 'text': '床前明月光', 'items': [{'word': '床', 'prob': 3.85273e-05}, {'word': '前', 'prob': 0.0289018}, {'word': '明月', 'prob': 0.0284406}, {'word': '光', 'prob': 0.808029}], 'ppl': 79.0651} ``` #### 3.4 百度智能云 - [文本纠错](https://ai.baidu.com/ai-doc/NLP/Ik6z52gp8) ##### 作用:对结构错误、表达不妥的字幕进行纠正。 ##### 范例 输入: ```python def correct(text): url = "https://aip.baidubce.com/rpc/2.0/nlp/v1/ecnet?access_token="+access_token data = { "text" : text } encode_data=json.dumps(data).encode('UTF-8') headers = { 'Content-Type':'application/json' } return requests.post(url,headers=headers,data=encode_data).json() correct("百度是一家人工只能公司") ``` 输出: ``` {'log_id': 5994622977069736408, 'item': {'vec_fragment': [{'ori_frag': '人工只能公司', 'begin_pos': 10, 'correct_frag': '人工智能公司', 'end_pos': 22}], 'score': 0.797593, 'correct_query': '百度是一家人工智能公司'}, 'text': '百度是一家人工只能公司'} ``` ### 4. API使用比较分析 #### 4.1 腾讯云的语音翻译对比其它API平台的语音翻译 ##### 4.1.1 功能对比 “语音翻译”隶属于“机器翻译”,目前市面上具有“机器翻译”API功能的平台并不多。除了腾讯云有“机器翻译”以外,阿里云平台也有“机器翻译”,但是阿里云并没有“语音翻译”的功能。因此与阿里云相比,腾讯云在“机器翻译”上,是占有优势的。 机器翻译(Tencent Machine Translation)是腾讯公司研发的人工智能机器翻译产品,基于自研的神经网络翻译引擎,能够从海量语料库中自主学习,在翻译的全过程中整体建模,从而达到翻译结果的高准确率与流畅度。 ##### 4.1.2 计费概述 由于没有其它平台的“机器翻译”具有“语音翻译”的功能,故这里不作对比,只是简单展示一下腾讯云“机器翻译”的计费概述。 **腾讯云机器翻译** ([价格链接](https://cloud.tencent.com/document/product/551/35017)) - 机器翻译当前仅支持按使用量计费的后付费方式: - 开通免费试用:您可以在每月免费额度内使用,超过免费额度之后请求将会被限制,直到下月初免费额度重新刷新。免费开通将不会产生任何收费账单。 - 开通付费版:您在超过每月免费额度之后可以继续使用,并对超过部分出账单收费。 - 语音翻译按每月调用次数收费,刊例价为0.03元/每次调用 - 语音翻译的每月免费额度为1万/次调用。 - 当月使用量小于等于免费额度时,无须支付费用,不生成账单。 -当月使用量大于免费额度时,超过部分需要支付相应费用。 #### 4.2 腾讯云自然语言处理对比其它平台的自然语言处理 以上使用过的文本纠错、句法依存分析、DNN语言模型等API功能都属于自然语言处理,而很多API平台都设有自然语言处理API功能的调用,例如百度云智能、阿里云等等。 ##### 4.2.1 功能对比 **[腾讯云的自然语言处理](https://cloud.tencent.com/document/product/271)** 深度整合了腾讯内部顶级的NLP技术,依托千亿级中文语料累积,提供16项智能文本处理能力,包括智能分词、实体识别、文本纠错、情感分析、文本分类、词向量、关键词提取、自动摘要、智能闲聊、百科知识图谱查询等。 可广泛应用于用户评论情感分析、资讯热点挖掘、电话投诉分析等场景,满足各行各业的文本智能需求。 **[百度智能云的自然语言处理](https://cloud.baidu.com/doc/NLP/s/xk6z52ac2)** 语言处理基础技术: 词法分析、词法分析(定制版)、词向量表示、词义相似度、短文本相似度、依存句法分析、DNN语言模型。 语言处理应用技术: 情感倾向分析、情感倾向分析(定制版)、评论观点抽取、评论观点抽取(定制版)、对话情绪识别、文本纠错、文章分类、文章标签。 **[阿里云的自然语言处理](https://help.aliyun.com/document_detail/60866.html?spm=a2c4g.11174283.6.541.43cdccaejf05nt)** NLP基础服务,为用户提供包括分词、词性标注、命名实体、情感分析、中心词提取等自然语言处理基础服务,可用于智能问答、对话机器人、舆情分析、内容推荐、电商评价分析等场景中。 NLP自学习平台,面向算法小白用户设计的NLP行业自适应标注、训练和服务平台,支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、短文本匹配、商品评价解析算法能力的定制。 ##### 4.2.2 价格对比 **腾讯云的自然语言处理**([价格链接](https://cloud.tencent.com/document/product/271/36133)) 基础 NLP 资源包 调用量 | 价格(元) :---: | :---: 10万次 | 270 40万次 | 880 80万次 | 1600 400万次 | 6000 800万次 | 8000 按量计费定价 服务名称 | 价格 --- | --- 基础自然语言处理 | 27元/万次 免费额度 基础自然语言处理,将为每个腾讯云账号提供每天50万次的免费调用额度,当日剩余免费调用量不累积结转至第二天,每个自然日重置50万次免费额度。 **阿里云的自然语言处理**([价格链接](https://help.aliyun.com/document_detail/69780.html?spm=a2c4g.11186623.6.542.43c55eefchuxSr)) 免费额度
![阿里云免费调用额度](image/阿里云免费调用额度.jpg) 按量付费定价 版本 | 价格 --- | --- 基础版|27元/万次 商品评价解析|160 元/万次
说明:“基础版”服务包括以下几个API:1、多语言分词;2、词性标注;3、命名实体;4、情感分析;5、中心词提取;6、智能文本分类;7、文本信息抽取。 资源包定价 资源包有效期1年(从购买成功之日起),收费更优惠,推荐用户通过[购买资源包](https://common-buy.aliyun.com/?spm=a2c4g.11186623.2.9.654268c0EP9rEf&commodityCode=nlpbasebag#/buy) 使用。 基础版资源包 调用量(万次) | 价格(元) | 当前折扣价(元) --- | --- | --- 10|270|84.37 30|720|225.00 50|1050|328.12 100|1800|562.50 300|4500|1406.25 商品评价解析资源包 调用量(万次) | 价格(元) | 当前折扣价(元) --- | --- | --- 10|1600|500 50|6800|2125 100|12800|4000 500|60000|18750 1000|112000|35000 5000|520000|162500 **百度智能云的自然语言处理**([价格链接](https://cloud.baidu.com/doc/NLP/s/gk6z52dfl)) 免费额度 企业认证状态| 免费次数| QPS限制 | 对应产品服务 --- | --- | --- | --- 未完成企业认证 | 每个接口累计50万次| 2 | 除地址识别外,自然语言处理所有API 未完成企业认证 | 每个接口累计500次| 2 |地址识别 已完成企业认证| 每个接口每天50万次| 5| 词法分析、情感倾向分析、对话情绪识别、文章分类、词向量表示、词义相似度、短文本相似度、DNN语言模型 已完成企业认证 |每个接口每天5万次| 5| 文本纠错、评论观点抽取、文章标签、新闻摘要 已完成企业认证| 每个接口累计50万次| 5| 词法分析定制、评论观点抽取定制、情感倾向分析定制、依存句法分析 已完成企业认证| 每个接口提升至5000次,企业实名认证额外赠送的免费额度有效期为1年|5|地址识别 按量后付费价目表 (1)基础接口 接口| QPS额度|价格(元/次) --|--|-- 词法分析|20|0.002 词法分析(定制版)|20|0.003 短文本相似度|20|0.002 词义相似度|20|0.002 词向量表示|20|0.002 DNN语言模型|20|0.002 依存句法分析|20|0.015 (2)应用接口 接口|QPS额度|价格(元/次) --|--|-- 情感倾向分析|20|0.0025 情感倾向分析(定制版)|20|0.003 对话情绪识别|20|0.0025 文章分类|20|0.0025 评论观点抽取|20|0.0025 评论观点抽取(定制版)|20|0.003 文本纠错|20|0.0025 文章标签|20|0.0025 新闻摘要|20|0.0025 地址识别|20|0.0025 预付费次数包价目表 (1)基础接口 - DNN语言模型 次数包规格|QPS额度|次数包价格(元)|调用单价(元/次) --|--|--|-- 10万次|20|190|0.0019 30万次|20|540|0.0018 50万次|20|850|0.0017 100万次|20|1600|0.0016 300万次|20|4500|0.0015 - 依存句法分析 次数包规格|QPS额度|次数包价格(元)|调用单价(元/次) --|--|--|-- 10万次|20|1400|0.014 30万次|20|3900|0.013 50万次|20|6000|0.012 100万次|20|11000|0.011 300万次 |20|30000|0.010 (2)应用接口 - 文本纠错 次数包规格|QPS额度|次数包价格(元)|调用单价(元/次) --|--|--|-- 10万次|20|230|0.0023 30万次|20|630|0.0021 50万次|20|950|0.0019 100万次|20|1700|0.0017 300万次|20|4500|0.0015 ##### 4.2.3 总结 - 从功能上看,三个平台的自然语言处理的API功能大同小异,但从APP的适用性来看的话,百度智能云平台的功能会更加适合且全面。 - 从价格上看,百度智能云平台相较于阿里云和腾讯云平台,显得更为实惠。 - 因此,在自然语言处理的API功能的调用上,选择百度智能云平台是最为明智的。 ### 5.人工智能产品概率性评估 ##### 人工智能产品概率性问题 尽管以上API的功能结合在一起会发挥出很强大的翻译效果,但是由于相关字幕数据并未有成功纳入数据库,并且也由于弱人工智能难以理解视频内容背后的文化,因此翻译出的字幕也会出现不尽人意的时候,并非每一次都能把字幕翻译得很好。 ##### 解决办法 - 用户可以向客服反馈错误的数据,事后客服会对这些错误的数据进行整理,让设计师根据整理好的数据,对APP的翻译功能进行优化。 - 定期收集用户的观影数据,分析出用户喜欢看的视频的类型,并将与这些类型相关的名词内容数据提前输入到APP中,提升字幕匹配的精度。 --- ## 四、心得总结及感谢 通过一个学期的《API、机器学习与人工智能》的学习,我知道了什么叫作API,了解了API的作用是什么,学会了如何去看API文档,也亲自动手体验了好多次如何去调用API。并且运用微信小程序完成期末项目,从一无所知到略知一二,这一整个学习的过程对于我来说真的非常神奇与感动,没想到一个看起来晦涩难懂的东西,其实学起来也并没有想象中那么困难。