# API期末项目
**Repository Path**: zhuyijing_bwcx/api-final-project
## Basic Information
- **Project Name**: API期末项目
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-01-17
- **Last Updated**: 2021-01-24
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
文档名称 | 掌上作文宝——产品需求文档
-|-
产品名称 | 掌上作文宝
产品描述 | 一款用户可以搜索优秀作文,识别手写作文转化为文档,识别用户语音转化为文档,收录用户投稿作文的手机app
产品现状 | 研发进行中
文档作者 | 朱怡静
## 一、MVP/价值主张
### (一)价值主张
对于现代文科生、文学系大学生而言,增强写作能力和水平是非常重要的;对于写作爱好者而言,素材的收集和灵感的激发是非常重要的;现在市场上缺少一款可以为这类用户提供全方位的关于写作方面的服务的app,我的这款产品利用百度开放平台的[作文检索](https://ai.baidu.com/tech/kg/zuowen)、[通用文字识别](https://ai.baidu.com/tech/ocr/general)、[手写文字识别](https://ai.baidu.com/tech/ocr_others/handwriting)和[实时语音识别](https://ai.baidu.com/tech/speech/realtime_asr)功能为用户提供一系列关于写作的服务。
### (二)核心价值
用户不仅可以搜索到需要的作文素材,可以上传自己的作品与其他用户分享;还可以将手写的随笔转换为文字文档,将语音读出来的文段转换为文字文档
### (三)人工智能可行性
* [人工智能(Artificial Intelligence)](https://baike.baidu.com/item/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/9180?fr=aladdin),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
* 人工智能是计算机科学的一个分支,生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
* 本产品使用到的百度AI开放能力有:**作文检索**,可根据作文名称进行模糊查询,结果将给出包含搜索名称相同的优秀作文内容。同时,正文内容中将涵盖该作文的点评内容。**通用文字识别**,使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验。**手写文字识别**,**实时语音识别**
***
## 二、问题描述与需求列表
### (一)用户画像/痛点
 |
 |
用户|使用场景|用户需求
---- | ---- | ----
文学专业学生|在课堂上进行写作,缺乏素材|需要可以找到贴合作文主题的素材或引用语句
写作爱好者|在业余生活中进行作文创作|需要记录随笔或灵感思路,与其他写作爱好者分享交流
### (二)用户问题表述
| | 问题 | 回答 |
-----|----|----|
1|页面有什么功能?|作文素材搜索、通用文字识别、手写文字识别、语音录入识别
2|如何实现文字和语音识别?|用户通过上传图片和音频的方式,来进行文字的提取和录入
3|识别结果从哪里来?|在百度AI开放平台对api进行调用
4|作文素材从何而来?|主要来自百度、知网等平台,还有用户分享与收录
### (三)需求列表与人工智能API加值
优先级|API类型|API智能加值|级别
---- | ---- | ---- | ----
1|作文检索|可根据作文名称进行模糊查询,结果将给出包含搜索名称相同的优秀作文内容。同时,正文内容中将涵盖该作文的点评内容|重要
2|通用文字识别|使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验|重要
3|手写文字识别|使用手写文字识别技术,实现对手写书摘、读书笔记、课堂笔记等内容的识别,实现对手写文字内容的扫描及线上存储,便于用户对书摘及笔记内容进行快速编辑、查找及传输,大幅度提升内容管理效率,优化用户使用体验|次重要
4|实时语音识别|语音输入准确高效,解放双手,说话内容实时转换为文字,便于整理|次重要
### (四)需求论证展示利害相关者分析
利益相关者|行为|获得利益程度
----|----|----
api供应商(百度api开放平台)|提供api技术支持|高
产品经理|市场调研、用户需求与痛点分析、确定产品类型和商业模式、分析用户体验等|高
app的UI设计人员|开发软件、维护软件运营|中
用户|使用产品,反馈体验|高
***
## 三、解决方案:界面流程与关键智能交互
### (一)用户体验分析

### (二)产品原型
[产品原型交互演示链接](https://modao.cc/app/b806b7e65c0357f3fc97c1315037ef7def9b0f2e?simulator_type=device&sticky)
### (三)交互及界面设计
**1.用户登陆后进入app主页,进行所需功能的选择**
| 登陆页面 |
主页 |
 |
 |
**2.用户点击作文搜索会进入素材广场,在此页面可以进行标题搜索作文或关键词搜索作文;还可以上传自己的作文或素材文段**
| 素材广场 |
上传作文 |
 |
 |
**3.点击图片识别进入文字识别页面,在此可以上传文字照片或手写文字照片,进行识别,将其转换为文字或文档,点击保存**
| 文字识别 |
文字识别结果 |
 |
 |
**4.点击语音识别进入语音识别页面,在此可以录入语音进行识别,将其转换为文字或文档,点击保存**
| 语音识别 |
语音识别结果 |
 |
 |
**5.在个人中心页面,用户可以对浏览过的作文素材进行回顾,查看收藏和上传过的作文,为用户提供更加便捷与人性化的服务**

#### 设计的用户可欲性:
使用这款app,用户可以便捷简易得搜索到合适的作文素材,大数据对关键词的筛选是高效准确的,这样大大节省了用户的时间,相对于网站而言app的使用更加弹性有效
#### 设计的技术可行性:
##### 1.[百度AI开放平台](https://ai.baidu.com/?track=cp:ainsem|pf:pc|pp:tongyong-pinpai|pu:pinpai-baidurengongzhineng|ci:|kw:10003819)的技术具有三大优势:
* 简单易用
* 成熟稳定
* 准确性高
##### 2.信赖度:
百度大脑AI大生产平台已开放210多项核心AI能力,日调用量过万亿次,可以满足超多不同的用户需求以至于用户广泛。
加上百度大脑AI生产平台具有完整而强大了用户隐私保护系统,让用户不用担心在使用该技术时存在隐私泄露等相关问题。
百度大脑AI开放平台自开放以来,一直秉承“用科技力量推动社会创新”的愿景,不断为用户提供最智能,最安全的人工智能!
#### 设计的商业可行性:
随着网民对互联网应用需求的攀升,与游戏、娱乐等相关应用的搜索已经占到百度每天处理请求的30%;
**百度应用开放平台**的发布,正是为了顺应这一趋势,促进更多优质的互联网应用与用户需求实现对接,使得网民在搜索相关应用关键词时,在结果页面直接实现“即搜即用”,从而大幅提升用户体验。
对于应用开发者和原创作者来说,百度应用开放平台则提供给他们一个通道,使他们可以在百度搜索结果直接展示或者销售自己的产品和服务,从而迅速获得**丰厚的收益回报**。
附:[百度正式推出应用开放平台 方便网民即搜即用](http://www.fanc.com.cn/html/news/meitibaodao/18920.html)
***
## 四、解决方案:数据流程及关键智能API使用
### (一)流程图
#### 1、用户使用界面流程图

#### 2、app数据流程图

#### 数据流程设计的用户可欲性:
使用这款app的步骤简单易懂,操作便捷;用户可以在软件内搜索到的作文或素材种类齐全,文字识别的功能也是其他搜索网站不具备的;用户可以放心得选择这款app使用
#### 数据流程设计的技术可行性:
这款app的交互设计非常有弹性,页面间的链接非常灵活;app内的功能基于百度ai开放平台的作文检索、通用文字识别、手写文字识别和时语音识别技术,有非常可靠的技术保障
#### 数据流程设计的商业可行性:
这款app的设计成本不高,而用户使用过后的信任度高,所以对于产品开发运营方来说商业价值高,在运营的中后期可以获取到的利润大。
### (二)智能API使用(代码展示)
#### 1.作文检索
* 百度AI开放平台-开放能力-知识图谱-作文检索
* 官方API文档:[作文检索](https://ai.baidu.com/ai-doc/KG/8kf27k4g4)
* 接口能力:作文检索接口,基于大量作文范文数据库,提供精准体裁类别与多样化标签标记,为日常写作指导场景,提供多维度作文内容检索服务。
* HTTP方法:POST
* 作文检索请求URL:https://aip.baidubce.com/rpc/2.0/kg/v1/cognitive/composition
##### 第一步
通过API Key和Secret Key获取的access_token,参考"[Access Token 获取](https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjhhu) "
##### 第二步,输入参数获取列表信息结果;
参数|描述
---|---
query|用户的输入
```
{
"query": "描写幸福的记叙文"
}
```
##### 第三步,在得到的列表信息结果中获取“作文ID”
见“列表类型数据示例”
参数| 描述
---|---
id |作文id
resource |作文库名
mode |IDSearch参数
##### 第四步,输出参数

- 输入关键字/标题得到作文与作文题目
```
"entity": [{
"@id": "a7df7af1b3c50e3d52973d476d1bb526",
"@type": [
"zuowen"
],
{
"key": "content",
"label": "作文内容",
"type": "simple",
"objects": [{
"@value": "海内存知己,天涯若比邻。\n——题记\n帘外的鸟叫声渐渐小了,抬头望去,天色乌蒙蒙的,你在哪儿,带了伞吗,我还在等你回来。轻推房门,终是耐不住寂寞了。下雨了,淅淅沥沥凄凄切切,我又想起为你作的《寻寻觅觅》,当时,我会想象着,你还夸我了得。是啊,这次第,怎一个愁字了得!\n如今人雁南飞,你可知转身后的背影,我噙着泪送你离开?外面的雨渐大,你淋雨了吗?曾记否,湛蓝的天空,白色的鸽子,带着我的思念向你飞来,载着你的回应向我奔来?你可知我那时的喜悦?一切都是往事了。你知道吗,我寻你千百度,日出到迟暮,可你却不在灯火阑珊处,实着让我伤透了心。往事凄艳,用情深,却伤的也深。\n人生只若初见,曾记否,我和你的初遇?那年我十七岁,来到汴京已有两年。作为一个女子,这个年龄早为人妇。可我的要求很高,我要我的后半生陪着这样的男人度过:才华横溢,风神俊朗,侠骨柔情,刚正不阿。于千万人之中,我只找到了你,因为我只看中了你。那时的你,风华正茂,十足的翩翩少年郎,更重要的是,你会作诗,作词。于是,十七岁的我带着满心热望等待着你,不管不顾。那日,我一个人孤独的荡秋千,在一个人的世界里,时间流逝。入迷的时候,我听到有声,是你,温暖了我。我来到声音的源头,找到了你,身外是露浓花瘦,心里是默默的温情。我心早已许你……\n十八岁,我如愿以偿嫁给了你。虽说我不喜欢父母之命,媒妁之言,但我的心依旧是美滋滋的。你我闲暇间赌谁对书架上的书的摆放熟悉,谁输了,就要把茶水倒进衣襟里去。呵呵,谁输了呢?当时只道是寻常。花开花落我也快记不得,身上残余的,是你的清香。这是简单的事,把我们的家变得温馨,也让我找到了幸福。然,上天注定我一生的幸福只有七年,那便是你娶我的七个年头。时限已至,果不其然,政局发生了地震般的动荡,父亲与朝庭全力排斥的所谓"
元佑党人 "有牵连,后来家产被封,你也被罢免官职。再后来,你终是因为病痛,让我狠心离开你,从此让我一个人颠沛流离……\n雨声震耳,不觉已倾盆。泥土的新鲜气息带着些腥甜。你到哪里去了呢?曾记否:"
莫道不销魂, 帘卷西风, 人比黄花瘦。 "这是我为你作的,但是你还夸我呢。我还记得你当时的笑颜……人家说,最遥远的距离是天涯海角,你是不是也去了呢?不,天涯若比邻。你一直在我心中,我眼前只有你的影子。我一直与你为邻,就不会有遗憾!看着你的背影,让我们来世再续前缘。\n雨依旧在下,只是淅淅沥沥。冲刷不掉的是天涯的距离,也是我永恒的缠绵。"
}]
}
{
"key": "name",
"label": "作文标题",
"type": "simple",
"objects": [{
"@value": "与你为邻"
}]
}
}]
```
#### 2.通用文字识别
* 百度AI开放平台-开放能力-文字识别-通用文字识别
* 官方API文档:[通用文字识别](https://ai.baidu.com/ai-doc/OCR/1k3h7y3db)
* 接口描述:基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一。
* HTTP方法:POST
* 通用文字识别请求URL:https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic
##### 1)功能演示
api识别图片中的文字,进行文本提取和录入。用户可通过提取到的文本进行保存处理,提高文本记忆。

##### 2)代码片段


#### 3.手写文字识别
* 百度AI开放平台-开放能力-文字识别-手写文字识别
* 官方API文档:[手写文字识别](https://ai.baidu.com/ai-doc/OCR/hk3h7y2qq)
* 接口描述:支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上。
* HTTP方法:POST
* 手写文字识别请求URL:https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting
##### 功能演示图

#### 4.实时语音识别
* 百度AI开放平台-开放能力-语音技术-实时语音识别
* 官方API文档:[实时语音识别](https://ai.baidu.com/ai-doc/SPEECH/2k5dllqxj)
##### 主要流程
1. 连接
2. 连接成功后发送数据 2.1 发送开始参数帧 2.2 实时发送音频数据帧 2.3 库接收识别结果 2.4 发送结束帧
3. 关闭连接
##### 示例
```
{
"type": "START",
"data": {
"appid": 105xxx17,
"appkey": "UA4oPSxxxxkGOuFbb6",
"dev_pid": 15372, # 识别模型,比如普通话还是英语,是否要加标点等
"lm_id": xxxx, # 自训练平台才有这个参数
"cuid": "cuid-1", # 随便填不影响使用。机器的mac或者其它唯一id,页面上计算UV用。
# 下面是固定参数
"format": "pcm",
"sample": 16000
}
}
```
### (三)智能API使用的人工智能概率性考量
1. 中国有数百万的中小站长和互联网技术、应用开发者,百度应用开放平台的推出,将使中小站长、技术开发者们任何有价值的创新,都能直接和百度海量的需求资源对接,形成新的商业机会,从而催生出一个庞大的产业链。
2. 通过百度开放平台,拥有优质资源的开发者、提供商、原创作者能够更好地分享到百度庞大的需求和流量资源。原本处于产业链末端的应用提供者直接与用户需求对接,实现可持续增长。
***
## 五、心得总结及感谢
#### 心得总结:
1. 通过这次api产品需求文档的编辑,我了解了百度ai开放平台的多项功能技术,也从API的体验中感受到了现代社会的智能化,给我们的生活带来了很多便捷的服务。
2. 我还学习到了对用户进行用户画像分析,制作用户使用软件流程图等作图技能,深入了解产品对用户产生的痛点等,学习了怎样成为一名产品经理
3. 此外我还学习到使用墨刀制作app原型图,这是一次很奇妙的体验,也增添了我的学习耐心
#### 感谢:
1. 感谢[百度AI开放平台](https://ai.baidu.com/?track=cp:ainsem|pf:pc|pp:tongyong-kaifangpingtai|pu:kaifangpingtai|ci:|kw:10003799)提供技术支持与免费的资源调用
2. 感谢[墨刀](https://modao.cc/brand/promote/main?utm_source=baidu&utm_term=modao&f=baidu2&renqun_youhua=2326761&bd_vid=8259486929361024427)在线产品原型设计与协作平台为我的设计提供了支持,让我设计完成了此产品的低保真原型图及交互
3. 感谢[processon](https://www.processon.com/diagrams)平台提供的免费在线作图、实时协作技术,让我轻松有效得作出需要的流程图
4. 感谢中山大学南方学院文学与传媒学院网络与新媒体专业**许智超**老师的指导
* (独立有效的外连URL:16个)
* [演示PPT录屏链接](https://www.bilibili.com/video/BV1AK4y1s7WK)