# 智识百草 **Repository Path**: d8899p/API_cdrug ## Basic Information - **Project Name**: 智识百草 - **Description**: API、机器学习与人工智能:智识百草APP,调用植物识别API、在线语音合成API - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 3 - **Created**: 2024-04-10 - **Last Updated**: 2024-04-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 项目介绍 * 项目名称:智识百草 * 调用的API: > * 百度AI开放平台·图像识别之——[植物识别](https://ai.baidu.com/tech/imagerecognition/plant)--[接口文档](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/Kk3bcxbxj) > * 讯飞开放平台·语音合成——[在线语音合成](https://www.xfyun.cn/services/online_tts)--[接口文档](https://gitee.com/meichun_chen/API_cdrug/blob/master/tts_ws_python3_demo.py) * [PPT演讲20*20口白](https://gitee.com/meichun_chen/API_cdrug/blob/master/%E6%99%BA%E8%AF%86%E7%99%BE%E8%8D%89.pptx) * [原型交互](https://modao.cc/app/82fb6f9548fac5ea1eb1e1daf343793ca28b2650?simulator_type=device&sticky) * [植物识别调用代码示例](https://gitee.com/meichun_chen/API_cdrug/blob/master/%E7%99%BE%E5%BA%A6API%E8%B0%83%E7%94%A8demo.ipynb) * [语音合成调用代码示例](https://gitee.com/meichun_chen/API_cdrug/blob/master/%E8%AE%AF%E9%A3%9E%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90API%E8%B0%83%E7%94%A8demo.ipynb) 【迭代二增加量】 增量改进: * 1.增加IDEO三要素 * 2.增加用户使用流程图 * 3.修改数据流程图 * 4.API使用说明具体化 * 5.增加API使用价格 * 6.增加API风险分析 * 7.增加竞品分析 * 8.增加产品未来的发展路线构想 * 9.增加总计和感谢 --- 文档名称 | 智识百草——需求文档 ---|--- 产品名称 | 智识百草 产品描述 | 一款能够利用植物识别、在线语音合成帮助对中草药感兴趣的用户识别中草药百科信息并查询相关中医典籍,了解中草药相关知识的APP 产品版本 | 2.0 文件状态 | 进行中 文件作者 | 陈媚淳 ## 加值宣言 --- 本产品智识百草APP人工智能技术体现在:调用百度AI开放平台提供的植物识别api,支持识别超过2万种通用植物和近8千种花卉,接口返回植物名称、结果置信度和百科信息,准确率达95% 以上;调用讯飞开放平台提供的在线语音合成api,将文字转化成语音,高质量合成音频的自然度和清晰度媲美人声,给应用配上“嘴巴”,帮助用户读出生僻字。中药材字典查询功能虽非智能技术,但对于对中草药感兴趣的用户来说却具有很大的使用价值。给用户提供中医世家的中药材网页中11242种中药材的网页链接,因中草药种类繁多,字典虽不能囊括所有,但也汇集了80%以上的中草药,更好帮助用户查询相关中医典籍,深入解中草药相关知识。 一句话版本:智识百草,让AI助你识记百草。 * [植物识别api识别准确率考量参考](https://ai.baidu.com/forum/topic/show/864277) ## 一、需求概述 ### 1、产品背景 中医药是中华传统文化的重要组成部分,然而近百年来西风东渐,中医药在自己的家乡却逐渐边缘化,令人颇为唏嘘。伴随新冠肺炎疫情的爆发和中医药介入疫情防控效果显著,中医药重新得到世界各国的关注。在世界卫生组织的一项研究表明,对大约80%的世界民众仍然依靠草药来治疗某种疾病,我们今天使用的药品约有74%含有至少一个植物学分子。学习中国传统中医草药知识,既是对中国传统文化精髓的继承,也对我们日常保健颇有益处。 ### 2、产品市场 经过对商场上图像识别类APP、语音合成类APP的调查,发现想对植物进行扫描获知,进行语音识别并不难,但是将这些内容进行整合,满足对中草药感兴趣的用户辨别中草药的需求的APP。另外,随着人工智能和图像识别技术的发展,图像识别技术已在类型上被细分,已能满足人们日常的生活需求,但在图像识别类应用的领域,对于中草药进行识别并查询中医典籍的应用程序依旧处于起步阶段。 ### 3、市场概述 #### 3.1中草药识别应用市场概述 目前,市场上图像识别类APP,包括动物识别、植物识别、人脸识别、商标识别功能的APP很多,但暂时还没有一款专门用于辨别中草药的APP。语音类APP中语音转文字类APP较多,而文字转语音的APP相对较少。市场上虽然有对植物识别的APP,也有对药方进行识别的APP,例如:形色识花APP和识方APP。将植物识别和语音合成相结合,以“图文音相结合”的卡片学习方式帮助用户识记中草药的APP目前尚未发现。 #### 3.2 市场特征 * 图像识别市场广阔,增长迅速,目前正在处于迅速发展的时期。 * 中草药识别市场处于发展初期,目前专门用于识别中草药的工具甚少。 * 对产品技术要求较高,需要契合场景要求,由于药物都具有一定的副作用,所谓“是药三分毒”,此类有关药物的APP只能作为科普的工具,临床应用需谨慎。 #### 3.3 发展优势 * 目前专门用于识别中草药的工具甚少,发展空间广阔 * 语音类APP中,文字转语音的APP相对较少,市场尚未饱和 * 越来越多人关注中国传统中草药文化,市场需求增长 ## 二、核心价值(最小可行性产品) 着眼于解决对中草药感兴趣的用户辨别和识记中草药的基本需求,智识百草将提供给用户中草药识别、文字转语音的服务功能。 * 中草药种类繁多难以辨别和记忆,图像识别帮用户快速识别 * 以“图文音相结合”的卡片学习方式有利于用户记忆 * 语音合成技术,将文字转化为语音,调动用户视觉听觉,印象更加深刻 * 语音合成技术,帮助用户查询不会读的生僻字读音 IDEO三要素 * 用户可欲性:满足对中草药感兴趣的用户辨别中草药的需求,以“图文音相结合”的卡片学习方式帮助用户识记中草药 * 商业可行性:市场上图像识别类APP用户群体数量多、分布范围广,以“图文音相结合”的卡片学习方式帮助用户识记中草药的APP目前尚未发现,具有一定创新型,会吸引那些对中草药感兴趣的用户 * 技术可行性:百度ai平台提供植物识别识别植物,中药材字典判断此植物是否为中药材,讯飞开放平台在线语音合成实现文字转语音 ## 三、用户分析 ### 用户画像 目标用户群: * 核心用户:20-55岁对中草药感兴趣的用户 * 主要用户:20-55岁喜欢花草树木的用户 ![用户画像](https://images.gitee.com/uploads/images/2020/0718/052658_e92643ff_2228939.png "用户画像 (1).png") * 使用场景:吴桐平时会在课余时间去户外踏青,背上简单的单肩包带上手机,拍摄一些他没有见过的植物,他觉得很新奇,因为有很多植物虽然不起眼,但是药用价值却很大。很多的植物长得相似,其实却是完全不同的植物,有的有药用价值,有的没有,难以辨认哪棵是真正有用的。 ### 问题与使用情景 |问题/痛点 | 使用情景 | | --- | --- | | 问题1:中草药种类繁多,难以辨认与识记 | 在户外,对中草药感兴趣的用户看见一株植物,可能曾经见过,知道这是一种草药,但是中草药种类繁多,有些植物又形态相似,难以辨认与识记。 | | 问题2:用户希望对中草药有更深入的了解 | 用户对中草药有一定的了解,百科信息已经不能满足用户的求知需求,用户希望了解更多相关中医典籍记载,追根溯源,更深地了解中草药知识。 | | 问题3:生僻字不会读 | 用户使用智识百草APP,发现中草药名称有很多生僻字不知道怎么读,不会朗读影响对中草药的识记,一个个搜索又很麻烦,体验感不好。 | ## 四、需求列表(对应人工智能加值) | 优先级 | 用户痛点 | API加值 | 智能加值? | API类型 | --- | --- | --- | --- | --- | | 重要 |中草药种类繁多,难以辨认与识记,难以辨认 | 调用百度AI开放平台提供的植物识别api,帮助用户通过拍摄照片并识别图片,返回植物的名称、置信度、百科信息| 是 | 图像识别 | 次重要 |用户希望了解更多相关中医典籍记载,追根溯源 | 中药材字典查询功能,以植物名称为关键字查询字典,在11242种中药材的链接找出所识别中草药对应的链接 | 否 | | 重要 | 中草药名称有很多生僻字用户不知道怎么读 | 调用讯飞开放平台提供的在线语音合成api,将文字信息转化为声音信息,给应用配上“嘴巴”,帮助用户读出生僻字 |是 | 语音合成 ## 五、人工智能概率性与用户痛点 |植物识别技术优势/用户痛点 |讯飞语音合成技术优势/用户痛点 | | --- | --- | |**识别植物名称**: 支持识别超过2万种通用植物和近8千种花卉,接口返回植物名称 | **讯飞的语音技术**:讯飞先进的语音技术、简单的语音接口、稳定的语音服务、给力的技术支持,实现快速构建语音应用 | | **获取百科信息**:支持获取识别结果的百科信息,接口返回百科词条URL、图片和描述,支持自定义返回词条数 | **自然清晰的语音体验**:文本转换为流畅、清晰、自然和具有表现力的语音数据——高质量合成音频的自然度和清晰度已经超过了普通人的朗读水平。 | | |**专属的语音个性定制**:提供中英日韩等18种多语种、川豫粤等多方言、男女声多风格的选择,音量、语速、音调等参数也支持动态调整——定制专属的语音合成。 | 据上所述,该产品可以识别多种植物,植物识别这项功能的精确性以及精确率较高,除了照片过于模糊等非正常因素,百度API在图像识别技术上都很成熟,响应速度和准确率都较高,并一直在不断优化算法,可以保证正常使用。讯飞语音合成自然清晰,发音为流畅、清晰、自然和具有表现力,还具有专属的语音个性定制,非常人性化。 ## 六、产品结构图 ### 1、产品功能结构图 ![产品功能结构图](https://images.gitee.com/uploads/images/2020/0718/042426_f742b429_2228939.png "界面.png") ### 2、用户旅程地图 ![用户功能结构](https://images.gitee.com/uploads/images/2020/0718/125449_95fe99d6_2228939.png "用户旅程地图.png") ### 3、用户使用流程图 ![用户使用流程图](https://images.gitee.com/uploads/images/2020/0723/164635_93254c43_2228939.png "用户画像 (2).png") ## 七、数据推理 * 用户开启应用摄像头权限,点击按钮拍照 * 应用将采集到的图片向植物识别api接口发送请求 * 植物识别分析api收到请求之后分析图片 * 植物识别分析api将识别数据以json形式返回给APP * 植物识别分析api传递植物名称作为key值到字典 * 字典查询,返回中医典籍的链接返回给APP * APP将返回的数据结果展现在页面上 * app将上一步返回的数据向语音合成api接口发送请求 * 语音合成api收到请求后把文字转化为语音向用户播报 ![数据流程图](https://images.gitee.com/uploads/images/2020/0723/163011_2073362b_2228939.png "数据流程图 (3).png") ## 八、产品原型及[交互设计](https://modao.cc/app/82fb6f9548fac5ea1eb1e1daf343793ca28b2650?simulator_type=device&sticky) ### 1、启动及登录界面 ![登录页](https://images.gitee.com/uploads/images/2020/0718/140518_c0299e8a_2228939.png "登录和注册页.png") ### 2、主要页面:植物识别 ![植物识别](https://images.gitee.com/uploads/images/2020/0718/141627_da9775a5_2228939.png "植物识别@1x.png") ### 3、主要页面:语音合成 ![语音合成](https://images.gitee.com/uploads/images/2020/0718/142217_ccd99e34_2228939.png "语音合成.png") ## 九、API的运用 ### (一)植物识别 百度AI开放平台——植物识别 * 接口描述:支持识别超过2万种通用植物和近8千种花卉,识别用户接口返回植物的名称,并获取百科信息,适用于拍照识图类APP中 * 接口地址 :https://ai.baidu.com/tech/imagerecognition/plant * 请求方法:POST * 调用步骤 (1)首先需要导入函数模块 (2)然后通过API Key和Secret Key获取access_token (2)接着输入本地图片链接对植物进行识别 (3)返回json数据,内容含显示植物名称、百科描述、百科链接 * 作用和调用说明: ![step4](https://images.gitee.com/uploads/images/2020/0723/171016_d40d6b82_2228939.png "step4.png") * [调用方式与输出结果的源代码链接](https://gitee.com/meichun_chen/API_cdrug/blob/master/%E7%99%BE%E5%BA%A6API%E8%B0%83%E7%94%A8demo.ipynb) ## 图文展示 ### ```【步骤1.拍摄图片】``` ![step1](https://images.gitee.com/uploads/images/2020/0723/170917_5ea39849_2228939.png "step1.png") ### ```【步骤2.导入“中药材”字典】``` ![step2](https://images.gitee.com/uploads/images/2020/0723/170938_9665a9cb_2228939.png "step2.png") ![step3](https://images.gitee.com/uploads/images/2020/0723/171000_028b9965_2228939.png "step3.png") ### ```【步骤3.导入模块】``` ![1](https://images.gitee.com/uploads/images/2020/0723/172052_a4039ef1_2228939.png "1.png") ### ```【步骤4.设置函数】``` ![4](https://images.gitee.com/uploads/images/2020/0723/172158_4593d697_2228939.png "2.png") ### ```【步骤5.调用函数返回结果】``` ![step5](https://images.gitee.com/uploads/images/2020/0723/171046_df71fb97_2228939.png "results.png") ### (二)在线语音合成 讯飞开放平台——语音合成 * 接口描述:将文字信息转化为声音信息,给用户提供了众多有特色的发音人(音库)。其合成音在音色、自然度等方面的表现均接近甚至超过了人声。这种语音合成体验,达到了真正可商用的标准。 * 接口地址:https://www.xfyun.cn/services/online_tts * 请求方法:POST * 调用步骤 (1)首先需要导入函数模块 (2)分别输入APPID、 APIKey、APISecret='XXXXXXXXXX' (3)进行参数的初始化 (4)生成RFC1123格式的时间戳、进行hmac-sha256进行加密、将请求的鉴权参数组合为字典、拼接鉴权参数,生成url (5)打印出建立连接时候的url,参考本demo的时候可取消上方打印的注释,比对相同参数时生成的url与自己代码生成的url是否一致 (6)运行并返回结果,成功调用在本地返回一个pcm格式的音频文件 * [调用方式与输出结果的源代码链接](https://gitee.com/meichun_chen/API_cdrug/blob/master/%E8%AE%AF%E9%A3%9E%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90API%E8%B0%83%E7%94%A8demo.ipynb) ### ```【步骤1.导入函数模块】``` ![模块](https://images.gitee.com/uploads/images/2020/0723/173329_c984c7bb_2228939.png "3.png") ### ```【步骤2.设置参数】``` 具体请见[调用方式与输出结果的源代码链接](https://gitee.com/meichun_chen/API_cdrug/blob/master/%E8%AE%AF%E9%A3%9E%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90API%E8%B0%83%E7%94%A8demo.ipynb) ### ```【步骤3.输出结果】``` ![合成](https://images.gitee.com/uploads/images/2020/0718/144609_1155c08c_2228939.png "hechengjieshu.png") ![合成](https://images.gitee.com/uploads/images/2020/0718/144633_6a59c8bf_2228939.png "yuyinhechengresult.png") ## 十、API使用价格 #### 【百度植物识别】价格表 ![价格表](https://images.gitee.com/uploads/images/2020/0723/174555_ae59ce11_2228939.png "植物识别价格表.png") #### 【讯飞语音合成】价格表 ![讯飞价格表](https://images.gitee.com/uploads/images/2020/0723/174832_9ba1924a_2228939.png "讯飞价格表.png") ## 十一、API风险分析 风险 | 解决方法 ---|--- 识别的图像不清晰或违规 | 调用图像审核api优化 识别的结果不够准确 | 进行机器学习,丰富植物库,提高准确率 识别的植物为中草药,并无相关的点击记载 | 丰富中药材字典记载的中草药种类,是它更加全面涵盖多种中药材 ## 十二、竞品分析 ![中医识方](https://images.gitee.com/uploads/images/2020/0723/190341_1afee4cd_2228939.jpeg "识方.jpg") * 产品名称:中医识方 * 应用简介:上传药方进行识别,为您提供最专业的药方分析,出处、药理、药效、禁忌全部都可以详细的看到,用户不是医生也能了解重要药方。 * 产品优势: 1. 【经典权威】:囊括788个国家权威认证药方、《本草纲目》、《黄帝内经》、《金匮要略》等700本古籍的经典药方; 1. 【药方验证】:综合权威经典药方,帮您识别处方单上的药材信息,了解药方出处、功效、用法、禁忌、方解等,让您用药更安心; 1. 【海量典藏】:以传统中医药学为根本,收录25000个经典药方、13000种经典药材祛湿治燥、补益安神、理气理血等大小病症皆有对策; 1. 【简便实用】:拍一拍处方,动一动手指,就能帮您识别和验证药方,同时可以按功效找药方,迅速获取药方信息; 1. 【智能识方】:根据最先进的图像识别技术,智能识别处方,真实还原处方药材,让您面对处方不再迷茫; 1. 【在线解读】:随时随地查询、收藏药方,手到擒来。 * **分析:识方APP的功能齐全、非常实用,智能识方最先进的图像识别技术,它与智识百草都是智能识别类APP。** * 竞品的差异化分析 1. 中医识方式识别药方,智识百草是识别植物,识别的对象不同。 1. 中医识方的作用是了解药方出处、功效、用法、禁忌、方解等,智识百草的作用是识别植物是否为草药,了解草药的功能、禁忌、生长环境等。 ## 十三、该产品未来的发展路线构想 发展理念:打造一款集智能识图功能与语音合成功能为一体,为那些对中草药感兴趣的用户提供一个更好的学习中草药知识的工具,其科普作用帮助人们认识中草药,让更多人关注中国传统中草药文化,让优秀的文化传承下去! 【产品的更新迭代规划】 ##### V1.0 * APP基本框架规划 * 主要的两个基本功能的实现 ##### V2.0 * 品牌logo设计和APP界面设计 * 丰富中药材字典,更新更多中药材的种类 * 对中药材字典中的药物按主要功效分类 ##### V3.0 * 设置分享论坛,用户可以分享常见药物的妙用、禁忌等生活小常识 * 设置专家咨询,用户可以请教专家问题,专家在线进行答疑解惑 * 设置中草药学堂,视频教学,让用户对学习产生兴趣,部分付费 * 设置周边商城,例如用户的中草药卡片制作成纸质的卡片、中草药仿真模型等 ##### V4.0 * 当产品取得一定的口碑,加大对产品的宣传力度 * 开始翻译产品内容,让智识百草走向国际化,让中国传统优秀文化走出国门 #### 产品的功能 1. 【植物识别】识别植物或者中草药 1. 【语音合成】将文字转化为语音 1. 【中药材字典查询】了解中草药的功效、禁忌、使用方法等 1. 【专家咨询】咨询药理知识、个人体质等 1. 【中草药学堂】视频分享中草药知识,或专业讲师系统化教学 1. 【周边商城】购买相关的道具模型、书籍、助记卡片等 #### 产品的盈利模式 * 专家咨询费用 * 部分付费课程 * 周边商城盈利 * 中药材商家推广费用 ## 十四、总结及感谢 感谢授课老师许老师的耐心教导,让我们逐渐了解到人工智能和机器学习的相关知识,激发我们学习的兴趣。感谢[百度AI开放平台](https://ai.baidu.com/)和[讯飞开放平台](https://www.xfyun.cn/)为本次项目提供重要的两大技术支持,并提供免费额度使用api。 本学期的学习让我们体验到API功能的多样和便利性,个人觉得对技术文档的阅读能力非常重要,关系到能否顺利成功调用api。其次,撰写产品需求文档也同样非常重要,从价值宣言、用户痛点分析、市场需求、竞品分析等到产品的基本成型,其中需要全面考虑IDEO三要素,即产品的用户可欲性、商业可行性、技术可行性。一个好的产品需要进行设计并不断地迭代优化,需要技术支持能够实现而不是天马行空,需要考虑商业可行性让产品可持续发展,更需要考虑用户可欲性,以人为本,为用户创造价值。