# Tech_Aarticle **Repository Path**: houpanpan/Tech_Aarticle ## Basic Information - **Project Name**: Tech_Aarticle - **Description**: 深度学习各种模型实战-深度学习模型在各大公司实际生产环境的应用讲解文章,涉及到搜索(Query理解,召回,排序)/推荐(召回,排序)/自然语言处理(文本分类,文本相似度判定,文本匹配,文本生成,命名体识别) - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2020-06-22 - **Last Updated**: 2022-01-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 深度学习模型实战-深度学习模型在各大公司实际生产环境的应用讲解文章 建这个仓库的是因为工作之后发现生产环境中应用的模型需要做到速度和效果的平衡,并不是越复杂越好。所以一味的追求新的模型效果不大(并不是不追,也要多看新东西)。学到模型最终是要用,而且要用好,于是就建了这么个仓库,积累一下深度学习模型在各个公司中的应用以及细节,这样在自己工作中可以做到借鉴。主要是罗列一些各大公司分享的文章,涉及到搜索/推荐/自然语言处理(NLP),持续更新... 微信公众号: NLP从入门到放弃 ![微信公众号](./images/wechat.png) ## 最近更新文章 因为下面的文章是按照领域划分的,顺序是按照我自己觉得不错的文章在前面,所以担心我最近更新的理解的文章大家看不到,所以单开一个版块,把最近读的文章迭代列出来,保持五篇吧。 | 最近更新文章 | 简单介绍 | 进度(粗度/精读) | | ------------------------------------------------------------ | ------------------------------------------------------------ | --------------- | | [精读-Embedding技术在民宿推荐中的应用-原文发表时间201907](./content/精读-Embedding技术在民宿推荐中的应用-201907.md) | 使用item2vec对app内房源进行embding,然后进行推荐,细节比较多,包括训练细节,数据构造细节等等,推荐看一看,我自己有精读,大家可以对照着看一看 | 精读完成 | | [精读-ALBERT在房产领域的实践-原文发表时间202005](https://github.com/DA-southampton/Tech_Aarticle/blob/master/content/精读-ALBERT在房产领域的实践.md) | 讲的是贝壳用ALbert做意图分类,和Fasttext相比,提了大概8个点,推理速度耗时20ms | 精读完成 | ## 部署 在我实际工作中,一般来说部署就是Flask+负载均衡,或者Grpc来提供服务。这个模块积累一下我看到不错的模型部署不错的文章 | 部署领域相关文章 | 简单介绍 | 进度(粗读/精读) | | ------------------------------------------------------------ | ------------------------------------------------------------ | --------------- | | [蘑菇街自研服务框架如何提升在线推理效率?](https://mp.weixin.qq.com/s/IzLtn1SR-aFuxXM3GNZbFw) | 使用协程解决并发问题,使用FLask提供Restful接口,进行容器化部署 | | | [如何解决推荐系统工程难题——深度学习推荐模型线上serving?](https://zhuanlan.zhihu.com/p/77664408) | 介绍了几种serving方式,值得一看 | | | [爱奇艺基于CPU的深度学习推理服务优化实践-201904](https://zhuanlan.zhihu.com/p/61853955) | 爱奇艺主要是在算法,应用以及系统三个方面对模型的部署进行优化。系统级主要是针对硬件平台上做的一些性能优化的方法,应用级是跟特定应用相关的分析以及优化的方法,算法级是针对算法的优化,例如模型的裁剪,模型的量化,在四个任务上提升了10倍左右(引自原文) | | ## 搜索: | 搜索领域文章 | 简单介绍 | 进度(粗读/精读) | | ------------------------------------------------------------ | ------------------------------------------------------------ | --------------- | | [Albert在房产领域的应用-202005](https://github.com/DA-southampton/Tech_Aarticle/blob/master/content/精读-ALBERT在房产领域的实践.md) | 讲的是贝壳用ALbert做意图分类,和Fasttext相比,提了大概8个点,推理速度耗时20ms | 精读完成 | | [DSSM文本匹配模型在苏宁商品语义召回上的应用-201909](https://ai.51cto.com/art/201909/603290.htm) | 详细介绍了DSSM模型在苏宁召回的使用,细节很多,居然还点出用的hanlp做的分词(也太细了吧),推荐大家看看 | | | [Transformer在美团搜索排序中的实践-202004](https://tech.meituan.com/2020/04/16/transformer-in-meituan.html) | (引用文中原句)本文旨在分享 Transformer 在美团搜索排序上的实践经验。内容会分为以下三个部分:第一部分对 Transformer 进行简单介绍,第二部分会介绍 Transfomer 在美团搜索排序上的应用以及实践经验,最后一部分是总结与展望。希望能对大家有所帮助和启发。 | | | [深度学习在文本领域的应用-201808](https://tech.meituan.com/2018/06/21/deep-learning-doc.html) | 美团的文章,主要是讲了基于深度学习的的文本匹配和排序模型。其中讲了DSSM和变种,引申出来美团自己的ClickNet,基于美团场景进行了优化,大家可以细看一下 | | | [基于BERT,神马搜索在线预测性能如何提升?-201908](https://developer.aliyun.com/article/714552) | 讲了一下在神马搜索中bert的性能优化细节,大致就是使用了知乎的cuBert,然后重写了预测逻辑 | | | [阿里文娱搜索算法实践与思考-202006](https://mp.weixin.qq.com/s?src=11×tamp=1591784596&ver=2392&signature=xsYYdd4UJzPrf6ZzFqnvqJTqf5aaHelBl9-vK9gLMSEDuN9ntXb9ZxM89Zcn*ylB0J-yBOyPUaVKU3QzrTQv8hU4I007NIw2*vbZfvctCrzhzIioU3WSJKuXlnRx*fP0&new=1) | (引用文中原句)本文将以优酷为例,分享视频搜索的算法实践,首先介绍优酷搜索的相关业务和搜索算法体系,从搜索相关性和排序算法的特点和挑战到技术实践方案的落地,最后会深入介绍优酷在多模态视频搜索上的探索和实践。 | | | [视频搜索太难了!阿里文娱多模态搜索算法实践-202005](https://www.infoq.cn/article/16UENbPwYMX7YZC0bhyL) | 对比上一个看 | | | [XGBoost在携程搜索排序中的应用-201912](https://mp.weixin.qq.com/s?src=11×tamp=1591786531&ver=2392&signature=hW8Du7a5sFL*BvkQ8qbnTSUNDfZtYoHL68DKdDFHFPAsb4ndTi9EXlmT-TyPstif0QYq9Z040LlQabdTs9e2UVpmhh5gD3M21BVeN24Y1TSvPBJmKMMRTMBNe6goPYuS&new=1) | 如题 | | | [爱奇艺搜索排序模型迭代之路-201909](https://cloud.tencent.com/developer/article/1500313) | 如题 | | | [滴滴搜索系统的深度学习演进之路-201908](https://www.infoq.cn/article/90ByjIRA29uxNO0zStsy) | 如题 | | | [深度学习在 360 搜索广告 NLP 任务中的应用-201907](https://www.infoq.cn/article/WZR0b9cjkse8uKgKd*eX) | 本文作者比对了DSSM 和 ESIM 以及Bert三种模型,介绍了三种模型在实际工作中的应用细节 | | | [小米移动搜索中的 AI 技术-201906](https://www.infoq.cn/article/1pcW2hMQt6wsFxaN*srw) | 大概讲了一下搜索中用的技术,比如文本相似度-dssm,具体的看文章吧 | | | [深度学习在搜索业务中的探索与实践-美团-201901](https://tech.meituan.com/2019/01/10/deep-learning-in-meituan-hotel-search-engine.html) | (引用文中原句)本文会首先介绍一下酒店搜索的业务特点,作为O2O搜索的一种,酒店搜索和传统的搜索排序相比存在很大的不同。第二部分介绍深度学习在酒店搜索NLP中的应用。第三部分会介绍深度排序模型在酒店搜索的演进路线,因为酒店业务的特点和历史原因,美团酒店搜索的模型演进路线可能跟大部分公司都不太一样。最后一部分是总结。 | | | [深度学习在搜狗无线搜索广告中的应用-201803](https://cloud.tencent.com/developer/article/1063013) | (引用文中原句)本次分享主要介绍深度学习在搜狗无线搜索广告中有哪些应用场景,以及分享了我们的一些成果,重点讲解了如何实现基于多模型融合的CTR预估,以及模型效果如何评估,最后和大家探讨DL、CTR 预估的特点及未来的一些方向。 | | | [百度中文纠错技术](https://mp.weixin.qq.com/s/r0kWgPHKthPgGqTbVc3lKw) | 主要讲了中文纠错技术,接下来会重点精读中文纠错方面的。 | | | [达观数据搜索引擎的Query自动纠错技术和架构详解](http://t.cn/Rql7mz9) | | | | [搜索中的 Query 理解及应用](https://mp.weixin.qq.com/s/rZMtsbMuyGwcy2KU7mzZhQ) | | | | [搜索中的Query扩展技术](https://mp.weixin.qq.com/s/WRVwKaWvY-j-bkjxCprckQ) | | | | [京东电商搜索中的语义检索与商品排序](https://mp.weixin.qq.com/s/4UBehc0eikVqcsFP7xL_Zw) | | | | [搜索相关性算法在 DiDi Food 中的探索](https://www.infoq.cn/article/01O8GTA66sakZOtbyUcL) | | | | [滴滴搜索系统的深度学习演进之路](https://www.infoq.cn/article/01O8GTA66sakZOtbyUcL) | | | | [说一说视频搜索](https://zhuanlan.zhihu.com/p/144359114?utm_source=wechat_session&utm_medium=social&utm_oi=691775466138251264&utm_content=sec) | ## 推荐: | 推荐领域文章 | 简单介绍 | 进度(粗度/精读) | | ------------------------------------------------------------ | ------------------------------------------------------------ | --------------- | | [Embedding 技术在民宿推荐中的应用-201907](./content/精读-Embedding技术在民宿推荐中的应用-201907.md) | 使用item2vec对app内房源进行embding,然后进行推荐,细节比较多,包括训练细节,数据构造细节等等,推荐看一看,我自己有精读,大家可以对照着看一看 | 精读完成 | | [双 DNN 排序模型:在线知识蒸馏在爱奇艺推荐的实践-202002](https://www.infoq.cn/article/pUfNBe1o6FwiiPkxQy7C) | 还没看。。但是看文章写得效果很厉害,“其中,在爱奇艺短视频场景时长指标 +6.5%,点击率指标 +2.3%;图文推荐场景时长指标 +4.5%,点击率指标 +14% ”(引用自原文) | | | [美团BERT的探索和实践-201911](https://tech.meituan.com/2019/11/14/nlp-bert-practice.html) | Bert在美团场景中的改进和优化,很厉害,细节很多 | | | [wide&deep 在贝壳推荐场景的实践-201912](https://mp.weixin.qq.com/s?__biz=MzI2ODA3NjcwMw%3D%3D&mid=2247483659&idx=1&sn=deb9c5e22eabd3c52d2418150a40c68a&scene=45#wechat_redirect) | 如题,看了之后感觉还不错, | | | [贝壳找房的深度学习模型迭代及算法优化-201910](https://cloud.tencent.com/developer/article/1528388) | (引用文中原句)第一阶段:建立初版模型系统,采用 XGBoost 模型,完成项目从 0 到 1 的过程; 第二阶段:深度学习模型,采用 DNN+RNN 混合模型; 第三阶段:效果持续优化,也是业务需要。 | | | [千人千面营销系统在携程金融支付的实践](https://cloud.tencent.com/developer/article/1500371) | (引自原文)支付中心数据组开发的一套用户精准营销系统 | | | [爱奇艺个性化推荐排序实践-201907](http://www.iqiyi.com/common/20171025/46d31f38d4cb7ee2.html) | 还没看 | | | [强化学习在携程酒店推荐排序中的应用探索](https://cloud.tencent.com/developer/article/1449819) | (引用原文)我们尝试在城市欢迎度排序场景中引入了强化学习。通过实验发现,增加强化学习后,能够在一定程度上提高排序的质量。 | | | [搜狗信息流推荐算法实践-201904](https://www.infoq.cn/article/A9w0Xg-P1vqbUZ4cEmyH) | 还没看。。。 | | | [深度学习在美团点评推荐业务中实践-201901](https://zhuanlan.zhihu.com/p/55023302) | (引用文中原句)在推荐平台的构建过程中,多策略选品和排序是两个非常重要的部分,本文接下来主要介绍深度学习相关的推荐算法,主要包括 DSSM、Session Based RNN 推荐召回模型与 Wide Deep Learning 的排序模型,我们会介绍深度学习模型在推荐业务应用及实现的相关细节,包括模型原理、线上效果、实践经验及思考。 | | | [美团“猜你喜欢”深度学习排序模型实践-201803](https://tech.meituan.com/2018/03/29/recommend-dnn.html) | (引用文中原句)目前,深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学习的应用提供了必要的条件。本文将主要介绍深度学习模型在美团平台推荐排序场景下的应用和探索。 | | | [优酷视频基于用户兴趣个性化推荐的挑战和实践-201802](https://developer.aliyun.com/article/443621?scm=20140722.184.2.173) | 简单介绍:(引用文中原句)本文将介绍一下优酷个性化搜索推荐的服务,优酷在视频个性化搜索推荐里用户兴趣个性化表达碰到的挑战和问题,当前工业界常用的方法,以及我们针对这些问题的尝试。 | | | [深度学习在58同城智能推荐系统中的应用实践-201802](https://mp.weixin.qq.com/s/qCpCHueEK7Nja-cPmlCaCg?) | | | | [携程个性化推荐算法实践-201801](https://zhuanlan.zhihu.com/p/32785759) | | | | [深度学习在美团点评推荐平台排序中的运用-201707](https://tech.meituan.com/2017/07/28/dl.html) | | | | [Embedding技术在房产推荐中的应用](https://mp.weixin.qq.com/s/flmPJtzeXLXDQXusI3Umxw) | | | | [智能推荐算法在直播场景中的应用--花椒推荐系统](https://mp.weixin.qq.com/s/fUdKIqygxqlkuv0P4wiIRg) | ## NLP其他领域: | NLP 其他领域文章 | 简单介绍 | 进度(粗读/精读) | | ------------------------------------------------------------ | -------- | --------------- | | [语义匹配在贝壳找房智能客服中的应用-202005](https://mp.weixin.qq.com/s?src=11×tamp=1591783120&ver=2392&signature=RZJ5qcZ5PEc0eHDi9eznGXdaoQM2s2WEgsQgMlft5aPuOUiveyUcsoMCIm-sefmm8sRV2OpzrpsoaR6xAv8He0Q84azUJ5wv5gcvB1KQcx7OyN7A1b0QIt2xIpvhSSRH&new=1) | 还没看 | | | [百度语义解析 ( Text-to-SQL ) 技术研究及应用](https://mp.weixin.qq.com/s/2ub1qbLF7cRGE_E0TsSB4g) | | | | [丁香园在语义匹配任务上的探索与实践](https://mp.weixin.qq.com/s/Zn7oXWQPOt6KM1MsOtYfxA) | | | | [大规模预训练模型在阿里机器翻译中的应用](https://mp.weixin.qq.com/s/phPU0SDcTQ6l1fnZi2Hy-Q) | | | | [情感分析算法在阿里小蜜的应用实践](https://mp.weixin.qq.com/s/k-gS6k3-hy-ZI_r901IGvg) | | | | [AI技术如何打造58同城智能客服商家版“微聊管家”](https://mp.weixin.qq.com/s/_D9HX03ZmnXXX72MTrCx7g) | | | | [58同城智能客服技术解密](https://mp.weixin.qq.com/s/5ewD2xD8J08W89-Rwixw4Q) | | | | [深度文本表征与深度文本聚类在小样本场景中的探索与实践](https://mp.weixin.qq.com/s/dWAf2kczbjhQGhn8MZdjAQ) |