# text **Repository Path**: gao_jin_yong/text ## Basic Information - **Project Name**: text - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-06-26 - **Last Updated**: 2021-06-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # B 大数据中国案例分析成果 5% ## 1.让数据主宰一切的担忧(信息隐私) ### 1.1 分析成果 1. 知乎的“隐私政策——知乎”会告知用户知乎的隐私政策要点。其中会包括 “我们会如何收集个人信息”和“我们会如何使用您的个人信息”。知乎称,根据用户同意和提供服务的需要,会收集用户的姓名、年龄、身份证号、电话号码、位置信息和日志信息等。这些收集的信息将用于提升产品的核心功能,及一些附加功能的用户体验。 ![输入图片说明](https://images.gitee.com/uploads/images/2021/0626/165947_5cbbe000_5329167.jpeg "隐私政策.jpg") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0626/165955_9361fe3b_5329167.jpeg "隐私政策2.jpg") 1. 如果用户继续使用知乎的服务,即意味着**同意知乎按照该隐私政策进行个人信息处理活动,包括收集、使用、储存、共享、转让和公开披露**。这样**使互联网监视变得更加容易**、成本更低廉也更有用处。进行大数据分析的人可以轻松地看到大数据的价值潜力,这极大地刺激着他们进一步采集、存储、循环利用我们个人数据的野心。随着**储存成本继续暴跌**而**分析工具越来越先进**,**采集和存储数据的数量和规模将爆发式的增长**。大数据会带来**更大的威胁**,它会**预测来判断和惩罚人类的潜在行为**。在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。如今很多用户都觉得自己的隐私已经收到了威胁,当大数据变得更为普遍的时候,情况将更加不堪设想。 ### 1.2 建议 1. 可以借鉴外国企业的做法,首先**以邮件的方式通知用户**,告知隐私政策部分修改的原因,如为了符合法律的新要求。同时强调更改后的新政策包含的内容并且可以**让用户点击了解修订后的隐私政策**。为了让用户直观理解协议。 2. 平台充分**保障用户的“不同意”权力**,如果用户坚持退出,页面跳转为首页,平台表示抱歉,并且再次给予用户多种选择以及相应操作方式。 3. 当平台需要开发新功能新模块,相应的需要一些新的权限。如果用户不愿意给予新的隐私数据,平台可以把一些模块不对这部分用户开放。 ## 2.全新的数据中间商 ### 2.1 分析成果 1. 知乎与百度输入法,搜狗输入法等合作,截取机主的日常使用信息,窃取隐私,即使没有打字,说的话也会被录音上传。为了防止察觉,知乎的精准推送都是**延后的**,短则几小时,长则几天。 ### 2.2 建议 1. 知乎的推荐是需要刷足够多的话题才会推荐少部分新的话题。我认为可以**适当调整推荐新话题和推荐关联话题的比例**,**减少同质化问题**。 ## 3. 推荐系统的相关关系 ### 3.1 分析成果 1. 知乎的霸王条款是这样写的:“您使用或继续使用我们的服务,即意味着同意我们按照本隐私政策收集、使用、储存、共享、转让和公开披露您的相关信息。”用户可以选择**“不同意”**和**“我同意”**。当点击“不同意”会跳转到温馨提示页面,进而为用户提供三种选择,**“仅浏览”**、**“我同意”**、**“不同意并退出应用”**;当点击“仅浏览”将进入**浏览模式**,只是**无法使用提问、回答、评论等功能**;当用户点击不同意,跳转至知乎温馨提示页面。 . 知乎APP的隐私协议看似都有这么标明,会收集用户隐私,但不会向公众公开,共享给第三方合作机构进行分析,只用于平台研究以提供用户更好的体验。这个**第三方机构其实就是知乎所属的广告联盟**。今日系广告联盟和腾讯系广告联盟都有投资知乎,他们会**向知乎提供用户在他们的APP里各种活动的隐私信息**,譬如在今日头条里搜了什么看了什么,微信里说了什么关键字,对于微信和今日头条来说,知乎就是他们合作的第三方,知乎会从这些APP上获取用户的各种信息。同时对应的,腾讯系的和今日系的都是知乎合作的第三方,他们也会**获得知乎提供的用户个人隐私信息,以提升智能推荐准确度**。 3. 知乎中的推荐系统就很好地应用了相关关系,在知乎的“首页”-“推荐”中会为用户推荐一些热度较高的问答,但当你长时间地在此页面中点击浏览相同类型或相同内容的问答时,你再次刷新页面,新推荐的内容中与你之前浏览的问答的内容相似的占大多数,或者为你推荐同一作者的其他视频或问答。“*大数据的相关关系分析法更准确、更快,而且不易受偏见的影响。*”知乎中仍然会为用户推荐一些平台中知名大V答主相关的问答或者一些热度较高的问答和视频,但是在这些推荐当中仍然会以用户之前大量的浏览记录和喜好为基础,**推荐尽可能相关的内容**。“*通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。*”知乎中的“关联物”可以是用户搜索框中的关键词,用户浏览、评论、点赞过的问答和视频,用户关注的某一个用户。**根据这些“关联物”为用户推荐内容**。 ### 3.2 建议 1. 首先知乎应**尊重用户隐私**,**未经允许不滥用用户数据**,而不是一份看似是隐私保护的霸王条款,既然无法做到完全不收集用户信息,起码要与广告、分析服务类、供应商、服务提供商等授权合作伙伴签署严格的保密协定,规定好获取个人信息的界限。 2. 在数据隐私保护政策上,可以将用户数据共享至的平台**明确列出**给用户,用户有知情权之后,自己在知乎平台上看到的内容在其他平台同时被推送的情况下减少自己对于自己隐私被暴露的使用不安感。 3. 虽然通过相关关系和“关联物”推荐给用户相关内容是更准确、更快、是可以创造更多点击率的,但是不能单单一直推荐相关的内容,就像书中提到的【*詹姆斯·马库斯回忆说:“推荐信息往往为你提供与你以前购买物品有微小差异的产品,并且循环往复。”詹姆斯·马库斯从1996年到2001年都是亚马逊的书评家,在他的回忆录《亚马逊》里他说道:“那种感觉就像你和一群脑残在一起逛书店。”*】**太多同质化的内容也会让用户厌倦,也不利于平台中其他内容的发展**,所以适当的推荐不同的、新鲜的内容也是有利于平台发展的。 ## 3. 平台设计方式&推荐系统的相关关系 ### 3.1 分析论证 - **为用户提供推荐内容具有重复性** 成功的平台能够精准匹配用户,这就与平台的推荐系统有很大的关系。知乎收集用户信息数据,形成过滤器,为用户提供推荐内容。知乎的推荐是为用户提供他们浏览、点赞或评论过的相似内容,通过鼓励用户的问答收集用户数据进行再匹配 ### 3.2 建议 1. 相关关系不仅只是相似,还应该推荐用户可能会喜欢的不同类型的内容,优化算法设计和过滤器,减少相似内容的重复性,为用户提供标注是否感兴趣的权利,减少不感兴趣的内容推荐。 2. 太多同质化的内容也会让用户厌倦,也不利于平台中其他内容的发展,适当的推荐不同的、新鲜的内容也是有利于平台发展的。 ## 4.盈利化方式&推荐系统的相关关系 ### 4.1 分析论证 - **知识付费、广告位推荐与用户匹配度不高** 知乎的盈利化板块在知识付费和广告位上,这两方面的推荐上都存在问题。知识付费的课程推荐,由于知乎用户水平较高,低质量的课程用户接收程度低。广告的推荐冗杂,降低了用户的使用体验。同时,知乎还提供了盐选专栏,收录优质文章,推行知识付费,这也是知乎盈利化的重要手段。平时用户在搜索的时候知乎也会随机推送盐选专栏中的文章。 ### 4.2 建议 1. 推荐的课程内容应该**结合用户的个人信息进行个性化推荐**,契合用户的受教育程度和学习水平。广告的推送也应该基于用户在知乎上的浏览信息进行相关推荐,与知乎上名誉高的大V进行合作,减少推荐的数量,提高推荐的质量。 2. 提倡知识付费的同时应**注重版权保护**,维护创作者的合理权益。同时,提高对优质文章的筛选,保证文章的质量水平。