树人论文网一个专业的学术咨询网站!!!
树人论文网

基于结合大数据技术的用户画像推荐方法

来源: 树人论文网发表时间:2020-06-22
简要:[摘要]伴随大数据技术的广泛应用及融合媒体的进一步发展,社交网络和基于社交的互联网应用不断涌现,随之而来的就是爆炸性的数据增长。对于各大网站而言,如何有效采集用户数

  [摘要]伴随大数据技术的广泛应用及融合媒体的进一步发展,社交网络和基于社交的互联网应用不断涌现,随之而来的就是爆炸性的数据增长。对于各大网站而言,如何有效采集用户数据并为其提供相应的推荐,无疑是一项极为重要的课题。以往仅仅只能作为信息受众的用户也可以是信息的来源。在互联网的内容消费方面,其格局也由买方市场代替了卖方市场。用户对于各类新媒体信息内容的喜好偏向个性化、碎片化与定制化。不同类型的用户群体对内容方面的需求有很大区别。因此新媒体内容生产者也需要顺应目标用户群体的需求喜好,并探索出能够生产出有针对性的高价值内容的模式,令内容的生产更为智能化、高效化。

  [关键词]大数据技术;用户画像;推荐方法

大数据论文

  科学技术的飞速发展,传统的工业时代已经开始逐渐走出了历史舞台,大数据作为近年来热议的技术话题,在快速发展的同时也给各行各业的发展带来了颠覆性的改变和巨大机遇。信息化技术开始在各个行业中使用,这对于企业发展而言既是机遇又是挑战。大数据时代的到来,使得用户能够获得信息的途径和方式变得愈加多样。因此,如何从互联网每日的巨量信息内容中提取出符合目标用户群体需求的精准内容,就成为接下来需要解决的重点问题之一。

  在此背景下,用户画像的应用越发广泛。因此,新媒体内容生产者可以以用户画像作为依据,来向每个用户精准推荐符合该类用户普遍喜好的内容。用户画像推荐系统的核心就在于为用户进行“画像”的模式。当前一般在这方面是采用提取用户“标签”的方法来给每个用户打上特征标识。

  本文就立足于大数据技术的应用对用户画像的推荐方法进行讨论分析,希望能够给相关的研究人员一些参考和建议。

  一、大数据技术与用户画像推荐方法概述

  (一)大数据

  在如今信息技术快速发展进步的时代背景下,信息传输速度也随之快速增长。“大数据”这个技术也随着信息传输速度及安全性的全面提升而迎来了难得的发展契机。如今多个行业都开始积极引入大数据技术,为自身的发展与运作带来一系列的便利。对于大数据技术的定义,当前国内外学术界尚未完全统一。目前比较权威的解释是出自Gartner对大数据技术提出的定义:大数据技术是基于海量的真实信息数据收集,并基于有效的数据处理算法及软硬件设施来对数据进行分析洞察,从而令数据不再是简單的信息堆砌,而是成为优质的信息资产。从中可以看出,大数据的价值不在于数据信息总量,而在于对数据信息的分析运用,并服务于具体行业用途。大数据技术由两大重要的元素组成,一是数据本身的获得,二是数据的收集、传输和分析技术”。

  (二)用户画像推荐方法

  1.以内容为基础的推荐算法

  以内容为基础推荐算法的应用主要有两个方面:第一是信息检索,第二就是信息过滤。以内容为基础推荐算法的基本思想是依靠现有的用户数据对其以往收藏或购买过的物品进行统计,再为其推荐相似相近物品。

  以内容为基础的推荐算法通常由三个步骤构成:第一,提取用户的浏览及购买记录的相关特征;第二,对其进行特征积累;第三,推荐给用户与其积累特征相关性程度最高的物品。

  以内容为基础的推荐算法逻辑简单清晰,且所需的计算量也较低。该方法无需大量的用户行为数据,也避免了初期用户没有足够的行为数据而造成推荐缺乏依据的弊端,能够很好实现“冷启动”。但单使用该算法时,对于用户潜在可能的兴趣点则难以准确发现辨别。

  2.基于用户的协同过滤推荐算法

  用户在社交网络中会有一定数量的好友及关注对象。即使新用户缺乏行为、兴趣方面的数据,但用户的好友或关注对象则可能已经有了大量的行为、兴趣数据。因此可以据此采用协同过滤推荐算法来发现用户组的相关性,作为推荐的依据。

  基于用户的协同过滤算法通常由三个步骤构成:第一,对于行为、兴趣具有足够相似度的用户建立用户集合;第二,对已经提取好的用户集合中所有用户行为、喜好及兴趣的相似特征进行提取和打标,并据此作为对用户推荐物品、内容的依据。

  上述算法是将用户首先按照粗略的规则分成不同的集群,然后再对每个用户集群的行为、兴趣进行分析归纳,并据此自动推荐物品、内容。该算法需要依靠大数据平台来进行,其前提是需要准确获取用户之间的相互关联信息,并做好集群归类。但该算法也有一定不足,就是随着用户数量增多,算法的复杂度也会显著增加。并且如果一个物品或者内容是全新的,缺乏用户行为数据,则很难被系统识别和推荐给目标用户集群。

  二、基于结合大数据技术的用户画像推荐方法具体应用

  (一)把握用户心理,精准推送营销信息

  在大数据算法对不同用户完成用户画像操作之后,运营人员就可以对画像中的高频标签进行分析统计,该过程亦由系统来自动完成。接着就可以实现对不同标签的用户应用不同的商品推荐方案。亚马逊(Amazon)所创造的图书推荐系统推动了协同过滤推荐方法在全世界的发展与风靡。该系统主要是根据用户评论留下的一些关键词,以及用户的购买、浏览记录等来决定推荐商品的名录,在计算方面主要使用的是SparkMLlib平台。基于上述原理的协同过滤推荐主要又分为以下两种:一是基于用户的协同过滤精准推荐;二是基于商品的协同过滤精准推荐。

  基于知识的推荐方式拥有简单的操作方法与快捷的处理速度,此种方法当前亦较为常用、常见。但运营人员需要提前设置好一系列的推荐规则。如果运营人员设置的推荐规则不合理,则会导致推荐的商品用户下单率较低。因此该方法需要与其他推荐方法结合使用,不宜单独使用。

  (二)以”用户画像”为基础的目标市场选择

  “用户画像”的含义就是基于用户的自定义标签以及系统对用户的行为分析而构成的2D静态标签+3D动态标签的用户描述模型。该技术具有能够准确描摹用户真实状态与习惯的优势,其可信度亦较高。

  基于“用户画像”来进行目标市场选择,可以借助大数据技术来明确目标客户群体所在,以及与企业的实际经营范围、经营能力进行自动匹配,并将一些过于狭小或者难于转化的细分市场予以剔除。使用大数据技术对基于“用户画像”的目标市场进行选择,其优势还在于对目标市场能够实现动态跟踪监控,从而洞悉目标市场的需求变化,并调整营销策略,令营销策略始终保持一定的前瞻性,并令营销资源也得以高效和精确的利用,避免浪费。

  推荐阅读:计算机的大数据和云计算技术分析