0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用户画像分析就是基于大量的数据

数据分析与开发 来源:数据分析与开发 作者:数据分析与开发 2021-03-12 15:24 次阅读

01

写在前面

我们经常在淘宝上购物, 作为淘宝方,他们肯定想知道他的使用用户是什么样的, 是什么样的年龄性别, 城市, 收入, 他的购物品牌偏好, 购物类型, 平时的活跃程度是什么样的, 这样的一个用户描述就是用户画像分析

无论是产品策划还是产品运营, 前者是如何去策划一个好的功能, 去获得用户最大的可见的价值以及隐形的价值, 必须的价值以及增值的价值, 那么了解用户, 去做用户画像分析, 会成为数据分析去帮助产品做做更好的产品设计重要的一个环节。

那么作为产品运营, 比如要针用户的拉新, 挽留, 付费, 裂变等等的运营, 用户画像分析可以帮助产品运营去找到他们的潜在的用户, 从而用各种运营的手段去触达。

因为当我们知道我们的群体的是什么样的一群人的时候, 潜在的用户也是这样的类似的一群人,这样才可以做最精准的拉新,提高我们的ROI

在真正的工作中, 用户画像分析是一个重要的数据分析手段去帮助产品功能迭代, 帮助产品运营做用户增长。

总的来说, 用户画像分析就是基于大量的数据, 建立用户的属性标签体系, 同时利用这种属性标签体系去描述用户

02

用户画像的作用

像上面描述的那样, 用户画像的作用主要有以下几个方面

1.广告投放

在做用户增长的例子中, 我们需要在外部的一些渠道上进行广告投放, 对可能的潜在用户进行拉新, 比如B站在抖音上投广告

我们在选择平台进行投放的时候, 有了用户画像分析, 我们就可以精准的进行广告投放, 比如抖音的用户群体是18-24岁的群体, 那么广告投放的时候就可以针对这部分用户群体进行投放, 提高投放的ROI

假如我们没有画像分析, 那么可能会出现投了很多次广告, 结果没有人点击

2.精准营销

假如某个电商平台需要做个活动给不同的层次的用户发放不同的券, 那么我们就要利用用户画像对用户进行划分, 比如划分成不同的付费的活跃度的用户, 然后根据不同的活跃度的用户发放不用的优惠券。

比如针对付费次数在[1-10] 的情况下发 10元优惠券刺激, 依次类推

3.个性化推荐

精确的内容分发, 比如我们在音乐app 上看到的每日推荐, 网易云之所以推荐这么准, 就是他们在做点击率预估模型(预测给你推荐的歌曲你会不会点击)的时候, 考虑了你的用户画像属性。

比如根据你是90后, 喜欢伤感的, 又喜欢杰伦, 就会推荐类似的歌曲给你, 这些就是基于用户画像推荐

4. 风控检测

这个主要是金融或者银行业设计的比较多, 因为经常遇到的一个问题就是银行怎么决定要不要给一个申请贷款的人给他去放贷

经常的解决方法就是搭建一个风控预测模型, 去预约这个人是否会不还贷款,同样的, 模型的背后很依赖用户画像。

用户的收入水平, 教育水平, 职业, 是否有家庭,是否有房子, 以及过去的诚信记录, 这些的画像数据都是模型预测是否准确的重要数据

5. 产品设计

互联网的产品价值 离不开 用户 需求 场景 这三大元素, 所以我们在做产品设计的时候, 我们得知道我们的用户到底是怎么样的一群人, 他们的具体情况是什么, 他们有什么特别的需求, 这样我们才可以设计出对应解决他们需求痛点的产品功能

在产品功能迭代的时候, 我们需要分析用户画像行为数据, 去发现用户的操作流失情况, 最典型的一种场景就是漏斗转化情况, 就是基于用户的行为数据去发现流失严重的页面, 从而相对应的去优化对应的页面,

比如我们发现从下载到点击付款转化率特别低,那么有可能就是我们付款的按钮的做的有问题, 就可以针对性的优化按钮的位置等等

同时也可以分析这部分转化率主要是在那部分用户群体中低, 假如发现高龄的用户的转化率要比中青年的转化率低很多, 那有可能是因为我们字体的设置以及按钮本身位置不显眼等等, 还有操作起来不方便等等因素

6. 数据分析

在做描述性的数据分析的时候, 经常需要画像的数据, 比如描述抖音的美食博主是怎么样的一群人, 他们的观看的情况, 他们的关注其他博主的情况等等

简单来说就是去做用户刻画的时候, 用户画像可以帮助数据分析刻画用户更加清晰。

03

如何搭建用户画像

用户画像搭建的架构如下:

数据层:

首先 是数据层, 用户画像的基础是首先要去获取完整的数据, 互联网的数据主要是利用打点, 也就是大家说的数据埋点上报上来的, 整个过程就是数据分析师会根据业务需要提数据上报的需求,然后由开发完成, 这样就有了上报的数据。

除了上报的数据, 还有其他数据库同步的数据, 一般会把数据库的数据同步到hive表中, 按照数据仓库的规范,按照一个个主题来放置

还有一些其他的数据比如外部的一些调研的数据, 以excel 格式存在, 就需要把excel 数据导入到hive 表中

挖掘层:

有了基础的数据以后, 就进入到挖掘层, 这个层次主要是两件事情, 一个是数据仓库的构建, 一个是标签的预测, 前者是后者的基础。

一般来说我们会根据数据层的数据表, 对这些数据表的数据进行数据清洗,数据计算汇总,然后按照数据仓库的分层思想, 比如按照 数据原始层, 数据清洗层,数据汇总层, 数据应用层等等进行表的设计

数据原始层的表的数据就是上报上来的数据入库的数据,这一层的数据没有经过数据清洗处理, 是最外层的用户明细数据

数据清洗层主要是数据原始层的数据经过简单数据清洗之后的数据层, 主要是去除明显是脏数据, 比如年龄大于200岁, 地域来自 FFFF的等明显异常数据

数据汇总层的数据主要是根据数据分析的需求, 针对想要的业务指标, 比如用户一天的听歌时长, 听歌歌曲数, 听的歌手数目等等, 就可以按照用户的维度, 把他的行为进行聚合, 得到用户的轻量指标的聚合的表。

这个层的用处主要是可以快速求出比如一天的听歌总数, 听歌总时长, 听歌时长高于1小时的用户数, 收藏歌曲数高于100 的用户数是多少等等的计算就可以从这个层的表出来

数据应用层主要是面向业务方的需求进行加工,可能是在数据汇总的基础上加工成对应的报表的指标需求, 比如每天听歌的人数, 次数, 时长,搜索的人数, 次数, 歌曲数等等

按照规范的数据仓库把表都设计完成后, 我们就得到一部分的用户的年龄性别地域的基础属性的数据以及用户观看付费 活跃等等行为的数据

但是有一些用户的数据是拿不到的比如音乐app 为例, 我们一般是拿不到用户的听歌偏好这个属性的数据, 我们就要通过机器学习的模型对用户的偏好进行预测


机器学习的模型预测都是基于前面我们构建的数据仓库的数据的, 因为只有完整的数据仓库的数据, 是模型特征构建的基础

服务层:

有了数据层和挖掘层以后, 我们基本对用户画像体系构建的差不多, 那么就到了用户画像赋能的阶段。

最基础的应用就是利用用户画像宽表的数据,对用户的行为进行洞察归因 挖掘行为和属性特征上的规律

另外比较大型的应用就是搭建用户画像的平台, 背后就是用户画像表的集成。

用户提取:我们可以利用用户画像平台, 进行快速的用户选取, 比如抽取18-24岁的女性群体 听过杰伦歌曲的用户, 我们就可以快速的抽取。

分群对比:我们可以利用画像平台进行分群对比。比如我们想要比较音乐vip 的用户和非vip 的用户他们在行为活跃和年龄性别地域 注册时间, 听歌偏好上的差异, 我们就可以利用这个平台来完成

功能画像分析:我们还可以利用用户画像平台进行快速进行某个功能的用户画像描述分析, 比如音乐app 的每日推荐功能, 我们想要知道使用每日推荐的用户是怎么样的用户群体,以及使用每日推荐不同时长的用户他们的用户特征分别都是怎么样的,就可以快速的进行分析

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3184

    浏览量

    48764
  • 数据分析
    +关注

    关注

    2

    文章

    1433

    浏览量

    34028
  • 用户画像
    +关注

    关注

    0

    文章

    7

    浏览量

    2387

原文标题:数据分析思维和方法—用户画像分析

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA助力百度提升数据分析效能

    数据分析师、运营团队以及销售人员等。过去他们不得不编写繁杂的查询语句,由此耗费掉大量的时间与精力。百度广告业务的重要性和复杂性,致使相关的业务数据每月会有超过 200 个迭代更新,用户
    的头像 发表于 11-20 10:06 171次阅读

    IP风险画像详细接入规范、API参数(Ipdatacloud)

    IP数据云的IP风险画像是基于数据分析和机器学习技术的产品。工作原理是对IP地址的多维度数据进行综合分析,进而为企业提供全面的IP风险评估和
    的头像 发表于 11-15 11:11 202次阅读
    IP风险<b class='flag-5'>画像</b>详细接入规范、API参数(Ipdatacloud)

    SUMIF函数在数据分析中的应用

    在商业和科学研究中,数据分析是一项基本且关键的技能。Excel作为最常用的数据分析工具之一,提供了多种函数来帮助用户处理和分析数据。SUMI
    的头像 发表于 11-11 09:14 267次阅读

    物联网的数据分析方法

    在数字化时代,物联网(IoT)正迅速成为企业和个人获取实时数据、提高效率和做出明智决策的关键工具。物联网设备,如智能传感器、可穿戴设备和智能家居设备,不断地生成大量数据。这些数据需要通
    的头像 发表于 10-29 11:27 381次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量
    的头像 发表于 10-24 09:18 359次阅读

    AI大模型的训练数据来源分析

    学术机构、政府组织或企业公开发布,涵盖了各种类型的数据,如图像、文本、音频、视频等。例如: ImageNet :一个广泛用于图像识别任务的大规模图像数据集。 Common Crawl :提供了大量的网页抓取
    的头像 发表于 10-23 15:32 408次阅读

    IP 地址大数据分析如何进行网络优化?

    。 2.用户行为分析数据分析可以对用户的网络行为进行分析,了解用户的需求和偏好。通过对
    的头像 发表于 10-09 15:32 195次阅读
    IP 地址大<b class='flag-5'>数据分析</b>如何进行网络优化?

    IP风险画像如何维护网络安全

    的重要工具。 什么是IP风险画像? IP风险画像是一种基于大数据分析和机器学习技术的网络安全管理工具。它通过对IP地址的网络行为、流量特征、历史记录等多维度数据进行深入
    的头像 发表于 09-04 14:43 274次阅读

    TCP传输大量数据时丢失数据的原因?

    当TCP用于传输大量数据时,要找到数据丢失的地方,当TCP传输大量数据时,数据包丢失,包错。 具
    发表于 07-12 15:03

    数据分析除了spss还有什么

    数据分析是当今世界中一个非常重要的领域,它涉及到从大量数据中提取有用信息、发现模式和趋势,并为决策提供支持。SPSS(Statistical Package for the Social
    的头像 发表于 07-05 15:01 573次阅读

    数据分析有哪些分析方法

    数据分析是一种重要的技能,它可以帮助我们从大量数据中提取有价值的信息,从而做出更明智的决策。在这篇文章中,我们将介绍数据分析的各种方法,包括描述性
    的头像 发表于 07-05 14:51 542次阅读

    PLC中的三大量分别是什么

    遇到不同类型的数据,这些数据在PLC中通常被分为三大量:开关量、模拟量和脉冲量。本文将详细阐述PLC中的这三大量,并探讨它们在工业自动化中的应用。
    的头像 发表于 06-12 11:47 838次阅读

    DocuSign拟用用户合同数据训练AI,引争议

    据了解,DocuSign计划借助微软Azure上的OpenAI工具,如GPT技术,以训练其所谓的“撰写协议”模型,并且从用户提供的大量数据中,训练出专属的人工智能(AI)模型,但这部分数据
    的头像 发表于 03-04 15:45 510次阅读

    Get职场新知识:做分析,用大数据分析工具

    综合分析。但现在有了大数据分析工具,一切问题都可迎刃而解。 大数据分析工具,顾名思义就是专门为分析海量
    发表于 12-05 09:36