0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

做数据产品时为什么埋点治理这么难

数据分析与开发 来源:一个数据人的自留地 作者:图图 2021-11-17 14:13 次阅读

从做数据产品开始,自己的日常工作就被埋点占据了大部分,到后面做平台类数据产品之后发现埋点问题依旧占据很多精力且治理困难,写这篇文章也是跟大家讨论讨论自己做埋点治理的心得以及深入剖析下为什么埋点质量这么难保障。

做埋点时间长了,越来越觉得埋点并不像自己想象的那么简单,仅仅是开发在自己要统计的业务场景下写埋点代码打包上传统计数据就完成工作,从最开始的埋点需求规划再到最后数据上报只要有一个环节有坑就会影响数据准确性,而数据准确性估计是每个数据人工作中必须要面对的难题。

下面简单聊聊自己遇到的坑,这些或许仅仅是表述了现象,至于导致此现象发生的本质相信就仁者见仁 智者见智了。

01

埋点需求混乱且缺少管控

产品和运营作为埋点需求的常见提出方,当新功能或活动上线时会提很多埋点需求,数据产品在这个环节如果对埋点需求没有明确的提需规范和把控,就会导致埋点需求爆炸,对于开发和维护成本都是压力,并且后续做数据分析的时候经常会发现数据不可用或数据不准确,那其实后续排查问题的成本非常大,所以数据产品一定要对埋点需求有全局把控。

1

明确埋点要统计哪些指标:

数据产品在评审埋点需求的时候很重要的一点就是:明确埋点要统计哪些指标。埋点统计是服务于指标的,如果对埋点需求没有管控放任提需,经过几个版本的迭代就会发现埋点维护很难,而且这样也能反推运营和产品思考自己到底关注哪些核心指标,对后期的数据统计和复盘都是有帮助的。

2

明确埋点提需规范:

埋点需求规范的价值是帮助业务方和数据产品拉齐对即将开发的埋点认知一致,所以在设计埋点提需规范时不仅仅要让业务方标明要统计哪些指标、事件如何规划、触发时机,最好能写出每个自定义参数的触发时机、参数打在哪个层级、是否需要透传等,对于刚起步做埋点治理的阶段可以先将精力focus在提需规范的设计和落实上,划重点:埋点提需规范越详细越好,可以帮忙拉齐各方对埋点的认知。

3

埋点需求评审会及设定需求接口

埋点需求评审就不具体展开了,大体说就是将业务方、开发、测试、数据产品等组织起来对埋点需求进行评审。我想多说说需求接口人这个角色,进了大厂发现需求接口人很重要,没有接口人的话仅靠数据产品跟业务对接在大体量和复杂业务场景的公司里是不现实的,所以接口人的定位是埋点需求master甚至是数据需求master,划重点:建议接口人可以考虑经常对接埋点需求的业务或是有开发背景的业务方,这样沟通起来会方便一些。

02

埋点设计环节缺少整体性思考

规划埋点是数据产品的基本工作,但真正能做好埋点规划很难,我觉得这个环节的痛点在于:很难以全局视角规划埋点并且具有可扩展性,所以为了后续的可扩展性,我简单列几条可参考的tips:

1

埋点设计要具有简洁性:

这里的简洁性是指同类场景下的埋点是否能合并成一个埋点规划,比如“点击支付按钮”事件,该事件在很多页面都可以触发,那么就可以把这个事件规划为一个埋点,在不同的页面点击时将页面名称或页面ID作为参数传递,但这些还是比较初阶的埋点设计方案,当很多业务属性以参数形式传递时,如何管理及规划这些参数,让数据RD看到埋点日志时很容易就能理解这条埋点携带了哪些信息,那么就引出来我要讲的下一点:

2

埋点设计要具有规范性:

其实规范性这个词很宽泛,我们通篇也都在探讨如何基于埋点治理的痛点制定规范。上面讲到我们如何管理埋点日志里的参数,我觉得可以按照性质和层级给这些参数进行个简单划分:

公共参数:每条买点日志都要上报的参数,包含设备信息、上报时间、ip地址等信息(这里不具体讲,大家可以参考第三方数据分析工具如神策、GrowingIO等公共参数的采集),那么数据产品对于公共参数的设计和管理体现在要规划号公共参数并协调各个埋点端上报格式一致,降低数仓解析成本私有参数:也叫自定义参数,每条买点在不同场景、不同操作、不同逻辑下会触发并传递不同参数,此类参数叫做私有参数。

这里的层级指的是埋点日志的json层级,如果能做好json层级的划分那么对于不同角色的RD可以按照自己关注的参数去解析,大大降低了解释成本。

公共信息层:如果读了上面的公共参数,那么会很好理解什么叫公共信息层:顾名思义就是存放公共参数层。

业务信息层:里面存放自定义参数,针对同类或同场景的采集信息可以抽象成一个对象,在对象里存放这些信息,例如上面提到的“点击支付按钮”事件,可以把页面信息存放到一个对象里、位置信息存放到一个对象里,下面举个巨简单的栗子:

2ed5244a-472b-11ec-b939-dac502259ad0.png

策略信息层:里面存放为策略服务的参数,之所以把它单独划分一层是因为策略多变且灵活,最好还是规划在同一层级下管理。

透传信息层:这种后端透传前端的参数也建议单独规划,便于后续做链路追踪等应用当埋点设计形成了规范,那么其实也完成了埋点最难的高度抽象的部分,接下来就是基于抽象好的规范甚至是数据模型来复用到后续的埋点规划中,抽象的思路可以先关注重点场景:先设计核心指标有关的核心点位或者场景复杂的点位。

3

埋点设计要具有可扩展性:

埋点设计的可扩展性与上面的规范性密不可分,当规范建立好数据产品要思考是否具有较强的扩展性,还有后面规范的新增和变更该如何管理和维护。

要知道埋点不仅仅只是服务于指标统计,想要全面的规划埋点还要设计分析产品性能、使用体验的埋点,比如上报启动时间、崩溃事件、页面加载时间等事件。

03

埋点开发不规范

这个问题也很有意思,数据产品经常有个疑问:为什么我规划好了的埋点,实际开发或上线后根本不符合预期。这个环节共设计到两个角色:数据产品和埋点开发,那么到底是哪一方在沟通理解上出现了问题呢?

数据产品:技术背景较薄弱,针对不同开发环境和生态了解欠缺

埋点开发:了解开发逻辑,对于未明确的细节用惯用逻辑实现大家发现了吗,当埋点场景复杂时,由于两个角色的侧重点不同很容易会出现gap,有人问有什么好的办法去规避吗?其实除了上面讲的,只能不同角色补齐自己的短板,还有就是两方一定要多沟通,埋点开发在埋点评审时要思考不同实现逻辑和异常场景是否会影响埋点上报,在开发埋点之前尽量把问题暴露出来。

04

埋点验收不够全面

埋点验收环节作为埋点上线的最后一道保障,也是很容易踩坑的。具体的现象不多说,只说如何在验收环节尽量不踩坑:

(1)验收是否多报

(2)验收是否少报

(3)验收是否缺参数上报

(4)验收上报参数是否符合预期

(5)验收上报为空日志的比例

(6)验收上报不符合预期日志的比例

除了上面的验收重点,验收方式一定要手动验证+平台自动化一起配合,最好能进行一遍回归测试,多方式进行验收。

05

欠缺埋点生命周期的管理

做埋点治理和数据治理的小伙伴应该深有体会,当缺少生命周期的管理一味放任熵增,后续治理的成本实在很高,所以埋点生命周期的管理必不可缺。简单来说要做好后续埋点梳理、埋点瘦身、埋点升级的工作,定期统计一段时间内低频上报的埋点和这些埋点相关指标、报表的访问量,以此为依据开展埋点生命周期管理工作。

说了这么多,越写越觉得想埋点想不踩坑对数据产品的要求实在很高,不仅要有需求管控能力、数据抽象能力,技术背景,还要有多部门协调能力和全局把控能力。所以本文也只能大体讲讲这些关键环节,但估计也是日常困扰大家比较多的问题了。

相信有此经历的小伙伴们看到文章应该很有共鸣,欢迎留言交流~如果有更好的想法欢迎一起讨论学习~

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6909

    浏览量

    88849

原文标题:聊聊为什么埋点治理这么难?

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    铠装光缆可以直接地吗

    铠装光缆可以直接地。直是光缆铺设的一种常见方式,即将光缆直接埋入地下,无需额外的管道或槽道。铠装光缆具有抗压、抗拉、防水等特性,外层材料能够很好地保护光缆,使其适合直接地。然而,在实际应用时
    的头像 发表于 11-06 10:09 108次阅读

    数据要素时代下构建高效数据治理能力的策略

    数据驱动的商业时代,高效的数据治理平台已成为企业成功的核心要素。尽管市场上已有众多成熟的数据治理产品
    的头像 发表于 11-01 11:19 250次阅读

    如何判断盲/孔HDI板有多少“阶”?

    , 避免判断错HDI盲/孔设计文件的阶数 。减少在生产过程中存在的设计异常以及设计缺陷,提升生产一次通过率;且提升生产品质良率, 降低生产成本 。 华秋DFM软件是国内首款免费PCB可制造性和装配
    发表于 10-23 18:38

    数据赋能:构建数据治理与AI的协同闭环

    在数字化浪潮中,数据已成为企业的新型燃料,而AI则是提炼这种燃料的精炼厂。数据治理与AI的协同作用,正在引领企业迈向更智能、更高效的未来。本文将展示企业如何通过将数据
    的头像 发表于 03-15 10:47 456次阅读

    数大数据时代的关键:融合数据治理与AI为企业增值_光科技

    数据驱动的今天,企业不能再将数据治理和人工智能(AI)视作孤立的实体。它们之间的协同作用已经成为推动企业增长的强大引擎。本文将探索数据治理
    的头像 发表于 03-14 11:20 304次阅读

    数据中台助力数据可视化智能治理

    数据可视化和智能治理的重要手段,为企业带来越来越多的重要价值。   在过去,工厂的数据往往分散在各个车间,设备协议多样、数据格式不一,难以实现有效整合。
    的头像 发表于 02-01 13:41 298次阅读
    <b class='flag-5'>数据</b>中台助力<b class='flag-5'>数据</b>可视化智能<b class='flag-5'>治理</b>

    数据治理为什么要清洗数据

    治理成为了当务之急。而数据清洗作为数据治理的重要环节之一,更是不可或缺的一部分。 数据清洗是指在数据
    的头像 发表于 01-23 08:55 1008次阅读

    中软国际成功上榜信通院《数据治理产业图谱2.0》,全面满足数据治理全链路需求

    再次入选产业图谱。 · 中软国际成功上榜三大板块 · · 数据治理产品——数据管理一体化平台 · 数据
    的头像 发表于 12-25 19:00 1312次阅读
    中软国际成功上榜信通院《<b class='flag-5'>数据</b><b class='flag-5'>治理</b>产业图谱2.0》,全面满足<b class='flag-5'>数据</b><b class='flag-5'>治理</b>全链路需求

    HDI(盲、孔)板压合问题

    随着电子信息技术的迅速发展,电子产品的功能越来越复杂、性能越来越优越、体积越来越小、重量越来越轻……因此对印制板的要求也越来越高,比如其导线越来越细、导通孔越来越小、布线密度越来越高等等。 、盲孔
    发表于 12-25 14:09

    数字化转型想做到为什么这么

    数字化转型是当今企业界的一个热门话题,但实现这一转型却充满挑战。这篇文章将探讨为什么数字化转型这么,并提供一些解决方案。
    的头像 发表于 12-20 11:34 363次阅读

    校园大数据治理的难点是什么?#数据治理 #光科技

    数据
    光点科技
    发布于 :2023年12月18日 10:07:44

    校园大数据治理的意义是什么?#数据治理 #光科技

    数据
    光点科技
    发布于 :2023年12月15日 09:17:56

    如何保证校园大数据治理数据质量?#数据治理 #光科技

    数据
    光点科技
    发布于 :2023年12月14日 17:15:07

    数据治理可视化需要注意哪些问题?#数据治理 #光科技

    数据
    光点科技
    发布于 :2023年12月06日 09:30:18