“ 人群创建模块,是用户画像系统最最基础的功能模块之一了。”
好久没有分享关于用户标签画像相关的内容了。之前分享的《标签系统的搭建》、《画像系统的应用场景》等,大家都可以回顾一下,比较概述的文章。
关于更多的用户标签数据、画像系统相关的文章,可以通过公众号内的导航进行查看,现在基本初成知识体系了。
闲言少叙,下面正式开始今天的话题。
01
—
画像系统及模块概述
其实关于画像系统的模块,之前有分享过《如何进行 look-alike 相似人群扩展》、《实时人群预估计算》、《如何提取关键画像信息》等。但是这些功能和今天要分享的人群圈选功能相比,都算是打辅助的。
人群创建是画像系统的基本功能。下面是一张画像系统产品架构图(来源:自如草帽小子的分享)。
人群创建是整个画像服务的第一步。
所谓人群创建,就是通过各种不同方式,最终生成符合业务期望的人群包的过程。
基于不同的创建方式,可以有条件圈选、人群市场圈选、一方上传等;基于不同的更新配置,可以分一次性和周期性。
详细的内容下面逐个分享。
02
—
条件圈选及标签类型
条件圈选应该是我们用户画像系统最常用的圈选方式了。比如下面的截图:
在条件圈选这里,不同数据类型(可参考《标签类型分类》)的标签圈选的方式是有明显差异的。
(1)数值型条件
所谓数值型条件,是通过输入标签值的范围进行人群的筛选。
采取这种方式的条件,都是统计连续值类型的标签数据。
(2)枚举型条件
所谓枚举型条件,是通过勾选进行人群的筛选。
(3)文本型条件
文本型条件,主要支持像关键词等非标准化的内容筛选。
(4)其他
上面三种条件圈选是比较常见的。除此之外,还有例如基于 POI 地理位置信息圈选的相关逻辑。可参考《LBS 数据标签生产》。
(5)交并差逻辑
当圈选条件大于等于 2 个时,将不可避免的需要进行交并差逻辑的添加。
上面是交并差以及多个逻辑复合的示例图。
03
—
人群市场与智能人群
下面介绍一下人群市场和智能人群相关内容。
(1)背景
通过条件圈选的方式,用户可以灵活圈选出符合自己业务需求的人群。
但是在应用过程中,虽然可以通过产品化的方式给用户提供每个标签条件的应用热度、使用建议等,但是对于小白用户,往往并不能轻松的实现业务目标与人群圈选的匹配。
举个例子。用户想实现高潜用户的转化,想把高潜用户给圈选出来做营销。如果有【高潜】标签,那正好可以;如果没有,那么到底通过哪些条件进行交并差,才是“高潜”用户呢?这就非常依赖用户的经验了。
这里提供的解决方案,就是通过人群市场与智能人群满足需求。
(2)人群市场
什么是人群市场呢?
主要是为用户提供的一个可以直接应用第三方人群包的平台。人群市场的供给者主要是第三方生态,例如 ISV,或者其他用户。
这种方式比较便捷,但逻辑开放度不像自行条件圈选那样高。
(3)智能人群
智能人群主要是平台方通过行业投放积累的数据,进行投放人群包的推荐。
04
—
一方人群上传与匹配
无论是条件圈选还是人群市场,都是通过平台方的数据实现的人群创建。下面介绍一下用户一方的人群上传圈选。
(1)背景
用户无论是做用户管理、还是营销投放,都肯定是有沉淀自己企业一方的一些数据的。这种情况下,往往需要和平台的人群系统能打通,做一些交并差的操作,生成更加精细化的人群。
因此就有了通过一方人群上传进行人群圈选的功能。
(2)人群匹配
在一方人群上传这里,绕不开 ID 的匹配。
关于 IDmapping,这里不详细展开了,有机会单独分享。
05
—
SQL 及算法模型训练
最后简单聊聊通过 SQL 以及算法模型实现人群创建。
(1)SQL 圈选
这应该是最灵活的圈选方式了。只要给用户开放相关的数据权限,用户就可以通过写 SQL 的方式完成圈选条件的配置。
(2)算法模型搭建
通过算法模型搭建,实现人群包的挖掘,这个属于比较高阶的能力了。
一方面,对于平台而言,需要搭建算法平台,给用户提供模型训练的能力;另一方面,对于用户而言,也需要懂算法、懂模型,才能进行相关应用。
关于用户画像系统,都有哪些实现人群创建的方式,就先分享到这里。基本市面上主流的创建方式,都涉及到了。至于未来是否有更加灵活便捷的人群生成方式,我们积极探索吧!