个数是如何用大数据做行为预测的？

“个数”是“个推”旗下面向 APP 开发者提供数据统计分析的产品。“个数”通过可视化埋点技术及大数据分析能力从用户属性、渠道质量、行业对比等维度对 APP 进行全面的统计分析。

“个数”不仅可以及时统计用户的活跃、新增等，还可以分析卸载用户的成分、流向，此外还能实现流失、付费等用户关键行为的预测，从而帮助 APP 开发者实现用户精细化运营和全生命周期管理。其中很值得一提的是，“个数”在“可视化埋点”及“行为预测”方面的创新，为 APP 开发者在实际运营中带来了极大便利，所以，在下文中，我们也将围绕这两点做详细的分析。

可视化埋点

埋点是指在产品流程的关键部位植入相关统计代码，以追踪用户行为，统计关键流程的使用程度，并将数据以日志的方式上报至服务器的过程。

目前，数据埋点采集模式主要有代码埋点、无埋点、可视化埋点等方式。

“代码埋点”是指在监控页面上加入基础 js，根据需求添加监控代码，它的优点是灵活，可以自定义设置，可以选择自己需要的数据来分析，但对复杂网站来说，每次修改一个页面就得重新出一份埋点方案，成本较大。目前，采用这种埋点方案的代表产品有百度统计、友盟、腾讯云分析、Google Analytics 等。

“可视化埋点”通常是指开发者通过设备连接用户行为分析工具，直接在数据接入管理界面上对可交互且交互后有效果的页面元素（如：图片、按钮、链接等）进行操作实现数据埋点，下发采集代码生效回数的埋点方式。目前，可视化埋点的代表产品有个数、Mixpanel、神策数据等。

“无埋点”与“全埋点”相似，它的原理是“全部采集，按需选取”，也就是说它可以对页面中所有交互元素的用户行为进行采集，它是先尽可能多收集检测页面的内容，然后再通过界面配置决定分析哪些数据，但它是标准化采集，如果需要设置自定义的采集方式仍需要代码埋点助力。这种方案的代表产品有 GrowingIO、数极客、百度统计等。

“个数”为什么会选用可视化埋点？

当下移动互联网正处于高速发展且发展形势瞬息万变的阶段中，开发者需要及时根据大数据的分析、反馈，对业务功能等做出调整，在传统的操作模式中，如果想要了解不同节点的数据，就要修改相应代码里面的埋点，然后测试发布，之后再在应用商店审核、上线，整个周期可能长达几个星期，这显然无法满足业务的需求。所以，“个数”采用的“可视化埋点”技术就是为了帮助开发者解决这个问题的。

“个数”的可视化埋点灵活、方便，不需对数据追踪点添加任何代码，使用者只需要通过设备连接管理台，对页面可埋点的元素圈圈点点，即可添加随时生效的界面追踪点，同时在数据采集模式及数据分析能力上，“个数”能够提供给开发者们准确的、有效的数据。

个数是如何用大数据做行为预测的？
可视化埋点主要具有以下特性：

1、零代码，无需代码，节省成本
2、免更新，新增便捷，无需升级
3、易测试，圈选测试，实时呈现

换而言之，可视化埋点不仅可以节约企业成本，还可以提高开发人员和运营人员的工作效率。

行为预测

“个数”的行为预测主要包括流失预测、卸载预测、付费预测等，它的原理是基于 App 历史行为数据构建算法模型预测用户关键行为，从而帮助开发者达到用户精细化运营和全生命周期管理的目的。

在这里需要注意的是，“个数”的行为预测与电商平台常用的个性化推荐不同，后者主要是基于用户近期的行为，如浏览记录、购买记录而分析出用户可能需要的东西，而“个数”是基于 App 各渠道卸载数、卸载趋势等指标的综合分析，更多的是对人群的聚类分析，而非仅仅基于个人的行为。

行为预测的步骤

据“个推”大数据科学家朱金星介绍，“个数”的行为预测主要分为以下几个步骤：

1、找样本，主要从历史数据库中抽取；

2、特征抽取，将用户与数据库打通，做匹配；

3、特征筛选，保留相关性高的或有价值的特征；

4、模型训练，将保留下来的特征放到模型中训练，在模型的选用上，“个数”主要用了逻辑回归，逻辑回归的模型相对深度学习等其他模型来说，简单一些，而且在特征筛选上相对好处理，得到的结果好解释，也相对稳定。