【导读】一个企业的盈利与其销售市场部门密不可分,传统的销售手段是销售人员逐个联系现有或潜在的顾客,这种方式不仅耗时耗力,而且不可避免地会有疏漏,不能够精准地联系到购买潜力较大的顾客。在本文中,Sai Vishnu Kanisetty将机器学习中的Logistic Regression(逻辑回归)运用到销售系统中,用Python实现,目的是寻找系统中具有高转化率的客户,从而提高工作效率,提升企业利润。专知内容组编辑整理。
Logistic Regression in Python to evaluate profitability of Sales-Marketing System
企业的销售和营销部门负责“找到客户,销售和赢利”。销售人员通过多种沟通方式联系现有客户和潜在客户,由于时间和成本限制,不能联系到所有的客户。在这篇文章中,机器学习中的逻辑回归(Logistic Regression)被用来识别具有较高转化率的目标人群,针对确定群体的盈利能力进行评估。
要了解更多内容,请参考我的GitHub。
GitHub:
https://github.com/saivishnuk/Data-Science/tree/master/Logistic-Regression-to-evaluate-profitability-of-Sales-Marketing-System
▌文章大纲
1)总体了解销售系统,并说明本文中使用的示例;
2)了解逻辑回归技术,以及在这种情况下它如何发挥作用;
3)方法,代码和盈利能力的评估结果。
▌总体了解销售系统,并说明本文中使用的示例
大多数销售系统都是通过销售代理访问或手机联系客户。生成销售线索和将销售线索转化为客户以及接触客户都要消耗成本,是一项时间和成本密集型任务。
例如,一家公司推出了一款新产品,并希望与可能对该产品感兴趣的现有客户进行接触。 公司现有客户的数量为41,188,公司估计接触客户的平均成本为10美元,如果客户购买产品,那么平均收入为50美元。从数字来看,成本与收入比是1:5,这样做会产生很大的利润。意识到以前的市场营销活动(〜11.5%)中同类产品的转化率,管理者明白,这种瞄准每一个客户的做法会造成很大的损失。 因此,经理决定“首先确定目标受众,然后再做预算。 他希望他团队的数据科学家回答3个问题:
实现最高投资回报的成本是多少?
实现最高利润的成本是多少?
利润-投资平衡点涉及的成本是多少?
▌了解逻辑回归技术,以及在这种情况下它如何发挥作用
二项逻辑回归(binomial logistic regression)预测了二分类中类别的概率,该变量基于一个或多个独立的变量,可以是连续的也可以是离散的。 在销售系统中,因变量是先前营销活动的结果,自变量是先前的活动指标,如“过去已达到客户的次数”,“自上次购买以来的天数”,以及客户的统计特征。在本文中,我们假设数据已经按照7/3的比例划分为训练集和测试集,并且我们只关注衡量盈利率的方法。
▌方法,代码和盈利能力的评估结果
1.在训练集和测试集中,结果变量为“1”(购买产品标记为1)的客户的百分比为11.2%。
2.通过训练集中的所有客户来计算“每个客户的平均利润”。
这表明,通过向所有客户提供约11.2%的转换率将导致$ 1,25,710的损失。 所以,可以把目标转向具有更高转换率的顾客。
3. 对训练集进行Logistic回归,并使用事件发生的预测概率、以0.01的间隔来计算每个概率值的成本,收入,利润和投资回报(ROI)。
上述函数以“实际结果”,“事件发生的预测概率”,“每个人的成本”,“每个人的收入”,“检查的概率范围”作为输入。 下面的代码调用上述函数,将训练数据作为输入,并估计每个人的成本和收入,来进行决策。
如果客户购买产品或不会购买产品,则“事件发生的可能性”被认为是隔离的。 我们可以观察到,随着“事件发生概率”的增加,“目标顾客百分比”减少。有趣的是,事件发生概率减少了,投资回报率却增加了,这意味着尽管我们减少了顾客数量,但是与增加顾客数量相比,我们得到了很好的结果,这也可以在下面的图表中看到
关于事件发生的不同预测概率的收入,成本和专业图表:
该图显示,随着“事件发生概率”的增加,成本,收入等指标不断下降,ROI也在增加。 根据“预算限制”,“高投资回报率”等需要,可以选择一个特定的概率作为截止点。
不同成本的投资收益和利润图
从前面的结果可以看出,这张图也显示了“利润和ROI随成本增加而降低”。这张图可以用来回答管理者提出的三个问题:
1) 实现最高投资回报的成本是多少?
成本较少会带来较高的投资回报率,但是与较高的成本相比,相关的利润则会较少
2) 实现最高利润的成本是多少?
成本较高会得到很高的收益,但这样的高成本可能带来更低的投资回报率
3) Profit-ROI平衡点涉及的成本是多少?
支出11,300美元,可以得到25,300美元的收入,而这笔支出的投资回报率为224,截止概率为0.42
我们还需要确保将截断概率设置为0.42才不会导致过拟合或欠拟合,并且测试数据的结果与训练数据差不多。
在上面的代码中,model_eval是用户定义的函数,结果表明训练和测试结果的模型评估指标几乎相同。 因此,0.42可以被视为截止概率,概率在0.42以上的所有客户都可以被视为目标人群。
参考文献:
https://towardsdatascience.com/logistic-regression-in-python-to-evaluate-profitability-of-sales-marketing-system-fe2261964fa4
-END-
专 · 知
人工智能领域主题知识资料查看获取:【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)
同时欢迎各位用户进行专知投稿,详情请点击:
【诚邀】专知诚挚邀请各位专业者加入AI创作者计划!了解使用专知!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!
请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!
点击“阅读原文”,使用专知