分享好友 维修大全首页 维修大全分类 切换频道

吉日象维修app

什么是机器学习(一文带你理解机器学习)

2023-11-14920

编辑导读:认识世界,就是一个从已知到未知的函数。机器学习,就是预测这个函数,并且使预测结果尽量准确。本文作者围绕机器学习展开讨论,与你分享。

什么是机器学习(一文带你理解机器学习)(1)

问:谈谈你对机器学习的理解。

答:机器学习就是用已知去预测未知。

认识世界,就是一个从已知到未知的函数。收集一大堆数据,然后用它们去预测一个值,就是回归问题。例如数码回收,根据你的机型、机况和行情,给出一个价格走势;从一大堆数据中,找到属于某一类的那些,就是分类问题。例如我们经常使用的验证码,“选出所有带桥的图片”。

机器学习,就是预测这个函数,并且使预测结果尽量准确。当然,这个过程是由算法工程师实现的,策略产品经理需要思考的是怎样用算法的逻辑,去解决业务问题。本文放弃了复杂的定义和公式,尝试用口语化的语言介绍常用算法的逻辑,降低新手产品经理(非技术)的学习成本,并且覆盖尽可能多的工作场景。

一、像树一样决策

决策树(Decision Tree)是一种以树形数据结构来展示决策规则和分类结果的模型,比较接近人类的决策过程。决策树发挥作用,首先要用到看似杂乱无序的已知实例,有2个值可以来形容这些实例。

  1. 信息熵:对随机时间不确定的度量,即到底有多杂乱无章。
  2. 信息增益:事件A的的发生为事件B增加了一些确定性,增量的多少即信息增益。

接下来,你要不断寻找最能将这堆杂乱无章的数据区分开来的特征——即使之区分于其他数据的特质——使用这一特征对数据进行划分。每次选择区分度最高的一个,不断迭代,直到所有特征都被用掉。用最经典的买瓜问题来示例:

什么是机器学习(一文带你理解机器学习)(2)

这时你就可以通过决策树来判断,下一个西瓜到底该不该买。在这个过程中,有时候需要产品帮助判断什么特征才是最有价值的。你也可以不断发现新的有价值特质,或删除一些多余的特征,将这棵”树“修剪地更加精致。

二、以类聚物,以群分人

所谓”近朱者赤近墨者黑“,虽然我们不了解一个人,但我们了解了他身边的人后,就根据已知信息推测他的性格特征。这也是K近邻模型的原理。在一个空间中,距离样本A最近的K个样本B属于一个类别,那么A也属于这个类别,并且具备这个类别的特征。这里”空间“和”距离“的定义较为复杂,不做展开。

如何选择合适的K值?需要持续训练。如果K们不能很好地归成一类咋办?那我A应该归属于谁呢?有两种判定方式,一种是少数服从多数,哪类最多我属于谁;一种是加权投票,可以根据远近程度加权,越近权重越大。

什么是机器学习(一文带你理解机器学习)(3)

对于产品而言,在进行用户分层类的项目时,可能会依赖这类算法能力。举个例子,当前我能提供图文、短视频和中长视频三种形式的服务,每种服务下都积累了大量的用户数据。这时由于运营的出色表现,产品涌入了大量新用户,我需要尽快知道他们更适合哪种形式的服务,以提高留存、活跃和转化。

三、完美一刀切

承接上文,面对大量新用户,我想要知道他们哪些对我价值最高,哪些价值稍低,从而采取不同的运营策略。支持向量机模型会是一个好的选择。

假如我有N个特征来形容这批用户,那么构建一个N维的空间,每个用户都能在其中找到自己的坐标。这时我找到一个N-1维的平面,它正好将所有用户分割成2个不同的类别,并且离正负样本的距离最远。

什么是机器学习(一文带你理解机器学习)(4)

这就是支持向量机模型的基本逻辑,是解决线性不可分问题、非线性问题的利器。

以上三种模型都是根据已知特征,给出一个确定的分类结果(未必准确),我们称之为判别模型。与之相对的是生成模型,它会给出一个最优的猜测结果,同时给出猜测的概率估计值。在一定条件下,它能更好地反映数据分布的全貌。

四、朴素贝叶斯模型

啥叫贝叶斯?贝叶斯就是在已知某条件的前提下,推算某事件发生的概率。它强调我们在预测一个事物前,要根据已有信息推断一个先验概率。用举个例子:如何肿瘤化验结果推断患者是否真正得癌?在计算这个概率之前,我们首先要知道先验概率,即癌症本身的发病率为多少,以及化验检测的准确率是多少。

什么是机器学习(一文带你理解机器学习)(5)

如上图所示,当你的化验结果是有病时,你实际上只有9%的概率真正患病;而如果你真正患病,也有十万分之一的概率没有被检测出来。

这其实告诉我们,在根据数据进行决策时,要考虑前提条件。例如我们在产品内部新上线了一个“长视频”板块,数据分析发现这一板块下的用户以35-45岁的用户为主,所以我们判断要根据这一年龄阶段的用户去优化UI设计和内容投放。

但考虑到先验概率的问题,我们首先要知道该板块用户的转化概率,即从35岁-45岁的网民转化到我“长视频”板块活跃用户的概率。如果这一概率很高,那么我们可能只是在这一年龄段用户聚集的渠道做了比较多的投放,导致现阶段35-45岁用户较多。我们针对其他年龄用户聚集的渠道,也来一波拉新策略,可能同样获得成功。那么现阶段去调整功能设计和内容策略,就是不合适的。

五、总结

对很多非技术产品经理来说,充斥着数学公式和专业术语的技术语言是很难理解,或理解成本较高的。但实际上,作为一个新手产品经理,还没有深入到具体的业务之前,只需要了解每种技术的实现逻辑即可。从策略的视角去审视技术,而不是让技术限制了你的想象力。树立强烈的目标导向,与技术团队建立良好的沟通关系,可能是更高效的手段。

举报
打赏
打赏主播是什么意思
打赏主播是指观众(用户)在观看网络直播节目时,自愿通过直播平台提供的支付渠道,将一定数额的金钱或虚拟礼物赠送给主播的行为

0评论2025-03-26870

主打是什么意思
“主打” 这个词常见的有以下几种意思:一、在商业、产品领域主要营销、重点推广当我们说某产品是公司的 “主打产品” 时,是指

0评论2025-03-26636

电台路是什么意思
“电台路” 通常是因与电台相关的因素而得名的道路,以下是一些具体例子:上海电台路:位于宝山区顾村镇,呈南北走向,南起宝安

0评论2025-03-26335

打狙的窍门是什么意思
“打狙的窍门” 通常是指在射击游戏或实际射击场景中,使用狙击步枪时能够提高射击准确性、效率和生存能力等的一些技巧和方法。

0评论2025-03-26647

路上的创作原声是什么意思
“路上的创作原声” 通常是指以 “在路上” 的状态、经历、感悟等为主题或灵感来源而创作的原始声音作品,在不同艺术领域有不同

0评论2025-03-26375

打印照片回执是什么意思
打印照片回执是指在完成照片拍摄并经相关系统审核通过后,将记录照片合格信息以及个人身份等相关内容的电子凭证,通过打印机输出

0评论2025-03-26283

棒打鸳鸯是什么意思
“棒打鸳鸯” 是一个汉语成语,意思是用木棒打散一对鸳鸯,比喻拆散恩爱的夫妻或情侣。该成语的来源和用法如下:来源与出处:出

0评论2025-03-26672

主打三棺是什么意思
“主打三棺” 是一种网络用语,用反语的方式讽刺人们没有正常的思维观念和底线。该梗起源于贴吧网友之间的讽刺话语,具体出自抗

0评论2025-03-26220

常用香料是什么意思
常用香料是指在烹饪、食品加工、香水制作、药品生产等领域中经常使用的具有独特香气和味道的物质。它们可以增添风味、改善气味、

0评论2025-03-26963

潮汕话香芋是什么意思
在潮汕话中,“香芋” 通常指的就是芋头。不过,潮汕方言中芋头的发音是 “麦筲”(mài shāo)。芋头在潮汕地区的饮食文化和民

0评论2025-03-26504

关于我们  |  网站留言
(c)2026 吉日象维修app www.mykuaidi.com