近年来数据科学(Data Science)、机器学习(Machine Learning)一直都是很夯的话题,也有不少像我一样的PM会对于怎么开发数据型产品(Data Product)很有兴趣。很幸运的,我现在工作的领域中有不少接触数据型产品的机会,在过程中有自己摸索一下跟数据科学家合作的方式,这篇会以一个数据型PM初心者的角度,跟大家分享如何开启跟数据科学家的对话。
一个完整的数据团队(Data team)中其实有很多角色,这边所谓的「数据科学家」主要是指在团队里面负责设计与开发算法、机器学习模型的人,与数据分析师(Data Analyst)和数据工程师(Data Engineer)不同。
▲数据团队中不同角色的差异。
什么是数据型产品(Data Product)
在去找数据科学家之前,我们要先知道 「什么样的问题适合用数据来解决」。
收集到的数据数据可以有很多用途,例如大家最熟悉的AB testing(利用数据去了解产品对用户的影响),或者是在产品规划前期做的数据分析(利用数据去找出目前产品最大的问题)。
若我们将这些数据与运算,直接融入产品功能中,它就是一种广义的数据型产品。以下是几种常见的例子:
-
推荐系统: 这个大家应该非常熟悉,例如YouTube的视频推荐,根据用户行为等数据,去找出用户最有可能继续延伸观看的视频。
-
内容分类: 例如Spotify上有许多的播放清单,除了个人化推荐以外,将类似曲风的音乐放在一起的「分类(Cluster)」也是常见的数据型产品。
-
影像识别: 例如淘宝的照片搜索功能,辨认与分析用户上传的照片,去寻找有相似特徵的商品图像。
-
垃圾信件侦测: 例如Gmail会去运算找出哪些信件可能会是垃圾邮件,帮你放到垃圾信件夹里面。
数据科学不是万灵丹,要先想清楚现在要解决的问题,是否适合与需要用复杂的数据运算手段。
我该怎么跟数据科学家提需求?
1. 定义问题
身为PM大家应该都对这一步很熟悉了,不过在用户问题背后,可能会有一些数据型产品特有的问题,要特别注意一下。比如说常见的Cold Start问题:用户刚注册时还不清楚他的喜好;又或刚上架的商品用户互动的数据较少等等。有蛮多策略可以解决Cold Start,例如用热门商品或新鲜货取代推荐商品、甚至在使用者创建帐户时直接问他的喜好等等,这些策略与其说是数据科学家的职责,更是PM的产品决策,在做产品规划的时候要纳入考量。
2. 确立要优化的指标(Metrics)
对数据科学家来说,优化的指标跟要解决的问题是紧紧绑在一起的。所以在描述完用户问题之后,立马跟他们说你想要优化的指标就对了!
例如,假设我希望做一个搜索结果排序,让品质好的商品可以被放在最上面,我们可以定义说「这个优化我是希望提升搜索结果的点击率」或「我希望优化后用户会看更多商品」,让数据科学家来协助思考解法。毕竟有些时候模型和算法就是根据目标来运算,我们不一定知道机器学习模型里面实际的规则是什么。