ramy  2020-03-11 09:26:00  机器学习 |   查看评论   

此外,他们注意到数据有重叠,因为博主曾经多次上传同一个视频,在接下来的分析中将会忽略这部分不大的样本。

用机器学习分析完网红视频后,我发现播放量暴涨的秘密

步骤2:用 NLP 对视频进行分类

 

在这一步中,他们根据标题中的关键词对视频进行分类。

 

分组标准是:

 

  • 这个视频针对的是身体哪个部位?

  • 这个视频的目的是增肌还是减肥?

  • 或者还有什么其他关键词?

     

作者使用了自然语言工具包(NLTK),Python 中一个常用的开源 NLP 库,来处理标题。

 

生成关键词列表

 

首先,标记化视频的标题。此过程使用分隔符(如空格(" ")将标题文本字符串拆分为不同的标记(单词)。这样,计算机程序就可以更好地理解文本。

 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自用机器学习分析完网红视频后,我发现播放量暴涨的秘密

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]