恒达当前位置:首页 > 动态 > 正文

恒达娱乐用Python分析了歌神张学友近16万歌词

来源: 恒达娱乐 | 浏览次数:815 | 更新时间:2019-05-14 15:12:20


用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


可儿可是张学友的铁杆粉丝,听了他的许多许多歌曲,比方“吻别”,“饿狼传说”,“等你等到我心痛”,“祝福”,“她来听我的演唱会”等等。学友的歌伴我走过了许多许多年月,从大学生到研究生,从学生到码农。都是歌神是情歌王子,那学友的歌里的情感到底怎么,已然玩Python,不如着手剖析一下。咱们爬取了近16万的歌词并剖析,并用机器学习剖析了一下,哇发现几个亮点。

01

歌词的收集


首要是关于歌词素材的收集,我对比了各大音乐渠道的歌词爬取难易程度,决议选用百度音乐作为爬取对象,爬取张学友的歌曲,因为其歌词是选用lrc文件保存,


用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


爬虫这块十分简略,总共才几十行代码,我把核心的代码贴了一下,咱们能够着手敲一下看看,不是很难的。爬取完毕之后将所有的歌词文件爬取到了本地。如下图所示:

用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


但是在读取歌词的时分,歌词中存在缺失,乱码等问题,所以需要关于歌词进行耐性的清洗,然后将歌词以及歌曲名称以及歌手信息保存到Excel表中,清洗好的数据如下图所示,去表格最初一部分的数据:

用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


取表格后10行的数据:


用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


02

歌词情感剖析


接下来便是进行关于歌词的情感剖析,关于歌词的情感剖析,依托的是BosonNLP渠道,该渠道关于中文,供给了许多运用简略、功用强大、功用牢靠的自然语言剖析服务。咱们这儿是用到他的情感剖析的功用。

首要咱们得去它的渠道注册,得到咱们个人的API密钥,如下图所示:

用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


得到API密钥后,就按照它的教程进行了关于歌词的情感剖析,该渠道供给的情感剖析,每天只有500次的免费运用机会。并且它关于句子的情感剖析返回的是两个值:

  • 第一个值是指该句子对错负面的概率
  • 第二个值是指的负面的概率,两个值的和加起来等于1

这儿的负面能够理解为一些消极的态度,例如生气、焦虑、忧伤等等。代码如下图所示:


用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


上述的代码十分的简略,首要做了下面几步:

1).先将歌词读入到list_lyrics这个列表中

2).然后调用requests.post函数,将句子送至BosonNLP渠道

3).终究就会返回该歌词的情感剖析值。

小编剖析了497首歌,终究得到了张天王的十大哀痛歌曲排行榜,和十大活跃歌曲排行榜,如下图所示:


用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


>>

十大哀痛曲目为: 0 1

0 我不明白 0.996758

1 不想失掉你 0.996119

2 燥狂 0.989038

3 I Don T Wanna Be 0.986872

4 你冷得像风 0.977820

5 认床 0.977314

6 葬月 0.977087

7 问月 0.974448

8 当爱变成习惯 0.974190

9 算命 0.973292

十大活跃曲目为: 0 1

0 让奇妙翱翔 0.996168

1 花与琴的流星 0.995877

2 祝愿 0.992565

3 温馨 0.991497

4 仍是会喜爱你 0.990432

5 仍是喜爱你 0.990432

6 流星下的愿 0.988126

7 留住这时光 (Full Version) 0.986213

8 简简略单便是爱 0.986053

9 飞机师的风衣 0.981768

由上图能够看出,学友哥的最哀痛的歌曲为《我不明白》,负面指数达到了0.996758,可谓是哀痛至极。小编特地去听了一下,真的很哀痛,歌曲缓慢打开,充满了离别的忧伤,是一首典型的哀痛情歌。

03

高频词剖析


做到这些就完了吗?显然不够,作为情歌王,张学友的各种必定充斥着复杂的“情感联系”,恒达娱乐小编剖析了歌词中“他”、“她”、“我”、“你”的数量,终究得到了一下的结果:


用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


读取文件,然后遍列每一行大歌词,用count计算每一行的关键字.

用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


从图上咱们能够看出,学友哥的歌曲人物联系大部分仍是环绕两人的情感打开,很少有掺杂“第三者”的问题。

已然是情歌,怎么能少得了“爱”,小编又为咱们剖析了这497首歌曲中哪五首歌曲中“爱”字呈现的频率最高,如下图所示:

用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


从上图能够看出,《命运舞会》这首歌中“爱”呈现的次数最高。

终究小编为咱们制作了歌词的词云剖析,让咱们清楚的看到,在学友哥的歌曲中,终究哪些关键词呈现的频率最高,如下图所示:

用Python剖析了歌神张学友近16万歌词,发现了几个隐秘


发现永远,自己,没有,一个,不会,一生,什么,全部这些词是高频呈现的。想想确实是的,你试着回忆几首学友的歌,都忽多忽少的呈现这些词。以上便是小编为咱们带来的基于歌词的情感剖析和计算,Python便是这么有趣,只需你想玩的趣味操练,Python大部分都能实现。

现在加重视小编有机会获取高手进阶必读的Python设计形式,机不可失。

用Python剖析了歌神张学友近16万歌词,发现了几个隐秘

终究,重视可儿不迷路。每日都会分享一些学习小技巧。

需要学习教程资料的私信可儿“资料”就能够收取啦。

恒达娱乐精选评论

沿途有你1999:四大天王都是人生大赢家[玫瑰][玫瑰][玫瑰]

1寸法师:最悲伤的应该有《日出时让恋爱终结》

您可能感兴趣的文章