NBA和数据挖掘

我们在学校里的时候,老师讲到“数据挖掘”,总是喜欢用啤酒和尿布做例子。这个例子实在是太生动,太贴近生活,以至于久而久之,大家都只会用这个例子了,众口一词,相当的乏味。其实,近来我发现,NBA是一个很活生生的好例子。NBA把数据挖掘用到了无处不在,时常令人有叹为观止的感叹。

例如,在最近的一期的《体育画报》里的一篇关于NBA的文章中提到:“二十年来,所有年度防守球员退役时都有枚戒指带”(言下之意,估计穆托姆博和阿泰斯特也会拿到总冠军的)。能够发掘到这样一个事实,基本上只有两种可能性:有那么一小撮对NBA掌故烂熟于胸且大脑极其发达的中年人,他/她们对一些深深隐藏在浩如烟海的数据背后的一些有趣的事实有极其敏锐的洞察力;或者NBA掌握了非常行之有效的数据挖掘技术,并运用这样的技术对其数十年如一其不厌其烦收集的数据进行了挖掘。

我比较愿意倾向于相信后面一种可能性,因为找到或者培养那种既能熟记大量数据又有敏锐洞察力的人是一件非常困难的事情,而且不具备可重复性——但我不止一次看到在涉及NBA的文章中出现那种深藏的事实,而且不单单是NBA,在美国的其他体育联盟(比如橄榄球、棒球等)里面,也经常能有类似的发现。同一期《体育画报》中另一处写道:“82games.com定义的‘关键时刻(最后5分钟双方分差小于5)’中,(Tracy McGrady)他有80%的得分靠单打的来。相反,姚明在‘关键时刻’…有高达60%的得分依赖助攻”。

从这些充满质感的数据和来自于数据中的事实中可以看出,即便不论那些数据挖掘是人做的还是计算机做的,美国的各大体育联盟对数据的收集之细,也是值得我们学习的。下次面试Senior SDE的时候不妨问这么一个问题:请设计一个NBA比赛和球员资料数据库。

One Comment

  1. “告诉我你想挖出什么”。。

    Reply

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s