您的位置  > 互联网

天池和大数据业余爱好者的三个平台都有各自的特色

关于这个问题,总体来说,三个平台各有特点。 具体来说,

1、从竞赛问题本身来看。

总体来说,天池目前为止的线上赛题都提供了丰富的业务场景,就是给你一些基础的数据表,告诉你具体的含义。 而且很多网上的竞赛题直接给你一些匿名特征的样本。 因此,天池的竞赛题也需要你构建特征工程,然后进行其他后续工作。 在数据量上,天池将线上比赛数据和平台比赛数据分开。 从目前来看,天池的线下比赛数据较少,这意味着参赛者的PC配置要求较低,这也有利于数据的分析和理解。 天池平台比赛的数据量比较大。 一般情况下,比赛的数据量会比较大。 大量的数据从某种意义上也代表了游戏的公平性和可靠性。 参加过比赛尤其是天池比赛的人都明白,同一个算法的性能会受到数据量的影响。

因此,对于一些买不起(或者不想买)高配置PC的玩家来说,天池的方法相对更适合。 数据量足够了,但是你的PC可能玩不了(虽然它也提供了计算平台,但是你的代码需要它。)。 数据量小,公平性不能很好保证。

2、从赛制来看。

对于每一道竞赛题,天池分为两个赛季,而天池和天池一般只有一个赛季(虽然三者都有数据更新链接)。 正如第一篇文章中提到的,天池分为两个季节,目的不同。 第一季注重选手硬件的公平性,第二季注重赛题本身的可靠性。 另外,他们的在线评价方式也不同。 天池每天进行一次统一评价,另外两个每天进行实时评价(限制每天最大评价次数)。 每个都有其优点和缺点。 定期评估不一定​​符合某些人的日程安排,但会减少某些人的利益(一个人有多个账户)。 实时评价方式增加了人性化,但也不可避免地带来一人多账号造成的不公平。 (PS:建议天池综合两者的优缺点,创新另一种评价方式,例如:第二季每天实时评价一次。)

3、从动机来看。

平均而言,奖金数量(按照汇率换算成人民币)最多,其次是天池,然后(与其他两个稍有不同)。 另外,天池大部分赛题每周都提供周星奖励(礼物)。 比赛结束后根据排名发放粮票(换礼物)(有时也有一些活动)。 目前情况并非如此。 目前至少没有粮票激励。 另外,天池和天池都有数据科学家的排名,但目前还没有排名。 这个排名是根据参赛者的总积分(与比赛场数和每场比赛的结果有关(有时与参赛人数有关))得出的,可以大致评价一个选手的综合实力。 对以后的发展自然会有一些好处,比如工作。

4、从参赛群体来看。

天池和Now的参赛团体主要来自中国,也有很大一部分是来自欧美等国家的选手。 总体来说,选手的素质还是比较高的。 当然,目前来看,冠军的含金量还是比较高的。 这可能和人气以及数据开放程度有关系(听说国外玩家更喜欢开放数据)。 当然,对于新手或者实力还没有达到世界顶尖水平的参赛者来说,可能就没有那么好玩了。 当然,从锻炼的角度来说,无论赛题在哪个平台,都可以得到一定程度的锻炼。 天池和天池的对比,无论是知名度还是玩家数量,天池都要更高一些。 天池冠军的含金量是比较高的。

5、从计算资源的角度来看。

严格来说,三个平台中,天池是唯一一个可以算是提供计算平台的平台。 我想体验过的人都觉得速度非常高,尤其是在限制了各个团队的计算资源之后。 没有体验过的人,有机会体验一下就知道了。 当然这个平台的主要特点就是:数据开发和算法开发。 对于数据开发,平台上可以直接使用HIVE SQL来实现数据表操作代码。 另外,如果有更丰富的逻辑需要实现,还支持以UDF(User)、MR()、Graph的形式离线实现,提交到平台运行。 从个人经验来看,我一开始讨厌平台竞赛,因为我无法编写这些代码或使用它们。 但是现在,你知道了之后,你就会有另一种体验(这种体验类似于喜欢它而不喜欢其他东西如果一直用它,一直用R等等)其实如果你想想从另一个角度来说,至少你我特别想加入阿里巴巴。 如果你习惯了这个平台,面试时会给你加分。 PS:我个人感觉天池平台并不难学,尤其是越来越多的分步教程。 关键是要快。

PS:今年天池平台还推出了独特的新人大赛(这是其他两个平台没有的)。 本次新人大赛以经典赛题为学习场景,提供详细的入门教程,一步步教你如何学习数据挖掘。 天池希望新人大赛能够成为高校热门的实践数据课程,帮助更多的学生掌握数据技能。 新人竞赛链接:大数据-聚焦数据(新手可以考虑从这里开始他们的数据之旅)。

祝您玩得开心!