www.649.net www.888.yt www.g22hf.com
您当前的位置:4887铁算盘开奖结果 > 4887铁算盘 > 正文4887铁算盘

大数据技能赛:多看优秀的比赛开源代码,掌握

来源:本站原创更新时间:2018-10-04
   

9月15日—16日,2018首届全国高校大数据应用创新大赛全国总决赛在上海复旦大学举行。自3月启动比赛以来,经过初赛、复赛和决赛,为期半年的比赛终于圆满落下帷幕。

此次比赛中产生了诸多优秀的获奖者。他们中间有大二的萌新女同学,也有学术成果满满的研究僧。那么,为什么是他们得到了评委的青睐?他们为何会选择通过竞赛来完善自己?对想要参加竞赛的同学们来说,他们的经历又有哪些借鉴意义?

本期,芯君为你推荐“联创杯”大数据技术技能赛的特等奖和一等奖获得者的故事。

特等奖

北京大学 YouOnlyLookOnce

这支队伍的队员均来自数据科学专业。成员张文涛告诉芯君,之所以参加此次大赛,天将图库网址,就是为了熟悉自身所学,培养对数据的嗅觉。

这次技能赛中的数据,主要有以下几个特点:1.规则特别强;2.类别不均衡问题严重;3.数据背后的应用场景易于理解;4.训练集的数据量比较小。

针对该数据的特点,队员们在不均衡数据分类以及ensemble这两部分做了大量的工作,并且采用了一些自己原创性的算法。“最大的困难主要是训练数据的数量小且不均衡问题严重。”

对于想要在大数据竞赛方面取得一定成绩的同学,他们提了几条建议:

1.入门可以多看kaggle上相关的kernel。

2.积累自己的代码库,很多比赛的代码都可以复用,提高比赛效率。

3.多看优秀的比赛开源代码,掌握常用的数据处理方法。比如如何处理时间类型数据带缺失值的数据和类别不均衡数据等。

一等奖

江西农业大学 KDD

照片最中间为吴兵龙

这支队伍之所以特殊,是因为只有一名队员。

来自软件学院三年级的吴兵龙,正是这位“独行侠”。不过,他并非一个人在战斗。

标签 数据 大数据 代码 算法 人工智能