精彩角逐!UNSW清华 -国际数据科学大赛成功举办
2019年9月,新南威尔士大学的学生与清华大学的学生进行了第一次跨国国际数据科学的比拼。
历时两天的数据科学竞赛“Datathon”,最终在澳洲IT巨头Atlassian悉尼总部落下帷幕,来自UNSW和清华大学的六组学生在这里进行数据分析结果的报告演讲。最后,来自清华大学的Cache,Hide与来自新南威尔士大学的Alphamerge队获得前三甲。
决赛现场的精彩演示
此次比赛的决赛由悉尼的大数据咨询公司Servain出题,新南威尔士大学数据科学学联(UNSW Data Science Society 简称DataSoc)与清华大学数据科学研究院及其大数据协会联合举办。整个比赛从初赛到决赛持续了两个多月,虽然过程中有不少艰辛,然而在多方支持和基于合作与挖掘培养在数据科学领域的国际人才的理念下圆满结束。
对于此次比赛的形式,DataSoc的现任主席Christopher Shi表示:“我们希望将来自不同背景,具有广泛技能的学生聚集在一起,使用数据科学技术来解决两个模拟现实世界问题。”
而谈及“Datathon”的举办目标,他期望:“ ‘Datathon’的目的是帮助学生培养和训练真实工作环境中所需的技能,不仅是应对挑战做出解决方案的技术上的技能,而且还需要能够以令人信服的方式进行成果演示的软技能等。”
通过这次与清华大学的首次合作,对于以后的发展Christopher Shi 认为:“DataSoc有一个更大的目标,我们希望在国际范围内促进多样性的合作,在新南威尔士大学和清华大学之间建立跨境合作关系。”
DataSoc决赛工作人员
两天一夜,精彩角逐
在Servian总部的决赛第一天,所有队员们就收到了包含6000多件衣服照片的复杂数据库!
这么多的数据需要怎么处理呢?
首先,队员们需要在接下来的12小时内开发一个模型,该模型可以识别分析任何图像里面的衣服类别(包含12种类型,比如短裤,衬衫,裙子等)。其次,为了确保模型是成功的,参赛队员需要在他们各自的模型上运行庞大的拥有6000张照片的数据库。记分系统会把学生模型的运行结果与预先生成的正确结果进行比对,同时会对模型在图片中预测衣服的精确度的质量进行打分。
在12个小时内完成数据分析和模型检测后,第二天早上,队员还需要前往Atlassian 总部向具有数据科学行业经验的专家进行成果展示和演讲。评委们会根据每个队伍展示的结果的精确程度以及现场表达的表现力(包括沟通能力,团队合作,幻灯片展示等)进行综合评估。
此外,精彩生动的报告演示现场有低年级的学生观摩,了解和学习高年级比赛者的数据模型解决方案。比赛结束后,参赛者与现场到来的行业嘉宾和学生进行了交流互动。
比赛结束后大合照
年轻社团,蓬勃发展
成功举办这次活动十分不易。一切的契机来源于UNSW DataSoc的前任副主席Shuning Zhao(赵舒宁)在清华大学进行交换学习的期间,与清华大学的大数据协会的朱思宇主席建立了良好的合作关系,在与两大高校的社团,学院,和各合作方交流后,多所高校之间的Datathon合作由此产生。初赛分别在中国和澳洲举办,最后分别筛选出前三的队伍进入决赛比拼。
整个比赛的结果令人惊喜,组织者对这次比赛的举办感到满意。决赛的那一周,清华大学的参赛学生和教职员工专程飞到悉尼,由新南威尔士大学的学生接待并参观了悉尼的本地公司和新南威尔士大学的数据科学相关的实验室。双方的合作不仅仅在于比赛,此次活动拓展学生的国际化视野的同时,也促进两所大学之间国际关系的发展,也向比赛的行业合作伙伴展示了未来人才的潜能。
比赛后,新南威尔士大学DataSoc成员带领清华大学的队员徒步邦迪海滩
数据科学行业是一个正在蓬勃发展的同时人才需求愈加旺盛的行业,新南威尔士大学数据科学学联DataSoc也是一个年轻的组织,其隶属于数学与统计学院,是澳大利亚境内第一个由学生组织创建的数据科学学联。成立两年以来举办了多种类型的活动,对于这次国际数据科学比赛的成功,Christopher Shi表示;” 我们肯定会在明年再次举办Datathon -我们迫不及待地想看看参与者将要解决的挑战。”
特别鸣谢赞助与支持本次Datathon的新南威尔士大学商学院,新南威尔士大学数学与统计学院,Accenture, IBM, Optiver,Advance AI和Syrius等组织机构和公司。特别值得一提的是Servian和Atlassian,为比赛题目和场地提供了巨大帮助。