随着“加快数字化发展,建设数字中国”作为一个完整篇章写入“十四五”规划,扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系成为数字化发展破局的关键。
数据是数字化发展的基础,当下,各地陆续成立大数据局等数据主管单位,发改委、经信局等机构也发挥着数据统筹与协调的作用。然而,数据开放措施难于贯彻落地、数据平台搭建苦于汇集数据、开放数据运营愁于提升质量,数字化建设可谓任重道远。
不仅是行政单位,数字化建设也成为企业发展的命脉。人才是企业数字化建设的基础,优质算法人才的匮乏,导致企业业务核心算法难以突破瓶颈,而传统招聘模式成本持续攀升、技术能力考核又不能量化,遴选算法优质人才成为了企业招聘痛点。
有没有一个抓手,可以同时盘活政府数据开放、招募并落地项目、精准招聘技术人才、提升业务核心算法?政府与企业,不约而同选择了数据科学竞赛。
政府办赛:数据开放与项目落地两手抓
数据科学竞赛始于美国,旨在通过竞赛的形式在短时间内聚集大量算法人才,根据提供的数据、针对指定的问题搭建算法模型,寻找最优解决方案。
在数字化发展成为热点伊始,上海市经信委便做了首家“吃螃蟹”的政府办赛机构。“SODA上海开放数据创新应用大赛”迄今已举办七届,累计产出创新作品2000余件,覆盖城市治理的方方面面,一举成为国内政府办赛的标杆。
随着数字建设持续深化,政府办赛的力度也随之扩大。2020年,深圳市举办了深圳开放数据应用创新大赛,汇集来自清北复交等头部院校及腾讯、阿里等龙头企业共计六千余人参赛。以一市之力在短时间集中众多行业顶尖人才,在此次赛前是难以想象的。比赛最终成功落地十余个项目,在解决社会热点问题、挖掘数据价值的同时,实现了人才引进、项目孵化、城市宣传诸多效果,比赛亦成为数据开放成果的放大镜。
与具备深厚技术土壤的区域不同,以传统产业为主的省份利用产业基础与场景应用的优势,办赛规模与效果不逊于北上深。
山东省在2020年开始试水数据科学竞赛,取得一定成效后,于2021年大幅扩大办赛规模。“第二届山东省大数据应用创新创业大赛”以“1+4”即一个省级赛区加四个地级市赛区的多城联动模式开展。该模式有两大优势:一是随着比赛规模、奖金数额的扩大,政策扶持、人才吸引力也随之提高;二是拓宽了数据体量与赛题方向,数据体量对数据人才具有天然吸引力,不仅选手规模大幅增长,也推动了政府部门在数据开放与价值挖掘上的规模效应。
值得注意的是,山东大赛在利用数据办赛的同时,也在生产数据。以“医疗报告单识别赛题”为例,通过OCR算法优化,实现纸质数据转化为电子数据的自动化,扩容数据规模,形成从数据激发应用到应用反哺数据的良性循环。
山东的数据开放举措也得到了社会认可,在复旦大学与国家信息中心联合发布的《中国地方政府数据开放报告》中,山东力压北京、广东,仅次于上海与浙江。山东省大数据局副局长顾卫东表示,通过开展数据应用创新创业大赛,充分激发社会各方面的积极性、主动性,破解公共服务、社会治理等方面迫切需要解决的重点、难点、堵点、痛点问题,提供更多、更贴近实际的数字化解决方案,对于加快数据资源的开发利用,促进跨界融合,更好的惠及民生具有深远的意义。当下,山东省的第三届大赛业已上线。
此外,专业性较强的赛事还能服务政府招采,辅助政府筛选技术实力一流的项目供应商。2020年中央军委装备发展部针对军事智能化发展问题,举办了“谋略方寸·联合智胜”智能博弈挑战赛,采取攻防对抗的形式评估参赛团队技术实力,获胜团队直接入围项目供应商名单。这一举措将供应商筛选从文件内容评估变为技术水平评测,开拓了军民合作的新模式。
总体而言,数据科学竞赛对政府的价值体现在两方面,即数据开放的抓手和招募项目的引擎。一方面,数据科学竞赛能够满足基础公共信息数据开放过程安全有序的要求,先进的加密方式与可控的办赛流程保障了敏感数据的数据安全,定制化赛题使政府可以更好地把握数据种类与开放规模,为数据开放试水;一方面,政府主导的数据科学竞赛能够发挥资源聚合的作用,政策、产业与资本合力为优质项目提供孵化与落地扶持,持续激励团队和个人产出创新项目。如四川省的“数字四川创新大赛”集合浪潮集团、长润资产等产业与资本力量,赛后十余个高水平项目得到了业务与资金支持。
对于政府办赛,知名竞赛平台DataCastle数据城堡联合创始人、DC竞赛负责人张洋认为,“十四五”规划提出并明确要建立健全数据要素市场,而做好数据开放是建立健全数据要素市场的第一步,在有足够规模且高质量的开放数据后,才能进一步开展流通交易。数据科学竞赛是数据开放的一个抓手和引擎,通过办赛可以持续推动数据开放,沉淀的人才与项目也将进一步建设并服务数据要素流通。
企业办赛:精准人才与算法突破双丰收
数据科学竞赛的核心在于人才的汇聚,相较于政府、企业对人才的诉求更急切。阿里、华为等科技巨头基于自身优势,很早就开始举办数据科学竞赛,在推广旗下云计算产品与算法工具的同时,将之作为精准招聘的手段。随着数据科学人才走俏与数字化经济浪潮兴起,越来越多的企业开始通过数据科学竞赛进行校招与社招,争夺高水平技术人才。
对于拥有海量数据的运营商而言,数据科学竞赛已成为实现精准招聘的利器。2021年中国移动“梧桐杯”大数据应用创新大赛将目光锁定在校招,参赛人群限定在高校学生群体,初赛采用算法赛形式,对选手进行技术能力评估;决赛采取应用赛形式,考察选手产品设计能力与商业洞察力。从技术能力、产品设计、商业嗅觉多个维度进行筛选,最终实现贴合中国移动企业自身需求的精准招聘。
中国移动“梧桐杯”是信息产业办赛的样板,办赛丰富了人才库,增强了技术团队实力。对于传统企业而言,囿于自身产业结构、薪资与品牌吸引力,组建算法团队存在招与养的难题。因此,举办数据科学竞赛一方面能够释放企业重视算法的信号,彰显产业升级的决心,增强人才吸引力;一方面能够将企业内算法部门无暇解决的项目众包出去,利用奖金与激励吸引优质团队提供解决方案。
“三一数据应用大赛”被视作传统制造业与数据科学竞赛结合的典范。大赛赛题聚焦机械产品智能化与工业供应链金融两方面,重点关注竞赛作品后续的产品化,利用三一集团的业务数据,搭建靶向算法模型,围绕真实场景解决实际问题。
在工业互联网浪潮席卷之下,寻求数字化转型的传统企业具有更迫切的办赛需求,传统企业人才吸引力匮乏很大程度来源于刻板印象,通过数据科学竞赛,展露自身数据体量与建模需求,是增强算法人才吸引力的有力手段。同时,参赛团队往往来自于互联网大厂与国内外优质学府,在奖金和offer的驱动下,相较于外包团队,竞赛团队技术过硬、态度认真、性价比高。
自营与第三方:殊途同归的发展路径
无论政府数据开放还是企业精准招聘,办赛质量是办赛效果的基础,办赛质量取决于赛题数据质量、平台技术与运营能力,办赛效果则要考察赛事规模与作品质量。与早期“双创”相对粗放的“PPT大赛”不同,数据科学竞赛不仅考察选手代码建模、产品设计、商业洞察等能力,选手还需要输出算法模型、产品demo、商业计划书、分析报告等成果。
复杂性问题需要专业性解决,打造一场专业的数据科学竞赛对竞赛平台、评审系统、赛题设置、数据处理、流程规划、宣传招募等方面都有较高要求,一些数据保密级别高或数据运算量大的比赛还需要线上编程工具与算力的支撑。
目前,国内赛事平台主要有两种类型:一种是“内循环”式企业自建平台,如天池,基于阿里强大的技术背景与丰富的业务场景,强调标准化,主要服务阿里系企业内部办赛需求,致力于推广阿里云等产品,沉淀用户与算法,丰富云生态、积累人才库,增强行业影响力。一种是“外循环”式第三方独立平台,如DC竞赛,基于丰富的办赛经验与领先的平台技术,强调定制化,主要服务有办赛需求的政府与企业。
两种平台模式与基因不同,发展路径与盈利方式也存在差异。企业自建平台依托企业资源,在赛事来源、品牌认知上有先天优势,但囿于成本和诉求,不提供定制化开发与运营服务,仅作为企业的有机组成部分,为企业产品提供支持。正是由此,聚焦提供定制化服务的第三方独立平台获得了发展空间。
虽然两种平台模式不同,但都关注数据与算法,着眼于打造高粘性用户社区,终极目标是促进数据开放、应用与发展。
数据科学竞赛形成的是一个生态,沉淀的是一个社区。诚然,办赛不能解决所有问题,但对于政府数据开放、项目招募落地;企业精准招聘、遴选优质算法而言是一个有效路径。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com