街坊秀 街坊秀

当前位置: 首页 » 街坊资讯 »

广东首批高质数据集赛题正式“发榜”,探索数据价值转化新路径

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:21世纪经济报道)

南方财经记者程浩 东莞报道

当前,数据已成为驱动产业变革的核心生产要素,而高质量数据集则是释放数据价值的“源头活水”。作为改革开放的排头兵、先行地、实验区,广东立足实际,全力打造数智化发展新高地,率先举办高质量数据集创新大赛。

12月2日,广东省首届高质量数据集创新大赛启动仪式在东莞举行,东莞市数据标注产业园及六大赋能平台在活动现场正式发布。此次大赛以“数聚湾区,智创未来”为主题,采用“揭榜挂帅”机制,推动高质量数据集的场景发掘、建设供给、规范流通、创新应用与成果转化,将为粤港澳大湾区数字化转型注入强劲动力。

广东省政数局局长王天广在致辞中表示,高质量数据集是驱动人工智能模型迭代升级、赋能千行百业的“核心燃料”。广东举办此次大赛将立足“小切口、大场景”,从真实需求出发,推动数据在关键领域创新应用,以赛促用、以赛促转、以赛兴业,全力抢占数智化发展制高点,合力打造数据要素创新策源地、成果转化试验田和产业集聚示范区,营造协同共赢的数据生态,助推全省数据产业迈上新台阶。

作为科创制造强市,东莞规上工业企业数量稳居全国前三,兼具丰富的AI应用场景与海量的工业数据两大优势,是国家人工智能应用中试基地。

“数据就像石油,不能光采不炼。”东莞市政数局局长张志云向南方财经记者介绍,当前,东莞正以建设“湾区数谷”为抓手,率先布局数据标注等基础环节,着力建设全国首个规模化边端智算网络,实现对工业产线数据的深度挖掘、高效加工。

本次高质量数据集创新大赛通过“揭榜挂帅”赛事机制,创新性采用“分期发榜、全年办赛”模式,聚焦工业制造、医疗健康、科技创新、城市治理、交通运输等重点领域发展需求,先找场景、再找数据,以赛事为载体和抓手,探索建设一批高质量、可复用的数据集,为人工智能模型训练和行业应用提供“燃料”,率先在全国实现“从0到1”的探索跨越。

启动仪式上,来自能源、生物医药、金融、交通、低空、教育等重点领域的首批高质数据集赛题正式“发榜”,南方电网、广州(国家)实验室、广东省人医、平安财险、佳都科技、金域医学,广东泰一、广东职教桥、奥海科技等单位,发出首批高质量数据集需求“发榜单”。

接下来,大赛将通过“1套发榜机制+3个竞赛阶段+N场供需对接会”的“1+3+N”组织体系,构建“数据供给—技术研发—场景落地—产业升级”的完整闭环。通过以赛促用、以赛促融、以赛促产,在推动成熟数据应用场景复制推广的同时,更好挖掘低空经济、工业互联网等新兴领域的数智潜力,充分发挥高质量数据集的赋能作用、有效释放数据要素的宝贵价值,为全国一体化数据市场建设、数据产业生态的繁荣发展,积极贡献“广东经验”。

高质量数据集是决定大模型质量的关键因素,也是数字产业进步的核心基石。启动仪式的分享环节,三位行业专家分别带来高质量数据集的洞察与实践。

工业和信息化部电子第五研究所人工智能中心副主任李帅介绍,数据预处理、数据标注、数据合成以及数据质量评估是构建高质量数据集过程中环环相扣的核心环节,它们通过系统化的协作,共同确保数据集能够精准支撑大模型的训练与应用。

李帅提到,电子五所正联合数据标注基地、行业龙头企业及人工智能服务商等多方力量,建设高质量数据集测评服务中心,为高质量数据集提供标准化生产流程和权威质量认证。

百度自动驾驶业务运营负责人沈健则聚焦具身智能领域,分享了数据采标室的解决方案。沈健认为,数据是具身智能行业走向通用智能的巨大瓶颈,而获取高质海量训练数据正是人形机器人破局的关键。

据了解,百度智能云能够依据客户采集需求,定制化建设各类具身智能的真实采集场景,支持场景运营和管理,开展任务定制、长期稳定、规模化采集作业,并通过采标管训全流程平台支撑模型能力提升。

中电信人工智能科技公司业务发展部副总经理魏文博总结了高质量数据集建设的诸多要点,包括数据安全与合规、一体化平台工具链支撑等。魏文博表示,中国电信正在构建“一平台三体系”新范式,通过建设运营一体化平台,支撑数据集建设、质量评估和数据安全三大体系,赋能高质量数据集的可控、高效、合规建设与价值释放,系统化破解数据集建设难题。

随着多方技术力量的持续投入和实践经验的不断累积,广东高质量数据集建设正从单点突破迈向多点开花,这将为人工智能产业的创新发展提供更加坚实的数据支撑。

未经允许不得转载: 街坊秀 » 广东首批高质数据集赛题正式“发榜”,探索数据价值转化新路径