国家数据局7月22日举行新闻发布会介绍2025中国国际大数据产业博览会相关情况。国家数据局有关负责人表示,全面加速高质量数据集建设和应用落地,进一步推动数据要素市场化、价值化,为培育新质生产力提供坚实的数据支撑。
高质量数据集是经过采集、加工等数据处理,可以直接用于开发和训练人工智能模型,能够有效地提升模型性能的高质量数据集合。我们日常生活中把高质量数据集分为三类:第一类是通识类、第二类是行业通识类、第三类是行业专识类。
据介绍,国家数据局已组织开展高质量数据集典型案例征集和示范推广,挖掘医疗、工业、交通等重点领域标杆实践;定期举办技术交流活动,围绕数据标注、合成、高质量数据集建设方法论等开展深度研讨;搭建常态化供需对接平台,促进数据供给方、技术提供方、场景应用方精准匹配。同时指导合肥、成都等7个城市建设数据标注基地,先行先试探索数据标注产业发展经验。截至今年上半年,7个数据标注基地建设数据集有524个,服务大模型也有163个。
国家数据局副局长余英表示广州米牛,下一步,将着力打造“数据标注+高质量数据集+模型+应用场景+市场化价值化”的闭环生态,推进数据要素市场化配置改革和“人工智能+”行动同向发力、同频共振。
通弘网提示:文章来自网络,不代表本站观点。