提升高质量数据供给能力,推动通用人工智能大模型领域创新
2023-08-06 06:05:46    东方资讯


(相关资料图)

近年来,大规模预训练模型(以下简称“大模型”)作为人工智能取得突破性进展的重要驱动力之一,显著加速人工智能工程化和普惠化发展进程,有望成为新一代智能技术底座。人工智能大模型的突破源于高质量数据的不断发展,提升高质量数据要素供给能力是推动通用人工智能大模型领域创新的关键。

2020年的一项重要研究工作发现,模型效果与模型的参数、数据和计算量之间存在幂律发展规律“ScalingLaws”。模型参数、数据和计算量呈指数级增长,模型在测试集上的损失呈指数级下降,模型性能越好。

也就是说,在计算量给定、参数规模较小的情况下,增加模型参数量对模型性能的影响远高于数据和训练次数的贡献模型的步骤。

因此,业界对大型模型的性能形成了普遍的认识,即模型的参数和容量越多,模型的性能越好。

从AI产业链的发展情况和未来发展趋势来看,中国AI数据服务行业的市场规模正在逐步扩大。随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工愈加清晰。

在青年先锋论坛活动上,云测数据总经理贾宇航指出,作为人工智能的“燃料”,AI数据的质量影响着大模型的最终的结果的好坏。数据的数量越多、质量越高,模型的训练和性能优化就越充分、性能就越好,高质量的AI数据将助力人工智能应用具备更强大的服务能力。

谈及面向大模型高质量数据需求,云测数据在相关层面有哪些优势布局时,贾宇航表示云测数据一直将数据质量作为AI数据服务的发展核心,不仅聚焦于技术研发优化,更是延伸至人才培养、产品服务等环节,为企业提供高质量的场景化的AI数据服务。业务层面通过数据采集、数据清洗、数据标注等方式为企业引入AI数据处理,以标准API接口支持数据导入和导出、支持已有算法预标注功能,可以提供多项AI数据产品应用和AI数据服务,跟任何的企业的数据库打通,完成原始数据到标注数据的快速积累,加速AI模型的开发进程。返回搜狐,查看更多

责任编辑:

关键词:

下一篇: 最后一页
上一篇: 一夜消息:浓眉刷新纪录,李凯尔首秀敲定,美国男篮连续落败

提升高质量数据供给能力,推动通用人工智能大模型领域创新

一夜消息:浓眉刷新纪录,李凯尔首秀敲定,美国男篮连续落败

AI助力游戏研发与产出

国家防总紧急调拨物资支援重点地区防汛救灾

王志文演的电视剧(王志文演过什么电视剧)

什么是投资银行(什么是投资银行)

试用期因不合适而被辞退有补偿吗

复旦博士创办框框大学分享经验

进“一家门”办“三家事”,水电气共享营业厅

属羊2022年生肖运势,生肖运势2022 属羊2021生肖运势详解

社会保险生育险怎么办理?有哪些手续的

怎么使用壁挂炉供暖

2023年8月5日云南省粳米批发价格行情

有一种叫云南的生活丨彩色稻田画 绘就永仁好“丰”景

杜克大学:基因编辑能减缓阿尔茨海默问题的风险,痴呆有救了

智通ADR统计|8月5日

巴西批准罗赖马州从委内瑞拉进口电力

模特卡的模特卡制作软件是什么_模特卡的模特卡制作软件

意媒:国米愿意以1500万欧+法比安签下萨马尔季奇

类似挥着翅膀的大灰狼的小说(挥着翅膀的大灰狼的小说)

汤臣倍健2023上半年盈利增长47.41% 聚焦科学营养布局VDS新周期

24项目入选第一批全国智慧旅游沉浸式体验新空间培育试点名单

青平:提升科研水平 建设世界科技强国

支援京津冀救灾 美团外卖成立“骑手志愿服务队”

浙江省博物馆需要提前预约吗(附预约指南)

航天晨光:冯杰鸿辞去董事长等职务

宁波航交所:欧线运价涨后回落 菲律宾线环比跌22%

临夏州选手在甘肃省青少年创意编程与智能设计大赛中获嘉奖

中国海油紧急调派直升机驰援涿州,已成功营救49人

东莞有人在江边“放生”鱼豆腐?水务局回应:会加强管理

西力科技:拟出售控股子公司金卡电力85%股权

火柴天堂原唱是谁 火柴天堂歌词欣赏

北京文化:公司已将封神相关服化道妥善安置保管,并积极进行IP开发及相关衍生品开发业务

论道短视频|短视频如何深下去?红星视频:用好三“度”提升品质

广州市抽检431间游泳场所

安徽省凤台县市场监管局开展物业收费价格专项检查