科技

人工智能从“大炼模型”到“炼大模型”

人工智能可以分为几个发展阶段:基于数据的互联网时代、基于算力的云计算时代,以及接下来可能将进入的基于模型的AI时代,这相当于把数据提升为超大规模预训练模型。未来,研究人员可以直接在云模型上进行微调,很多公司甚至不用维护自己的算法研发团队,只需要应用工程师即可。

写小说、和人聊天、设计网页、编写吉他曲谱……号称迄今为止最“全能”的AI模型GPT-3,当然远远不止会这些。作为2020年人工智能领域最惊艳的模型之一,GPT-3无疑把超大规模预训练模型的热度推向了新高。

3月下旬,我国首个超大规模人工智能模型“悟道1.0”发布,该模型由智源学术副院长、清华大学教授唐杰领衔,带领来自清华大学、北京大学、中国人民大学、中国科学院等单位的100余位AI科学家组成联合攻关团队,取得了多项国际领先的AI技术突破,形成了超大规模智能模型训练技术体系,训练出包括中文、多模态、认知和蛋白质预测在内的系列超大模型。

已启动4个大模型开发

据悉,“悟道1.0”先期启动了4个大模型研发项目:以中文为核心的超大规模预训练语言模型文源、超大规模多模态预训练模型文澜、超大规模蛋白质序列预测预训练模型文溯,以及面向认知的超大规模新型预训练模型文汇。

唐杰介绍,文源拥有26亿参数,文澜则为10亿,文溯是2.8亿,文汇则达到了百亿以上。虽然相对于GPT-3的1750亿参数而言还有差距,但“接下来会有更大的模型”。

目前,文源模型参数量达26亿,具有识记、理解、检索、数值计算、多语言等多种能力,并覆盖开放域回答、语法改错、情感分析等20种主流中文自然语言处理任务,在中文生成模型中达到了领先的效果。

“目前这些模型既有一些交集,但也存在明显差异。文源的重点是在中文和跨语言,未来也会加入知识;文澜的重点主要是图文;文汇则更多地瞄向认知。”唐杰表示,认知是人工智能技术发展的趋势和目标,关系到机器是否能像人一样思考这个终极问题。

“下一代人工智能技术的发展方向一定是认知。”据唐杰介绍,在作诗任务中,目前文汇已经通过了图灵测试。从算法的角度上来看,文汇能通过图灵测试的关键在于“生成”,而不仅仅限于“匹配”,这种生成能力是多样的。

被问及为何会选择这4个预训练模型项目时,唐杰说,这是综合考虑了国内外同行的相关工作、国内人工智能发展的现状、团队人员构成、北京区域优势等作出的决定。“当时GPT-3刚发布不久,悟道团队认为首先要对标其卓越的少样本学习能力,同时还要做出差异化,做短、中、长3个阶段的布局。于是,中文版GPT-3即清源CPM(文源的前身)应运而生,这是短期布局。之后,文源要向中英文模型乃至多语言模型发展,这是中期布局。最后走向认知智能,这是长期布局。”唐杰说,与此同时,国内顶尖的企业人才、学术人才和自然科学人才所组成的团队给了项目巨大的想象空间。

大模型有大智慧

自2018年谷歌发布BERT以来,预训练模型逐渐成为自然语言处理(NLP)领域的主流。

2020年5月,OpenAI发布了拥有1750亿参数量的预训练模型GPT-3。作为一个语言生成模型,GPT-3不仅能够生成流畅自然的文本,还能完成问答、翻译、创作小说等一系列NLP任务,甚至可以进行简单的算术运算,并且其性能在很多任务上都超越相关领域的专有模型。

以GPT-3为代表的超大规模预训练模型,不仅以绝对的数据和算力优势取代了一些小的算法模型,更重要的是,它展示了一条通向通用人工智能的可能路径。在此背景下,建设国内的超大规模预训练模型和生态势在必行。

在唐杰看来,为了提高机器学习算法的效率,改变传统的行业布局,过去几年,大家拼命做模型,导致模型越做越多。然而,一般的模型训练效果并不如人意,花了大量财力精力却达不到理想的训练效果,“为了优化效果、提高精度,模型越来越复杂,数据越来越大,很多公司的能力不足以应对这种状况,效率越来越低。”唐杰举了个例子,小炼钢厂往往条件简陋,能炼钢,但质量不好。大炼钢厂买得起设备、花得起电费,炼出的钢质量就好,大模型就是大炼钢厂,它可以获得大量数据,并把数据清洗干净,提升算力,满足要求。

与此同时,“小模型可能只需要几个老师和学生就能完成算法的设计,但是大模型的每一层都要找专人来做,这样可以把模型的设计和训练精细化,模型设计也从单打独斗变成了众人拾柴。”唐杰说。

小团队将成最大受益者

据唐杰透露,团队目前正在跟北京冬奥会合作,开发可通过文本自动转成手语的模型,“医疗方面我们的主要方向是癌症早筛,如上传乳腺癌图像,找到乳腺癌相关预测亚类,通过影像识别宫颈癌亚类等。”

而谈到“悟道1.0”的发展,唐杰坦言,目前还存在需要持续攻关的问题。一是模型能否持续学习的问题,即能否不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。就目前来看模型还需要调整,其效果还有待加强;二是面对一些复杂问题,目前模型还无法回答;三是万亿级模型的实用性问题,即如何在保证精度的同时压缩模型,从而能让用户低成本地使用。

“这是一个全新的产业模式。原来大家数据上云、算力上云,现在模型上云。”唐杰说。

他认为,人工智能可以分为几个发展阶段:基于数据的互联网时代、基于算力的云计算时代,以及接下来可能将进入的基于模型的AI时代,这相当于把数据提升为超大规模预训练模型。未来,研究人员可以直接在云模型上进行微调,很多公司甚至不用维护自己的算法研发团队,只需要应用工程师即可。

唐杰表示,随着超大规模预训练模型系统的开放,小团队是最大的受益者,大家不必从零开始,预训练基线智能水平大幅提升,平台多样化、规模化,大家在云上可以找到自己所需的模型,剩下的就是对行业、对场景的理解。这将给AI应用创新带来全新的局面。

唐杰透露,“悟道1.0”只是一个阶段性的成果,今年6月将会有一个规模更大、水平更高的智慧模型发布。届时,模型规模会有实质性的进展:模型会在更多任务上突破图灵测试,其应用平台的效果也会更加让人期待。


【责任编辑:欧阳雪】

"赛博伴侣"十天吸金千万:当机器人男模走进家门,人心准备好了吗

身着修身西装、戴金丝眼镜的"机器人男模",正被化妆师一笔一笔画上眼影、腮红、高光的"赛博女友"——当人形机器人不再演示叠衣服、不再工厂巡检,而是直接杀入情感陪伴赛道,一场关于技术边界与社会心理的深层碰撞,已然发生。优必选旗下消费级人形机器人品牌"优世界"首款产品U1系列,自6月2日开启预售以来仅10天,已收获近4000台预订订单,定金总额突破千万元。对去年全年仅

近1500名选手9月决战上海 第48届世界技能大赛倒计时100天

技能界的“奥林匹克”进入百日冲刺。12日上午,国务院新闻办公室在京举行第48届世界技能大赛筹办情况新闻发布会。本届大赛将于今年9月22日至27日在国家会展中心(上海)隆重举办,届时将有来自73个国家和地区的近1500名顶尖技能青年选手“论剑”黄浦江畔,共同角逐64个比赛项目的桂冠,并有望创下历届比赛项目、参赛人数及参与成员国家和地区数量三个“历史之最”。打造彰显中

通感算智深度融合提速 工信部划定"AI+通信"三年攻坚路线图

人工智能与信息通信的融合正在从"试验田"走向"主战场"。工业和信息化部6月3日正式印发《"人工智能+信息通信"创新发展实施意见(2026—2028年)》(工信部通信〔2026〕121号),以四大方向、17项具体任务,为未来三年产业融合创新画出清晰作战图。目标锁定:2028年城域算力1毫秒时延圈覆盖率不低于75%《实施意见》明确,到2028年,人工智能与信息通信初步

6G“部省协同”:到2029年形成自主创新技术方案

6月4日,工业和信息化部正式发布《关于组织开展6G创新发展部省协同试点专项行动的通知》,决定面向各省、自治区、直辖市组织开展6G创新发展部省协同试点。该行动旨在充分发挥我国新型举国体制优势,凝聚重点地方、重点企业创新资源,共同开展6G技术创新、产业生态培育和应

激活企业创新力 抢占前沿新赛道 - 嘉兴创新驱动发展一线观察

行走嘉禾大地,一股从实验室快速奔涌向生产线的创新热潮扑面而来。最新数据显示,2025年嘉兴全市全社会研发投入占GDP比重达3.57%,列全省第二位;规上工业企业研发机构设置率达74.33%,连续五年保持全省第一。亮眼数字背后,

六大亮点创“历届之最”!第九届数字中国建设峰会在福州拉开帷幕

全球瞩目的“数智盛宴”闪耀闽江之畔!4月29日,由国家发展改革委、国家数据局、国家网信办、工业和信息化部、福建省人民政府共同主办,以“加快数智技术创新发展,深入推进数字中国建设”为主题的第九届数字中国建设峰会在福州海峡国际会展中心隆重开幕。恰逢“十五五”规划开局起势之年,亦是数字中国建设第二个十年的开启之年。本届峰会围绕“数智融合”“创新主体”“场景驱动”三大特

制胜“十五五”关键期:工信部重锤加码未来产业,已落子超百项“揭榜挂帅”攻坚任务

面对全球新一轮科技革命与产业变革的加速重构,一场围绕未来产业发展制高点的角逐正在提速。4月21日,工业和信息化部在北京召开未来产业企业座谈会,释放出关键信号——要以更大力度超前布局未来产业,加快锻长板、补短板、强弱项,抢抓“十五五”关键期,抢占未来发展制高点。向原始创新短板发起总攻工信部党组书记、部长李乐成主持召开了第十九次制造业企业座谈会。来自生物制造、量子科技

扫一扫专利到家,逛巴扎技术“淘宝”- 新疆“码上有利”“专利大巴扎”打通成果转化“最后一公里”

推出“码上有利”和“专利大巴扎”两项创新服务举措,搭建知识产权与实体经济深度融合的对接平台,让专利转化像超市购物一样便捷。两项服务形成“精准匹配+海量检索”的互补模式,打破科研院所与产业间的壁垒,推动专利转移转化更加开放协同。长期以来,专利转化领域存在一个结构性难题:一方面,大量高价值专

辽宁千山湾钢铁实验室启动 政产学研用协同助力鞍山钢铁产业升级

4月3日,辽宁千山湾钢铁实验室启动仪式暨管委会第一次会议在辽宁科技大学举行。仪式邀请了国内钢铁领域工程院院士,东北大学、北京科技大学知名专家和学者,鞍山钢铁集团有限公司、中国钢研科技集团有限公司等国内行业知名企业代表,鞍山市委、市政府相关部门领导等参加。 鞍山市委书记吴开华,鞍山钢铁集团有限公司党委书记、董事长王军,辽科大党委书记孟劲松,党委副书记、校长胡军共同

硬核“新质力”亮相莱芒湖:第51届日内瓦国际发明展启幕,中国军团237项发明刷新纪录

初春的莱芒湖畔再次成为全球创新目光的聚焦点。第51届日内瓦国际发明展于当地时间11日在日内瓦Palexpo展览馆正式拉开帷幕。在这个全球举办历史最长、规模最大的发明盛会上,中国代表团以237个发明项目的庞大阵容亮相,参展规模不仅位居前列,更创下了历年来新高,向世界展示了中国科技创新的蓬勃生态与前沿趋势 。“含新量”十足:中国展团实现“数量与能级

抢滩“一人公司”时代:多地竞速发布“龙虾”政策,最高补贴1000万

一条红色的“龙虾”,正在掀起全国范围内的产业政策竞速。因开源AI智能体工具OpenClaw图标酷似红色龙虾,近日“AI养龙虾”引爆全网热度。这把火从技术极客的GitHub仓库,一路烧进全国两会会场,更在短短一周内点燃了深圳、合肥、无锡、常熟等多地政府的政策工具箱。从“放水养鱼”到“放水养龙虾”,一场关于未来“一人公司”(OPC)新业态的卡位战已然打响。多地密集“下塘”:最

工信部启动“工业数据筑基行动”:“1+4+N”解锁工业AI“富矿”

从根本上破解工业领域数据“采”“集”“用”的堵点,工业和信息化部于3月10日正式对外发布《关于启动工业数据筑基行动 开展面向人工智能赋能的高质量行业数据集建设先行先试的通知》(工信厅信发函〔2026〕64号)。这标志着我国在推动工业数字化转型向智能化迈进的关键时刻,正式打响了“数据赋能”的攻坚战。锚定2026:打造高

从“+AI”到“AI+”:政策与市场同频共振,我国“人工智能+”驶入“智能经济”新蓝海

“智能经济”这一全新概念首次写入政府工作报告,标志着我国“人工智能+”行动正从技术赋能产业的“起步区”驶入产业深度融合、生态全面重构的“深水区”。在政策红利持续释放与市场需求井喷的“双轮驱动”下,一幅 “10万亿级”智能经济新形态的蓝图正加速展开。战略升维:从“工具”到“经济形态”3月5日,国务院总理李强在政府工作报告中明确提出“打造智能经济新形态”,并连续第三年

中企 MWC 2026:从追光者变身光源

当西班牙国王费利佩六世饶有兴致地与一台人形机器人握手,并接过一部折叠屏手机时,2026年世界移动通信大会(MWC)迎来了它最高光的时刻之一 。为期四天的MWC 2026正式落下帷幕 。这个以“智能新纪元”(The IQ Era)为主题、恰逢落户巴塞罗那20周年纪念的展会,用前所未有的热度向世界宣告:移动通信的未来已不再仅仅是连接,而是
返回
顶部