国内掀起AI大模型“混战”,AI人才身价暴增

博观科技 行业动态 软硬件开发
当前位置:博观首页 > 物联网开发 > 文章详情>>

国内掀起AI大模型“混战”,AI人才身价暴增

博观科技 2023-04-19

距离被阿里“通义千问”刷屏还不到一周时间,4 月 11 日,阿里云峰会又再放大招。


活动现场,阿里巴巴集团董事会主席兼 CEO、阿里云智能集团 CEO 张勇在云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,钉钉、天猫精灵已率先接入通义千问测试,并会在评估认证后正式发布新功能。


AI人才


不仅如此,阿里云还将开放通义千问的能力,帮助每家企业打造自己的专属大模型。张勇表示,面向 AI 时代,所有产品都值得用大模型重新升级。


当大家还在就通义千问跟 ChatGPT、文心一言的对比效果而津津乐道时,阿里再进一步,已抢先在其应用中率先测试,让外界深切地感受到,生产力变革真的要到来了,中国 AI 下半场激烈竞争的号角也正式吹响。


国产AI模型大混战


接下来,有多场大模型相关发布会扎堆举办。


4月10日,商汤“日日新SenseNova”大模型体系问世;4月11日,毫末智行自动驾驶生成式大模型DriveGPT雪湖·海若发布;由昆仑万维和奇点智源合作研发的天工大模型3.5发布在即,并将于4月17日启动邀请测试;5月6日,科大讯飞“1+N认知智能大模型”即将发布……


互联网巨头、人工智能公司、智能硬件公司、自动驾驶公司等各方力量,都积极参与到大模型这一场盛宴中来。


行业监管也迅速出手。4月11日,国家网信办发布通知,就《生成式人工智能服务管理办法(征求意见稿)》面向社会公开征求意见。


根据计算机科学家、自然语言模型专家吴军的说法,ChatGPT背后是一个叫做语言模型的数学模型在发挥作用,这项语言模型技术早在1972年就已经有了,是由他的导师弗莱德里克·贾里尼克(Fred Jelinek)在IBM期间带领团队研发出来的。


只是到了今天,由于算力不断提升,语言模型已经从最初基于概率预测的模型发展到基于Transformer架构的预训练语言模型,并逐步走向大模型的时代。


复旦大学计算机学院教授、MOSS系统负责人邱锡鹏曾这样描述大模型的能力飞跃:“当模型规模较小时,模型的性能和参数大致符合比例定律,即模型的性能提升和参数增长基本呈线性关系。然而,当 GPT-3/ChatGPT 这种千亿级别的大规模模型被提出后,人们发现其可以打破比例定律,实现模型能力质的飞跃。这些能力也被称为大模型的‘涌现能力’(如理解人类指令等)。”


每当有革命性的技术诞生,无一不是由其在具体行业的商用化应用来实质性地推动行业进步。作为连接技术生态和商业生态的桥梁,大模型也将在很多行业应用落地。


只是,这波来势凶猛的大模型热,究竟会催生万物生长改变万千业态,还是继区块链、元宇宙之后又一个看上去很美的泡沫?


AI大模型成功的两大要素


尽管阿里并不是国内第一个公布类GPT的,但阿里却是国内最早着手AI大模型研发的大厂之一。


阿里云智能 CTO 周靖人表示,“对我们行业内的人来讲,我们并不认为这条道路好像就是 2023 年突然出现。这是一个长期以来技术发展的演进过程。”在他看来,大模型通义千问既不是起点,也不是终点,而是一个中间节点。


实际上,阿里达摩院在NLP(自然语言处理)等前沿科研领域布局多年。2019年阿里启动大模型研发,当年即发布大规模预训练语言模型structBERT并登顶全球NLP权威榜单GLUE,成为近年中国公司在AI领域的核心突破之一。


此后,阿里陆续发布国内首个超百亿参数的多模态大模型及语言大模型,训练实现全球首个10万亿参数AI模型。在2022年,达摩院推出集大成的通义大模型,在语言及多模态能力、超大模型、通用统一模型等多个技术维度上,均处于国内第一梯队。


在周靖人看来,阿里对AI大模型的投入及研发,已通过自身实践锤炼出了国内唯一支撑过万亿参数以上大模型的“飞天智算基础设施”。


此次云峰会上,他首次全面诠释了“飞天智算基础设施”可提供的三层系统服务能力:


智算IaaS服务包括可支持最大十万卡GPU单集群规模、可承载多个万亿参数大模型同时在线训练的智算集群,可为万卡规模AI集群提供无拥塞通讯的自研RDMA网络架构等;


智算PaaS服务以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发;


智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型,以及国内首个“模型即服务”开放平台魔搭社区,魔搭现已汇聚超800个优质开源模型,总用户量超100万,模型累计下载次数超1600万,成为国内规模最大的模型社区。


“这一系列都是帮助我们在人工智能的时代更好的训练自己的模型,更好的把我们模型服务推向我们的业务去解决我们实际的问题。”周靖人总结说到。


不少业界人士认为,这是通义千问问世背后的关键因素——深厚的大模型技术积淀、强大的云基础设施能力,对大模型的研发来说缺一不可。


AI人才遭疯抢


AI已经成为了时代的风口,这个风口的风力有多大呢?


一个月12-20万。


对,一个月120000-200000元!


如果说,步入2023年最火的是什么,那一定就是ChatGPT所引领的开放式AI了,这个东西有多火呢?


现在就连查个百度都要问一下AI是什么看法了。


如此火热的项目,自然少不了大厂之间的相互竞争,而竞争的第一步,便是招兵买马。


据了解,现在猎头正在寻找多位AI方向投资经理,base北京,并且开出待遇:薪资范围60k-90k。招聘网站显示,AI方向VP-MD,最高月薪200K。


与此同时,AI大模型也是一块香饽饽,在某招聘平台上搜索AI大模型相关岗位,相关词条可多达数页,图像识别、算法研究员、深度学习等岗位的年薪均已达百万元。而在此之前,传闻百度文心一言大模型团队内的研发人员遭到其他公司的“挖角”。


造成这一现象的原因除了AI产品本身的火热,还有因为市场未来的趋势一定是走向大数据。“国内肯定要有自己的大模型,这是通往未来的船票。”这已经成为了业内的共识,那么如何拿到这张船票,就成了国内大厂研究的重点。


但这张船票是有门槛的,而且很高。


关于AI大数据的花费有多大呢?计算机科学家、自然语言模型专家吴军谈及ChatGPT的训练成本时介绍:“大概可能是3000辆特斯拉的电动汽车,每辆跑到20万英里,把它跑死,这么大的耗电量,才够训练一次,这个非常花钱的一件事”。


也正因为如此,目前宣布自家AI产品的,无一不是大厂,截至目前,国内AI赛道参与的玩家有:百度“文心一言”、阿里巴巴“通义千问”、360“360智脑”,可能有些纰漏,大家还可以在评论区指出来,我们可以看出,AI已经成为了大厂的竞争,小公司已经完全没有了立足之地。


综合这三家测试的媒体反馈来看,目前国内相关产品相较于行业领先的产品仍有一定的差距,还需要大量的训练改进才能有更好的发展。国内的AI市场应该会是未来几年,大家内卷的目标。


郑州博观电子科技有限公司是一家提供科技类物联网开发软硬件定制化方案服务商、也是中原地区领先的物联网终端设备解决方案提供商。致力共享换电柜、智能充电桩、共享洗车机、物联网软硬件等服务平台的方案开发与运维。总部位于河南省郑州市高新区,已取得国家高新技术企业认证证书。经过10多年的业务开拓,公司已经形成了以中原地区为中心、业务遍布全国的经营格局。


上一篇:盘点AI在医疗领域的三大市场,实现AI看病还要多久? 下一篇:安全再上新台阶!搭载虹膜识别技术,德施曼发布多款旗舰新品智能锁