“千模大战”100天:六路玩家**ChatGPT

2023-06-13 智东西

智东西

作者 | 李水青

编辑 | 心缘

随着ChatGPT火遍全球,“千模大战”在国内已经打响!

今年3~5月,堪称“国产大模型之春”。据智东西统计,自2022年11月ChatGPT发布至5月29日,国内至少有55个类GPT大模型已经推出或马上面世,互联网和云服务大厂、AI企业、行业头部公司、高校及科研机构、大数据及算力提供商都参与到这场AI“大乱斗”之中来了。

下表展示了国内的类GPT大模型发布/更新的具体情况。为了呈现更清楚,本表格仅以企业最新一次大模型重大进展情况为参照,比如百度、阿里早在位列第一的MiniMax之前推出了大模型,但我们选择统计其今年最新公布的文心一言、通义千问的进展节点;华为于2021年4月就推出了**大模型,但由于在统计时间内未公布重大进展,因此未列入表格。

国内大模型推出/更新时间表(2022年11月~2023年5月)

根据近日在2023中关村论坛上面世的《我国人工智能大模型地图研究报告》,全国有14个省(市)在开展大模型研发,其中仅是北京、广东两地的大模型产品分别达到38个和20个,可以说全局情况远超我们肉眼可见的信息面。

国产大模型浩浩荡荡,但这还没算上陆续官宣创业的业界大佬动作,今年2月起,从美团联合创始人王慧文到搜狗创始人王小川,再到李开复宣布Project AI 2.0计划……大佬“从大厂毕业去做AI”成为科技圈的新趋势。

国内部分知名人士大模型创业情况(不完全统计)

在5月的一场ICT市场趋势论坛上,知名行研机构IDC对基于大模型的AI市场规模进行了预测:我国AI市场规模在2023年将超过147亿美元,到2026年将超过263亿美元,市场增量主要源于基于大模型的AI应用、生成式AI及新AI企业应用,不具备大模型能力的厂商难以维持竞争优势。这样的局势给了国内互联网大厂及AI企业无限压力。

实际上,国内大模型于2021年前后就崭露头角。三年来,国内企业推出的大模型参数规模从几十亿扩展到几万亿;同时,通用大模型也在向行业大模型发展,应用从Demo进化为测试版本,已有一定技术和产业基础。

但ChatGPT横空出世,让国内玩家看到其间的代际差距现实。即便是被寄予厚望的百度文心一言,也只被其创始人打了70分。只有在中文大模型及特定细分行业的局部领域,国内大模型或许能短期内赶超。

随着逆全球化风险在全球蔓延,很多人期盼国内出现与ChatGPT对打的技术。那么在这场“千模大战”之中,这些大模型有什么相似和不同之处?哪些是真刀实枪,哪些又是虚晃一剑?它们前景如何,竞赛格局又会怎样?本文对此进行了深入探讨。

一、互联网云大厂**ChatGPT,军备赛打响

近几个月,随着微软、谷歌、亚马逊等硅谷大厂纷纷公布大模型及AIGC进展,通过AI搜索引擎、AI办公软件等一系列应用打响AI竞赛,国内互联网云大厂也陆续全军出击了。

以百度、阿里、**、华为为第一梯队玩家,360、京东、网易、知乎等为第二梯队玩家,以及字节跳动、快手、小红书等为潜力玩家,互联网/云大厂已经在大模型、算力设施、AIGC应用产品、生态等各方面展开了明争暗斗。

互联网/云大厂推出大模型的情况

众所周知,打响应战ChatGPT第一枪的互联网大厂是百度,今年3月面世的文心一言(ERNIE Bot)是百度在2021年12月推出的百度·文心(ERNIE 3.0 Titan)迭代而来的细分模型,百度创始人李彦宏称将用其重构百度所有的应用。而后,首个跳出来硬刚百度的是阿里。4月11日,阿里云推出通义千问大语言模型(LLM),阿里董事会**兼CEO张勇宣布,阿里所有产品将接入大模型全面升级。阿里的大模型进展公开可追溯到2021年10月的云栖大会。

阿里云推出通义千问大语言模型(LLM)

随着百度、阿里参战,互联网云大厂AI竞赛开始变得硝烟四起。

4月9日,360集团基于360GPT大模型的“360智脑”落地搜索场景内测;

同日,京东透露京东言犀大模型预训练参数达到千亿级,2月言犀平台曾官宣推出“产业版ChatGPT”:ChatJD;

4月13日,知乎和面壁科技合作推出中文大模型“知海图AI”,落地“热榜摘要”开启内测;

近日,短**厂商字节跳动、快手,以及生活方式平台小红书都已筹备大模型团队或透露出大模型计划。

……

华为和**仍未在这波大模型浪潮正式推新,但已经从局部领域围而攻之。

比如,华为于2021年4月就推出了**系列大模型,并在2022年推出了矿山、气象、金融OCR等行业大模型。4月17日,华为云旗下的智能编程助手CodeArts Snap在深圳一场“华为代码大模型的方案与应用”活动中露面;再看看**这边,其也在2022年12月推出了万亿参数的中文NLP预训练模型“混元”(HunYuan-NLP-1T),但至今未正式披露类ChatGPT应用的新进展。4月14日,**云推出大模型算力集群;5月15日,**云副总裁、**云智能平台负责人李学朝透露:“具体的大模型**内部正在做……具体进度后续会统一对外公布。”

华为云AI领域首席科学家田奇4月讲解**大模型

当然,仍有一些互联网大厂表现得比较谨慎。比如搜狐董事局**兼CEO***近日接受媒体采访时称,搜狐现在对大模型仍是观望,应该会从应用角度来看一看,相对还是比较谨慎一点,但在整个GPT的应用方面搜狐已经开始在产品里逐渐渗透了。

通用大模型之战是大厂的大型军备竞赛。

市面上大厂推出的大模型,大多是基于Transformer架构进行开发的通用大模型,这是一场算法、算力和数据以及应用落地、生态合作的全面比拼。这边,百度刚刚宣布文心一言接入企业超700家;那边,阿里云宣布全系产品史上最大规模降价,发起规模战进行攻击;看似按兵不动的华为则加速在行业“圈地”,抢占大模型落地先机。

合作成为BATH以外的互联网企业的选择。比如360集团和知名AI大模型企业智谱AI于5月宣布了战略合作,共同研发千亿级大模型“360GLM”,借鉴“微软+OpenAI”组合的分工模式。5月24日,云知声也宣布了与360集团的战略合作,双方将积极推动山海大模型在各领域的落地应用。

在打法上,互联网云大厂大多“两条腿走路”:一边通过提供大模型MaaS,获取平台***用;一边通过出租算力和推训平台,赚取大模型企业的租金。两种方式都有望成为云服务业务的新增长点,并带来新的云服务范式。

尽管战争仍在初期,大厂之间已经开始明着较量,阵势不小。

二、AI企业大乱斗:数量多爆发强,避开“巨兽的脚印”抢生存空间

AI大模型也吸引了一大批创业者,从美团联合创始人王慧文到搜狗创始人王小川,再到李开复宣布Project AI 2.0计划,众多大佬都在加入AIGC创业潮。

实际上,国内已有一批AI企业率先将大模型做出来了。

据智东西统计,国内至少有19家AI企业加入了这场AI大模型之战,其中4月官宣的企业达到9家,接近一半。如下图所示,这些AI企业大致分为两类,一类是专用AI中小模型起家的企业,一般成立有一段时间了;一类是原生AI大模型创企,大多是新公司。

AI企业推出的大模型

在第一类AI企业中,最受关注的无疑是NLP领域龙头企业科大讯飞,其于5月6日推出的“星火”大模型已开启内测,与文心一言打擂台。

此外还有商汤科技,其于4月10日推出“日日新SenseNova”大模型体系,包括其自研中文语言大模型应用平台“商量”等。近期,包括云从科技、云知声、旷视科技等专用AI起家的知名企业都披露了大模型动向。这类企业具有AI算法研究的人才队伍及经验积累,长处在于算法研发和行业工程化突破。

商汤科技推出日日新大模型

第二类企业是AI大模型原生企业,如昆仑万维,其在4月10日正式推出千亿级大语言模型“天工3.5”,对标ChatGPT、支持万字以上的文本对话。有很多AI大模型企业创立不久,比如创立于2021年的澜舟科技、MiniMax等,但其团队成员做大模型的时间却跨越数年。这波大模型浪潮的到来令这些企业压力不小,催促其加快结合细分赛道的产业化探索。

可以看到,在这些大模型的领域分布上,NLP仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在CV和智能语音等领域的大模型还较少。

AIGC大模型已成为热门投资领域,金沙江创投管理合伙人朱啸虎近日发文透露今年的投资策略,称今年一半投资都给了AIGC。反过来对于AI公司来说,推出大模型有望帮公司吸引更多资金以推动估值上涨,比如刚刚推出AI大语言模型“序列猴子”的出门问问,就被彭博社爆料正推动港股IPO,可能筹集约2亿至3亿美元。

在互联网大厂的团战之下,AI创企的空间有多大?

对此多位业内人士和投资人告诉智东西,AI大模型领域不同于互联网“大补贴”时代,可能不会赢家通吃,而是百花齐放。

一方面,大语言模型在产业可能仍是大厂主导,因为参赛入场券是足够的钱、数据、算力及人才。比如OpenAI三年前接受了微软为其打造的一台由数万个A100 GPU组成、价值数亿美元的大型AI超级计算机,据推测标准大小的ChatGPT-175B大概需要625台8卡DGX A100服务器进行训练,成本约达到3~5亿元人民币。创企融来的几亿元在这个层面几乎做不了什么,大厂则资金相对充裕。

但另一方面,有业内人士告诉智东西,一些关键点突破可能还要看科创公司。据悉,国内AI企业的大模型很多是基于GPT-2开源模型开发而来,与GPT-4仍有代际差。由于GPT-4是闭源的,国内企业无法参考**而只能自行研发追赶,并不是投钱和时间就能攻克的。因此从算法层面来说,AI创企与互联网大厂可以说站在同一起跑线,甚至聚焦创新的能力会更强。

正因为AI大模型算法结构突破难度大,许多创企公司都是由高校及科研机构成果孵化而来。与此同时,众多高校直接推出了大模型,包括复旦大学、清华大学、武汉大学等。

根据《我国人工智能大模型地图研究报告》,大模型的学术影响力已初步形成,但仍有提升空间。在开源影响力方面,国内大模型研发团队在积极推进大模型开源发展,目前已经有超过半数大模型实现开源,且高校和科研机构是开源主力。

高校及科研机构布局大模型的情况

即便是基于强大科研成果,AI初创企业要突围还需要花些巧劲。正如创世伙伴资本合伙人梁宇此前告诉智东西:“创企要学会躲开‘巨兽踩下的脚印’,所有伟大的公司都是从很小的缝隙中钻出来的。”

在大厂领跑的同时,初创公司的机会可能在应用层,从垂直领域切入做产业落地、降本增效。比如澜舟科技聚焦的就是金融领域。其于3月14日推出孟子对话大模型,而早在2021年7月推出了孟子(MChat)大模型及相关系列开源模型。基于Transformer,孟子大模型可支持以及快速替换自回归(如GPT)、自编码(如BERT)等多种预训练模型。

三、行业公司与算力企业纷纷入局,抢占绝佳站位

说到AI大模型竞赛,数据是必不可少的一环。行业公司掌握海量数据,是这波“千模大战”中另一类不容小觑的选手。

据智东西统计,截至目前至少有15家行业公司推出了行业大模型。其中,金融领域涉及的企业最多,包括我国农业银行、江苏银行、度小满、奇富科技等;教育领域涉及的企业仅此其后,包括网易有道、学而思、淘云科技、孩子王等推出或计划推出大模型。此外,医疗、自动驾驶、智能物联等领域的行业公司都已经行动。

行业公司推出的大模型

随着大模型产业化落地加速推进,目测一大批来自各个行业的大模型也将喷涌而出。

行业头部公司由于接近客户和落地场景,因此更容易在数据、应用落地方面占据优势。比如近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升。

说到数据,实际上也有一些大数据起家的公司推出了大模型。比如大数据公司达观数据就于3月18日推出了曹植大模型,不过具体参数和应用效果还不清楚。

大数据公司推出的大模型

此外,一些算力公司也推出了大模型。比如4月29日消息,联发科在4月28日发表官方博客称,联发科AI研究小组近日发布了全球第一个繁体中文大型语言模型BLOOM-zh。多语言模型BLOOM-zh在保持其英语功能的同时,在大多数繁体中文基准上优于其前身。

国内服务器头部企业浪潮甚至在2021年9月就推出了源1.0大模型。根据公司2月在深交所互动平台上的发言,源1.0模型结构与GPT-3类似,与GPT-3相比参数量增加40%,训练数据集提升10倍,达到了2457亿参数,训练使用了5TB的高质量中文数据。消息称,源2.0也将在不久之后发布。

国家超算天津中心于5月19日推出了“天河E级智能计算**创新平台”和“天河天元大模型”,据称将带来突破百亿次的跨模态的超级计算算力,支撑传统的科学工程计算,并服务智能混合计算,成为智算中心机构布局大模型的代表。

可以看到,行业、大数据、算力领域的大模型入局玩家还不多。但由于这些领域的企业往往拥有算力和算力优势,如果与AI大模型企业合作,有望在大模型领域实现超车,这都为“千模大战”的战况带来更多变数。

结语:千模大战打响,研发和落地是持久战

仅仅两个月时间,国内的大模型之战已经打响,互联网/云服务大厂、AI企业、行业公司、大数据公司以及算法公司全都入局了。

可以看到,入局的公司要么在资本实力、平台生态、应用场景方面占据优势,要么在算法、算力和数据层面构筑了护城河,但这都只是一张“入场券”。

AI大模型创业将是一场持久战。国内的大模型产品大多与GPT-4仍有代际差,这毕竟是一个高难度的**性工程,仍需要国内大模型玩家深耕技术、贴合应用,以此在硅谷巨头的包围中实现突破。


崛起的中科系,被改变的我国芯片产业格局

当前,以芯片为代表的信创产业逐步成为国家科技竞争力的重要标志。在国产CPU产业强势崛起的过程中,你首先想到的会是哪几企业?答案有很多,但“中科系”的提及率绝对很高。作为国家战略科技力量,“中科系”旗下

芯片战场丨芯片领域三箭齐发 英特尔跑步突围

21世纪经济报道记者倪雨晴 圣何塞报道在硅谷源泉之一的圣何塞,英特尔CEO帕特·基辛格(Pat Gelsinger)正在带领英特尔加速奔跑。当地时间9月19日,2023英特尔on技术创新大会于美国加利

OPPO重启芯片业务?国产芯片或需告别“单打独斗”

财联社9月19日讯(记者 唐植潇)近日有消息称,OPPO将会重启芯片业务,并且“有部分员工已经回流,加入到了车载业务之中”。记者就此事向OPPO方面进行核实,对方表示“不予置评”。特百惠(我国)数字与

600亿颗芯片!我国巨头正式宣布,美媒:**也没料到制裁这么快

我国芯片市场与美国依赖我国的集成电路市场一直以来都是一个巨大的市场,拥有庞大的需求和巨大的增长潜力。我国的电子消费市场一直在迅速增长,包括智能手机、电视、电脑和各种智能设备等,这些设备都需要高性能的芯

最新手机芯片天梯图:A17、华为麒麟9000S,排在什么位置?

近日,最火的两颗芯片分别是苹果的3nm芯片A17 Pro,虽然很多人吐槽它较上一代提升不明显,但论性能,可以碾压任何安卓芯片,甚至是领先2代的。另外一款芯片,则是华为麒麟9000S,当然,这颗芯片工艺

韩国芯片连续13个月暴跌,尹锡悦指责我国不采购,外媒:自食其果

据韩国媒体称,韩国的半导体出口额已经连续暴跌13个月了,比去年同比下降了28%左右。韩国政府急的焦头烂额。尹锡悦政府竟直接甩锅我国,话里话外都是指责,他认为韩国半导体卖不出竟是我国的原因,我国应该帮助

我国突破芯片瓶颈将影响全球秩序?美国很担心,指出我国关键弱点

我国在芯片半导体领域一直深受美国的**,通过贸易制裁的方式阻止高端芯片进入我国市场。这样的举措一度造成我国芯片领域发展断档,不过随着我国科技企业近几年的突破,目前我国已经在芯片制造方面取得了重大的成果

没有他,我国芯片发展至少要**十年?

前几天,华为一声不响的上线了mate60系列,带着麒麟芯片9000s强势回归,吸引了全世界的目光。而华为麒麟芯片**背后,我们不该忘记这位老人—张汝京。我国半导体之父,为回**造芯片,被开除**户籍,

陈清泰:未来汽车颠覆传统,50%以上的零部件体系面临重构

【有车以后 资讯】“未来汽车对传统汽车的颠覆性,使传统零部件体系的50%以上都面临重构。”12月16日,在全球智能汽车产业峰会(GIV2022)上,我国电动汽车百人会理事长陈清泰指出,智能汽车的价值链

「姿势」一辆汽车由多少个零件组成?保证你说不清...

投稿点这里汽车有多少个零件?其实这个问题并没有一个十分确切的标准答案...据估计,一般轿车约由1万多个不可拆解的**零部件组装而成。结构极其复杂的特制汽车,如F1赛车等,其**零部件的数量可达到2万个

全球最大的10家汽车零部件供应商 都是世界500强 无我国企业

【卡车之家 原创】美国《财富》**每年发布的世界500强排行榜,是以营业收入数据对全球企业作出排名的榜单。2017年“世界500强”榜单中,汽车制造商和零部件厂商共占据33席(除去大型工程车辆企业),

汽车零部件企业哪家强?除了博世**还有这些名字你一定耳熟能详

文:懂车帝原创 李德喆[懂车帝原创 行业]9月18日,由《我国汽车报》主办,罗兰贝格协办的2019汽车零部件“双百强”企业发布会在江苏南京举行。在两份榜单中,博世、**、电装位列2019全球汽车零部件

汽车零部件行业现状及产业链

行业现状(Reference:产业运行 | 2021年汽车工业经济运行情况)中汽协预测:2022年我国汽车销量达到2700万辆,新能源销量超过550万辆(Reference:乘用车市场信息联席会)以乘

全球十大汽车零部件供应商,核心技术都被他们垄断,自主遗憾缺席

提到电影,我们会想到张艺谋、冯小刚,而很少会想到幕后的制作人;提起流行乐,我们会想到周杰伦、萧敬腾,而很少会想到背后的作词人。台前台后,一幕之别,知名度往往相差甚远。车界又何尝不是如此,知名车企我们都

高清汽车各零部件构造图,看完你就是汽车专家!

2023世界移动通信大会即将举行,大批中企强势回归!

来源:环球时报 【环球时报记者 倪浩 陶震 环球时报驻德国特约记者 青木】经过3年疫情后,全球最具影响力的通信展今年有望再现往日盛况。2月27日至3月2日,由全球移动通信**协会(GSMA)主办的20

太空新赛道:6G时代的卫星通信,究竟是什么?

近日华为、苹果争相推出手机卫星通信功能,成为一大亮点,不少手机厂商也将目光投到卫星通信。放眼未来,手机直连卫星的卫星通信服务将是大势所趋,也是6G时代的重要标志。华为以“北斗三号”为依托,率先把“卫星

光纤#光纤通信

国内企业在光通信产品的参数测试过程中,通常使用国外的先进测试设备。然而,这些测试仪器之间往往是孤立存在的,需要手动调试仪器并通过旋钮、按钮和人眼观察波形或数据。这不仅*作繁琐易出错,而且测试效率低下。

龙头20cm涨停,7天股价翻倍!一文看懂卫星通信前世今生及产业链

卫星通信概念股华力创通今日再度强势拉升,截至发稿,该股股价20cm涨停,7个交易日累计涨幅近113%,现报23.52元续刷阶段新高,总市值155.9亿元。消息上,有媒体从供应链获悉,Mate 60 P

工信部:目前我国尚不具备实现网络层面的移动通信号码归属地变更的条件

针对网友提出的“电话号码归属地更改”建议,工信部近日给出了官方回复。此前,有网友在人民网留言板向工信部留言称,“现在电话都是实名制,电话号绑定的***及一些主流的软件较多,更换号码后造成一系列问题

AD
更多相关文章