抢跑大模子,AI重构baidu

 人参与 | 时间:2024-10-26 10:44:23

这家在挪移互联网时期稍显清静的抢跑大厂,终于凭仗着从前间在AI赛道的大模技术积攒 ,跑在了时期最前方 。重构

图片源头
:Pixabay图片源头:Pixabay

baidu终于等到了属于它的抢跑机缘。

一周前 ,大模文心一言位列首批拿到监管部份入场券的重构大模子名单,并成为12家中措施最快那个——8 月 31 日零点   ,抢跑争先向全社会周全凋谢 。大模

在凋谢下载首日,重构文心一言日沉闷用户破 100 万 ,抢跑并登上 App Store 收费运用排行榜首位。大模而据baidu民间平台吐露数据展现 ,重构8月31日0点至24点,抢跑在这短短24小时内,大模文心一言合计回覆网友超3342万个下场 。重构

家喻户晓,揭示词对于大模子内容天生起着关键熏染 。为提升用户体验,文心一言担当起了科普大模子“prompt”(对于话揭示词)的脚色  。开淘汰模子的同时,baidu文心“灵感中间”也凋谢公测 ,提供海量AI模板,涵盖AI绘画、创作 、娱乐、职场、命理、激情 、学习等七大类  ,辅助用户更顺畅 、更高效地运用大模子。

随后 ,其余一众大模子平台逐渐对于外宣告向社会凋谢。但绝大部份平台只豫备好了网页真个进口,并未上线App。抖音豆包 、讯飞星火、智谱清言等乐成上线的App ,其下载量也远逊于文心一言 。

据第三方机构七麦数据估算,上述三款App近一周光阴外在App Store的日均下载量无一过万。与之比照 ,文心一言近一周光阴内的日均下载量逾越18万次。

B端展现也绝不逊色。9月5日的云智大会上 ,时隔六个月,baidu智能云交出大模子效率的下场单 :千帆大模子平台上月活企业数已经近万家,拆穿困绕金融、制作、能源、政务、交通等行业的400多个场景 。

在即将修正天下的大模子混战中 ,baidu成为有望夺冠的种子选手 。这家在挪移互联网时期稍显清静的大厂,终于凭仗着从前间在AI赛道的技术积攒 ,跑在了时期最前方。

机缘最终仍是留给了有豫备的人 。

十年苦守,去世磕AI

早在2019年  ,baidu就曾经争先宣告中国首个正式凋谢的预磨炼模子文心ERNIE1.0 。在ChatGPT引爆天生式AI热潮之后 ,baidu同样快捷照应 ,于往年3月推出新一代狂语言模子文心一言,成为国内大厂中第一个做出对于标ChatGPT产物的企业。

产物宣告后仍在减速迭代。往年6月 ,baidu推出文心大模子3.5版本。在国内 ,调研机构IDC宣告的《AI大模子技术能耐评估陈说2023》展现,该版本在算法 、生态、效率能耐等12名目的中取患上7项满分,综合评分、算法模子、行业拆穿困绕均为第一  。

在外洋 ,InfoQ钻研数据展现,文心一言在狂语言模子综合测试上患上分达74.89% ,仅次于ChatGPT ,远超第三名的Claude。

baidu今日技术爆发眼前,是李彦宏的十年苦守。

作为PC时期的互联网巨头 ,baidu也有过光线的光阴。曾经多少多时,“BAT”这三个字母,代表了中国互联网企业在“搜查、电商 、社交”三大规模的最高造诣  。但随着挪移互联网的普遍 ,信息取患上的方式变患上愈加多元 ,搜查再也不是流量的仅有进口 ,baidu不患上不另寻他路。

错过挪移互联网先发优势,baidu惟独找到新的削减引擎  ,能耐重回浪潮之巅。押注家养智能,是李彦宏给出的谜底 。

这一谜底一度看起来过于超前。

在2016年的乌镇互联网大会上,李彦宏就曾经在演讲中作出分说 :“两年前我来乌镇时还在讲咱们奈何样顺应挪移互联网的时期,明天我要讲的是挪移互联网的时期已经终清晰。靠挪移互联网的风口已经不可能再泛起独角兽,互联网未来的机缘在家养智能 。”

次年 ,baidu更是喊出“All in AI”的口号,宣称公司有能耐 、有定夺成为中国致使天下的AI标杆企业 。

宏愿壮志眼前 ,baidu早已经妄想AI多年。作为中国企业家群体中未多少见的“技术派” ,李彦宏不断深信技术修正天下。他最先在2012年就曾经向导baidu退出竞拍“深度学习之父”Geoffrey Hinton的守业公司,出价高达数万万美元 ,最终惜败google。

要知道,正是Geoffrey Hinton增长google成为全天下AI技术最卓越的公司之一 。而昔时追寻他一起退出google的Ilya Sutskever,也是如今Open AI的散漫独创人兼首席迷信家 。

彼时,李彦宏就已经揭示出惊人的前瞻性。竞标失败的他不光不坚持 ,反而增长baidu鼎力投入AI技术的自主研发 ,2013年 ,baidu先后在中、美两地设立了家养智能钻研中间,日后踏上“去世磕”AI的道路。

这绝非一条坦途  。面临一项并不可熟的前沿技术,baidu必需坚持压强式 、马拉松式的研发投入 ,能耐有所后退  。

财报数据展现 ,在2013年到2022年这十年间 ,baidu累计研发投入已经逾越1400亿元。其中 ,光2022年baidu中间研发用度就抵达214.16亿元 ,占baidu中间支出比例抵达22.4%。

摆在baidu眼前的下场是,在以前很长一段光阴内 ,AI都未能找到适宜的商业化落点  。智能机械人 、人脸识别、智能客服 、智能音箱等 ,都未能给成为事实的功劳驱动引擎 。

在2022年尾的一次外部演讲中,李彦宏坦言道 ,baidu这多少年过患上比力苦,财报、营业削减性都不是那末赫然 。

幸好baidu从未轻言坚持。苦守十年之后 ,李彦宏等来了机缘。据其在财报电话会上泄露,baidu智能云营业在往年Q1已经实现盈利,并在Q2不断盈利 。

往年第二季度  ,baidu实现营收341亿元 ,同比削减15%;归属baidu的净利润(non-GAAP)抵达80亿元 ,同比削减44%。营收以及利润双双实现大幅削减,超市场预期。其中,baidu智能云、智能驾驶 、用户产物等根基盘营业在二季度不断高速削减,迎来突破性妨碍 ,领跑行业 。

“天生式AI以及狂语言模子在良多行业具备重大刷新能耐,为咱们提供了严正的市场机缘 。”李彦宏展现 。

全栈妄想,重构baidu

十年的不断投入,让baidu把握了其余相助对于手难以坚持的优势。

以数据 、算法 、算力这AI时期的三概况始终看,baidu都有着丰硕的蕴藏。搜查营业降生的baidu做作就具备优异的数据能耐  ,不论是在抓取、抽取 、洗涤、去重 、反剩余等操作上 ,都可能更快拿到高品质数据集  。

算法层面,早在2019年 ,baidu就曾经争先宣告中国首个正式凋谢的预磨炼模子文心ERNIE1.0,该模子一度登顶全天下威信数据集GLUE榜单。在随后四年光阴内 ,该模子不断迭代  ,已经从繁多的做作语言清晰缩短至少模态  ,实现视觉 、文档、文图 、语音“万能” 。

反对于文心模子磨炼的算法框架平台 ,是baidu飞桨。这是中国首个自主研发的财富级深度学习开源凋谢平台。妨碍2023年8月,飞桨平台上已经凝聚800万开拓者 ,效率22万家企事业单元,基于飞桨建树了80万个模子 。位列中国深度学习平台市场综合份额第一 。

算力层面 ,baidu自主研发的云端通用AI芯片——昆仑芯一、2代已经实现量产,并抵达数万片规模部署 ,昆仑芯第三代估量2024年初量产。此外 ,baidu还已经在阳泉、徐水、定兴三地建树起自用云合计中间 ,重大的超算集群为大模子的磨炼奠基了根基 。

上述三重优势,使baidu能在极短的光阴内跟上OpenAI的脚步,成为全天下大厂中第一个做出对于标ChatGPT产物的企业 。

加倍紧张的是,随着文心大模子跟文心一言的宣告 ,baidu乐成补上了全栈AI能耐的最后一块拼图 。如今的baidu在“芯片层 、框架层 、模子层、运用层”等四层IT技术栈上均有妄想,成为全天下为数未多少 、妨碍全栈妄想的家养智能公司。

从昆仑芯片、飞桨深度学习平台 、文心大模子到文心一言  ,baidu经由这些关键自研技术  ,实现为了层与层反映 ,端到端优化,大幅提升功能  。

患上益于此 ,baidu能耐在强烈的国产大模子之战中 ,不断坚持争先并吞C位 。

以文心一言为例,这一产物在往年3月宣告以来快捷妨碍。妨碍当初,其熟练把握的创作文体逾越200个 ,内容丰硕度是宣告早期的1.6倍 ,脑子链长度是早期的2.1倍 ,知识点拆穿困绕抵达早期的8.3倍 。

功能方面 ,经由飞桨端到端自顺应混并吞行磨炼技术以及缩短、推理、效率部署的协同优化 ,文心大模子磨炼速率抵达原本的3倍  ,推理速率抵达原本的30多倍。

随着技术能耐慢步降级,以及大模子存案的经由  ,baidu正减速建树生态 ,增长大模子运用的睁开,为下未来的睁开做好铺垫 。baidu总体资深副总裁何好汉就对于外展现 ,基于根基大模子开拓进去的运用,以及这些运用能在多大水平上提升破费功能,才是大模子存在的意思。

“巨匠比的不理当是你有多少多把鎯头,而是找到那个钉子,用鎯头把钉子给敲进去 。这是未来比拼的中间关键。”

当初,在C端,baidu旗下种种用户侧产物正在运用大模子妨碍重构 ,baidu搜查、百家号 、baidu文库  、baidu输入法等产物正在研发并陆续推出相关AI功能,未来还将推出NEWAPP等产物;在B端 ,baidu经由飞桨开源凋谢平台、baidu智能云赋能工业 、能源、金融、通讯  、媒体  、教育等各行各业。

而这正是李彦宏心中baidu的临时目的 。在往年5月举行的2023中关村落论坛上 ,他清晰指出baidu要做第一个把全副产物重做一遍的公司。

“不是整合,不是接入 ,是重做、重构。”

顶: 53673踩: 6655