AV无码免费一区二区三区_99国产欧美久久久精品蜜桃_久久久久久精品免费免费英国_97久久精品人人做人人爽

“世界模型”——AI下一個(gè)“必爭之地”,英偉達、谷歌雙雙下場(chǎng)

  來(lái)源:硬AI

  作者:趙穎

  黃仁勛身著(zhù)新皮衣亮相2025?CES,除了推出炸裂的GPU RTX 5090之外,還宣布入局AI領(lǐng)域當下最關(guān)鍵的方向一“世界模型”。

  1月7日,黃仁勛在2025年拉斯維加斯消費電子展(CES)上宣布,推出Cosmos世界模型(Cosmos World Foundation Models,簡(jiǎn)稱(chēng)Cosmos WFMs),該模型專(zhuān)為理解物理世界打造,可預測和生成“物理感知”的視頻。

  具體來(lái)看,Cosmos WFMs分為三類(lèi):

(1)Nano:適用于低延遲和實(shí)時(shí)應用;(2)Super:高性能基線(xiàn)模型;(3)最高質(zhì)量和保真度輸出。

  這些模型的參數規模從40億到140億不等,Nano最小,Ultra最大。英偉達還發(fā)布了上采樣模型、針對增強現實(shí)優(yōu)化的視頻解碼器以及確保負責任使用的guardrail模型。

  實(shí)際上,除了英偉達,谷歌以及不少初創(chuàng )企業(yè)也在追逐世界模型,谷歌旗下DeepMind組建世界模型研究團隊,聘請Sora核心人員Tim Brooks掌舵。此外,“AI教母”李飛飛的World Labs、初創(chuàng )公司Decart、 Odyssey也都涉足其中。

  不僅引得一眾科技企業(yè)逐鹿,“世界模型”還被業(yè)內吹捧為是AI領(lǐng)域的下一個(gè)關(guān)鍵突破,那么“世界模型”到底指的是什么?它的重要之處在于哪里?

  英偉達入局“世界模型”,一眾科技巨頭“逐鹿”

  據英偉達介紹稱(chēng),Cosmos WFMs經(jīng)過(guò)了9000萬(wàn)億個(gè)token的訓練,數據來(lái)自2000萬(wàn)小時(shí)的真實(shí)世界人類(lèi)互動(dòng)、環(huán)境、工業(yè)、機器人和駕駛數據。模型可針對特定應用進(jìn)行微調,通過(guò)英偉達API和NGC目錄、GitHub和AI開(kāi)發(fā)平臺Hugging Face可獲得。

  多家企業(yè)已開(kāi)始試用Cosmos,英偉達表示,Waabi、Wayve、Fortellix和Uber等多家已經(jīng)承諾在各種用例中試用CosmosWFM,從視頻搜索和策劃到為自動(dòng)駕駛汽車(chē)構建AI模型。

  不過(guò),由于英偉達拒絕透露訓練數據的具體來(lái)源,這引發(fā)了版權爭議,分析稱(chēng)這正是英偉達將這些模型稱(chēng)為“開(kāi)放”而不是“開(kāi)源”的原因。

  與此同時(shí),谷歌DeepMind也在積極布局世界模型領(lǐng)域。根據TechCrunch報道,DeepMind正在組建一支專(zhuān)門(mén)的世界模型研究團隊,以擴大其在該領(lǐng)域的領(lǐng)先地位。該團隊將由前OpenAI研究員Tim Brooks領(lǐng)導,他于去年10月加入DeepMind。

  DeepMind上個(gè)月發(fā)布了Genie,該模型可模擬虛擬世界以及逼真的動(dòng)畫(huà)和物理效果,并支持所有這些元素之間的交互。例如用戶(hù)可以使用Genie創(chuàng )建的各種示例世界,包括航海模擬、賽博朋克西部片等,還可以使用文本、圖像或兩者的組合來(lái)提示Genie。

  除了英偉達、谷歌等科技巨頭,還有不少耀眼的初創(chuàng )玩家?!癆I教母”李飛飛的World Labs已籌集2.3億美元用于構建“大世界模型”,以及Decart、 Odyssey等公司也入局其中。此外,OpenAI此前發(fā)布的Sora模型也可視為一種“世界模型“,它能夠模擬如畫(huà)家在畫(huà)布上留下筆觸等行為,以及渲染類(lèi)似Minecraft的UI和游戲世界。

  AI領(lǐng)域的下一個(gè)關(guān)鍵突破:世界模型

  什么是AI“世界模型”?為什么它們很重要?

  具體來(lái)看,世界模型是指通過(guò)大量圖像、音頻、視頻和文本數據訓練,創(chuàng )建對世界運作方式的內部表征,并能推理行為的后果。這使它們能更好地理解和模擬現實(shí)世界的規律。

  世界模型的概念源自人類(lèi)大腦形成的心智模型,我們的大腦能夠將感官獲取的抽象信息整合成對周?chē)澜绲木唧w理解,從而形成“模型”,這些模型幫助我們預測和感知世界。

  世界模型的特點(diǎn)是試圖超越數據,模擬人類(lèi)的潛意識推理,例如,棒球擊球手能在毫秒內決定如何揮棒,是因為他們能本能地預測球的軌跡。這種潛意識推理能力被認為是實(shí)現人類(lèi)級智能的先決條件之一。

  “世界模型”的意義在于可以實(shí)現復雜推理和規劃,還將生成式視頻技術(shù)的突破:

1. 生成式視頻技術(shù)的突破:世界模型在生成式視頻領(lǐng)域展現出巨大潛力。與傳統的生成模型相比,具備基本物理規律理解的世界模型能更準確地模擬物體的運動(dòng)。例如,它不僅能預測籃球會(huì )彈跳,還能理解為什么會(huì )彈跳。Snap前AI負責人、Higgsfield公司CEO Alex Mashrabov表示,有了強大的世界模型,創(chuàng )作者就不需要為每個(gè)物體定義預期的運動(dòng)方式,模型本身就能理解這些。

2. 復雜預測和規劃:Meta首席AI科學(xué)家Yann LeCun認為,世界模型未來(lái)可能用于數字和物理領(lǐng)域的復雜預測和規劃。例如,給定一個(gè)臟亂的房間(初始狀態(tài))和一個(gè)整潔的房間(目標狀態(tài)),世界模型可以推理出一系列清潔行動(dòng),而不僅僅是根據觀(guān)察到的模式進(jìn)行操作。

  擁有這些能力后,“世界模型”可廣泛賦能影視、游戲,自動(dòng)駕駛以及機器人等行業(yè)。

  World Labs聯(lián)合創(chuàng )始人Justin Johnson預測,未來(lái)的世界模型可能能夠按需生成用于游戲、虛擬攝影等用途的3D世界,大大降低開(kāi)發(fā)成本和時(shí)間。世界模型將不僅能獲得圖像或視頻片段,還能得到一個(gè)完全模擬的、生動(dòng)的、可交互的3D世界。

  代表好萊塢動(dòng)畫(huà)師和漫畫(huà)家的工會(huì )動(dòng)畫(huà)協(xié)會(huì ) (Animation Guild) 一項2024年研究估計,人工智能有可能在未來(lái)兩年內顛覆美國10多萬(wàn)個(gè)電影、電視和動(dòng)畫(huà)工作崗位。

  世界模型還有望推動(dòng)機器人技術(shù)進(jìn)步,通過(guò)增強機器人對周?chē)h(huán)境和自身的感知能力,幫助它們更好地理解所處情境并推理可能的解決方案。

  盡管前景誘人,世界模型的發(fā)展仍面臨諸多技術(shù)挑戰:

巨大的計算需求:訓練和運行“世界模型”需要比當前生成模型更多的計算能力;幻覺(jué)和偏見(jiàn)問(wèn)題:像所有AI模型一樣,“世界模型”也會(huì )產(chǎn)生幻覺(jué)并內化訓練數據中的偏見(jiàn)。

訓練數據限制:缺乏足夠廣泛而又具體的訓練數據可能會(huì )加劇上述問(wèn)題。復雜行為模擬:目前的模型難以準確捕捉世界居民(如人類(lèi)和動(dòng)物)的行為。

  過(guò)去一年AI技術(shù)在多元方向持續突破,世界模型被視為下一個(gè)重大突破。雖然距離成熟的“世界模型”還有數年時(shí)間距離,但這一技術(shù)已展現出巨大潛力。如果所有主要障礙都能克服,“世界模型”有望在虛擬世界生成、機器人技術(shù)和AI決策等領(lǐng)域帶來(lái)重大突破,為人工智能與現實(shí)世界的融合開(kāi)辟新的途徑。

  市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

轉載原創(chuàng )文章請注明,轉載自東莞厚街佰勝機械設備廠(chǎng),原文地址:http://www.fauchierpartners.com/post/30040.html

上一篇:科技巨頭集體大跌!英偉達、阿斯麥盤(pán)前均跌超8%!什么情況?

下一篇:A股大逆轉!深交所重磅消息

評論

◎歡迎參與討論,請在這里發(fā)表您的看法、交流您的觀(guān)點(diǎn)。
AV无码免费一区二区三区_99国产欧美久久久精品蜜桃_久久久久久精品免费免费英国_97久久精品人人做人人爽