百家樂IOS/安卓通用版/手機APP下載 老黃吹的Cosmos 3,在一個北大團隊作念的榜單上拿了第一
剛剛疇昔的 GTC Taipei 上,最備受暄和的,莫過于Cosmos 3。

這是一個悉數開源的物理 AI 全模態模子。老黃默示,Cosmos 3 謝寰宇生成這項上,在 Artificial Analysis、Physics-IQ、PAI-Bench、R-Bench 四個開源榜單上均列第一。

前三個 bench 都算業界比較眼熟的,而R-bench——我稀奇查了查,這個讓 Cosmos 3 霸榜的榜單,竟出自一支北大團隊。
這篇職責已被 ICML 2026 接納,名字叫《Rethinking Video Generation Model for the Embodied World》,來自北京大學、字節超越 Seed 等機構的盤考團隊。
他們提倡了面向具身寰宇的視頻生成評測與數據基礎設施:R-Bench+RoVid-X。

值得在意的是,在作家列內外,字節 Seedance 2.0 的預進修講求東談主曾妍,也赫然在列。
R-Bench:專門給機器東談主視頻生成請的"考官"
Cosmos 3 是英偉達此次 GTC Taipei 的主角之一。
按老黃的說法,它是人人首個悉數開源的物理 AI 全模態模子,基于一種 mixture-of-transformers 架構,能在一個模子里同期通曉和生成文本、圖像、視頻、環境聲息,乃至機器東談主的動作。
Nano 和 Super 兩個尺寸,都也曾掛上了 Hugging Face。

換句話說,Cosmos 3 要作念的不是"拍出順眼的視頻",而是給機器東談主、自動駕駛這些要在的確寰宇里干活的系統,生成"物理上說得通"的數據。
但問題它就來了。
一個模子生成的機器東談主視頻,到底是不是"物理上說得通",該用什么來猜度?
疇昔一年,視頻生成的故事險些都繞著歸并個問題張開:誰能拍得更了了、更結識、更有電影感。
但在機器東談主場景里,畫質順眼是一趟事,能不可用又是另一趟事。
要是一個模子能生成傳神的機械臂,卻讓夾爪穿過物體;能讓機器東談主看起來"動起來",卻無法完成抓取、擯棄、回身、互助等任務,那么它距離 Physical AI 需要的"寰宇模子",仍然隔著一條領域。
R-Bench的中樞起點,即是把視頻生成模子從"視覺生成器"放到"物理寰宇模擬器"的語境下再行評估。
它不單看畫面是否傳神,而是系統性猜度模子是否能生成順應具身任務邏輯和物理管制的視頻。

具體而言,R-Bench 是一個以機器東談主為中心的視頻生成評測基準,包含650 個圖像 - 文本評測樣本,從5 類任務才能和4 類機器東談主花樣兩個維度構建。
在職務維度上,R-Bench 障翳操作奉行、空間聯系、多主體互助、永劫謀劃和視覺推理;在機器東談主花樣維度上,障翳單臂、雙臂、四足和東談主形機器東談主。

這么的假想讓 R-Bench 不再只問"視頻像不像",而是進一步追問:
機器東談主有莫得的確斗爭到見識物體?
任務樞紐法子是否齊全出現?
多個物體或多個主體之間的聯系是否合理?
機器東談主花樣在通順歷程中是否保持結識?
永劫序動作是否順應任務邏輯?
因此,R-Bench 不僅僅一個名次榜,更可以看成機器東談主視頻生成數據的"物理質地過濾器":
它能夠評估生成視頻是否振作斗爭聯系、動作門徑、花樣結識性和任務完成度等物理管制,從而匡助篩選出更順應物理法例、可用于具身智能進修的數據。
為了捕捉這些問題,R-Bench 假想了一套可復現的自動化評測謀劃體系,能夠識別機器東談主花樣畸變、物體屬性漂移、部件飄搖或穿模、無斗爭抓取、虛擬出現物體、樞紐動作缺失等常見失敗模式。
值得在意的是,R-Bench 的自動打分,和東談主工評測的 Spearman 研究悉數達到0.96。

這意味著它不僅僅個自動跑分用具,在很猛進程上對都了東談主類對"物理合不對理""任務完沒完成"的判斷。
亞搏體育中國一站式服務官網榜單上還能看到什么?
在最新 R-Bench Leaderboard 中,Cosmos 3 系列也曾成為開源社區最亮眼的模子之一。
Cosmos3-Nano 以0.584的輪廓得分位列 RBench 開源模子第一,Cosmos3-Super 緊隨其后,拿到0.581。

放到通盤榜單里看,這傳遞出兩個信號。
一所以物理 AI 為見識進修的視頻寰宇模子,也曾初始在機器東談主圖像到視頻生成上展現競爭。
比較傳統通用視頻模子,它的上風不單在畫質,更在于更接近具身智能需要的物理模擬與動作延展才能。
二是閉源交易模子輪廓才能仍然率先,但開源正在快速追逐。
對盤考社區來說,百家樂2026世界杯中國官方下載這種"開源能打"的信號,比單個模子更強更蹙迫。

而比排名更有價值的,是 RBench 照出來的幾處共性短板:
考究操作照舊老浩劫。移動、回身這類大幅動作模子也曾作念得可以,但抓、執、擰、插、擯棄這些對斗爭建模條件高的動作,最容易出錯。
永劫謀劃仍是弱項。視頻看起來連貫,不代表任務邏輯正確,模子可能動作領悟卻漏掉樞紐法子,或者把門徑搞反。
通用學問和機器東談主數據沒"合上"。純通用視頻有豐富的寰宇學問但缺機器東談主交互,純機器東談主數據又時時范圍有限、花樣單一。
從這個角度看,R-Bench 更像一面鏡子,把視頻模子在物理寰宇里的的確軟肋照了出來。
RoVid-X:400 萬條機器東談主視頻,開源了
發現了問題,下一步即是喂數據。這恰是RoVid-X要治理的事。
團隊也曾在 Hugging Face 上開源了 RoVid-X 的蹙迫子集(300 萬條機器東談主視頻),上線后熱度攀升很快——它在 Datasets Trending 的 Video 模態大范圍數據圍聚排名第一,在沿途 6.5 萬多個 Video 模態數據集的合座 Trending 里也位列第九。
這反應了 RoVid-X 看成面向機器東談主視覺 / 視頻通曉的大范圍數據資源,在開源社區中的快速影響力。
數據集的齊全版范圍達到400 萬條機器東談主視頻片斷、1300+ 細粒度妙技、1 萬 + 小時本體,劃分率 720P,并附帶 RGB、深度、光流等多模態物理標注。

和通用互聯網視頻不同,RoVid-X 要讓模子斗爭的是更接近的確的機器東談主交互歷程:物體何如被抓取、機械臂何如接近見識、任務何如被明白、動作和環境何如共同造成物理管制。
這種數據關于視頻寰宇模子尤其樞紐。因為物理通曉不是神圣靠請示詞補出來的,而需要模子在廣泛交互數據中學習斗爭、門徑、力學聯系和結構結識性。
推行限定也清楚,引入 RoVid-X 數據后,模子在具身任務中的進展能夠取得結識栽種。
舉例在 Wan 系列模子上,經過 RoVid-X 微調后,模子在操作奉行、永劫謀劃和空間通曉等維度均有顯著改善。

這評釋高質地、結構化的機器東談主視頻數據,如實能夠栽種視頻生成模子面向具身場景的可奉行性與結識性。
這項職責的意思,不單在于多了一個 benchmark 和一個 dataset,而是把視頻生成放進了物理 AI 的語境里再行注釋。
疇昔視頻生成更多處事于本體創作:告白、短片、殊效。往后,它可能成為機器東談主進修、仿真環境構建和具身智能數據閉環的基礎設施。
當模子初始通曉斗爭、門徑、結構結識性和動作后果,"生成一段看起來合理的視頻"就在向"可用于物理寰宇推演的寰宇模擬引擎"逼近。
R-Bench 和 RoVid-X 是在這個轉向中補上兩塊樞紐拼圖:一個薪金"怎樣評估",一個薪金"怎樣進修"。
跟著 Cosmos 3 等 Physical AI 視頻寰宇模子干涉 R-Bench 榜單并取得開源 Top-1,具身視頻生成的競爭也正在從單純比拼視覺效用,轉向更接近的確寰宇的物理通曉和任務奉行才能。
關于開源社區而言,這不詳是一個更蹙迫的信號:Physical AI 的進展,不單屬于閉源模子和交易系統,也可以確立在敞開評測、敞開數據和敞開模子共同演化的基礎之上。
按團隊的謀劃,下一步還會去作念從生成視頻反推可奉行徑作的 Inverse Dynamics Model,進一步買通視頻生成、戰術學習和真機部署之間的閉環。
視頻生成模子的下一站,不詳的確不僅僅拍電影,而是模擬、通曉,并參與的確的物理寰宇。
團隊配景
這支團隊叫DAGroup,來自北京大學,講求東談主是周大權。

周大權的閱歷,正值踩在此次職責的題眼上。
他從 2022 年就初始作念視頻生成,是最早一批入場的東談主之一——
代表作 MagicVideo 是業界最早的隱空間擴散視頻模子之一,自后還有 MagicVideo-V2、StoryDiffusion、Magic-Me 等一系列職責。

在騰訊混元視頻模子 HunyuanVideo 中,他領導了模子預進修與擴散算法假想團隊。
更早之前,他在模子與硬件效用標的也頗有蓄積,Coordinate Attention 曾被列為 CVPR 2020 最具影響力論文第 2 名。

如今回到北大作念助理造就,他把盤考要點放到了機器東談主、AIGC 和 VLA 上。
他自述,我方的盤考持久帶著一條"用最少的算力和內存,跑最強的算法"的干線。
除 R-Bench/RoVid-X 外,DAGroup 還在激動 HumanNet、StableVLA 等多個具身與寰宇模子標的的開源名目。
論文地址:
https://arxiv.org/abs/2601.15282
Project Page:
https://dagroup-pku.github.io/ReVidgen.github.io/
GitHub 地址:
https://github.com/DAGroup-PKU/HumanNet
R-Bench Leaderboard:https://huggingface.co/spaces/DAGroup-PKU/Leaderboard ?
RoVid-X Dataset:https://huggingface.co/datasets/DAGroup-PKU/RoVid-X/
— ?迎接 AI 產物從業者共建 ?—
? ?「AI 產物學問庫」是量子位智庫基于持久產物庫跟蹤和用戶步履數據推出的飛書學問庫,旨在成為 AI 行業從業者、投資者、盤考者的中樞信息要道與方案搭救平臺。

一鍵暄和 ? ? 點亮星標
科技前沿進展逐日見百家樂IOS/安卓通用版/手機APP下載