

Надпреварата за изграждане на световни модели – AI системи, които могат да разберат и симулират физическата реалност – се разгаря. Сега запис с отворен код от Китай се изстреля до върха на класацията, надминавайки предложения от Google, NVIDIA и добре финансирани стартиращи компании.
BWM (Модел на безграничния свят) постигна резултат от 64.54 на WorldArena Track-1 (качество на видеото), поставяйки се на първо място сред всички модели с отворен код и второ като цяло — само 0,39 точки зад лидера на затворения код. Състезавайки се с 86 модела от лаборатории по целия свят, BWM победи записи от Google, NVIDIA, Zhiyuan Robot, Shengshu Technology и други.
Роден в академичните среди, поддържан от отворен код
BWM не е фирма. Разработен е от екип, ръководен от Проф. Шен Хенгтао при Университет Тонгджиработейки заедно с Джу Лей, Коала Йорани Shanghai CodeMax. Вместо да създава от нулата, екипът прецизира отворения код на Alibaba Wan2.2-TI2V-5B модел за генериране на видео (5 милиарда параметъра), което прави BWM свидетелство за това какво могат да отключат основите с отворен код.
Три архитектурни иновации
Производителността на BWM произтича от три ключови дизайнерски решения:
- DiT (дифузионен трансформатор) — замяна на традиционния гръбнак на CNN с базирана на трансформатор дифузионна архитектура, позволяваща по-богато пространствено мислене.
- Механизъм на динамичната памет — поддържане на времева кохерентност в дълги видео последователности, което е от решаващо значение за реалистична физична симулация.
- Насочване за първи кадър + Двуканален контрол на действието — кондициониране на модела както на първоначален кадър, така и на команди за фино действие, което му дава истинска управляемост.
Въплътени сценарии от реалния свят
BWM беше оценен в шест въплътени категории задачи: пространствено пренареждане, артикулирано взаимодействие, фина манипулация, координация с две ръце, разположение на дълъг хоризонт и генерализиране извън разпространението. Най-важното е, че BWM демонстрира истински физическа интуиция — той се обобщава към невиждани сцени и обекти, върху които никога не е бил трениран, отличителен белег на истински модел на света.
Отворени тежести, нарастваща общност
Теглата на модела и кодът за извод са публично достъпни на GitHub и Прегръщащо лицекъдето проектът вече е натрупан 1600 звезди. Този открит подход е в контраст със секретността около много конкурентни усилия.
Защо световните модели имат значение сега
Световните модели се превърнаха в една от най-оспорваните граници на ИИ. AMI Labs на Yann LeCun, Световните лаборатории на Фей-Фей Лии Проектът Prometheus на Джеф Безос всички наливат ресурси в това пространство. На Sequoia AI Ascent 2026, Джим Фен от NVIDIA направи провокативно твърдение: “VLA е мъртъв, WAM е следващият” — като се твърди, че моделите Vision-Language-Action ще бъдат заменени от World Action Models.
BWM доказва, че един фокусиран академичен екип, използващ фондации с отворен код, може да се конкурира с най-добрите в света. За изследователите и практиците с въплътен AI това е модел, който си струва да се гледа.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта