近期,零次方率先完成中國信通院“可信AI”—具身智能基準測試(EAI Bench),成為國內第一家在清潔場景中完成該項評測的具身智能企業(yè)。
依托Zerith-V0模型與Zerith-H1輪臂式人形機器人,零次方在這次復雜清潔場景測試中展現了卓越的泛化與適應能力。從實驗室到真實世界,零次方率先交出了具身智能基準測試的高分答卷。
具身智能行業(yè)正處于商業(yè)場景落地的關鍵期。如何評價一臺機器人“好不好用”、“夠不夠聰明”?
中國信通院人工智能研究所于2024年初啟動具身智能基準測試(簡稱“EAI Bench”)工作,以產業(yè)共建、國際引領為目標,聯(lián)合40余家單位共同開展《2024-1328T-YD-人工智能關鍵技術具身智能基準測試方法》行業(yè)標準編制。
中國信息通信研究院是工業(yè)和信息化部直屬科研事業(yè)單位,以“國家高端專業(yè)智庫產業(yè)創(chuàng)新發(fā)展平臺“為發(fā)展定位,在信息通信行業(yè)重大戰(zhàn)略、規(guī)劃、政策、標準和測試認證等方面發(fā)揮了有力支撐作用。
目前該標準已報批定稿,并同步在ITU SG21推進國際標準立項。
零次方機器人作為行業(yè)標準編制的深度參與者,在可信AI—具身智能基準測試(EAI Bench)首批測試(Y2025Q4)中,參測場景任務為“清潔場景—桌面擦拭”,以實戰(zhàn)檢驗技術硬實力。
Zerith-H1的“空間清潔”能力測評
本次測評中,零次方參加了極具空間清潔代表性的“清潔場景—桌面擦拭”任務。這不僅要求機器人能夠“看見”污漬,更要求其具備精準的抓取策略與動態(tài)規(guī)劃能力。
在多輪嚴苛的實測中,Zerith-H1表現出極強的泛化能力與靈活性:
精準識別污漬:除了對可樂、芬達、綠茶、番茄汁等常見污漬有極高識別率外,面對測試員現場隨機采購的3種完全未見過的污漬,Zerith-H1依然精準識別,展現了強大的視覺泛化能力。
穩(wěn)定發(fā)揮:無論是作業(yè)高度的變化,還是面對半透明的“茉莉柚子茶”,Zerith-H1機器人均能穩(wěn)定的擦拭清潔。
靈活避障:在存在障礙物干擾的情況下,Zerith-H1能靈活規(guī)劃并調整擦拭軌跡,動作策略適應性較好。
EAI Bench評測工作介紹
EAI Bench是首個面向產業(yè)的具身智能基準測試方法。
緊貼行業(yè)需求,統(tǒng)一評價尺度。目前已開放15個場景賽道,覆蓋14個通用能力評測。
涵蓋模型和部署模型的整機系統(tǒng)2類評測對象,適用于不同技術路線(如VLM、VLA、世界模型等)和不同形態(tài)整機(輪臂、雙足、機械臂、四足狗)。
支持虛實結合測試,涉及仿真和真實2類評測環(huán)境。
模擬現實場景干擾,量化τ1~τ3三種干擾強度,考察系統(tǒng)對場景干擾的應對能力。
具身智能基準測試框架
作為具身智能商業(yè)場景落地引領者,零次方機器人始終堅持“以真實場景迭代技術”。此次參與EAI Bench標準編制與首批測評,是零次方推動具身智能標準國際化、產業(yè)化的重要一步。
未來,零次方將繼續(xù)在真實商業(yè)場景中深耕,助力具身智能真正走進百業(yè)千家萬戶。

