將機器人學習轉移到現實世界中要具有更大的挑戰性。
為靈武等地區用戶提供了全套網頁設計制作服務,及靈武網站建設行業解決方案。主營業務為成都網站建設、網站設計、靈武網站設計,以傳統方式定制建設網站,并提供域名空間備案等一條龍服務,秉承以專業、用心的態度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!
騰訊科技訊 10月13日消息,對于人類來說,用腿走路幾乎是本能,可以輕松越過障礙、爬斜坡或樓梯。但對機器人,尤其是像波士頓動力公司的Spot這類四條腿機器人,學習如何正確行走卻非常困難。不過,美國芯片巨頭英偉達正與瑞士蘇黎世聯邦理工學院的研究人員聯手,利用虛擬障礙課程訓練名為ANYmals的四足機器人。
4000多個類似狗狗的機器人浩浩蕩蕩地向前行進的場景,即使是在模擬中也會給人帶來隱約的威脅感覺。但這可能會為機器學習新技巧指明方向。這個虛擬機器人軍團是由瑞士蘇黎世聯邦理工學院和英偉達的研究人員共同開發的,他們使用漫游的機器人訓練一種算法,然后該算法被用來控制現實世界中機器人的腿。
在模擬中,這些ANYmals機器面臨著重重挑戰,比如虛擬景觀中的斜坡、臺階和陡峭山坡。每次機器人成功克服挑戰后,它們會“晉級”挑戰更困難的關口,進而推動控制算法變得更加復雜。在訓練期間,機器人能夠很容易地掌握上下樓梯的技能,但克服更復雜的障礙物需要更長時間。應對斜坡被證明特別困難,盡管有些虛擬機器人學會了如何滑下斜坡。
當最終的算法被轉移到真實版本的ANYmal上時,它能夠在樓梯和街區之間導航,但在更高的速度下遇到了問題。ANYmal是四條腿的機器人,體型與狗狗大小相當,頭上有傳感器,還有個可拆卸的機械臂。研究人員將其歸咎于傳感器感知真實世界的方式與模擬相比不夠準確。
類似的訓練可以幫助機器人學習各種有用的技能,從分揀包裹、縫紉衣服到收割莊稼等。該項目還反映了模擬和定制計算機芯片對應用人工智能(AI)未來發展的重要性。
加州大學伯克利分校教授、CoVariant聯合創始人皮特·阿貝爾(pieter Abbeel)表示:“從更高的層面上講,快速模擬真的是很棒的事情。”CoVariant是一家利用AI和模擬技術訓練機器人手臂為物流公司挑選和分揀物品的公司。他說,瑞士蘇黎世聯邦理工學院和英偉達的研究人員“獲得了不錯的提速。”
AI在訓練機器人完成真實世界的任務方面表現出了巨大潛力,這些任務不容易寫入軟件,或者需要某種形式的適應。例如,抓取笨拙、易滑或不熟悉的對象的能力,就不太可能被寫到代碼中。
4000個模擬機器人接受了強化學習的訓練,這是一種AI方法,靈感來自于對動物如何通過正反饋和負反饋學習的研究。當機器人移動它們的腿時,一個算法會判斷這對它們行走能力的影響,并相應地調整控制算法。
這些模擬運行在英偉達的專用AI芯片上,而不是計算機和服務器中使用的通用芯片上。因此,研究人員說,他們能夠在不到通常所需時間的百分之一時間內訓練機器人。
使用專門的芯片也帶來了挑戰,因為英偉達的芯片擅長渲染圖形和運行神經網絡的關鍵計算,但它們不太適合模擬物理特性,如攀登和滑動。因此,研究人員不得不想出些聰明的軟件變通辦法,英偉達負責模擬技術的副總裁雷夫·勒巴雷迪安(Rev Lebardian)說:“我們花了很長時間才把事情做好。”
模擬、AI和專用芯片有可能推進機器人智能提升。英偉達已經開發了軟件工具,使使用其芯片模擬和控制工業機器人變得更容易。該公司還在西雅圖建立了一個機器人研究實驗室,同時還銷售用于自動駕駛汽車的芯片和軟件。
開發3D視頻游戲軟件的Unity Technologies公司,也涉足開發適合機器人專家使用的軟件。該公司負責AI業務的高級副總裁丹尼·蘭格(Danny Lange)表示,Unity Technologies注意到有很多研究人員在使用其軟件進行模擬,因此他們讓它更逼真,并與其他機器人軟件兼容。Unity Technologies目前正在與瑞典Algoryx公司合作,該公司正在測試強化學習和模擬是否可以訓練林業機器人拾取原木。
強化學習已經存在了幾十年,但由于其他技術的進步,最近已經產生了許多值得關注AI里程碑。2015年,強化學習被用來訓練一臺計算機下圍棋,最近它已投入實際應用,執行包括需要經驗和判斷力的芯片設計自動化工作。問題是,這種學習方式需要大量的時間和數據支持。
例如,Open AI公司花了14天多的時間,通過強化學習,在多個CpU同時運行的情況下,訓練一只機械手以粗糙的方式操作魔方。每次機器人接受再培訓都要等待兩周,這可能會打消企業使用機器人的積極性。早期用強化學習訓練機器人的努力將這個過程分散到幾個現實世界的機器人上,物理模擬的改進使在虛擬環境中加速學習成為可能。
麻省理工學院的學生安德魯·斯皮爾伯格(Andrew Spielberg)說,這項新工作“對終端用戶來說非常令人興奮”,他曾使用類似的模擬方法為機器人提供新的物理設計。他指出,谷歌的一個研究小組已經做了相關工作,通過將機器人拆分并在該公司定制的張量處理單元芯片上運行,加快了機器人的學習速度。
塔利·福特(Tully Foote)在開放機器人基金會(Open Robotics Foundation)管理著廣泛使用的開源機器人操作系統。他說,模擬對商業用戶來說越來越重要,“在部署到硬件之前,在現實場景中驗證軟件可以節省大量的時間和金錢”。它可以比實時運行得更快,永遠不會損壞機器人。如果出現錯誤,它可以立即自動重置。
但福特補充說,將機器人學習轉移到現實世界中要具有更大的挑戰性。他說:“現實世界中的不確定性要多得多,污垢、光線、天氣、硬件不均勻以及磨損等,這些都需要追蹤。”
英偉達副總裁勒巴雷迪安表示,用于訓練行走機器人的那種模擬最終可能也會影響到相關算法的設計。他說:“虛擬世界幾乎對一切都有價值,但其中最重要的一項肯定是為我們想要創造的AI構建游樂場或訓練場。” (騰訊科技審校/金鹿)
本文來自“騰訊科技”,審校:金鹿,36氪經授權發布。
當前名稱:機器人學走路很難嗎?英偉達利用虛擬障礙快速訓練
分享鏈接:http://m.kartarina.com/article22/sccjjc.html
成都網站建設公司_創新互聯,為您提供網站制作、網站排名、服務器托管、外貿建站、App開發、動態網站
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯