DeepMind AI 修練成精了,已經學會「發脾氣」?
作者 雷鋒網 | 發布日期 2021 年 08 月 12 日 8:00 |
DeepMind 又在「捏小人」了!這群小人是英國人工智慧實驗室 DeepMind 生產的 AI,不過只能在遊戲裡看到。但你可能不知道的是,DeepMind 還訓練過 AI 下象棋、玩足球、比電競,甚至提出人工生命言論。
最近這群AI,竟然能直接跳過數據訓練,在開放式任務環境自我進化。
之前Alpha Go和Alpha Star能力再強,也只能在各自擅長遊戲放大招,超出範圍立刻停擺。現在這批小人卻能在不同遊戲游刃有餘完成任務,展現超強的泛用能力。難道人工智慧治好泛用「頑疾」了?
在搶奪高地金字塔的任務,兩個不同顏色的小人能力值相當,都沒有跳躍能力,開始發脾氣亂扔東西,混亂中竟把其中一塊板子「扔」成樓梯,長驅直入,任務完成!
多次實驗發現,小人可複製方法,難道這群AI有記憶了?不僅如此,小人還學會「相對運動」──我上不去,你下來──借助板子直接把目標拉下來!甚至為了贏得比賽,多個小人學會配合,團體合作能力一直上升。
這種用虛擬遊戲自我進化的AI,僅需人為搭建任務環境,設計大量任務目標,利用加強深度學習,一步步打通關,最終成為十八般武藝精通的AI。
沒有樣本,沒有經驗,這些AI究竟如何進化,零樣本學習是否意味這些AI具備基本的「自學意識」?
社會達爾文主義訓練場
比起之前的足球場,這批AI的訓練場更像遊戲「社會」,有無數個遊戲房,每房間遊戲照競爭性、平衡性、可選性、探索難度分類。不管哪種任務,這批AI都只能從最簡單開始,一步步解鎖更複雜的遊戲,整個遊戲更像虛擬社會。
無需大數據集訓的AI,每玩一次遊戲就成長一次,與各種環境互動和「獎勵」下成長為更通用的AI,更像人工「生命」。
能讓AI自我進化的關鍵在於正確設計初始智慧和進化規則。一開始都非常簡單,所有複雜結構都是進化而來。就像嬰兒不會做大人的事,任務核心是不要超出AI自身的改進能力。
據DeepMind說法,每個AI會在4千間遊戲房玩約70萬個遊戲,並在340萬個任務經歷2千億次訓練步驟。1億次步驟約耗時30分鐘。照這訓練法,41天就能訓練出一群「成年」AI。
但AI還是不會思考
DeepMind表示「單AI可開發智慧成多目標,不僅一個目標」。AI公司Pathmind 的CEO Chris Nicholson也說「它學到的技能可舉一反三。例AI學習抓取和操縱物體,就能完成敲鎚子或鋪床任務。DeepMind正用程式設計為AI在這世界設定目標,這些AI正在學習如何掌握。」
但南加州大學計算機科學副教授Sathyanaraya Raghavachary表示,這些AI並不能定義為「生命」,尤其關於AI擁有身體感覺、時間意識及理解目標幾個結論。「即使人類也沒有完全意識到身體這件事,更不用說人工智慧了。」
他表示,活躍的身體對大腦不可或缺,大腦要放在合適的身體意識和空間位置內進化。如果AI能理解任務,何必需要2千億次模擬訓練達到最佳結果?總體而言,虛擬環境訓練的AI只是和以往AI「大同小異」。
從理論到現實的路還很長
狹義人工智慧是「複製人類行為的元素」,在計算機內執行某種任務,如分類圖像、定位照片物件、定義對象邊界等。這些系統旨在執行特定任務,而不具解決問題的一般能力。
相比之下,Deepmind使用的「通用人工智慧」有時也稱為人類等級人工智慧,因可理解上下文、潛台詞和社會線索,甚至認為可能完全超過人類。
但正如行為主義和認知主義的對抗,AI是否有解決問題的能力,並不能只考慮統計結果。善於「事後解釋」任何行為,實驗室之外還是無法「預測」哪些行動即將發生。
資料來源:https://technews.tw/2021/08/12/is-deepminds-new-reinforcement-learning-system-a-step-toward-general-ai/?fbclid=IwAR0xofCay9Ydy83BfQ_7lyEtfGvJroFfCznxiTxYIHP6HUFWpELClQPFs28
南加州大學 科 系 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
解鎖新技能,美科學家開發可發揮想像力的人工智慧系統
作者 Alan Chen | 發布日期 2021 年 07 月 21 日 9:48 |
雖然近年來,AI 已經在一些領域發揮超越人類的能力,例如計算、下棋、邏輯推理等,但仍然有許多功能還無法與人腦比擬。近期美國南加州大學研究團隊發表了一項研究成果,展示了可以發揮想像力的 AI 系統,讓機器學習領域出現新的突破。
在人的腦中,可以自由的根據過往經驗,以及人事物的各項特質,憑空想像出不同的場景、動作與畫面,但對於機器來說是一項非常困難的任務,因此南加州大學(University of Southern California,USC)團隊,在今年度「國際機器學習展示會議」(International Conference on Learning Representations,ICLR)發表 AI 想像力系統。
「人類的大腦可以輕易的解構過往學習到的人事物,並且根據不同的特徵-例如形狀、姿態、位置和顏色等,重新合成現實不存在的新圖像。」團隊中的博士生 Yunhao Ge 表示,透過人工神經網路技術,他們設計出一套可以發揮想像能力的 AI 系統。
目前的 AI 系統,如果要自動產生某種圖像,例如人臉,必須先設計出一套演算法,並提供一定數量的人像,讓機器透過演算法學習人臉的各項特徵,之後就能夠自行產生各種虛擬人像。但現有技術的限制在於,系統雖然可以產生無數的虛擬人像,但無法產生與人無關的事物,或是讓虛擬的人處在不同情境中。
研究團隊使用機器學習「脫鉤」(Disentanglement)的概念,這項概念最著名的運用就是「Deepfake」技術,Deepfake 可以將不同人事物的外形、動作和情境分開學習,並用演算法重新創造出一組虛擬的人事物,且進行不同的動態。
因此團隊捨棄傳統演算法使用的單張圖片學習方式,一次用一組互無關聯的圖片,讓 AI 運用脫鉤概念進行特徵分析,從而創造出 AI 進行想像的能力,團隊稱這種想像力為「可控脫鉤圖像學習」(Controllable Disentanglement Representation Learning)。
「透過演算法,AI 能夠隨意的把變形金剛裡面的大黃蜂、柯博文與時代廣場結合起來,產生大黃蜂顏色的柯博文卡車在時代廣場旁行駛的圖片。」領導團隊的 Laurant Itti 博士表示,這項成果相較於傳統的圖像產生 AI 來說,有更多聯想能力,能把更多元素同時帶進演算法,讓機器產出更豐富的畫面。
團隊同時也指出,這項技術對醫藥領域也有相當大潛力,透過 AI 脫鉤聯想能力,機器能同時分析成千上萬種不同藥物或生化物質的特性,並透過分析與重組,合成出新的藥物配方,大量減少新藥物研發的時間,可為人類健康帶來許多幫助。
附圖:▲ 目前的 AI 雖然能夠產生完美的虛擬人臉,但無法模擬人臉以外事物。(Source:The Verge)
▲ 帶領研究團隊的南加大教授 Laurent Itti。(Source:USC)
資料來源:https://technews.tw/2021/07/21/usc-developed-new-ai-system-that-can-imagine-things/
南加州大學 科 系 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文
未來吵架王,美科學家訓練 AI 與人類辯論
作者 Alan Chen | 發布日期 2021 年 07 月 05 日 18:00 |
雖然科幻電影常看見古靈精怪的 AI 機器人,與人類主角一來一往抬槓,但現實 AI 距離電影仍然相距甚遠。美國南加州大學近期發表研究,展示團隊訓練 AI 與人類進行主題辯論的成果。
南加大(USC)「創意科技中心」(Creative Technology Institute,CTI)研究團隊,在本月「北美計算語言學協會」(North America Chapter of the Association for Computational Linguistic)年度會議展示 AI 系統「CaSiNo」(Camp Site Negotiations)的辯論訓練成果。
實驗採取情境式對話劇本為 AI 訓練教材,團隊以露營活動為對話訓練主題,並透過實際露營活動,將過程所有出現的對話情境,包括狀況討論、資源分配、意見反駁、修正、妥協和合作等內容,匯集成大量數據資料供 AI 學習。
對話資料彙整後,團隊歸納出九種辯論策略,讓 AI 經深度學習,自由搭配運用不同策略組合,但團隊同時也指出,露營場景設定下,合作策略的成效遠大於自私策略,因此 AI 學習後,與人類對象討論露營資源分配時,也會傾向合作。
「我們的研究與其他團隊不同之處在於,先前 AI 對話研究多是固定內容、選單式方式進行。」團隊主任 Kushal Chawla 博士指出,CaSiNo 優勢在於,透過大量對話學習,往後 AI 將可真正使用通順的語言與人類對話,甚至爭論。
Chawla 博士也表示,團隊接下來的研究,將著重非合作場景的對話訓練,例如說服對方接受自己意見的劇本。團隊需要繼續研究,如何讓 AI 學習在資源分配無法使雙方互利的情境下,說服對方接受較少資源的各種對話策略。
隨著 AI 學習越來越多分析和辯論能力,不久後人們也許要開始煩惱,該如何跟 AI 機器人進行辯論比賽,或是當人們老是吵輸 AI,對心理會否造成長期影響。
附圖:▲ 主導研究團隊的 Kushal Chawla 博士。(Source:USC)
資料來源:https://technews.tw/2021/07/05/usc-training-ai-for-better-negotiation-ability-with-human/