為了讓 AI 不斷打怪升級,DeepMind 打造「宇宙」
作者 雷鋒網 | 發布日期 2021 年 07 月 30 日 8:15 |
DeepMind 又給我們小驚喜。我們都知道,強化學習苦於類化能力差,經常只能針對單個任務從頭學習。
DeepMind之前開發的AlphaZero,儘管可以玩圍棋、西洋棋和日本將棋,但每種棋牌遊戲都只能從頭訓練。類化能力差也是AI一直被詬病為人工智障的一大原因。人類智慧的厲害之處,就在藉鑑之前經驗迅速適應新環境。
但類化能力不是一蹴而就,就像玩遊戲,也是先做簡單任務,逐步升級到複雜任務。《空洞騎士》(Hollow Knight)一開始只需要隨意走動揮刀砍怪,但噩夢級難度的「苦痛之路」關,沒有前面累積的技巧,只能玩寂寞。
多任務宇宙
DeepMind此次採用「課程學習」,讓智慧體於不斷擴展升級的開放世界學習。也就是說,AI新任務(訓練資料)是基於舊任務不斷生成。智慧體可盡情鍛鍊自己,簡單的如「靠近紫色立方體」,複雜點的如「靠近紫色立方體或將黃色球體放在紅色地板」,甚至和其他智慧體玩耍,如捉迷藏──「找到對方,且不要被對方發現」。
每個小遊戲存在世界小角落,千千萬萬個小角落拼成龐大的物理模擬世界,如下圖的幾何「地球」。總體來說這個世界的任務由三個要素構成,即任務=遊戲+世界+玩家,並根據三要素關係,決定任務的複雜度。
複雜度的判斷有四個維度:競爭性、平衡性、可選項、探索難度。
比如「搶方塊」遊戲,藍色智慧體需要把黃色方塊放到白色區域,紅色智慧體需要把黃色方塊放到藍色區域。這兩個目標矛盾,因此競爭性較強;同時雙方條件對等,平衡性比較高;因目標簡單,所以可選項少;DeepMind把探索難度評為中上,可能是因定位區域算較複雜的場景。
再如「球球喜歡和方塊一起玩」遊戲,藍色和紅色智慧體有共同目標,讓相同顏色的球體和方塊放在相近位置。
這時競爭性自然很低,平衡性毋庸置疑很高的;可選項比上面遊戲高很多;探索難度沒有定位區域,智慧體隨便把球體和方塊放哪都行,難度就變小了。
基於這四個維度,DeepMind打造超大規模「宇宙」任務空間,幾何「地球」也只是這宇宙的小角落,是四維任務空間的一點。DeepMind將「宇宙」命名為XLand,包含數十億個任務。
來看XLand的全貌,由一系列遊戲組成,每個遊戲在許多模擬世界進行,這些世界的拓樸和特徵平滑變化。
終生學習
數據有了,接下來得找到合適的算法。 DeepMind發現,目標注意代理(GOAT)可學習更通用的策略。
具體來說,智慧體輸入包括第一視角的RGB圖像、本體感覺以及目標。經過初步處理後,生成中間輸出,傳遞給GOAT模組,會根據智慧體目前目標處理中間輸出的特定部分,邏輯分析目標。
邏輯分析是指,每個遊戲可藉由一些方法,構建另一個遊戲,並限制策略的價值函數的最優值上限或下限。
DeepMind提出一個問題:對每個智慧體,什麼樣的任務是最好的?換句話說,打怪升級時,什麼樣的關卡設置才讓玩家順利升級為「真」高手,而不是一刀9999?
DeepMind的答案是,每個新任務都基於舊任務生成,「不會太難,也不會太容易」。其實恰好是讓人類學習時感覺「爽」的興奮點。
訓練開始時,太難或太容易的任務可能會鼓勵早期學習,但會導致訓練後期的學習飽和或停滯。不要求智慧體某任務非常優秀,而是鼓勵終身學習,即不斷適應新任務。所謂太難、太容易是較模糊的描述。需要量化方法,在新任務和舊任務之間彈性連接。
怎麼不讓智慧體做新任務時不適應而「暴死」?進化學習就提供很好的靈活性。總體來說,新任務和舊任務同時進行,且每個任務有多智慧體參與「競爭」。舊任務適應好的智慧體,會選拔到新任務繼續學習。
新任務中,舊任務的優秀智慧體權重、瞬間任務分佈、超參數都會複製,參與新一輪「競爭」。除了舊任務的優秀智慧體,還有很多新人參與,這就引進隨機性、創新性、靈活性,不用擔心「暴死」問題。
當然,因任務不斷生成、動態變化,一個任務可訓練不同長處的智慧體,並往不同方向演化(隨著智慧體相對性能和強健性進行)。最終每個智慧體都會形成擅長任務的集合,就像春秋戰國時期「百家爭鳴」。說打怪升級顯得格局小,簡直是模擬地球。
DeepMind表示,「這種組合學習系統的特性是,不最佳化有界性能指標,而是更新定義的通用能力範圍,這使智慧體開放式學習,僅受環境空間和智慧體的神經網路表達能力的限制。」
智慧初現
最終這複雜「宇宙」升級、進化、分流的智慧體長成了什麼優秀物種?DeepMind說,智慧體有很明顯的零樣本學習能力,比如使用工具、合圍、數數、合作+競爭等。
來看具體例子。首先智慧體學會臨機應變。目標有三個:
黑色金字塔放到黃色球體旁邊
紫色球體放到黃色金字塔旁邊
黑色金字塔放到橙色地板
AI一開始找到一個黑色金字塔,想拿到橙色地板(目標3),但搬運過程瞄見黃色球體,瞬間改變主意,「我可以實現目標1啦」,將黑色金字塔放到黃色球體旁邊。
第二個例子是,不會跳高,怎麼拿到高台上的紫色金字塔?智慧體需要想辦法突破障礙,取得高台上的紫色金字塔,高台周邊並沒有類似階梯、斜坡的路。
因不會跳高,所以智慧體「掀桌子」,把周邊幾塊豎起來的板子弄倒。然後一塊黑色石板剛好倒在高台邊,「等等,這不就是我要的階梯嗎?」這過程是否體現了慧體的智慧,還無法肯定,可能只是一時幸運。關鍵還是,要看統計數據。
經過5代訓練,智慧體在XLand的4千個獨立世界玩了約70萬個獨立遊戲,涉及340萬個獨立任務,最後一代每個智慧體都經歷2千億次訓練步驟。智慧體已能順利參與幾乎每個評估任務,除了少數即使人類也無法完成的任務。
DeepMind的研究,或許一定程度體現「密集學習」重要性。也就是說,不僅資料量要大,任務量也要大。這也使得智慧體在類化能力有很好表現,如資料顯示,只需對一些新複雜任務進行30分鐘集中訓練,智慧體就可快速適應,而從頭開始用強化學習訓練的智慧體根本無法學習這些任務。
往後我們也期待這「宇宙」更複雜和生機勃勃,AI經過不斷演化,不斷給我們帶來驚喜(細思極恐)的體驗。
資料來源:https://technews.tw/2021/07/30/deepmind_xland/
同時也有26部Youtube影片,追蹤數超過1萬的網紅CMmath,也在其Youtube影片中提到,微補習商店 https://cmmath.com/shop/ . Q1:何謂微補習 簡單來說,就是線上看影片自主學習,然後在社團內依據我安排的進度,你可以與老師利用影音互動輔導,有問題24小時都可以在line提問 . Q2:你是誰?為什麼我要相信你可以幫我帶來好成績? . Q3:聽起來不...
「導函數是什麼」的推薦目錄:
- 關於導函數是什麼 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
- 關於導函數是什麼 在 Facebook 的精選貼文
- 關於導函數是什麼 在 辣媽英文天后 林俐 Carol Facebook 的最佳解答
- 關於導函數是什麼 在 CMmath Youtube 的最佳貼文
- 關於導函數是什麼 在 CMmath Youtube 的最佳解答
- 關於導函數是什麼 在 孫在陽 Youtube 的最佳貼文
- 關於導函數是什麼 在 導數與導函數 - YouTube 的評價
- 關於導函數是什麼 在 導函數的極限定義 - YouTube 的評價
- 關於導函數是什麼 在 反導函數反函數2023-在Facebook/IG/Youtube上的焦點新聞和 ... 的評價
- 關於導函數是什麼 在 反導函數反函數2023-在Facebook/IG/Youtube上的焦點新聞和 ... 的評價
- 關於導函數是什麼 在 觀念講解| ❒ 公開課❒ 張旭微積分微分篇[01] 導數與微分的概念 的評價
導函數是什麼 在 Facebook 的精選貼文
是的,指考。
不意外的,又有一波擔憂國家數理發展,以及另一波擔心語言發展,還有其他波的擔心XX發展,加上奧運舉辦,體育發展的憂慮也刷一波
依照各方大德的憂慮,想要達成全部目標,我們現在的國民教育應該會從小一開始改成全住宿制,每天課程排到晚上9,一路上到大學還得要義務化。
簡稱,不可能的任務。
看不懂?嗯,因為這算月經文..........年經文才對。
我的意思很簡單啦,每次大考考完,除了那些每年都要靠邀幾句的校長,總會多出一批新人,憂心教育內容每況愈下,學子未來值得擔憂,國家競爭力缺乏等等。從教改啟動前就開始罵,罵到今天還是沒停。
坦白說,我對罵沒意見,但總要有具體點的建議出來。具體的建議可不是什麼提高數學教學強度,增加閱讀測驗等等,這叫做毫不具體。
具體的事項,要很明確的講出:
「必須從國一開始上三角函數,國二要會球座標」
「當前作文與閱讀課不敷需求,每周要加到5堂課」
用產業界的說法,就是你得提出目標-需求-資源,不然誰曉得你想幹嘛。那種高喊今年業績要提高的老闆很多,拍桌說業務要更積極搶單的經理更多,但具體計畫寫下來,恐怕是沒幾個能動的。
說不出個所以然,只是單純地看到數理教學內容變少,然後看則新聞說半導體落後,就膝蓋反射認定是教改失敗,學生程度太差,這連結相關度說有多高嘛...........
唉
我是希望,每個老師或是教授,真想對教育內容有建設性意見,不要只是碎念,請從現場時數去反推課程合理性,自己做不到也沒關係,試著想一次就曉得多麻煩,沒教過學校會很難這種「分配力學」。
做不到的人可以反過來,從希望達成的目標去反推該做什麼,這個業界也常做。那就是,你覺得我們哪些產業,或是未來需要哪些能力,必需在教育上立刻改變?
例如「半導體業是國家未來重點項目,所以要增加基層作業員素質,故全國技職體系都該開設鍍膜工藝、真空技術、現場操作技巧,所以今年就該鼓勵現場工程師轉職,進修教育學分後,分發到高職開始進行高強度的基層訓練。」(從爆肝工程師變成爆肝技工的概念)
或如「綠能產業是未來重點,所以國中理化課程應該大幅增加相關內容,電磁學要放到國二,基礎理化放到國一,生物課程另開,增加時數從文科挪走。並在國三大幅增加實驗課程,除高中以外,高職開設新的電力與製造工程師課程。」(人社科去死的概念)
不然喔,永遠只是在那邊憂國憂民,因為憂的範圍超級大,所以基本上台灣所有的問題都可以被囊括進去,可以給抱怨者宇宙無敵大的憂國情懷,卻沒有半個人可以提出具體解決辦法。
但不去討論實際運作的狀態,多數人都只是看著小孩課本,抱怨怎麼內容變那麼簡單,然後看了新聞說XX國很強,就反射認為都是課本教壞,這種想法沒有意義啦。
沒篇幅了,所以我這邊就提一個問題,看有沒人會想討論,之後再來講:
我們教育究竟是要傾向全民篩選制,還是積極放長線釣大魚的概念。這兩者雖然可以並行,但若全力推動一種,另一種就會被當成不公平喔。
導函數是什麼 在 辣媽英文天后 林俐 Carol Facebook 的最佳解答
感謝熱情認真的李學長,
今天要來介紹「建中科學班」!
————————————————————
科學班考試三月多就考了,獨立招生。
📍考進科學班有什麼優點?
主科老師會是比較有經驗的,幾乎沒有地雷老師。老師還會同時兼任你的專題研究老師
🔆三年不分班,會有電神互相切磋討論。
教學資源多,可以借用科學館做實驗、借競賽資料、想考數理科免修可以直接報名(普通班要7%或是老師推薦)。
數理科目進度高二就上完,要在高三去台大修課(微積分、普通物理、普通化學、普通生物四選一)。高二下須通過資格考試方能第三年取得台大修課資格,沒考過者你會拿不到科學班認證證明文件,但是不會強制將你轉班。
📍 科學班的內容會不會比較難,成績會不會不好看?
🔆 數理科的內容會比較難,老師比較少管必選修,以主題式教學為主。
某些科目段考較難,老師會調到比較高分,只要你有努力老師一定看得出來分數給的算高。文科被當在科學班會更常發生,因為我們甄選就是數理跟一階不太難的語文考試。
📍 我是一個沒有超修的國三生(注意,那是會考前),要怎麼準備考試?
🔆 初試:
語文:不用太擔心,英文國文都在會考範圍,然後T分數差距也不大。
考古題以及其相似題型有公開,建議練完,才有考過初試的機會。
同樣地,初試會有沒準備的人來考,分數的標準差較大,最後T分數大概會落在60上下,在總體人數上大約是60/350。
科學班數學考試絕大多數題都可以國中解法,但多半想不太到。不會寫不要太沮喪,其他人大部分也不會寫。如果有餘力可以學習一些高中好用的單元如三角函數,能在你想不出那些超難解法時提供一個只要花時間就可以做出來的方法。
自然科會參雜一些高中觀念,但是不太會影響到解題,計算方面則多半是國中公式在高中的延伸。可以針對考古題去對對應的高中章節進行延伸閱讀在考試時比較不會那麼慌。
🔆 複試(實驗&證明):
數學佔複試4成,數學會是好幾大題每題帶六七小題的形式,其中每題的前段基本上通過初試的人都做得出來,建議每題都先做完前幾小題,卡在一大題很久會造成大量的分數損失。建中沒有公布複試題目,但外縣市學校好像有,可以去找找,但難度低於建中。
物理和化學各佔複試的2成,都有筆試和實驗。
物理筆試會考一些較難的高二高三題型最難到達物理奧林匹亞初複試水平,運動學和力學佔大宗,物奧初選該部份可以在高中範圍念完後練習一下。光學和熱學出現了國中為提供的公式請先自行預習,高中的電磁學與國中難度差較多,考的比較少。
化學筆試範圍有點多且量也很多(四十幾頁),有英文文章的閱測,比起其他題這類題目只要英文能力強一點就能做了。其他題目需要高中大量觀念,而且有些觀念是常常連高中生都忽視的(像溶解)。
🔆 實驗的部分:
兩科都是以高中實驗改編而來,會有線索提供你研究步驟以及計算,在討論的部分最好能去閱讀一些高中的實驗手冊,了解格式以及重點句的寫法,不要玩器材,會被扣分,打破也會(手殘者在此)。數據做出來差強人意也要放然後再想辦法解釋,你如果捏造數據老師一定會發現,你的成績就不會太高。有些討論不會需要作完實驗,實驗做不出來趕緊寫那裡搶分!!
複試的實驗技巧很多難以以國中的能力去填補,如果有這個規劃,可以在初試後詢問你的國中理化老師是否有機會讓你在課餘時間自主訓練高中實驗。(我的國中老師蠻支持的)
生物和地科各佔複試一成,生物高機率動植物器官、滲透壓、細胞觀察。做好這三類的實驗考過機率較大。地科由於內容不多,推薦讀完高中內容,才能節省做題組前要看大量資料才能解決的窘境。
✅ 再來是學習歷程的部分,學習歷程會用到競賽、專題等東西,考上者你們跟數資班對比的優勢就在四月到七月了,趕緊選一科專心拼競賽。在開學後你們可以跟數資班拉開一段距離(但在一、兩年後就沒了QQ)
✅專題研究有數學、物理、化學、生物、地科、資訊六科可以選,與你的競賽能力無關,建議去台大或中研院找個指導教授,他能帶給你大量的收穫。
專題研究高一下開始分組,高二上10月有國際科展初審,進度快者可以直接拼這個
高二下三月會有校內科展然後特優可至台北市科展然後特優可至全國科展,最後還是會回到台灣國際科展,台灣國際科展的目的就是篩選出一批國手前往美國比ISEF選上國手至少可以推薦本科系,得幾等獎會影響保送推薦範圍,請查教育部法規。
✅ 開學初會有能力競賽,以及各科奧林匹亞,能力競賽物理、化學、生物、地科限四選二初試,到了校隊培訓時資訊以外科目限選一科成為校隊。
然後有時候比競賽還是會吃天賦的,吃天賦的大小由左至右遞減大概是
數學>資訊>物理>化學>生物
但同樣也有人全部都行然後被迫上述能競四選二
最終能力競賽與奧林匹亞都會匯流到選訓營,然後決選營,而選訓營前半會推薦個本科系,成為國手後得金銀銅會影響保送推薦範圍,請查教育部法規。
✅ 科學班保送推薦人數僅佔三分之一,其餘的人最終還是會回流到學測指考。如果當初文科很爛考進來,沒拼到保送或推薦及特殊選才者很吃虧。可能會因此落入一些較差的志願。申請時如果有一個某科選訓營,加分會很賺。
✅ 再來就是要關注人才培育計畫,大概在8, 9月可以去考,有台大、清大、中研院等等各科的培育。這可以推廣到專題研究的部分,如果你對計畫裡的指導教授的研究主題感興趣的話,你可以毛遂自薦,指導教授get!
✅科學班的同儕實力很強大,有數物化生地免修的人、各科的奧林匹亞決選者與國手,跟他們一同考試時不要壓力太大。也因為這樣你永遠有奮鬥的目標,以及能幫你在課業跟競賽都走得更遠的人。
#俐媽學子經驗分享
#俐媽學子經驗分享資優班篇
#他們認真拚數理科學
#但也沒偏廢英文的學習喔
#台大明明高手輩出
導函數是什麼 在 CMmath Youtube 的最佳貼文
微補習商店 https://cmmath.com/shop/
.
Q1:何謂微補習
簡單來說,就是線上看影片自主學習,然後在社團內依據我安排的進度,你可以與老師利用影音互動輔導,有問題24小時都可以在line提問
.
Q2:你是誰?為什麼我要相信你可以幫我帶來好成績?
.
Q3:聽起來不錯,那跟外面賣線上課程的有什麼不同??
坊間線上課程多是請老師錄製完後,每年重覆賣,而我的微補習,每年更新教材,加入最新考題,重新錄製影片,而且不會賣完就不理你,社團及line上面24小時等你提問
.
Q4:價錢是怎麼訂的?
陳名老師為了推廣線上自主學習,想盡一點力量拉近城鄉差距,也讓都市的小孩不要再舟車勞頓趕車補習,定價約是在補習費的1/4,比如三角函數這個單元,我在補習班要上4堂課,在台中的補習行情約是3000$,我微補習大概就定價$690,這是老師考量之後,可以幫助同學也讓我兒子有奶粉可以喝的價錢,請多支持
.
Q5:媽媽說我不會真的那麼乖看影片主動學習!
沒錯!被動型的學生,還是建議你到補習班給老師盯,但是送大家一句話;「你有多自律,就有多自由」,你很羨慕知名youtuber可以不用上班打卡,每天拍片就可以接業配賺很多錢,可是你知道他們要自己安排時間寫腳本、拍片、剪片,早上不可以賴床,沒有老闆盯你的進度,這些是需要多大的自律能力嗎?如果你想像他們一樣,那就從現在學習自主管理,把省下的時間,學習更多有興趣的專長,把省下的補習費,買更多書或投資自己,這樣良善的循環🔄你未來肯定不同凡響
.
Q6:我決定要開始主動學習,那課程可以試看嗎?
YouTube頻道上面有500多部影片可以試看,IG什麼也有提供超多免費學習資源,所以要考慮清楚唷,微補習是不能退費的!
.
Q7:最後想問一下,為什麼叫微補習?
大家聽過80:20法則嗎?!
比如:世界上80%的財富集中在20%的人身上,一間公司80%的業績來自20%的商品。所以老師相信考試80%的考題來自於20%的重點,所以老師幫你抓出這微小的重點,你只要付出微少的時間,與微小的金錢,我幫你創造分數的極大值!哪個單元不會就買哪個單元,不用到補習班花費一學期萬把塊的錢,然後大部分的內容你可以自己學就會了
.
如果還有疑問,歡迎到ig私訊老師唷!
#微補習 #高中數學 #高職數學
導函數是什麼 在 CMmath Youtube 的最佳解答
微補習商店 https://cmmath.com/shop/
.
Q1:何謂微補習
簡單來說,就是線上看影片自主學習,然後在社團內依據我安排的進度,你可以與老師利用影音互動輔導,有問題24小時都可以在line提問
.
Q2:你是誰?為什麼我要相信你可以幫我帶來好成績?
.
Q3:聽起來不錯,那跟外面賣線上課程的有什麼不同??
坊間線上課程多是請老師錄製完後,每年重覆賣,而我的微補習,每年更新教材,加入最新考題,重新錄製影片,而且不會賣完就不理你,社團及line上面24小時等你提問
.
Q4:價錢是怎麼訂的?
陳名老師為了推廣線上自主學習,想盡一點力量拉近城鄉差距,也讓都市的小孩不要再舟車勞頓趕車補習,定價約是在補習費的1/4,比如三角函數這個單元,我在補習班要上4堂課,在台中的補習行情約是3000$,我微補習大概就定價$690,這是老師考量之後,可以幫助同學也讓我兒子有奶粉可以喝的價錢,請多支持
.
Q5:媽媽說我不會真的那麼乖看影片主動學習!
沒錯!被動型的學生,還是建議你到補習班給老師盯,但是送大家一句話;「你有多自律,就有多自由」,你很羨慕知名youtuber可以不用上班打卡,每天拍片就可以接業配賺很多錢,可是你知道他們要自己安排時間寫腳本、拍片、剪片,早上不可以賴床,沒有老闆盯你的進度,這些是需要多大的自律能力嗎?如果你想像他們一樣,那就從現在學習自主管理,把省下的時間,學習更多有興趣的專長,把省下的補習費,買更多書或投資自己,這樣良善的循環🔄你未來肯定不同凡響
.
Q6:我決定要開始主動學習,那課程可以試看嗎?
YouTube頻道上面有500多部影片可以試看,IG什麼也有提供超多免費學習資源,所以要考慮清楚唷,微補習是不能退費的!
.
Q7:最後想問一下,為什麼叫微補習?
大家聽過80:20法則嗎?!
比如:世界上80%的財富集中在20%的人身上,一間公司80%的業績來自20%的商品。所以老師相信考試80%的考題來自於20%的重點,所以老師幫你抓出這微小的重點,你只要付出微少的時間,與微小的金錢,我幫你創造分數的極大值!哪個單元不會就買哪個單元,不用到補習班花費一學期萬把塊的錢,然後大部分的內容你可以自己學就會了
.
如果還有疑問,歡迎到ig私訊老師唷!
#微補習 #高中數學 #高職數學
導函數是什麼 在 孫在陽 Youtube 的最佳貼文
面對日新月異的大數據工具,有時候很難跟上這節奏。Microsoft Power BI讓大家可以簡易的製作大數據分析。用 Excel Power BI 做大數據分析,課程大綱有認識大數據、大數據分析、視覺化呈現結果,提升管理品質,有效提升工作效率。另外;大數據分析還應該包含許多學習到的知識,回饋給資料,再重新計算,不是僅畫出視覺化圖後,就說做好了大數據分析。期待大家將了解應用這些工具使用,將大數據分析導入您的工作中。
孫在陽老師主講,[email protected]
範例、講義下載:https://goo.gl/ytzRxT
導函數是什麼 在 導函數的極限定義 - YouTube 的推薦與評價
之前得到結論:不僅是多項式的函數的導數定義有一個極限形式,也知道此極限形式對有效。但是其實真正需要知道的是 導函數 ,我們希望任意的一個函數的導 ... ... <看更多>
導函數是什麼 在 反導函數反函數2023-在Facebook/IG/Youtube上的焦點新聞和 ... 的推薦與評價
反導函數反函數2023-在Facebook/IG/Youtube上的焦點新聞和熱門話題資訊,找反導函數計算機,反導函數計算,反導函數英文在2022年該注意什麼?反導函數反函數在2023的熱門 ... ... <看更多>
導函數是什麼 在 導數與導函數 - YouTube 的推薦與評價
導數與 導函數. Q仔高中數學教室. Q仔高中數學教室 ... 初等微积分03 导数 与微分PengTitus专辑. PengTitus. PengTitus ... 01 函数 是什么 函數高中數學. ... <看更多>