--課程已於 2020 年 7 月更新--
這個課程是關於整合方法 (Ensemble Methods)。
我們已經學習了一些經典的機器學習模型,如 k-nearest neighbor 和決策樹。 我們已經研究了他們的局限和缺點。
但是,如果我們可以結合這些模型來消除這些限制,並產生更強大的分類器或迴歸器呢?
在本課程中,你將學習如何將決策樹和邏輯迴歸等模型相結合,以建立可以達到比基礎模型更高的精度的模型。
具體來說,我們將詳細研究隨機森林和 AdaBoost 演算法。
為了激勵我們的討論,我們將學習統計學習中一個重要的話題 – 偏差 – 變異權衡 ( bias-variance trade-off )。然後,我們將研究 bootstrap 技術和 bagging 作為同時減少偏差和變異的方法。
我們將做大量的實驗,並在真實的資料集上使用這些演算法,這樣你就可以親眼看到它們是多麼的強大。
https://softnshare.com/machine-learning-in-python-random-forest-adaboost/
bootstrap統計 在 純靠北工程師 Facebook 的最佳解答
#純靠北工程師2lr
我在跟你討論的Bootstrap,是統計學上的Bootstrap
結果你居然以為是響應式網頁的Bootstrap
跟你說了Bagging你還一臉茫然,看樣子是真的不知道,而不是誤會
你要知道你來面試的是AI工程師,不是前端工程師!!
現在AI工程師被稱為難民工程師,就是一堆你們這些本質學能太爛的前端工程師害的,能夠畫圖表就自以為是Data scientist了嗎?
D3.js看著文件做,每個真的有本質學能的工程師,都能畫出漂亮圖表,你是在自滿什麼啦?
吼氣氣氣氣氣氣,看到這些到處流竄的劣幣,讓我們這些真的下過紮實苦工、真的有本質學能的工程師很生氣。
業界的行情就是被你們這些人破壞掉的。
ps. 為了避免離題去戰轉職者,我要表達的是本質學能的重要性。
我就遇過一個台大雜牌科系的,很認真鑽研學理和技術,也成為頂級強者。
現在轉職者最大的問題就是不努力,寫了一個複製貼上的程式,就到處要飯,真的讓人受不了。
👉 去 GitHub 給我們🌟用行動支持純靠北工程師 https://github.com/init-engineer/init.engineer
📢 匿名發文請至 https://kaobei.engineer/cards/create
🥙 全平台留言 https://kaobei.engineer/cards/show/3375
bootstrap統計 在 軟體開發學習資訊分享 Facebook 的最佳貼文
這個課程是關於整合方法 (Ensemble Methods)。
已經學習了一些經典的機器學習模型,如 k-nearest neighbor 和決策樹。 也研究了他們的局限和缺點。
但是,如果可以結合這些模型來消除這些限制,並產生更強大的分類器或迴歸器呢?
在本課程中,你將學習如何將決策樹和邏輯迴歸等模型相結合,以建立可以達到比基礎模型更高的精度的模型。
具體來說,課程將詳細研究隨機森林和 AdaBoost 演算法。
為了激勵討論,課程將學習統計學習中一個重要的話題 – 偏差 – 變異權衡 ( bias-variance trade-off )。然後,我們將研究 bootstrap 技術和 bagging 作為同時減少偏差和變異的方法。
將會做大量的實驗,並在真實的資料集上使用這些演算法,這樣你就可以親眼看到它們是多麼的強大。
由於深度學習如此受歡迎,課程也會研究隨機森林、AdaBoost 和深度學習神經網路之間的一些有趣的共同點。
這個課程的材料都是免費的。你可以使用 Windows、Linux 或 Mac 上的簡單命令下載並安裝 Python、Numpy 和 Scipy。
https://softnshare.com/…/ensemble-machine-learning-python-…/
bootstrap統計 在 [問題] 拔靴法(Bootstrap)的適用時機- 看板Statistics - 批踢踢實業坊 的推薦與評價
由於我嘗試翻閱由Efron所著之An introduction to the bootstrap之後,
還是對於拔靴法的應用不是很懂,
因此有些關於拔靴法的問題想詢問大家,
還望大家協助解惑~
不好意思因為本身並非數理底子很好的學生,
所以看統計學的內容有些吃力...
就我目前所了解到的(包含參閱其他研究文獻):
1.拔靴法主要是用來校正誤差的,
且其實未受到研究母群一定得要是常態分配的限制,
因此可以適用在當母群非常常態分佈時的狀況下使用,
所以假如我的研究中我已經確定我的研究母群並非呈常態分佈,
而比較可能是reverse J-shape distribution的話,
那麼如果我在使用統計軟體SPSS跑多元線性迴歸時同時設定跑Bootstrap,
這樣的話是正確的嗎?
我目前的想法是因為多元迴歸的基本假設中有提到殘差需符合常態,
但是如果檢驗結果殘差未呈常態,
那麼我能夠藉由拔靴法的協助在殘差未呈常態分佈的狀況下執行多元迴歸,
然後有能符合統計方法的使用正確性嗎?
因為我就我的了解,
好像拔靴法的使用另一個比較重要的觀念為,
若所欲分析的研究樣本並非常呈現常態分配,
但是如果所抽樣的樣本其分布型態與母群的實際分布近似,
依舊是可以使用拔靴法的。
不知道我的理解是否有誤?
還請專業的大家幫忙指正,
感謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.44.82
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1458455106.A.22A.html
... <看更多>