新智元推薦來源:圖靈TOPIA作者:Mohammad Shahebaz 編譯:劉靜【新智元導讀】本文作者在Kaggle 比賽中獲得了4 枚銀牌和1 枚金牌獎牌,並且擁有31 枚 ... ... <看更多>
「kaggle教學ptt」的推薦目錄:
- 關於kaggle教學ptt 在 [轉錄] [閒聊] 菜鳥上Kaggle: 房價預測- 看板DataScience 的評價
- 關於kaggle教學ptt 在 2年自學,21歲最年輕Kaggle大師之路 - PTT新聞 的評價
- 關於kaggle教學ptt 在 KAGGLE - 飛比價格- 2022年1月PTT與DCARD推薦網拍商品 的評價
- 關於kaggle教學ptt 在 KAGGLE - 飛比價格- 2022年1月PTT與DCARD推薦網拍商品 的評價
- 關於kaggle教學ptt 在 [心得] 心理系的資料科學轉職之路- 幾乎0 成本- salary 的評價
- 關於kaggle教學ptt 在 Re: [請益] 機器學習在台灣的出路- 看板Soft_Job | PTT職涯區 的評價
- 關於kaggle教學ptt 在 [請益] 大四畢業前機器學習規劃| Soft_Job 看板| MyPTT 網頁版 的評價
- 關於kaggle教學ptt 在 找python練習題ptt相關社群貼文資訊 的評價
- 關於kaggle教學ptt 在 [請益] 轉行做資料數據分析agiwar PTT批踢踢實業坊 的評價
- 關於kaggle教學ptt 在 tensorflow教學ptt TensorFlow深度學習,一篇文章就夠了 - Voajcr 的評價
- 關於kaggle教學ptt 在 [請益] 深度學習該怎麼入門詳讀tensorflow2 - Soft_Job | PTT Web 的評價
- 關於kaggle教學ptt 在 Re: [討論] 新手學機器學習和Python - Mo PTT 鄉公所 的評價
- 關於kaggle教學ptt 在 從做中學AI - Posts 的評價
- 關於kaggle教學ptt 在 [心得] 資料科學沈之涯- 看板NTHU_Course - PTT網頁版 的評價
- 關於kaggle教學ptt 在 [評價] 109-2 李宏毅機器學習- NTUcourse - PTT生活資訊討論 的評價
- 關於kaggle教學ptt 在 本文目標是讓沒寫過PyTorch 的讀者成為PyTorch 新手(?) 的評價
- 關於kaggle教學ptt 在 專題參考資料- MrBearTW/TCFST Wiki 的評價
- 關於kaggle教學ptt 在 Use-Scrapy-To-Crawl-PTT-Data from ChienChengLin - Github ... 的評價
- 關於kaggle教學ptt 在 Use-Scrapy-To-Crawl-PTT-Data from ChienChengLin - Github ... 的評價
- 關於kaggle教學ptt 在 5 資料讀取與匯出| 資料科學與R語言 - 曾意儒Yi-Ju Tseng 的評價
- 關於kaggle教學ptt 在 [評價] 108-2 陳縕儂深度學習之應用 - PTT Uncovered 的評價
- 關於kaggle教學ptt 在 #請益數據分析/資料科學家,作品集? - 軟體工程師板 | Dcard 的評價
- 關於kaggle教學ptt 在 Automatic speech recognition github. Wave2vec Recognize ... 的評價
- 關於kaggle教學ptt 在 Python: Advanced Predictive Analytics: Gain practical ... 的評價
kaggle教學ptt 在 KAGGLE - 飛比價格- 2022年1月PTT與DCARD推薦網拍商品 的推薦與評價
KAGGLE PTT 與DCARD推薦網拍商品就來飛比,收錄全新、二手KAGGLE 在露天、蝦皮推薦商品|飛比價格. ... 初探機器學習:從認識AI到Kaggle競賽(附線上教學影音與測驗)|全 ... ... <看更多>
kaggle教學ptt 在 KAGGLE - 飛比價格- 2022年1月PTT與DCARD推薦網拍商品 的推薦與評價
KAGGLE PTT 與DCARD推薦網拍商品就來飛比,收錄全新、二手KAGGLE 在露天、蝦皮推薦商品|飛比價格. ... 初探機器學習:從認識AI到Kaggle競賽(附線上教學影音與測驗)|全 ... ... <看更多>
kaggle教學ptt 在 [心得] 心理系的資料科學轉職之路- 幾乎0 成本- salary 的推薦與評價
Regression:https://www.kaggle.com/c/bike-sharing-demand Bike Share 的需求 ... (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Salary/M.1583395941. ... <看更多>
kaggle教學ptt 在 Re: [請益] 機器學習在台灣的出路- 看板Soft_Job | PTT職涯區 的推薦與評價
在Kaggle 上這點就很明顯, 你的feature engineering 怎麼做才是重點, 甚至是做n-fold 去確保模型穩定,你不是靠運氣選到好的testing data 做feature selection 找出 ... ... <看更多>
相關內容
kaggle教學ptt 在 [請益] 大四畢業前機器學習規劃| Soft_Job 看板| MyPTT 網頁版 的推薦與評價
... 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.237.62.157 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1491308717.A.5A5.html. 1樓 推jj0321: 拿Kaggle來練, ... ... <看更多>
kaggle教學ptt 在 找python練習題ptt相關社群貼文資訊 的推薦與評價
中一數學練習下載# 怪獸電力公司國語版。 分类导航>> 初中课件、教案与教学设计、试卷练习题及资料>>数学试卷练习题>>九年级. ... の質問80件?gl = tw 日文的「面試80題? ... <看更多>
kaggle教學ptt 在 [請益] 轉行做資料數據分析agiwar PTT批踢踢實業坊 的推薦與評價
PTT · Soft_Job ... 圖表,這樣的過程有高度的興趣進而想去接觸機器學習等更多的理論自己平常有上網看python教學,基本的套件與資料分析 ... 推薦你先去kaggle 玩玩看. ... <看更多>
kaggle教學ptt 在 tensorflow教學ptt TensorFlow深度學習,一篇文章就夠了 - Voajcr 的推薦與評價
tensorflow教學ptt TensorFlow深度學習,一篇文章就夠了 ... 就職小米科技,使用YOLO的pre-trained model(CoCo dataset訓練,TensorFlow在Github上Fork數 ... <看更多>
kaggle教學ptt 在 [請益] 深度學習該怎麼入門詳讀tensorflow2 - Soft_Job | PTT Web 的推薦與評價
3 F → CaptPlanet: 讀paper、打kaggle、刻模型 08/04 13:54 ... 36 F 推Jekk: 什麼時候開始都不嫌晚啦推薦莫煩pytorch教學 08/04 20:36. ... <看更多>
kaggle教學ptt 在 Re: [討論] 新手學機器學習和Python - Mo PTT 鄉公所 的推薦與評價
這兩個教學網站大部分是以互動型做教學在講述一段觀念之後能直接練習會 ... 邊學會比較有效一點所以這部分自己找個目標做做看或者上Kaggle 找比賽來 ... ... <看更多>
kaggle教學ptt 在 從做中學AI - Posts 的推薦與評價
我們開始了用Excel 操作主成分分析的系列教學文,你跟上了嗎? ... 昨天(2021/12/14),Kaggle 平台開始了一個新的競賽:Feedback Prize - Evaluating… ... <看更多>
kaggle教學ptt 在 [心得] 資料科學沈之涯- 看板NTHU_Course - PTT網頁版 的推薦與評價
... 都是用投影片來上課,因為疫情關係,這學期幾乎都是遠距教學,也因為 ... HW3: 給定dataset,去預測明天會不會下雨,用Kaggle競賽,比F1 score ... ... <看更多>
kaggle教學ptt 在 [評價] 109-2 李宏毅機器學習- NTUcourse - PTT生活資訊討論 的推薦與評價
... 上課方式(投影片、團體討論、老師教學風格) 老師用投影片上課,基本上也 ... 作業都是實際訓練模型,輸入給定的訓練集去生成結果,上kaggle或是這 ... ... <看更多>
kaggle教學ptt 在 本文目標是讓沒寫過PyTorch 的讀者成為PyTorch 新手(?) 的推薦與評價
https://github.com/remorsecs/Kaggle-Plant-Seedlings-Classification-Example/blob/master/ ... 讀官方教學 ... https://discuss.pytorch.org/; Ptt DataScience 板. ... <看更多>
kaggle教學ptt 在 專題參考資料- MrBearTW/TCFST Wiki 的推薦與評價
Kaggle Instacart Market Basket Analysis ... PTT數據資料https://disp.cc/b/611-5MXy. 極度花俏https://bl.ocks.org/mbostock/1256572 ... sklearn簡體中文教學 ... ... <看更多>
kaggle教學ptt 在 Use-Scrapy-To-Crawl-PTT-Data from ChienChengLin - Github ... 的推薦與評價
PTT ,全名批踢踢實業坊,為台灣影響力數一數二的網路社群,擁有超過2萬個分類看板, ... 就顯得相當基本且重要,本教學目的為提供用Python Scrapy爬取PTT資料的方法。 ... <看更多>
kaggle教學ptt 在 Use-Scrapy-To-Crawl-PTT-Data from ChienChengLin - Github ... 的推薦與評價
PTT ,全名批踢踢實業坊,為台灣影響力數一數二的網路社群,擁有超過2萬個分類看板, ... 就顯得相當基本且重要,本教學目的為提供用Python Scrapy爬取PTT資料的方法。 ... <看更多>
kaggle教學ptt 在 5 資料讀取與匯出| 資料科學與R語言 - 曾意儒Yi-Ju Tseng 的推薦與評價
###Import Dataset功能(RStudio) RStudio 1.0版後即提供很好的資料匯入介面,使用者 ... 由於不是每個網站都提供API,但網頁上卻有你想要分析的資料(像是ptt推文! ... <看更多>
kaggle教學ptt 在 [評價] 108-2 陳縕儂深度學習之應用 - PTT Uncovered 的推薦與評價
... 方式(投影片、團體討論、老師教學風格) 投影片去年因為疫情的關係都改成線上每 ... 跑code測有沒有過baseline 沒有kaggle HW1:Summarization Extrative, seq2seq, ... ... <看更多>
kaggle教學ptt 在 #請益數據分析/資料科學家,作品集? - 軟體工程師板 | Dcard 的推薦與評價
雖然新鮮人沒經驗,但我覺得也可以根據以上思路去做,例如kaggle選一個你最認真的分析項目。 可以做幾頁PPT,第一頁:簡單描述一下背景、分析目標第二 ... ... <看更多>
kaggle教學ptt 在 Automatic speech recognition github. Wave2vec Recognize ... 的推薦與評價
The dataset currently consists of 11,192 validated hours in 76 languages, but we're always adding more voices and … Active and Unsupervised Learning for ... ... <看更多>
kaggle教學ptt 在 Python: Advanced Predictive Analytics: Gain practical ... 的推薦與評價
... Learning: ° http://www-bcf.usc.edu/~gareth/ISL/ISLR%20First%20 Printing.pdf • Analytics Vidhya blog: ° http://www.analyticsvidhya.com/ • Kaggle blog: ... ... <看更多>
kaggle教學ptt 在 [轉錄] [閒聊] 菜鳥上Kaggle: 房價預測- 看板DataScience 的推薦與評價
作者: pipidog (如果狗狗飛上天) 看板: Python
標題: Re: [閒聊] 菜鳥上Kaggle: 房價預測
時間: Wed Mar 7 04:33:23 2018
※ 引述《OnePiecePR (OPPR)》之銘言:
: 這裡有人玩 Kaggle 嗎?
: 其實我還沒認真坐坐下來學Python,也沒其他程式經驗。
: 只是朋友說Kaggle 很好玩,可以當作學 Python 的目標,建議每兩週作一題,我就挑戰
: 看看。
: 我做的是很久的題目,1460 筆房價資料,每筆資料79個特性。
: 訓練後,要估另外1459筆資料回傳讓網站系統估算成績。
: 我先花了四五天,整理資料(我以前 Excel 還可以),然後朋友丟一個 Lasso Regressi
: on給我,我馬上套用,算一個結果就上傳... 以為這樣就算完成一題。
: 結果被打搶,Error message 我沒看清楚。
: 那一版真的很差,預估值誤差 rmse 將近35000。
: 再花了一週時間,重新再整一次資料,邊研究別人的方法,大致加了兩招:XGB 跟 K fol
: d 誤差降低到15000 左右。我想大概是我的極限了。
: 過程中一直用的 bumpy,pandas,一下子 array, 一下子 dataframe, 花了不少時間處理
: ,應該乖乖坐下來搞懂才是。
一點想法:
1. 1460筆資料,卻有79的feature,似乎太多了.你聽過維度詛咒嗎? 建議先作特徵
選取,挑出最重要的20個feature(或者更少? 這你得試試看才知道)來作訓練:
*你說你選擇用Lasso Regression,不知是有目的的這樣作還是隨便挑的,因為Lasso
其實就是在loss裡面加入了L1懲罰,L1會導致線性擬合的時候很多參數被強迫變
成0.這意味著你也認為這79個feature裡面,其實只有幾個是真正重要的.如果是
這樣,何不一開始就先試著作特徵選取? (事實上有時候Lasso就是拿來做特徵選
取之用)
https://scikit-learn.org/stable/modules/feature_selection.html
2. 如果資料只有1千多筆,而網站又提供的另外的測試集了,建議訓練時就不要再分
測試跟訓練了. 你直接對全部的資料用corss-validation來判斷模型表現,找出
好的超參數後,就拿全部資料訓練模型就好.才一千多筆還分測試跟訓練,貴了一點.
https://scikit-learn.org/stable/modules/cross_validation.html
3. 你的數據可能非線性程度高,用Lasso自然不好,試試看SVM(支援向量機)?
一般如果是回歸問題,kernal多選用Radial basis function
https://scikit-learn.org/stable/modules/svm.html#regression
4. 沒有一個模型不能解決的事情,如果有,就給它一堆模型! 所以你可以考慮ensemble
learning,例如random forest, adaboost,..,etc.多數情況下會比用單一模型好.
https://scikit-learn.org/stable/modules/ensemble.html
5. 最後找個網站,把pandas練熟,這東西沒弄熟,洗資料會搞得你很痛苦.
https://ithelp.ithome.com.tw/users/20103511/ironman/1077?page=2
看一下14,15天.
* 最後,處理數據佔90%的時間,訓練模型只佔10%,這是很正常的...越髒的事情越花時間
,不要覺得奇怪.
--
★人生中最溫暖的夏天是在紐約的冬天★
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.66.168.95
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1520368414.A.CE9.html
※ 編輯: pipidog (73.66.168.95), 03/07/2018 04:51:15
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.8.6.231
※ 文章網址: https://www.ptt.cc/bbs/deeplearning/M.1520642760.A.2B2.html
... <看更多>
相關內容