大數據分析與聲量和輿情分析-02.文字雲.資料表關聯.Join.比率分析
大數據分析其實早就存在,只是因為數據越來越大,需要更好的計算方法、更快的設備、更強的呈現結果方式,形成另一種視覺化分析。探索數據的行為模式,視覺化呈現結果,讓我們進一步分析並擬訂可能行為。
聲量與輿情,如何瞭解民之所欲?本課程是以PTT最近對警察的發言,做為資料分析依據,所以還要學習如何用Python爬蟲程式抓PTT資料。
01.認識大數據分析、連續性分析
02.連續性分析.同期比較.散佈圖
03.類別分析.散佈分析.動態分析.占比例分析.連動分析
04.04.資料整理.DAX函式.新資量值.新增資料行
05.DAX函數.重新整理.取得資料來自資料夾
06.重新整理.多檔整合分析
07.爬蟲程式

python數據分析ptt 在 [請益] 轉行做資料數據分析- 看板Soft_Job 的推薦與評價
板上各位高手好,小弟有些問題想請教,還請大家給些經驗與建議,謝謝。
先介紹我的背景好了:
目前在台北研替當中,一年後退伍。學歷是113機械、112應力碩。
論文方向是使用matlab做風速資料分析,
並參考模擬軟體演算法自己寫出程式執行,在與實際資料做比對。
畢業後先到GG輪班,後來轉調至現在公司,待退伍中。
現在工作:
當初面試進來時,公司當時需要有人從事分析風能數據的人才
這剛好與我的碩論有高度相關,因此順利進來
但任職到現在一年多,發現其實我真正在做分析數據的業務幾乎微乎其微
基本上,這間公司目前及未來的主要業務與我的背景不太相關
再加上薪資待遇很普通,所以有退伍即離職的想法。
目前我最會的應該就是python,當初用python有做一些分析風能資料
我發現我對於raw data的整理與分析,最後視覺化產生圖表,這樣的過程有高度的興趣
進而想去接觸機器學習等更多的理論
自己平常有上網看python教學,基本的套件與資料分析相關的模組都會操作
也有去台大資訊訓練班上了兩期python資料分析相關課程
現在正在coursera看林軒田老師的ML課程,自己練習寫演算法(例如PLA)
偶爾上網找書自己讀這樣。
但...總的來說,我沒有數統的背景,也沒有資訊的背景
我想我的優勢在於過去的學歷,我有自學能力,以及目前我會的「工學院的數學」
其實板上相關文章我大致都有看過
不管是針對資料分析的人才需求,或是跨行需要承擔的風險我也有考慮
也有在想是否去補習再去補一個數據科學的學歷。
希望有過來人或高手,就我的學歷背景經驗來給我建議
是繼續這樣進修自學,還是直接補習去補學歷,還是直接放棄資料分析這條路?
謝謝~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.163.2.172
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1504598887.A.80E.html
放棄GG原因有很多,除了兼顧生活品質外,我認為受過前四大教育的我
畢業就去輪班實在可惜,雖然錢多,但這其中的know how僅限在tsmc
除了錢多,其他因素對長久職涯發展沒有益處。
機器學習的討論串很多,我也有看,但結論似乎皆導向:
「台灣玩不起來」「要馬就去國外」「沒學歷都是屁」...
其實我承認自己能力沒多好,但依然想知道這領域自己可以涉略多少~
好的,我會去kaggle嘗試看看。
另外femlro,我並沒有瞧不起GG,他畢竟算是個很成功的企業。
離開GG只是個人選擇,我也有說明雖然錢多,但其他因素不符合我的期待
坦白說,也只是想知道自己除了被綁在無塵室外,還有多少能耐
因為實在有太多案例,都是「進不去的想進去,進去了想出來卻被現實綁住」
f496328mm:我也是最近在知道GG有資料分析的相關部門
但這一切也是在我離開設備才有機會進修資料分析
beaprayguy原來是GG前輩呀!我想只有GG人才懂其中的感受XD
一起加油~
鄉民不是說有前四大還去資策會,代表自學能力有問題= =
我是因為也沒有太多錢可以去資策會,然後因為網路上資源很多可以學習,就暫且先自學
。
離開GG不能大賺一筆沒錯,但相反地,我也就無法有更多心力去學新東西,待在GG只是讓
自己等領下一季分紅的時間。倒也不見得要走純軟,有看到不少公司在主打工業4.0,不
知是否可以應用到這專業?
所以要再追求這領域的學歷,出國是唯一解? 台灣的沒什麼用是嗎?
我不是本科出身的,要進Appier應該不可能吧@@
我覺得你說的很有道理
儘管花兩年時間補足這領域的專業,不見得能在台灣找到滿意的工作
恩我也想跟強者學習,你有認識的想介紹嗎XD
在我待過GG12廠那段時間,其實5年要從32升上31職等,真的沒那麼簡單
當時我同事甚至有做了12年才31(新人32),有些同事學歷不差,但老闆機歪
真的做了3~5年了,還在原地打轉,只為求每季獎金,礙於現實考量離不開GG
這些學長也很建議我想走趕快走,只能說內部黑暗現實面,只有待過的人才懂
我也希望我能有機會選對領域,但目前資料科學在台灣好像有如大家所述那樣不樂觀
了解。
真的! 錢很重要沒錯,但不是唯一,無恥一點未來很缺的時候再去輪班也行(誤
打好cs基礎,是再精進數學呢? 還是去接觸實務的coding
我是完全沒學過統計,是不是可以先著重在條件機率即可?
如果有錢,我會考慮的!
哈 如果我有能力的話不排斥看看阿XD
英文也是可以再花時間去K起來啦,但我目前想說先把專業知識補起來
其實...我真的只是覺得四大機械背景就直接去輪班,讓我很嘔
所以想再多學東西去不同領域看看
我也是離開GG了才知道有ML部門,但若我當初沒離開GG,應該也不可能可以調部門吧
其實我就是擔心我不是本科的,要找到工作真的很難,所以就先自學再說
可我自己知道,自學根本不能跟人家4年CS畢業的競爭
我是不清楚104上的資料科學的職缺如何
"補習補數據科學的學歷",這是指說去補資工的課,然後去考個台大數據科學所這樣
恩真的是普遍低薪~
原來這些工具已不值錢了,我還以為會使用的人不多
只能說每個人的選擇不同
就是要在這之中去找尋平衡囉
其實我真的有想過這問題,畢竟學歷證書在業界是很重要的入場券
管他實務經驗充分與否,先騙進去再說
就像我自己應力碩畢業,我也不覺得自己哪邊厲害 = =
我明白你說的這道理,我是會持續學習現有的工具,同時在補背景知識的不足
那XJY13大,您有去GG嗎?
站內信跟您請教問題~
我清楚知道自己的本事在哪,更了解高手那麼多,我會的大家一定都會
但我不確定104上面的缺是不是都很不值得,因為坦白說現在的我連能去哪都不知道
只能先繼續充實自己,直到停損點發生吧
謝謝pieya給的建議,coursera上確實有資料科學相關的學位
「找個領域先提升自己」
是不是其實就是先從資料黑手起家,待獨當一面後再去選擇更好的?
微積分線代沒什麼問題,大概就需要去補條件機率的部分吧
當然我知道比賽的層級不能跟修課來做比較
問個問題,如果未來我準備好有能力的話
我都從GG設備離開了,還有機會再進GG的ML team嗎XD?
※ 編輯: agiwar (118.163.2.82), 09/07/2017 11:28:46
... <看更多>
相關內容