昨天和量化交易的朋友檢討,記錄一下。
我們做了很多海外期貨的策略,回測10多年下來,看似有效因子的有很多,基本面、籌碼面、總經面、情緒面…等好幾大類,每一類裡面有好幾個大大小小的因子,所以光是一個金融商品,影響我們買賣的因素就有上百個。
問題來了,看似過去10多年能打敗大盤的這些因子,未來是否還能繼續有效?還是我們只是自我感覺良好的overfitting 而已?例如我們只要想辦法在過去10多年的股市大跌躲過那關鍵的幾次崩跌,例如2008、2011、2015、2018、2020,那就能做出一條很好看的績效曲線,但「先看答案再找解法」,會不會未來的崩跌是完全不同的原因?很多量化基金都是因為過去測起來sharp看起來很好而開了槓桿,然後實戰起來發生了某次黑天鵝而爆掉。
那怎麼辦呢?讓測的時間拉更長?但拿30年、50年前的狀況測,跟現在的背景不會差太多嗎?還有參考性嗎?
我目前傾向不是拉長回測期間,而是先把自己當做塔雷伯這種疑神疑鬼的技能點滿。
把看似有效的策略進行各種嚴刑拷打,用各種不同架構來檢驗,如果有疑慮就不用,想不通為什麼這樣能賺那麼多錢就不用,如果測完發現超好賺,通常不是挖到寶,而是哪裡出錯了…
另外,最近常有朋友問我那些短線神人怎麼做的,其實他們和做量化的人的思考方式蠻不一樣的,因為台股很多潛在交易機會,常常是因為某些事件或規則,產生了一些規律,這些規率出現的時間沒有很久,然後又會隨著競爭變多慢慢變得難賺,所以變成這些神人的做法是一發現某招好像不錯用就比較敢大膽的用,做得愈順就玩愈大,一直到開始不順就愈做愈小,然後再找尋其他機會。
這是另一種不錯的思維,雖然對於那種學院派或很講究科學的人來說,會覺得這樣統計樣本不足就直接用很不嚴謹。但這些神人哪管那麼多,一波行情就一次賺了好幾億,反正只要一不順馬上停就好,繼續找下一個的台股新規律,或者等待舊規律恢復。
總之,跟我這次訪談Mike裡面講的一樣,每次市場有新規則改變,就會有一群掌握到新規律的投資者,成了爆賺贏家,而沒有與時俱進的人被淘汰,敏銳的觀察變化,即時調整,是一個優秀的交易者必須付出的努力。
明年操盤室會招募新夥伴/徒弟/實習生,一起研究新策略,不斷搜集大大小小的招式,汰舊換新(我猜很像文藝復興基金他們在做的事?不過我們身處的市場,應該比他們遇到的競爭少很多)。
歡迎對交易有熱情的年輕朋友來試試,這裡的大神還蠻認真教的,也有提供完整資料庫。(有點像教授在帶研究生那樣,一步步完成論文的感覺~)
同時也有2部Youtube影片,追蹤數超過3萬的網紅孫在陽,也在其Youtube影片中提到,「孫在陽」直播-數據科學與雲遄運算1.using the data 「孫在陽」直播-數據科學與雲遄運算2.Data cleaning up 大數據分析-統計分析從資料取得,資料清理到視覺化分析。如何做大數據分析? 孫在陽老師主講,[email protected] 範例、講義下載:h...
統計樣本 在 信傳媒 Facebook 的最佳解答
欸…原來統計樣本不是愈多愈好?來看看你有沒有踩到誤讀數據的深水區🧐
#大數據
⭐快加入【信傳媒財神到】社團一起財富自由:https://is.gd/pMrY87
⭐掌握更多訊息,快加入信傳媒Telegram:
https://is.gd/a5lUNM
⭐好玩有趣的新聞分享,歡迎加入信傳媒IG:https://tinyurl.com/y6oqqqbh
統計樣本 在 朱成志的華山論劍 Facebook 的最讚貼文
我對疫苗政策的看法(朱敬一院士)
我是經濟學教授,不是疫苗專家,但是做過科技政委、國科會主委,督導過行政院生技產業發展計劃,有一些背景知識。基於「將官不分兵科」的原理,想要對最近的疫苗審查紛爭,做一些科普級的解說,也提出一些「疫苗產業」的政策意見。我以下分點陳述。
1)疫苗從研發到推出,需要做三期臨床試驗,第一期看初步身體反應,第二期尋找有效激發抗體的劑量。所以二期做完,即使樣本不很大,就可以知道某種疫苗究竟能不能有效產生抗體。
2)既然知道疫苗能否產生抗體,那麼為什麼還要做第三期試驗呢?疫苗的作用,是訓練身體面對病毒時的作戰能力,我們身體對抗病毒作戰的士兵,叫做「抗體」。成功訓練作戰士兵,不表示他們能夠克敵(病毒)致勝。臨床三期的作用,是檢驗疫苗的致勝有效性,以及我們身體對病毒戰鬥所可能付出的成本。
3)為什麼有抗體未必表示能成功克敵呢?什麼又是戰鬥成本呢?大概有三個面向要考慮。a) 產生抗體的同時,也可能引發若干嚴重的副作用,例如血栓,像是七傷拳,出拳傷敵也傷到自己;b) 抗體士兵是有了,但是因為某些原因,卻打不過病毒;c) 抗體雖然能夠打敗病毒,卻是「慘勝」,造成身體其他傷害。這些都是「疫苗本身風險」成本,都需要臨床三期試驗,讓士兵有機會真實作戰,才能確認疫苗的風險成本與有效性。
4)為什麼歐美藥廠疫苗臨床三期沒做完,就會發緊急藥證 EUA 准予施打呢?這是一個管制科學的統計問題與取捨問題。正常的三期試驗,也許要求幾個月之後的某種統計數據。但是如果傳染病嚴重,那麼拖越久核准疫苗,傳染病造成的傷亡就越大。提前核准施打,就是在「疫苗本身風險」與「傳染病蔓延死傷風險」之間,做妥協。EUA 可以依新數據,不斷滾動修正。
5)另一種可能的提前核准,是在臨床三期發現,疫苗對某些族群子樣本副作用較小,於是可針對子樣本族群先核准施打。這也是依統計樣本結果,而做彈性修正。
6)無論如何,緊急核准都不是正式核准,臨床三期還是在繼續進行,都要依據三期臨床的數據修正。如果發現「疫苗本身風險」頗為可觀,也可以取消核准。
7)總統可以事先宣布什麼時候施打國產疫苗嗎?在民主國家答案很簡單,不應該。如前所述,核准疫苗的決定,必須依據「疫苗本身風險」與「傳染病死傷風險」的評估。這是管制科學的判斷,不是政治判斷。在科學結論出來之前先說政治結論,這就會給審查委員不當壓力。
8)國外情況呢?美國前總統川普,曾經希望美國FDA能在大選投票前核准疫苗,但遭到紐約時報、美國國家科學院等的強烈批評。最後,美國FDA沒有妥協。這些報導谷歌唾手可得,我不引用連結了。
9)陳培哲院士的主張是什麼呢?我的了解是:他認為臨床三期一定要做,不可以以二期擴大樣本取代三期。他日前的聲明,也建議從某些特定群體先做臨床三期。至於這些臨床三期的樣本其統計檢定要如何修正,以平衡「疫苗本身風險」與「傳染病死傷風險」,這可以由委員會討論。
10)對陳培哲的攻擊有道理嗎?如果部分台灣人民因為某位科學家的意見不為自己所喜,或是與自己偏愛政黨的政策相左,就抹黑、抹紅、肉搜、辱罵、胡亂批評,這樣的行為,與中國網民因為台灣藝人的隻字片語而胡亂圍勦、杯葛,有差別嗎?我們痛恨對岸的網路霸凌,是不是也該檢討自己的水準?台灣要深化民主,就要擺脫這種低級的網路霸凌文化。
11)媒體或媒體人帶頭攻擊,有道理嗎?當然沒有道理。台灣若干媒體與媒體人的水準,真的是「一口濃痰不足以描述」。有人說,台灣最美的風景是「人」。我覺得,台灣最醜的風景,也是「某些人」。
12)台灣需要多少疫苗?如果台灣預計施打劑數是 3000 萬劑,則也許我們應該購買 3500 萬劑,依疫苗效力指標決定施打次序,最後沒有用到的 500 萬劑,可以銷毀可以贈送。這筆預算不大,是國家可以支應的。無論如何,生命健康權最大,疫苗絕對沒有「愛用國貨」的優先性。
13)那麼疫苗採購該不該有「扶持本土疫苗產業」的考量呢?可以有,但是做法要細膩。a) 我認為政府可以採購取得 EUA 的國產疫苗,但是每劑的單價,可以設下級距,要與該疫苗的效力指標掛勾,至少保證廠商回本,效力越好單價越高,這樣藥廠的努力誘因才會增加。b) 如果國產疫苗需要國家政策的配合,則國家可以要求某種類似「政策技術股」的回饋。如果國家疫苗政策成功,該疫苗股票價格大漲,則國庫也受惠,不是單純地圖利廠商。
14)疫苗紛爭要怎麼收場?三點:1)蔡總統應該要修正她原先的談話,公開宣示她對科學專業審查的絕對尊重。2)在專業受到尊重的前提下,陳培哲院士可以回到審查委員會,說服委員會臨床三期的變通做法。3)孕育本土疫苗產業,要有足夠的經濟專業概念,採購契約內容要經得起民主社會的檢驗。
統計樣本 在 孫在陽 Youtube 的最佳解答
「孫在陽」直播-數據科學與雲遄運算1.using the data
「孫在陽」直播-數據科學與雲遄運算2.Data cleaning up
大數據分析-統計分析從資料取得,資料清理到視覺化分析。如何做大數據分析?
孫在陽老師主講,[email protected]
範例、講義下載:https://goo.gl/ytzRxT
時間軸
00:00 簡介
03:40 數據科學
09:30 大數據分析與統計分析的差別
13:35 AI是什麼
14:52 圖靈測試 Turing test
17:35 機器學習
20:47 建模
21:58 用線性迴歸做預測
26:46 用羅吉斯迴歸做分類
28:54 其他機器學習
31:28 研究目的
33:21 數據來源的差別
42:58 取得 Azure API for FHIR 數據
01:10:00 資料清理
01:19:48 如何展開資料
01:37:40 描述性統計:樣本個數
統計樣本 在 范琪斐 Youtube 的精選貼文
今年過年很不一樣,這個農曆新年我是吃年夜飯配肺炎新聞,而不是賀歲節目。今年的新年歌曲恐怕也要改成:每條大街小巷,每個人的嘴裡,見面第一句話,就是「口罩買到沒?」
這場疫情實在讓大家都很不好過,網路上謠言不斷、真假消息難辨,今天就要帶大家來瞭解一下,我們要對付的敵人究竟是什麼來頭。
我們先來正名一下,目前世界衛生組織WHO,暫時把病毒稱作「2019 novel coR0navirus」,簡稱2019-nCoV,中文翻譯是「2019新型冠狀病毒」。 去年12月疫情爆發初期,中共衛生當局直接把矛頭指向「武漢華南海鮮市場」,還二話不說下令關門清洗,之後更堅稱沒有人傳人的證據,但權威醫學期刊《The Lancet》卻打臉說,去年12月1日發病的第一個肺炎患者,明明就沒有華南海鮮市場接觸史,而且一整個月下來,41名患者中,有三分之一都跟市場無關。
既然沒有「人傳人」,那沒去過市場的人,到底是從哪裡感染病毒的?北京當局給不出答案,再加上態度遮遮掩掩,這使得網路上傳言四起,有的甚至說中共其實正在秘密研發「生物武器」,病毒就來自武漢一間國家級的P4實驗室!
各種「腦補」繪聲繪影超精彩,但我們還是得用科學的角度來探討源頭。其實早在2002年SARS爆發後,中國科學院武漢病毒研究所專家「石正麗」,就帶著團隊到中國各地採集蝙蝠樣本,試圖找出SARS的病毒源頭,十多年來總共發現500款過去從未發現過的冠狀病毒,還在2018年公布了研究結果。
而這次的疫情爆發後,「石正麗」團隊就火速發表了最新論文,內容提到他們當年在雲南發現一種「中菊頭蝠」,從這種蝙蝠身上採集到的冠狀病毒「RaTG13」,和武漢肺炎冠狀病毒的序列,相似度高達96.2%,幾乎可以說兩種病毒是兄弟。
雖然目前無法證實,武漢肺炎病毒直接來自雲南,也無法得知,別的地方還有沒有更相近的病毒株,但專家根據現有證據推斷,很有可能是這種蝙蝠,把病毒傳染給中間宿主,然後中間宿主再把病毒傳染給人類,傳播模式就跟SARS大同小異。
不過大家有沒有發現,最近幾年來世界各地的新型傳染病,幾乎都跟動物脫不了關係。SARS病毒可能來自蝙蝠,H7N9禽流感來自禽鳥類,伊波拉來自猿猴,MERS疑似來自駱駝,全部都是人畜共通傳染病。
這些原本跟人類完全無交集的病毒,到底是怎麼跳到我們身上的?原因不外乎是吃「野味」,以及我們對野生動物棲息地的破壞。《下一場人類大瘟疫》的作者David Quammen幾天前就投書紐約時報說,病毒原本可能好端端的在蝙蝠洞裡,是人類活動把它釋放出來,今天爆發這樣的傳染病,恐怕是我們「自找的」。
接下來我們現在再來看看這個病毒的傳播力有多強。我們現在已經知道,武漢肺炎冠狀病毒是藉由飛沫傳染,美國疾病管制與預防中心CDC指出,傳播距離大約在6英呎,也就是1.8公尺內,比起麻疹、水痘病毒可以飛30公尺遠好得多。
再來我們要搞懂病毒的「基本再生數R0」,簡單來說就是一個病患平均可以感染多少人。如果能藉由醫療措施把R0降到1以下,就代表一個病人能再感染不到一個人,這個疾病也就能被撲滅了。
不過統計樣本和傳染模型的不同,會大幅影響R0的估算結果。目前WHO的數據最為保守,介於1.4到2.5之間,而倫敦帝國理工學院則估計2.6。光看數字好像有點不痛不癢,我們實際拿R0 2.6來算算看,如果5名武漢肺炎患者,每人能感染2.6人的話,在5個感染週期後,就會有368個人生病。拿季節性流感相比,平均一個病人會傳染給1.3個人,同樣以5名病患、5個感染週期來算,最後只會有45人生病。R0只差1.3個百分點,最後結果卻是差了8倍。 這樣一比就「很有感」了吧?也難怪先前四名英美專家公布論文,說武漢肺炎R0高達3.6到4.0時,就嚇壞不少人。
儘管各國專家估算的R0不一樣,但怎麼看都覺得中共當局公布的確診案例數據好像…「太客氣」了,目前綜合各國專家發表的研究結果,實際感染人數恐怕上看10萬人,甚至更多。
美國「國家過敏與傳染病研究院」主任佛契就警告說,武漢肺炎病毒傳染性非常非常高,幾乎可以確定將成為大流行。還有許多專家不約而同提到,這波疫情令人聯想1918年的「西班牙流感」,當時爆發全球性H1N1甲型流感大流行,導致全世界5億人感染,至少5000萬人死亡,連當時的台灣也有4萬多人喪命。
大家可能會想,預防重於治療,現代醫學這麼發達,疫苗應該很快就能上市了吧?恐怕沒那麼樂觀,問題出在:第一速度,人體試驗的速度,第二還是速度,病毒變化的速度。
北京當局1月10日公布新型冠狀病毒的遺傳密碼後,各國醫藥專家爭相投入了這場疫苗競賽。美國國家衛生研究院就聯手生技公司Moderna聯手開發疫苗,預計三個月後,就能進行第一階段試驗。中國首富馬雲,也大手筆捐贈1億元人民幣,相當4.4億台幣,用於疫苗研發。香港大學微生物學系正在研究,可以同時預防武漢肺炎和流感的「鼻噴式疫苗」。
美國醫療保健產品大廠嬌生,也加入戰局,預計8到12個月內進行人體試驗。美國加州聖地牙哥Inovio實驗室更宣布,他們只花了短短3個小時,就設計出一款叫做「INO-4800」的疫苗,預計初夏以前就會進行人體試驗。
想當初2003年SARS爆發後,研究人員花了20個月的時間,才研製出可用於人體試驗的疫苗,到2015年茲卡病毒蔓延時,專家們已經將疫苗研發時間縮短至6個月,現在竟然只要3小時!“愛的迫降”我只看三集他就研發出來了,好犀利呀!不過別以為研發成功就沒事了,難是難在後面一系列的安全測試,無論怎麼壓縮時間,疫苗都必須經過動物測試,再經過人體試驗,整套流程差不多要一年時間。
再來就是,醫藥科技快,病毒變化更快!冠狀病毒是一種「核醣核酸RNA」病毒,偏偏RNA變異的速度很快,一旦變異個幾代,原先針對某種特定病毒所設計的疫苗,可能就完全失去效果了。加上冠狀病毒疫情往往來去一陣風,殺個你措手不及然後就銷聲匿跡,例如當年的SARS。
大家要知道研發一款疫苗,都是幾千萬、幾億在燒欸,這就很像大手筆製造了最新型的飛彈坦克,但等武器做好,敵人根本已經換了一批,或是早就消失了,還打什麼仗?
所以啊,現在不管研發疫苗或解藥,都是「遠水救不了近火」,我們只能勤快洗手,盡量避免前往疫區,保持距離以策安全。
--------------------------------------
《#范琪斐ㄉ寰宇漫遊》每週四晚間十點在 #寰宇新聞台 播出,沒跟上的也沒關係,歡迎訂閱我們的 YouTube 頻道 🔔#范琪斐ㄉ寰宇漫遊 🔔https://reurl.cc/ZvKM3 1030pm準時上傳完整版!