💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
同時也有11部Youtube影片,追蹤數超過3萬的網紅孫在陽,也在其Youtube影片中提到,「孫在陽」直播-陽明交通大學-數據科學與雲端運算-Data cleaning 大數據分析中的數據清理,關乎於大數據分析成敗關鍵。轉置、樞紐、文字清理、數字清理、日期清理等,遺漏值、異常值、雜訊等數據清理。讓數據不是垃圾,就必需做好數據清理。 孫在陽老師主講,[email protected]...
性別比例計算 在 新思惟國際 Facebook 的精選貼文
💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
性別比例計算 在 Daydaycook Facebook 的最佳貼文
【識食和牛篇 Part 3 :等級|A級牛牛深度學🧐】
「A5 」已成為日本頂級和牛代名詞,事實上亦係評級牛肉靚與否的標準。係咪叫A5就代表最好🤔? 首先就要知道「A」同「5 」代表咩。 學識點解,同防偽logo,去買肉唔驚被人呃買A貨👩🏫。#唔係有霜降紋就叫A5架
✨等級[日文:格付] :由日本食肉格付協會統一嘅標準制定,分為兩部分,前英文,後數字。
🔠前英文為[步留等級]:分A、B及C三層級判定。指去除內臟與皮之後,一隻牛可取得食用肉比例多寡(精肉率)。A最多(72%以上),B中間(69%以上72%未滿),C最少(少於69%),以第6-第7肋間切開橫切面作量度。
🔢後數字為[肉質等級]:以脂肪交雜(B.M.S 12級指標)、肉嘅色澤(B.C.S 7級指標),脂肪色澤(B.F.S 7級指標),及肉質嚟評級,綜合上述指標計算得出1-5個級別,5為最高級🏆。
👩🏫各項中再有細指標分級,其中霜降度的「脂肪交雜B.M.S 指標」總共12級,更係大部分和牛標價基準📈,要達到B.M.S 8-12級先可以叫「A5 」嘅「5 」。
✨就連日本三大和牛都唔一定達到BMS 12 。所以BMS等級 12 嘅 A5 ,真係極品中嘅「極上品」🏆,和牛嘅天花板😎!
本集⋯⋯未完!學識埋點樣睇日本和牛防偽先💯!
📍日本食肉格付協會推出「和牛統一標誌」Q嘜,仲會有出品證書📜,附牛牛ID QR code 就可以查到出品農場、出生日期、品種、性別、等級等資料,而美、澳等其他地區和牛,唔會有依款Q嘜認證。#唔淨係買靴密士先要睇係咪A貨 #買日本靚和牛先認q嘜
✨我地日日煮推出全新燒肉套餐,係來自日本牛匠岩手縣靚和牛,同樣有Q嘜認證!送大家一份安心品質保證!準備好嚐鮮就嚟依到落單😏:https://bit.ly/3yalRtk
性別比例計算 在 孫在陽 Youtube 的最佳解答
「孫在陽」直播-陽明交通大學-數據科學與雲端運算-Data cleaning
大數據分析中的數據清理,關乎於大數據分析成敗關鍵。轉置、樞紐、文字清理、數字清理、日期清理等,遺漏值、異常值、雜訊等數據清理。讓數據不是垃圾,就必需做好數據清理。
孫在陽老師主講,[email protected]
範例、講義下載:https://goo.gl/ytzRxT
時間軸
00:00 簡介數據清理
07:40 轉置:樞紐其他資料行(unpivot)
09:30 大數據分析與統計分析的差別
13:35 AI是什麼
36:25 關聯
37:56 匯出轉置後的資料表
48:16 FHIR標準的數據設定
53:36 載入錯誤資料的說明
55:56 資料型態
01:00:00 視覺化的數據清理
01:03:27 錯誤取代為負極值
01:11:54 文字的數據清理-性別
01:44:40 數值的數據清理-年齡
02:06:24 數據清理規則
02:07:15 譯碼簿包含LOINC
02:07:56 Release Note
性別比例計算 在 孫在陽 Youtube 的最佳解答
面對日新月異的大數據工具,有時候很難跟上這節奏。Microsoft Power BI讓大家可以簡易的製作大數據分析。用 Excel Power BI 做大數據分析,課程大綱有認識大數據、大數據分析、視覺化呈現結果,提升管理品質,有效提升工作效率。另外;大數據分析還應該包含許多學習到的知識,回饋給資料,再重新計算,不是僅畫出視覺化圖後,就說做好了大數據分析。期待大家將了解應用這些工具使用,將大數據分析導入您的工作中。
孫在陽老師主講,[email protected] 範例、講義下載:https://goo.gl/ytzRxT
01. 認識大數據
02. 認識Power BI大數據分析工具、分析.環境介紹
03. 取得Excel資料
04. 如何分析、數據分析
05. 自動分析
06.連續型分析
07.淡旺季分析
08.連動分析
09.同期比較.交叉分析分析
10.自動分群 機器學習.顧客關係分析
11.動態行為模式分析
12.關鍵影響因素分析.地理分析.堆疊圖佔比例分析
13.重新整理.真實的利潤快速計算.關連
14.大數據找到趨勢的策略
15.登革熱開放資料的大數據分析
16.縣市登革熱統計.編輯查詢.資料清理
17.資料清理的統一大小寫台.向下探索.樹狀圖分析
18.使用發生率做公平比較.新增量值.新增資料行
19.登革熱病源分析,登革熱病患性別分析,年齡別分析,
20.地理分析,趨勢預測,
21.資籵取得網址,自動更新,開放資料應用,
22.全國用電連續分析
23.各縣市用電統計,各行政區用電統計, 用電量逐年增加,
24.六都用電腦趨勢分析
25.重新整理,新增資料放在指定資料夾中,自動更新,
26.空氣品質的大數據分析
性別比例計算 在 孫在陽 Youtube 的最佳貼文
面對日新月異的大數據工具,有時候很難跟上這節奏。Microsoft Power BI讓大家可以簡易的製作大數據分析。用 Excel Power BI 做大數據分析,課程大綱有認識大數據、大數據分析、視覺化呈現結果,提升管理品質,有效提升工作效率。另外;大數據分析還應該包含許多學習到的知識,回饋給資料,再重新計算,不是僅畫出視覺化圖後,就說做好了大數據分析。期待大家將了解應用這些工具使用,將大數據分析導入您的工作中。
孫在陽老師主講,[email protected] 範例、講義下載:https://goo.gl/ytzRxT
01. 認識大數據
02. 認識Power BI大數據分析工具、分析.環境介紹
03. 取得Excel資料
04. 如何分析、數據分析
05. 自動分析
06.連續型分析
07.淡旺季分析
08.連動分析
09.同期比較.交叉分析分析
10.自動分群 機器學習.顧客關係分析
11.動態行為模式分析
12.關鍵影響因素分析.地理分析.堆疊圖佔比例分析
13.重新整理.真實的利潤快速計算.關連
14.大數據找到趨勢的策略
15.登革熱開放資料的大數據分析
16.縣市登革熱統計.編輯查詢.資料清理
17.資料清理的統一大小寫台.向下探索.樹狀圖分析
18.使用發生率做公平比較.新增量值.新增資料行
19.登革熱病源分析,登革熱病患性別分析,年齡別分析,
20.地理分析,趨勢預測,
21.資籵取得網址,自動更新,開放資料應用,
22.全國用電連續分析
23.各縣市用電統計,各行政區用電統計, 用電量逐年增加,
24.六都用電腦趨勢分析
25.重新整理,新增資料放在指定資料夾中,自動更新,
性別比例計算 在 人口結構其他分析 的相關結果
公式: (老年人口數+ 幼年人口數)÷壯年人口數x 100%。 · 定義: 將女性的人口數當做100,指每100位女性所相 對的男性人數. 公式: · 特性: 性別比>100:表示代表男>女。 ... <看更多>
性別比例計算 在 人類性別比- 維基百科,自由的百科全書 的相關結果
國家/地區 新生兒(CIA估計) 15歲以下 15–64 65歲以上 總計 新生兒(WDB估計)
世界 1.07 1.07 0.99 0.80 1.01 1.07
阿富汗 1.05 1.03 1.04 0.86 1.03 1.07
阿爾巴尼亞 1.118 1.1 1.05 0.87 1.04 1.07 ... <看更多>
性別比例計算 在 性別比- 翰林雲端學院 的相關結果
性別比 =男性人口數/女性人口數X 100。 >100表男多,<100表女多。 ... <看更多>