四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
同時也有2部Youtube影片,追蹤數超過14萬的網紅品味壹番 A Matter of Taste,也在其Youtube影片中提到,日本威士忌 怎麼變夯的?【林一峰Whisky School威士忌第28課】 近幾年日本威士忌身價水漲船高,在全世界都供不應求,許多酒款甚至停產不供貨;在「物以稀為貴」之下,一瓶「余市12年」的價格,可以飆到美金250元(約合台幣7600元),超越許多高年份威士忌。 日本威士忌,究竟是怎麼變夯的? ...
蒸餾 例子 在 工頭堅。旅行長 Facebook 的最佳貼文
#線上旅行團 #南法普羅旺斯山居歲月之旅
昨天忘了說,當我們來到薰衣草田的這天,行程已經進入第四個省份:
濱海阿爾卑斯省 >> 瓦爾省 >>> 隆河河口省 >>> 上普羅旺斯阿爾卑斯省(Alpes-de-Haute-Provence)
到瓦朗索爾(Valensole),除了薰衣草(還有向日葵)盡情拍照以外,意外更令團員夥伴們興奮的,就是採買相關製品。
對當地農人而言,薰衣草是經濟作物,絕不單單只有觀賞價值(事實上,觀光僅是附加價值),還要將它們做成各類產品,才是本意。若要舉個例子來類比,則台灣花東海岸的金針花海,也有類似意義。
所以在花田旁邊,往往會直接開設蒸餾廠(製作精油),而更有商業嗅覺的農家,乾脆就直接開起了商店,自產自銷。在這裡,可以用產地價格,直接買到各類製品,一大塊薰衣草精油香皂,早期去的時候還不到兩歐元(現在可能漲價),團員們都瘋狂買起來,往往是十幾二十個的包起來。
回去的行李箱,滿滿都是南法的味道。
其實以前這個地方,真是我們的私密景點,都不想把座標和地點寫出來。但前幾年開始,已經「走漏風聲」,特別是對岸去的自駕客爆增(甚至還在停車場直接賣起方便麵),店家也不放過做生意的機會,所以價位就不像早年那般親民了。
當然,薰衣草的產地不僅限於此地,而且根據地理環境不同,花色最鮮艷的時期也有差異。下一站,我會繼續帶大家前往「薰衣草之路」上的另一個產區。
蒸餾 例子 在 Facebook 的最佳貼文
CASO酒櫃目前有【T大粉絲專屬 限時折扣優惠】
於網站下單時輸入促銷代碼:caso&t
享有85折優惠,限時限量只有10組,手腳要快喔~
.
---------------------
.
近年來飲用葡萄酒在台灣已經蔚為風行,大家也逐漸脫離了早年的錯誤想法,了解葡萄酒其實並不適合拿來泡洋蔥或加冰塊飲用,不過對於如何保存一瓶葡萄酒,大多數人還是一知半解。事實上,葡萄酒是一種以葡萄為原料、經過天然發酵釀製而成的水果酒,並沒有經過高溫蒸餾的程序,也因此有人稱葡萄酒是「活的」飲品。
至於一般蒸餾而成的烈酒,只要離開了木桶裝入玻璃瓶中,它的變化就會極其緩慢,也不太需要在低溫環境保存;然而葡萄酒卻是大不相同,尤其是大部分價位稍高的好酒,它從裝瓶之後,仍然會在瓶中隨著時間而發展,而且會越陳越香、越老越貴;而葡萄酒的陳年過程中,對環境也極其敏感,其中最重要的因素,就是溫度。
高檔紅酒最適合的保存溫度,大約為攝氏14~16度,而台灣的夏季,動輒氣溫高達30度以上,並且會長達3個月以上;葡萄酒如果放在室溫經歷了這段過程,喝起來的口感絕對會變得跟以前不太一樣;或許偶爾有些紅酒歷經了不良的高溫環境,反而提前催熟,變得比較圓潤可口,這種例子不是沒有,但是絕大多數的紅酒不會這麼好運,熱過的酒通常會變得口感粗糙,而且帶有醬油鹹菜或爛熟水果的不佳風味,白白糟蹋了一瓶佳釀。這也是為什麼我常常開玩笑地跟酒友們說:「小學生放暑假很高興,但千萬不可以讓葡萄酒放暑假!」
葡萄酒除了需要較低溫且恆溫的環境之外,氧氣更是葡萄酒最大的殺手。葡萄酒若放在濕度不夠的地方,時間久了軟木塞會變得乾燥而萎縮,造成密封程度不佳,空氣容易進入瓶中,使得葡萄酒氧化變成醋酸。
各位只要謹記,會讓葡萄酒變質的主因,一個是環境處於高溫、另一個就是酒液接觸氧氣,要避免以上二種狀況,溫度、濕度這二個因素,是妥善葡萄酒保存的不二法門。
目前市面上有販售專門存放葡萄酒的恆溫酒櫃,外型就像個冰箱,但除了低溫恆溫之外,還能提供葡萄酒所需的高濕度環境,並且依消費者的需求而有不同的尺寸與價格,是葡萄酒最好的居家。尤其在地處亞熱帶的台灣,夏天一年比一年熱,對於葡萄酒愛好者而言,恆溫紅酒櫃實在是個不可缺少的配備。如果平常家中存放的葡萄酒數量較少,放在家用冰箱中也並非不可,只是畢竟冰箱內溫度變化的幅度較大,而且蔬果食物需求的溫度也較低,更嚴重的是會有造成軟木塞乾燥脫水的現象,葡萄酒短期暫放冰箱幾個星期不是問題,但若要長時間存放,還是以專業的恆溫紅酒櫃為宜。
我個人接觸葡萄酒30年,家中一直都有一台葡萄酒櫃,最近我需要增添一台酒櫃,因此接觸了CASO這個德國品牌的壓縮機酒櫃。
我讀了許多酒櫃的規格說明比較,並實際測試一些功能之後,我覺得CASO壓縮機酒櫃相當不錯;它有上下雙層的雙溫控設計,上層我設定為攝氏12度用來存放白酒,下層設定為15度用來存放紅酒,這樣酒一拿出來就剛好是最適飲的溫度,完全不會有白酒不夠冰、紅酒卻太冰的困擾。
此外,CASO酒櫃的雙層抗UV玻璃門,不僅具有抗紫外線的功能性,而且因為是玻璃的,裡面的溫度顯示一目了然,整體的視覺也非常賞心悅目,跟家中的裝潢完全無違和感;甚至,它本身就是整體裝潢造型美感的一部分了。
整個開門關門的手感非常順暢,幾乎沒有什麼振動與噪音,這個德國品牌的酒櫃,果然具有日耳曼民族的精準設計與嚴格品管,完全符合我對於德國品牌家電的好印象。更重要的是,它的價格相當實惠,我覺得特別適合小坪數的居家環境。
CASO德國品牌的壓縮機酒櫃,總代理是台灣的至鴻公司,這家老字號的台灣傳產公司從事冷凍技術相關事業已經50年了,老師傅傳承的專業經驗也相對更值得信賴,所以售後服務也是一項加分的優點。
我除了對於CASO酒櫃的造型美感與實際功能十分滿意之外,我還發現CASO這個德國品牌在歐美還有一些微波爐、烤麵包機、咖啡機等家電產品,口碑都不錯,造型也極有質感,希望未來也會引進台灣。
詳細資訊請參照 CASO Design Taiwan
網址:https://lihi1.com/Y8LCt
.
目前有【T大粉絲專屬 限時折扣優惠】
於網站下單時輸入促銷代碼:caso&t
享有85折優惠,限時限量只有10組,手腳要快喔~
.
蒸餾 例子 在 品味壹番 A Matter of Taste Youtube 的精選貼文
日本威士忌 怎麼變夯的?【林一峰Whisky School威士忌第28課】
近幾年日本威士忌身價水漲船高,在全世界都供不應求,許多酒款甚至停產不供貨;在「物以稀為貴」之下,一瓶「余市12年」的價格,可以飆到美金250元(約合台幣7600元),超越許多高年份威士忌。
日本威士忌,究竟是怎麼變夯的?
就讓我們從蒸餾器說起吧。
威士忌達人學院首席顧問林一峰指出,蘇格蘭威士忌有128家蒸餾廠,每一家蒸餾廠都各自擁有不同形式的蒸餾器,等於是整個蘇格蘭至少有128種不同風格的原酒,可以作為調合式威士忌的元素。
相較之下,沒有那麼多威士忌蒸餾廠的日本,要怎麼做出調合式威士忌呢?就讓我們以三得利集團的山崎蒸餾廠做例子吧。
不像蘇格蘭的威士忌蒸餾廠,往往一家蒸餾廠只使用一種形狀的蒸餾器;山崎蒸餾廠為了得到不同風格的原酒,以一種近乎偏執的職人精神,不但蒸餾器的數量從原先的12只,逐步增加至14只;甚至到2017年,已經增加到16只,共有7種不同形狀的蒸餾器。
這使得山崎這一家蒸餾廠,可以製作出至少40種到60種不同的原酒,再加上同集團的白州蒸餾廠,整個三得利集團可以製作出至少100種原酒;三得利集團的調合式威士忌「響」之所以屢屢在國際大賽上拔得頭籌,就是這個原因。
究竟蒸餾器的長相如何決定酒廠風格?蒸餾製程有哪些環節會影響風味?不要錯過林一峰精彩的分析。
(製作/撰文:高婉珮,攝影:陳思明)
【警語:飲酒過量,有礙健康。酒後不開車,安全有保障。飲酒過量,害人害己。未成年請勿飲酒。】

蒸餾 例子 在 memehongkong Youtube 的最讚貼文
鉛水事件,我想集中跟大家講一個問題。就是無論是公樓還是私樓,如果不介應花幾百元,應該第一時間去驗水。它對小朋友有特別大害處,因為小朋友身體質量比較小,而且生長期間鉛的禍害是終身的。成人的傷害小一點,因為生長完。生長時是需要鈣,但身體分不到鈣和鉛。會用了一部鉛建構身體,這可以是致命。至於如果證明了水有鉛,那就不要再食那些水,改蒸餾水直至政府駁好新喉。如果血中有鉛,是公屋居民的話,我建議大家立即申請法援控告房署和承辦商,這是今日主要想講的東西。
如果同一屋苑有很多小朋友都驗到鉛超標,而水又驗到有鉛。那足以構成起訴的賠償。根據科學,身體每多1微克的鉛,智力都會受到損害,一個月會找少百多元美金。鉛的毒害是有科學根據。不過辯方就會講可能空氣有鉛,或者玩具油漆有鉛,但現在是很難告不入的。法官傾向相信既然水有鉛,邨內很多小朋友有鉛,那通常會告得入。現在的例子,應該會賠償很多錢,因為那是一生人的受損,那是醫療和痛苦的賠償。以香港來講,十多百分比屋邨有問題,當中又有十多百分比有問題,那大妁七至十萬人有問題。那是一個天文數字。
至於私人屋邨就告業主立案法團,那就會所有業主一齊夾錢賠償。如果你是業主,也要負擔。當中一定是嬰孩、小朋友、孕婦老人會驗到鉛。
即時聊天室:http://goo.gl/ToDqof
謎米香港 www.memehk.com
Facebook:www.facebook.com/memehkdotcom
