✈️ Gate 廣場【Gate Travel 旅行分享官召集令】
廣場家人們注意啦!Gate Travel 已經上線~ 機票+酒店一站式預訂,還能用加密貨幣直接付款 💸
所以說,你的錢包和你的旅行夢終於可以談戀愛了 😎 💕
現在廣場開啓 #GateTravel旅行分享官# 活動,邀你來秀旅行靈感 & 使用體驗!💡
🌴 參與方式:
1️⃣ 在【廣場】帶話題 #Gate Travel 旅行分享官# 發帖
2️⃣ 你可以:
你最想用 Gate Travel 去的目的地(私藏小島 or 網紅打卡點都行)
講講用 Gate Travel 訂票/訂酒店的奇妙體驗
放放省錢/使用攻略,讓大家省到笑出聲
或者直接寫一篇輕鬆的 Gate Travel 旅行小故事
📦 獎勵安排,走起:
🏆 優秀分享官(1 名):Gate 旅行露營套裝
🎖️ 熱門分享官(3 名):Gate 旅行速乾套裝
🎉 幸運參與獎(5 名):Gate 國際米蘭旅行小夜燈
*海外用戶 旅行露營套裝 以 $100 合約體驗券,旅行速乾套裝 以 $50 合約體驗券折算,國際米蘭旅行小夜燈以 $30合約體驗券折算。
📌 優質內容將有機會得到官方帳號轉發翻牌提升社區曝光!
📌 帖文將綜合互動量、內容豐富度和創意評分。禁止小號刷貼,原創分享更容易脫穎而出!
🕒 8月20 18:00 - 8月28日 24:00 UTC+
數學能力超ChatGPT,70B開源大模型火了:用AI微調AI,微軟全華班出品
來源:“量子位”(ID:QbitAI),作者:豐色
用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——
微軟最新開源大模型WizardMath來了。
並且是在參數只有700億,遠不及後三者的情況之下。
比如解決下面這道四次多項式方程:
有網友向作者表示:
用AI生成的指令增強大模型能力
OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執行各種複雜和多樣化的任務,一部分原因是使用了真實人類用戶生成的開放域指令數據進行了微調。
然而,不是誰都能像這家公司一樣獲得這樣的指令數據集。
一是因為整個註釋過程極其昂貴且耗時,二是人工難以創建出足夠比例的高難度指令。
因此,開發出一種成本相對較低的、大規模開放域指令自動生產方法,成為當下指令調優語言模型的關鍵。
在此,作者將他們的方法命名為Evol Instruction。
它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。
具體而言,Evol Instruction分為指令進化器和指令消除器。
其中指令進化器可通過深度進化(藍線)或廣度進化(紅線)兩種路徑,將簡單指令升級為更複雜的指令或創建一條全新指令。
具體執行哪一條?隨機選擇就好。
添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入複雜化(complicate input)。
由於所有指令均由AI完成,有時難免會出現錯誤。因此,指令消除器就是用於過濾失敗指令的。
以下是一個具體示例,該方法從“1+1=?”開始,最終通過以上步驟自動生成了相當多的新指令。
在此,作者選擇Alpaca的訓練數據(僅由175條人工創建的種子指令生成)作為初始數據集,然後使用ChatGPT的API執行了四個進化週期,最終獲得25萬條指令。
為了與Vicuna的70k真實用戶數據(ShareGPT)進行公平比較,作者從這25萬條數據中抽取了等量的樣本,訓練LLaMA 7B模型,最終得到WizardLM,結果WizardLM的性能明顯優於Vicuna。
(Alpaca:斯坦福在LLaMa-7B基礎上微調出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎上微調得來)
此外,在更為複雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理複雜指令的能力。
基於此,作者又利用Evol Instruction生成了很多數學領域相關的指令,然後微調羊駝大模型,得到了WizardMath。
其效果如開頭所示,在GSM8k數據集上測得其數學能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次於GPT-4、Claud1. 3和2.0,以及5400億參數的Flan-PaLM 2之後。
以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。
團隊介紹
本文共9位作者,全華人。
一作有3位:
Can Xu,微軟亞洲互聯網工程院S+D NLP組高級應用科學家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統工作;
Qingfeng Sun, Microsoft Research科學家,研究方向為自然語言處理和信息檢索,精通構建高效搜索系統,為Microsoft Bing和Office 365貢獻了核心深度模型;
Kai Zheng,Microsoft Research科學家,研究方向為自然語言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻了核心深度模型。
另还有一位作者Jiazhan Feng,是北大学生,这篇合著论文是TA在微软实习时产出的。
項目主頁:
論文地址: