✈️ Gate 廣場【Gate Travel 旅行分享官召集令】
廣場家人們注意啦!Gate Travel 已經上線~ 機票+酒店一站式預訂,還能用加密貨幣直接付款 💸
所以說,你的錢包和你的旅行夢終於可以談戀愛了 😎 💕
現在廣場開啓 #GateTravel旅行分享官# 活動,邀你來秀旅行靈感 & 使用體驗!💡
🌴 參與方式:
1️⃣ 在【廣場】帶話題 #Gate Travel 旅行分享官# 發帖
2️⃣ 你可以:
你最想用 Gate Travel 去的目的地(私藏小島 or 網紅打卡點都行)
講講用 Gate Travel 訂票/訂酒店的奇妙體驗
放放省錢/使用攻略,讓大家省到笑出聲
或者直接寫一篇輕鬆的 Gate Travel 旅行小故事
📦 獎勵安排,走起:
🏆 優秀分享官(1 名):Gate 旅行露營套裝
🎖️ 熱門分享官(3 名):Gate 旅行速乾套裝
🎉 幸運參與獎(5 名):Gate 國際米蘭旅行小夜燈
*海外用戶 旅行露營套裝 以 $100 合約體驗券,旅行速乾套裝 以 $50 合約體驗券折算,國際米蘭旅行小夜燈以 $30合約體驗券折算。
📌 優質內容將有機會得到官方帳號轉發翻牌提升社區曝光!
📌 帖文將綜合互動量、內容豐富度和創意評分。禁止小號刷貼,原創分享更容易脫穎而出!
🕒 8月20 18:00 - 8月28日 24:00 UTC+
人類數據告急,微軟OpenAI開始用AI餵AI,奧特曼放話:未來所有數據都將變成合成數據
原文來源:量子位
人類數據缺缺缺,AI被迫開始吃AI生產的數據了!
這是微軟、OpenAI等一眾AI前沿公司面臨的現狀。
他們從維基百科、電子書、新聞網站、博客、推特和Reddit等平台和論壇中搜羅了大量數據,然後現在……這些數據快被用完了。
據《金融時報》介紹,不少公司正把大模型生成的結果、也就是所謂的合成數據(Synthetic data),餵給參數量更小的大模型吃,發現效果還不錯。
對於使用合成數據,OpenAI的CEO Sam Altman不僅不介意,還放話“未來所有數據都將變成合成數據”。
估值20億美元的大模型初創公司Cohere同樣在用合成數據。公司CEO、經典大模型Transformer論文作者之一Aidan Gomez甚至認為:
所以,究竟哪些大模型已經在用合成數據了,這些合成數據又是從何而來?
大AI合成數據,小AI吃
這些所謂的合成數據,本質上是用當前表現較好的大模型生成的數據,經過人工調整後,再餵給稍微小一點的大模型。
例如Cohere公司就嘗試使用了兩個大模型進行“角色扮演”對話,並將它們生成的結果做成合成數據。
這兩個大模型分別扮演“數學老師”和“學生”,正在進行一堂虛擬的數學教學。同時,Cohere安排一個人類員工在旁邊監督對話生成。
儘管確實還需要人力,但這比聘請科學、醫學和商業方面的專家來撰寫文本要便宜得多。
那麼,什麼樣的大模型會用到這些合成數據呢?
微軟研究院最近有研究表明,合成數據可以用於訓練比GPT-4或PaLM-2稍微小一點的語言模型。
以用GPT-4生成的一個“四歲兒童小說”數據集TinyStories為例,這個數據集被證明雖然只包含4歲小孩能理解的單詞,但用於訓練一個大模型之後,同樣可以生成語法正確、閱讀體驗流暢的故事:
背後產業鏈已出現
目前,包括Scale AI、Gretel.ai等企業,已經開始給外界提供合成數據服務。
先是Scale AI,旗下就推出了一款合成數據產品Scale Synthetic,用於給企業提供合成數據服務。
而在之前一篇SemiAnalysis爆料GPT-4“大花邊”的新聞中,還提到GPT-4的數據集中,有數百萬行是來自Scale AI和內部的指令微調數據。
但並非所有人都接受合成數據這種“神奇操作”,目前各方的看法主要分成兩波。
一部分贊同使用合成數據。包括Cohere等AI公司在內,有不少搞大模型的企業仍然堅持這一做法,並認為它可能生成更好的AI,甚至從中誕生出“超級智能”。
另一部分則認為,合成數據終將讓AI“自食其果”。
例如一篇來自牛津大學、劍橋大學、帝國理工學院、多倫多大學、愛丁堡大學和Vector Institute多家機構的研究表明:
參考鏈接: [1] [2] [3] [4]