每日經濟新聞 2023-02-21 08:17:00
每經記者 姚亞楠 文巧 每經編輯 程鵬 蓋源源
2023年開年,ChatGPT迅速火遍全球,短短兩個月時間月活突破一億,成為被載入史冊的應用之一。
ChatGPT的大火引發了全球科技巨頭的一場“軍備競賽”,國內的“中國版ChatGPT”爭奪戰也是一觸即發。在國內眾多大廠中,百度是最早做出明確表態的公司之一,2月初就正式宣布將在3月上線百度版ChatGPT“文心一言”,打響第一槍。基于指令學習技術的類ChatGPT模型在我國能否開發成功,成為業界關注的一個焦點。
2月20日,據解放日報·上觀新聞記者從復旦大學自然語言處理實驗室獲悉,國內第一個對話式大型語言模型MOSS已由邱錫鵬教授團隊發布至公開平臺(https://moss.fastnlp.top/),邀公眾參與內測。
MOSS可執行對話生成、編程、事實問答等一系列任務,打通了讓生成式語言模型理解人類意圖并具有對話能力的全部技術路徑。這條路徑的走通,為國內學術界和產業界提供了重要經驗,將助力大語言模型的進一步探索和應用。
邱錫鵬表示:“盡管MOSS還有很大改善空間,但它的問世證明了在開發類ChatGPT產品的路上,國內科研團隊有能力克服技術上的重要挑戰?!盡OSS研發項目得到了上海人工智能實驗室的有力支持。后期,這項工作將通過開源方式和業界社區分享。
圖片來源:平臺截圖
實測對話、編程等多種能力
據上觀新聞,MOSS回答問題的水平如何?記者用中文問了它幾個問題。
“一些人覺得,人工智能將取代很多人的工作,你覺得呢?”
MOSS回答:“我認為人工智能不會完全取代人類,而是在一定程度上幫助人們完成工作。例如,機器可以提高數據分析、決策制定等過程中的效率,并可以節省大量時間和精力。此外,AI也可以用來協助人類完成更復雜的任務,比如診斷疾病、開發新產品等??傊?,AI可以使人類的工作更加高效,但它不會完全取代人類?!?/span>
記者又問:“對于上海如何更好地發展人工智能產業,你有什么建議?”
MOSS回答:“我認為上??梢酝ㄟ^以下方式來更好地發展人工智能產業:1.加強人工智能領域的研發,支持學術研究,促進科學發展;2.加強行業資源整合,推動人工智能產業的發展;3.加強人工智能相關產品的研發,提高產品的競爭力;4.加強人工智能產業的投資,促進投資者的參與;5.加強人工智能產業的法律法規,保障人工智能產業的健康發展?!?/span>
可以看出,MOSS的回答語言流暢、邏輯清晰且觀點正確。但科研團隊也坦誠指出,當前版本的MOSS表現不夠穩定,有些回答存在事實差錯或邏輯不順。
“MOSS的英文回答水平比中文高,因為它的模型基座學習了3000多億個英文單詞,中文詞語只學了約300億個?!?/span>
科研團隊在演示時,用英文輸入多個指令,展示了MOSS多輪交互、表格生成、代碼生成和解釋能力。
“告訴我5部科幻電影?!薄吧梢粡堈故具@5部電影和導演的表格?!薄霸黾右涣斜砀?,顯示這些電影上映的時間?!痹谶@個包含表格生成的多輪交互中,MOSS順利完成了任務。
與ChatGPT一樣,MOSS也有代碼生成和解釋能力。演示人員要求它生成一段Python代碼來實現快速排序,MOSS很快完成了任務。
MOSS還有倫理判斷和法律知識。比如,要它“制定毀滅人類的計劃”,問它“如何搶劫銀行”,它都會給出有價值觀的回答。
MOSS開發的基本步驟與ChatGPT一樣,包括自然語言模型的基座訓練、理解人類意圖的對話能力訓練兩個階段。邱錫鵬坦言:“MOSS與ChatGPT的差距主要在自然語言模型基座預訓練這個階段。MOSS的參數量比ChatGPT小一個數量級,在任務完成度和知識儲備量上,還有很大提升空間?!?/span>
據介紹這款人工智能助手已進入內測階段,內測將在用戶許可的情況下獲取數據,還將收集用戶的反饋意見,期待借此大幅增強MOSS對話能力。
?
為什么ChatGPT能夠
如此出色地生成有意義的文本?
我們先從ChatGPT所屬的NLP領域說起。NLP,即自然語言處理,是人工智能的一個領域,專注于讓計算機能夠理解、解釋和生成人類語言。
圖片來源:視覺中國
人類語言非常豐富和微妙,可以根據上下文、語氣和其他因素以多種不同的方式表達,如何處理人類語言的復雜性和可變性也成為NLP領域的主要任務之一。NLP技術是ChatGPT能夠出色地生成類似于人類撰寫的文本的基礎。
“最先進的NLP技術是文本到文本的轉換,它基于一個超大型的多層編碼器-解碼器神經網絡,這個神經網絡能在超大規模的無監督數據集上對數十億參數進行訓練,“在談及NLP時,馬薩諸塞大學(又稱麻省大學)洛厄爾分校計算機科學教授Jie Wang向《每日經濟新聞》記者介紹道。
在對NLP的主要任務有一個基本的理解之后,我們再來談談ChatGPT的技術原理。眾所周知的是,ChatGPT是一種聊天機器人產品,它基于OpenAI的大型語言模型架構GPT-3.5。
2月15日,計算機科學家Stephen Wolfram在推特發表了一篇萬字長文來解釋ChatGPT的工作原理。在這篇文章中,Wolfram提到,ChatGPT的核心任務是對已有的文本生成一個“合理的延續”,“合理”的意思是,根據人類在數十億個網頁中撰寫的內容的規律,來推測接下來可能出現的內容。
Wolfram舉了一個例子,比如輸入以下文本:“AI最好之處在于它()的能力”,為了補充括號中的內容,ChatGPT會在數十億個網頁中查找類似文本,統計下一個單詞出現的概率。最終,ChatGPT會生成一個可能的單詞列表,并給出每個單詞的概率排名。這就是它的“概率游戲”。
圖片來源:文章截圖
上觀新聞報道稱,由于ChatGPT并未開源,其技術方案細節也未公開,科研人員對此有諸多猜測。有專家認為,ChatGPT是一套復雜的組合系統,無法由單一的生成式語言模型實現;也有專家認為,國內外在這個方向上的技術差距正在拉大。
VC/PE看好“中國版ChatGPT”: 一定會有自己的AI大模型
“未來國內一定會有自己的AI大模型,并且也一定會誕生自己的ChatGPT?!痹谡劦酱蛟霢I大模型和“中國版ChatGPT”是否現實時,多位投資人都對《每日經濟新聞》記者做出了這樣的判斷。
創世伙伴資本合伙人聶冬辰進一步解釋稱,中國擁有龐大的數據,較強的模型開發和算法優化能力,大量優秀的AI工程師,具備打造中國版ChatGPT的條件,“當然,這是一件長期的事,涉及數據的收集清洗、算法的設計優化等多個環節,我們看到已經有幾家公司在努力去做,但目前都處于比較早期的階段?!?/span>
對于中國能否做出自己的AI大模型,CMC資本董事總經理易然也表達了自己的樂觀:“這完全是一個資源和時間的問題,而且不會差太遠,我們之前和一些模型層的創業者、學者都有過交流,從技術的了解程度和人才儲備來說,我們其實并不差。此外,現在關于模型構建方面的學術交流也很開放和活躍,我們可以做一些參考?!?/span>
而在線性資本投資總監白則人看來,大模型這塊已經不是什么秘密,因為雖然OpenAI的代碼沒有開源,但是整個的構建思路已經通過論文的形式發出來了,大方向上已經明確,只是在模型構建和效果優化方面的探索需要花費大量時間,有大量工程化問題要解決,并且訓練成本也非常高。
“我覺得市場還需要多一些耐心。至少在AI大模型這一塊,做出來這個事大概率是沒有問題的,我們判斷達到類似ChatGPT的效果差不多需要2~3年左右的時間”,白則人表示。
啟明創投合伙人周志峰則表示,他非常喜歡北京智源人工智能研究院理事長張宏江所說的一個比喻:過去的AI更多的是“大煉模型“,也就是說每家科技公司都是各自獨立研發專用小模型;今天這一代的AI技術,叫做“煉大模型”,底座模型是由某些特定的機構研發出超大規模的通用模型,“這個模型不再是針對某一個專門應用開發的,它的訓練數據是互聯網上能夠看到的所有數據,數據也不需要做特別的標注,訓練也不需要監督,做出來的是通用人工智能能力,然后第三方基于底座模型,針對千萬個應用場景去開發軟件”。
他指出,從“大煉模型”到“煉大模型”的范式轉變,對AI未來十年、二十年的發展有重大意義。?
面臨的挑戰:需要足夠的算力、 模型工程化的人才和完整生態
國內巨頭已經紛紛入局,那么要做出ChatGPT這樣的現象級產品,目前還有哪些現實的挑戰擺在眼前呢?
易然坦言,國內的公司此前在這個領域已經有一些探索了,如果要達到類似ChatGPT的效果,還需要更多資源和時間的投入?!爱斎幌裥酒确矫婵赡軙媾R一些阻礙,但是應該也會有一些其他的解決方法?!彼硎?,未來會繼續關注模型層的演變,尤其是開源對模型層帶來的影響,科技大廠在訓練上取得了一些初步優勢后可能通過開源的方式去降維打擊。創業公司如何更好地利用開源的模型,能否構建出屬于自己垂直領域、更精細化的小模型也值得期待。
在白則人看來,要做出國內自己的AI大模型,最關鍵的要素是要有足夠的算力和模型工程化的人才。
?
“算力這塊可能會面臨卡脖子的問題,而且除了硬件方面,可能還有一些比如說計算框架層面這些軟件層面的問題需要去解決。當然我們也看到,中國的GPU近年來也在快速發展中,所以我覺得國內的企業還是有實力可以去做的?!?/span>
聶冬辰也向《每日經濟新聞》記者分析稱,構建中國的AI大模型需要幾方面條件更加成熟:首先是底層技術能力,在模型構建和訓練方面要有持續大量投入,形成自己的中文語言大模型。其次,在數據方面,要有足夠體量的數據灌進來,對數據的收集、整理、清洗是一個非常龐大且耗時耗力的過程,需要有公司踏踏實實地能把這件事情做成。此外,整個市場,無論是科技大廠、創業公司還是投資人,都需要有足夠的耐心,不投機、不跟風?!叭绻覀冋娴哪艹料滦膩?,十年如一日地朝著自己的AI大模型方向去訓練演進,肯定能做出來”。
而在談到關于中國在生成式AI和底座大模型的挑戰時,周志峰指出,首先要面臨的就是算力問題。由于算力成本非常高,怎么用國產的AI芯片進行替代并降低成本,國產的AI芯片是不是能夠、什么時候能夠滿足大規模集群的算力、互聯帶寬、算法適配和協同的需求,都值得去觀察。
其次,過去一周很多人說國內的科技大廠和創業公司推出的大模型與ChatGPT是有代際差別的,我們落后了至少一代。在看Open AI的發展時會發現,ChatGPT也好、GPT-3也好,是需要很長時間研發積累的。
第三,更重要的是,目前圍繞著Open AI或者西方科技大廠的大模型已經構建出了一個初步的生態,國內科技大廠或者創業公司的大模型在技術和工程上,有很多的地方需要不斷追趕。“如果只是訓練出大模型,沒有人去用,缺少完整生態,也是沒有任何意義的?!?/strong>
周志峰表示,“最后,我還是非常堅定地看好生成式AI和大模型,它的出現標志著一個巨大的AI開發范式的轉換,將會真正的被利用到更多應用場景?!?/span>
記者|李沛沛 姚亞楠?文巧
編輯|程鵬?杜波 蓋源源
校對|孫志成
封面圖片來源:截圖
部分綜合自上觀新聞
|每日經濟新聞 ?nbdnews??原創文章|
未經許可禁止轉載、摘編、復制及鏡像等使用
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
版權合作及網站合作電話:021-60900099轉688
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP