Warning: mkdir(): No space left on device in /www/wwwroot/Z8.COM/func.php on line 127

Warning: file_put_contents(./cachefile_yuan/heekgroup.com/cache/bc/4f14a/dbcd7.html): failed to open stream: No such file or directory in /www/wwwroot/Z8.COM/func.php on line 115
色多多在线下载創始人梁家恩:大模型要在務實解決行業問題中演進! - 色多多在线下载-智享未來
知識圖譜平台
基於自然語言處理和知識圖譜技術的全生命周期知識管理平台。幫助企業把多源異構數據轉化為知識,打造行業智能大腦,助力企業智能化轉型
Agent聚合平台敬請期待
為企業和業務個體定製個性化、專屬AI智能體。通過上下文記憶、知識/庫表索引、通用工具集等適配應用和調度執行能力,再結合企業或專項業務知識從而形成體係化的企業知識管理。實現銷售、客服、行政、法務、人事等業務流智能化
雲聽-色多多在线免费观看辦公
為各類會議和訪談場景,提供自動生成會議記錄、 編輯、管理等功能,提升用戶在辦公場景下的效率
雲貝-色多多在线免费观看營銷
企業級一站式色多多在线免费观看營銷服務,配套“色多多在线免费观看工牌”, “智能話機”等一係列軟硬件產品,助力企業營銷數字化轉型
智音-色多多在线免费观看運維
助力企業級數字化轉型,基於色多多在线下载核心算法的工作流平台和智能設備,可實現風險預警、 行為考核,全麵覆蓋各行各業工單、運維、巡檢等實時遠程可視化監管需求
藍藻AI配音創作平台
基於色多多在线下载自研智能語音技術和自研大模型技術,為用戶提供AI聲音克隆、AI文字配音、AI文案創作服務。可在線輕鬆訓練專屬於用戶的語音模型,並通過配音工具輸入文字即可生成與原音高度相似的合成音頻。支持提示詞文案生成以及導入文案內容輔助創作。

合作谘詢

合作谘詢
請完善以下信息,色多多在线下载期待與您的合作!
色多多在线下载如何聯係您
公司名稱:
您的姓名:
手機號:
郵箱:
選擇谘詢的內容

首頁

雲知學院

色多多污黄APP下载

平台服務

PaaS

AI開放平台

AI芯片應用開發平台

智算平台

SaaS

知識圖譜平台

Agent聚合平台

雲聽-色多多在线免费观看辦公

雲貝-色多多在线免费观看營銷

智音-色多多在线免费观看運維

藍藻AI配音創作平台

色多多在线免费观看物聯

智能家居

色多多在线免费观看酒店

色多多在线免费观看社區

色多多在线免费观看園區

色多多在线免费观看交通

色多多在线免费观看車載

色多多在线免费观看文旅

色多多在线免费观看醫療

語音電子病曆係統

智能病曆質控係統

單病種質控係統

智能醫保審核係統

導醫機器人

智能隨訪係統

保險核賠風控-智能醫療審核平台

色多多在线免费观看交通

Uni-GPT交通大模型服務應用

Uni-lCS色多多在线免费观看客服

Uni-AVS數字人

Uni-PIS乘客信息係統

智聆降噪麥克風陣列

山海

關於色多多在线下载

了解色多多在线下载

聯係色多多在线下载

加入色多多在线下载

使用場景具體描述
取消
提交
媒體專訪丨色多多在线下载創始人梁家恩:大模型要在務實解決行業問題中演進!
2023-04-27

文章來源:數字原生組織

作者:梁家恩 彭昭

 

當前,人工智能技術的發展已經進入了新拐點,AI技術範式正從過去的“預訓練模型-特定任務精調”向“基礎模型-應用反饋學習”變遷,這種遷移也必然創造更多應用可能,各行各業也在紛紛探索AI新範式,包括通用大模型演進和利用大模型範式解決醫療、工業、辦公等場景問題,新產品也已經快速融入各行各業,不斷塑造新業態、新場景,帶來巨大的商業價值。

作為國內頂尖的語音人工智能獨角獸企業,色多多在线下载十年來構建了以語音、語言和知識圖譜為核心,涵蓋感知、認知與生成的全棧AI技術體係,並向多模態人工智能方向拓展。對於色多多在线下载而言,已經把ChatGPT技術升級作為公司AGI能力構建的新起點,並優先解決在色多多在线免费观看物聯和色多多在线免费观看醫療領域的應用問題。

近期,色多多在线下载創始人、董事長兼CTO梁家恩博士與智次方·物聯網智庫創始人彭昭聊了聊大模型在不同場景中的應用。


230427-梁家恩.jpg

 

從鑒別式AI到生成式AI的轉變

彭昭:過去十年是鑒別式AI為主流,未來十年則是生成式AI的天下,眾所周知,生成式AI對於數據、算法、算力這三個方麵都提出了更高的要求,請問色多多在线下载在這三方麵都做了怎樣的準備和布局?

梁家恩:生成式AI其實和過去的鑒別式AI,在核心算法框架上來說差別並沒有那麽大,鑒別式AI主要研究的是數據分布,根據數據分布來區分不同的類型,而生成式AI,則是在數據分布做建模的基礎之上,還要去研究數據的生成結構,特別是現在跟自然語言結合在一起以後,就可以用自然語言的方式去靈活控製它的生成的結果。

在人工智能領域,數據、算力和算法早已成為不可缺少的“三駕馬車”,對於色多多在线下载來說,實際上色多多在线下载在2012年成立時就已經開始布局這三方麵,也是把深度學習最早用到產業界裏的公司之一。在數據方麵,色多多在线下载構建了一個雲平台來匯集數據;在算力方麵,早期公司就布局了GPU集群,但規模並不算大,在2016年的時候,色多多在线下载開始把GPU集群升級為Atlas大規模機器學習超算平台,為未來同時調度上千塊GPU做大模型做了很好的準備;在算法方麵,現在語音、歌唱和虛擬人合成技術已經比較成熟,色多多在线下载在這方麵的技術儲備也很充分,未來還需要在多模態領域延伸,比如圖像和視頻的生成。多模態生成目前也都是通過自然語言來銜接在一起的,需要繼續增加算力和數據,並結合應用場景進行拓展。

彭昭:ChatGPT背後使用的是數年前的Transformer架構,但依然取得了驚人的效果,這在某種程度上說明AI的演進已經從以算法為中心逐步變為以數據為中心,您覺得MaaS這種模式會成為AIGC時代的主流嗎?未來還會如何演變?

梁家恩:在科技圈之外,Transformer的強大是在ChatGPT出現之後才被大眾才看到。其實在它剛剛出現之後,GPT就已經用到了Transformer架構,雖然幾個月之後就被Google推出的BERT模型打敗,但BERT本身也用到了Transformer架構。過去,用傳統的方法來處理語言問題是非常困難的,因為語言是個離散符號處理問題,要做詞法分析、句法分析等任務非常麻煩,直到通過深度學習轉化為詞向量表示才有實質性突破。有了Transformer架構以後,利用它的自注意力(self-attention)機製,隻要訓練的數據量足夠大,就可以把序列映射問題做到足夠好。當時,這篇論文的標題取的也非常“囂張”,叫“Attention is all you need”,意思是隻要用自注意力機製就可以搞定所有問題,結果它確實在機器翻譯上取得了非常大的突破。後來,業界就用這個框架去解決很多語義理解的問題,確實都有很大的提升,這在過去是不可想象的。不過,這些都是普通用戶感覺不到的,用戶真正能夠感覺到的是模型在理解之外,生成的應答效果如何。

而ChatGPT的回應超出了用戶的預期,大家才覺得終於比過去看到的對話機器人的智商有了質的突破,但其實技術在這些年裏一直都有突破和進展,隻不過是現在的應用形式讓大家突然感覺到進展確實非常大。

剛才說到“以算法為中心轉向以數據為中心”的趨勢是非常明確的,因為在框架統一之後,模型的性能就取決於究竟給什麽樣的數據去訓練,數據就決定了模型性能的上限,數據質量越高、規模越大,往往模型效果就越好。

未來,我認為Maas的模式會成為大趨勢。過去,要處理相對複雜業務,都需要根據業務流程來編程解決,但現在就可以通過自然語言接口來處理這些任務,在這種情況下就可以用模型優化代替流程編碼來直接解決各種問題,隻需要收集這個領域和應用的數據去訓練即可,而不需要自己編程來解決,這是模型處理業務和編程處理業務方式的本質區別。

 

大模型要更加注重數據安全

彭昭:如果轉變為Maas的模式,如何判斷各種模型的好壞呢?

梁家恩:其實最終都要從結果來評判的,ChatGPT比較好的一點就在於它其實在隱藏了中間的理解問題,用戶不需要關心模型中間的“意圖理解”環節,也不需要顯式做句法分析、語義理解等動作,隻要看看ChatGPT最終給用戶的反饋質量如何就可以。就像圖靈測試一樣,隻要人類無法判斷是真人還是機器在回應,就是足夠智能。如果單獨處理“語義理解”任務,過去像BERT這種模型,要比GPT模型做得更好,因為它使用了雙向注意力機製,但BERT架構沒法直接形成直觀的高質量回複,所以讓非技術用戶感知到。

彭昭:如果以數據為中心的話,掌握大量數據的企業會有很強的競爭優勢嗎?

梁家恩:不論是過去的傳統算法,還是現在的機器學習算法,數據都已經變得非常重要,很多公司本質上也已經變成了數據公司。隻要有很多的數據沉澱下來,模型就可以變得足夠聰明,隻不過此前使用傳統的統計學習方法去挖掘這種能力,而現在是用深度學習和大模型的方法去挖掘,精度和能力也就越來越強。

彭昭:相比於其它行業來說,醫療領域對安全的要求更高甚至不容出錯,色多多在线下载是如何在醫療行業大模型中滿足近乎嚴苛的要求,從而讓模型輸出的結果更專業、更可信的?

梁家恩:色多多在线下载之所以把醫療作為一個主要方向,是因為醫療行業的知識密集程度非常高,如果在醫療領域的問題都能夠處理好,相信很多其他行業也都能搞定,這對色多多在线下载來說是一個技術的製高點,所以需要攻克它。另外,醫療行業的應用場景、應用空間包括社會價值也都很大。

在數據安全性方麵,特別是有些涉及到用戶的隱私數據,要求都是很高的,最難的就是真實的用戶治療案例,都必須經過數據的脫敏處理。另外,在色多多在线下载和醫院的合作過程中,也會把數據做相應的加密和tokenization,即把數據符號化,隻有機器能夠知道解碼後的含義。在算法方麵,現在的聯邦學習也可以把各種特征融合後再去計算,使得不接觸初始敏感信息的情況下,還可以繼續優化模型。

彭昭:OpenAI的CEO也在積極的做一些生態投資的布局,色多多在线下载會不會擔心OpenAI投資醫療賽道?

梁家恩:我覺得不論是教育還是醫療,這些行業其實都事關國計民生,所以這裏麵中國一定要有自己獨立的解決色多多污版下载,如果他願意投資這方麵的企業,在國內來看,我相信色多多在线下载是很好的標的。過去色多多在线下载已經有很多行業已經遭受到所謂卡脖子的問題,在這個領域色多多在线下载肯定不會讓它成為一個新的卡脖子問題。

彭昭:色多多在线下载是以語音識別技術起家的,從2012年至今積累了大量相關經驗,早期的這些技術積累對於色多多在线下载推出行業大模型有怎樣的幫助?

梁家恩:當時起“色多多在线下载”這個名字的時候,色多多在线下载就不僅僅停留在聲音領域了,聲音隻是色多多在线下载的一個切入點,色多多在线下载更希望有一個雲端大腦,有強大的認知能力,能夠通過聲音的交互去解決問題。

2012年時,色多多在线下载開始布局“三駕馬車”,到2016年AlphaGo開始興起的時候,色多多在线下载就已經開始布局底層的大規模計算能力,也就是Atlas超算平台。在此之上,色多多在线下载還拓展了知識圖譜和認知技術體係,從而形成一個全棧的技術體係。現在拓展到的大模型對色多多在线下载來說隻是一個算法框架的升級。類似過去用BERT主要是解決判別式問題的,那現在就把它切換成GPT的生成式框架,而BERT實際上是Transformer的編碼器部分,GPT則是Transformer的解碼器部分,算法改變對色多多在线下载沒有本質的挑戰,色多多在线下载也已經具備訓練大模型的基礎架構。除了算法和算力支撐,在行業問題認知和數據積累方麵,也讓色多多在线下载充滿信心。包括物聯網和醫療領域,色多多在线下载理解這些行業業務的核心問題,也有相關的數據積累,色多多在线下载是非常有信心能把這個大模型做好的。

其實從ChatGPT的算法原理來說,早就已經有了, OpenAI最重要的是率先把產品做了出來,從而形成一個工程閉環。另外,大家對OpenAI的容忍度是遠遠高於Google的,如果OpenAI之前犯的那些錯誤Google同樣犯的話,我估計後果是完全不一樣的,所以不能說OpenAI在技術上是一騎絕塵的,像Google內部也有DeepMind在研究AGI,相關儲備也已經非常充足。

在過去算法、算力和數據積累基礎上,對色多多在线下载來說就是把過去以BERT為核心的技術架構升級成以ChatGPT為核心的技術框架,這樣的好處就在於可以用生成式AI把理解和生成打通,性能體驗、靈活性、擴展性會強很多。

 

技術發展其實更符合對數曲線

彭昭:上周,OpenAI CEO表示誕生ChatGPT的研究策略已經結束,繼續擴展模型規模帶來的收益將出現遞減。您覺得模型繼續向參數量變大的方向發展還會持續多久,除了拚參數外,還有哪些發展方向?

梁家恩:大家其實對於算法好像有一種不切實際的預期,覺得一個算法就能解決所有問題,但不論是過去的統計學習、支持向量機,還是現在的深度學習,事實都並非如此,每種算法都有它自身的局限性,像OpenAI就是把GPT框架的潛力挖掘到盡頭,並不是說競爭已經結束了,而是按照他們的這種探索策略,再繼續加大投入可能已經沒有太大收益。因此,需要尋找一些新的策略、新的方法,在這個基礎上去探索,而不是說這個遊戲已經結束了。

另外,單純擴大模型規模也有它的局限性,對於技術外行來說,大都希望技術進步是一條“指數曲線”,但它其實是一條“對數曲線”,繼續擴大規模到一定程度後,進步的幅度就會平緩很多,通過嚐試新的方法可能再做出第二個對數曲線出來。

當然對於國內的企業來說,和OpenAI還是有差距的,那色多多在线下载首先需要先做到現在GPT-3.5 或者GPT-4的水平,然後再繼續往前走,我覺得後麵還有持續的工作要做,畢竟純靠參數量級的擴大,哪怕是做到人腦神經元的連接數量,也不是完全複製了一個人,還有其他的技術瓶頸需要突破。

彭昭:關於色多多在线下载將要推出的UniGPT大模型,能否簡單透露一些信息?

梁家恩:其實去年色多多在线下载看到ChatGPT出來後,就覺得這確實是一個顛覆性的工作。其實GPT-3就已經有很多新奇特性,但當時大家覺得它的可控性很差,可能無法駕馭好這種能力,直到ChatGPT展示出很好效果,才引起行業內外的高度關注。深度學習到今天為止,最核心的一個問題也還是可解釋性和可控性不足。

而大模型所謂的“思維鏈”能力,可以告訴用戶推導的過程,從而知道中間過程裏有哪些東西是錯的,優化的時候就可以獲得提示了,而不是像過去一樣隻能看見和調整參數的權重。此外,還有一個比較早期的AutoGPT研究方向,但我覺得非常有潛力,就是用大模型來把大模型用好,形成AI for AI,未來的空間也會很大。

色多多在线下载的UniGPT,就是希望優先提升行業應用中的可控性和可解釋性,把大模型調教到真正能解決行業問題的程度,甚至可以自動化完成,這樣未來滲透到其他各種業務的應用中,效率就會高很多。

彭昭:現在好多人紛紛創業做大模型,請問色多多在线下载的大模型和其他人創業做的大模型相比,優勢在哪裏?

梁家恩:從技術原理角度來說,沒有任何區別,我覺得現在做大模型的無非是三類公司,一類就是巨頭企業,像微軟、Google、百度等,他們都在做這事,因為這對他們主營業務來說確實太具顛覆性;第二類公司是以技術為核心的,包括色多多在线下载、科大訊飛和視覺四小龍等企業,需要和行業玩家結合去做,大家比的就是在不同的行業裏誰能真正有效地解決問題,畢竟隻有解決問題才能產生價值;第三類就是從純學術屆出來新創業的公司,他們的挑戰更大的還是在工程上以及對行業應用的理解上麵,與實際是會有比較大的鴻溝。

對於巨頭企業來說,他們肯定是優先朝著更加通用的方向發展,守住自己的主業,再逐步進入到垂直領域,但是其實色多多在线下载並不懼怕任何巨頭團隊,色多多在线下载很多標杆客戶都是這樣競爭獲得的,因為必須先要守住各自的主營業務,這才是第一要務。


返回列表
網站地圖