• 未來大模型:更多能 更輕量 更親民
    來源: 科技日報 作者: 發布時間: 2024-04-25

    去年起,全球掀起以大模型為代表的生成式人工智能行業浪潮,人工智能邁向全面應用新階段。國外以OpenAI、微軟為代表,谷歌、Meta等巨頭一個不落,國內頭部科技企業則悉數入場。

    近日,國家數據局局長劉烈宏表示,中國10億參數規模以上的大模型數量已超100個,行業大模型深度賦能電子信息、醫療、交通等領域,形成上百種應用模式,賦能千行百業。

    大模型技術日新月異,產業化腳步追星趕月。在這個熱鬧夾雜爭議的行業,不同的技術路線和選擇正在延展開來。

    多模態正成標配

    360集團董事長周鴻祎在關于2024大模型發展的十大趨勢判斷中明確表示,多模態將成為大模型標配。未來,大模型不僅能聽會說,還能看懂圖片和視頻,更能識別理解。

    中國科學院自動化研究所研究員劉靜在《GPT-4對多模態大模型在多模態理解、生成、交互上的啟發》一文中談到,模態是指表達或感知事物的方式,例如人類的聽覺、視覺、觸覺等。在人工智能領域,多模態是指利用多種模態的信息來進行感知和理解。多模態技術可以讓機器同時接收并處理不同模態信息,如文本、圖像、音頻等,從而提高機器感知和理解能力。

    劉靜進一步解釋,相比傳統的單模態大模型,多模態大模型更加符合人類的多渠道認知方式。它能將不同模態信息相互補充,提高信息的完整性和準確性,從而更好地應對復雜環境、場景和任務。如在語音識別中,多模態大模型可以結合語音和文本信息,讓機器更準確地識別和理解語音內容。在圖像識別中,圖像和文本信息的結合可以讓機器更深入地理解圖像內容。

    劉靜介紹,落實到應用層面,多模態能使機器更好地理解人類的意圖和需求,提供精準、個性化服務。例如,在目前智能技術已經深入落地的客服領域,多模態大模型可以根據用戶的文本和語音信息,綜合理解用戶問題并提供解決方案。在智能家居領域,多模態大模型通過與智能家居設備的交互,可以根據用戶需求智能調整家居環境。在醫療領域,多模態大模型則可以融合醫學圖像、病歷文本等信息,輔助醫生進行疾病診斷、制定治療方案。

    結合國內大模型產業布局,多模態大模型是近年主流廠商普遍選擇的發力方向。如“紫東太初”2.0全模態大模型可實現文本、圖片、語音、視頻、3D點云、傳感信號等不同模態的統一表征和學習。

    落地應用越來越“輕”

    為提升大模型性能、增進用戶體驗,大模型正以肉眼可見的速度越來越“大”。開源模型的參數從幾百億增加到幾千億,閉源模型也在沿著尺度定律路徑不斷升級,在千億參數的基礎上向著萬億參數攀登。但與此同時,人工智能產業算力吃緊,難以滿足大模型參數規模的指數級增長。

    為加速大模型落地應用,人工智能領域正嘗試對大模型進行輕量化,通過打造更小型、更高效、成本更低的模型吸引行業客戶,讓模型在更廣泛的場景有更高應用價值。

    大模型輕量化通過降低模型的計算復雜度和內存占用,實現模型性能與資源消耗的平衡。這不僅有助于提高計算效率,降低運行時資源消耗,還可以減輕計算系統的硬件和軟件壓力,提高系統的可靠性和穩定性。此外,輕量化還有助于提高模型部署的靈活性和可擴展性,為模型在各種場景下的應用提供更多可能性。

    輕量化主要通過模型壓縮來實現。模型壓縮是指在不降低模型性能的前提下,減小模型的計算復雜度和內存占用。模型壓縮的方法有很多,剪枝、低秩分解等是業界常用的方法。具體來看,剪枝是指刪除一些不必要或冗余的參數,低秩分解是指將高維數據或高維模型分解為低維數據或低維模型。這些方法都是通過降低模型的復雜度,減少參數和計算量,來達到讓模型“更輕”的目的。

    輕量化不僅有助于提高計算效率,降低運行時資源消耗,還可以減輕計算系統的硬件和軟件壓力,提高系統的可靠性和穩定性。

    對于通用大模型服務垂直領域、行業大模型落地應用來說,輕量化更是關鍵步驟——通過合理的數據準備、模型選擇、超參數設置和訓練驗證過程,可以使模型更好地適應特定領域,提高模型性能。

    聯想集團副總裁、聯想研究院技術戰略與創新平臺總經理王茜鶯曾表示,用好大模型主要有三個要素,第一是場景化,第二是隱私化,第三是輕量化。輕量化不僅是將個人大模型進行壓縮并部署到用戶設備上,還包括企業內部的輕量化,甚至云端的輕量化。輕量化意味著使用成本的降低。

    端側成廠商新“角力場”

    去年以來,大模型正逐步走向“智能終端側”,國內外一些廠商紛紛宣布加速推進大模型在移動終端的部署。端側大模型,正成為行業熱詞。

    所謂端側,是指模型服務不部署在云端,而直接存儲在終端內部的芯片中,利用芯片算力生成結果。這樣的大模型服務不需要聯網,數據也不需要被上傳到云端。

    相比于云端大模型,端側大模型的優勢主要在于:無需云端處理信息,安全隱私性更好;不消耗云成本,高頻使用下的成本更可控;弱網和無網環境下也可以使用,用戶無需擔心云端服務器宕機,交互體驗更穩定。

    中國工程院院士鄔賀銓表示,通過模型壓縮和定制人工智能芯片提升算力,將具有百億參數大模型的推理能力嵌入手機,可以提供低成本、低時延、高安全的智能助手服務。

    相比ChatGPT、Midjourney等人工智能應用依賴云端服務器提供服務,端側大模型主打在本地實現智能化。甚至有廠商提出,讓每個人在手機上都擁有“個人大模型”。

    目前,在中國手機市場份額排名前五的企業中,除了蘋果公司,其余均已發布自有端側大模型產品。手機廠商提出的包括通話記錄自動生成、人工智能圖像處理等應用場景,日漸成為消費者的日常。

    端側大模型同樣是個人電腦產品發布時的高頻詞。在相關宣傳中,端側大模型不僅能夠提升日常使用及辦公效率,還是保護隱私和數據安全的最優解。

    艾媒咨詢CEO兼首席分析師張毅表示,人工智能可能成為今年度的手機新賣點,尤其是手機的社交價值功能呈現方面,將有更多故事可講。對于手機廠商而言,大模型是公認的未來發展賽道和方向。盡管現在人工智能在智能手機終端的應用仍較為初級,但未來的普及和推廣仍值得期待。

    不過,現有技術條件下,要做好端側大模型并不容易。目前條件下,手機性能遠遠不足以支撐大模型運行。對于大模型來說,參數量是模型能力的直觀體現,如今云端大模型的參數量均在千億級別,而手機端最高參數規模則不過百億。

    聯想集團董事長兼CEO楊元慶認為,未來十年是人工智能的十年,人工智能將改造所有業務。將來人人都會有自己的智能體,后者通過交互學習越來越懂用戶,最終成為每個人的“人工智能雙胞胎”。

    但他也不諱言市場的不確定性。在他看來,內置個人智能體需要更高配置,如果這些對用戶不是剛需,可能就不需要這么高配置。

    國際數據公司認為,未來人工智能終端將在創作與創意、游戲和虛擬世界、語音合成與轉換、視覺和圖像處理、聊天機器人等十大領域廣泛落地發展。(記者 崔 爽


    地方動態

    第四次數據標注產業供需對接會暨央企走進國家數據標注基地(保定)舉行

    算力與綠電協同:中金數據烏蘭察布打造中國源網荷儲一體化零碳算力標桿

    2025數據服務業發展研討會在京召開

    A股產業互聯網平臺公司高質量發展研討會在京成功舉辦

    • 協會要聞
    • 通知公告
    初爱视频教程完整版免费观看高清