未來大模型：更多能更輕量更親民-中國信息化?中國信息協會

未來大模型：更多能更輕量更親民

來源：科技日報作者：發布時間： 2024-04-25

去年起，全球掀起以大模型為代表的生成式人工智能行業浪潮，人工智能邁向全面應用新階段。國外以OpenAI、微軟為代表，谷歌、Meta等巨頭一個不落，國內頭部科技企業則悉數入場。

近日，國家數據局局長劉烈宏表示，中國10億參數規模以上的大模型數量已超100個，行業大模型深度賦能電子信息、醫療、交通等領域，形成上百種應用模式，賦能千行百業。

大模型技術日新月異，產業化腳步追星趕月。在這個熱鬧夾雜爭議的行業，不同的技術路線和選擇正在延展開來。

多模態正成標配

360集團董事長周鴻祎在關于2024大模型發展的十大趨勢判斷中明確表示，多模態將成為大模型標配。未來，大模型不僅能聽會說，還能看懂圖片和視頻，更能識別理解。

中國科學院自動化研究所研究員劉靜在《GPT-4對多模態大模型在多模態理解、生成、交互上的啟發》一文中談到，模態是指表達或感知事物的方式，例如人類的聽覺、視覺、觸覺等。在人工智能領域，多模態是指利用多種模態的信息來進行感知和理解。多模態技術可以讓機器同時接收并處理不同模態信息，如文本、圖像、音頻等，從而提高機器感知和理解能力。

劉靜進一步解釋，相比傳統的單模態大模型，多模態大模型更加符合人類的多渠道認知方式。它能將不同模態信息相互補充，提高信息的完整性和準確性，從而更好地應對復雜環境、場景和任務。如在語音識別中，多模態大模型可以結合語音和文本信息，讓機器更準確地識別和理解語音內容。在圖像識別中，圖像和文本信息的結合可以讓機器更深入地理解圖像內容。

劉靜介紹，落實到應用層面，多模態能使機器更好地理解人類的意圖和需求，提供精準、個性化服務。例如，在目前智能技術已經深入落地的客服領域，多模態大模型可以根據用戶的文本和語音信息，綜合理解用戶問題并提供解決方案。在智能家居領域，多模態大模型通過與智能家居設備的交互，可以根據用戶需求智能調整家居環境。在醫療領域，多模態大模型則可以融合醫學圖像、病歷文本等信息，輔助醫生進行疾病診斷、制定治療方案。

結合國內大模型產業布局，多模態大模型是近年主流廠商普遍選擇的發力方向。如“紫東太初”2.0全模態大模型可實現文本、圖片、語音、視頻、3D點云、傳感信號等不同模態的統一表征和學習。

落地應用越來越“輕”

為提升大模型性能、增進用戶體驗，大模型正以肉眼可見的速度越來越“大”。開源模型的參數從幾百億增加到幾千億，閉源模型也在沿著尺度定律路徑不斷升級，在千億參數的基礎上向著萬億參數攀登。但與此同時，人工智能產業算力吃緊，難以滿足大模型參數規模的指數級增長。

為加速大模型落地應用，人工智能領域正嘗試對大模型進行輕量化，通過打造更小型、更高效、成本更低的模型吸引行業客戶，讓模型在更廣泛的場景有更高應用價值。

大模型輕量化通過降低模型的計算復雜度和內存占用，實現模型性能與資源消耗的平衡。這不僅有助于提高計算效率，降低運行時資源消耗，還可以減輕計算系統的硬件和軟件壓力，提高系統的可靠性和穩定性。此外，輕量化還有助于提高模型部署的靈活性和可擴展性，為模型在各種場景下的應用提供更多可能性。

輕量化主要通過模型壓縮來實現。模型壓縮是指在不降低模型性能的前提下，減小模型的計算復雜度和內存占用。模型壓縮的方法有很多，剪枝、低秩分解等是業界常用的方法。具體來看，剪枝是指刪除一些不必要或冗余的參數，低秩分解是指將高維數據或高維模型分解為低維數據或低維模型。這些方法都是通過降低模型的復雜度，減少參數和計算量，來達到讓模型“更輕”的目的。

輕量化不僅有助于提高計算效率，降低運行時資源消耗，還可以減輕計算系統的硬件和軟件壓力，提高系統的可靠性和穩定性。

對于通用大模型服務垂直領域、行業大模型落地應用來說，輕量化更是關鍵步驟——通過合理的數據準備、模型選擇、超參數設置和訓練驗證過程，可以使模型更好地適應特定領域，提高模型性能。

聯想集團副總裁、聯想研究院技術戰略與創新平臺總經理王茜鶯曾表示，用好大模型主要有三個要素，第一是場景化，第二是隱私化，第三是輕量化。輕量化不僅是將個人大模型進行壓縮并部署到用戶設備上，還包括企業內部的輕量化，甚至云端的輕量化。輕量化意味著使用成本的降低。

端側成廠商新“角力場”

去年以來，大模型正逐步走向“智能終端側”，國內外一些廠商紛紛宣布加速推進大模型在移動終端的部署。端側大模型，正成為行業熱詞。

所謂端側，是指模型服務不部署在云端，而直接存儲在終端內部的芯片中，利用芯片算力生成結果。這樣的大模型服務不需要聯網，數據也不需要被上傳到云端。

相比于云端大模型，端側大模型的優勢主要在于：無需云端處理信息，安全隱私性更好；不消耗云成本，高頻使用下的成本更可控；弱網和無網環境下也可以使用，用戶無需擔心云端服務器宕機，交互體驗更穩定。

中國工程院院士鄔賀銓表示，通過模型壓縮和定制人工智能芯片提升算力，將具有百億參數大模型的推理能力嵌入手機，可以提供低成本、低時延、高安全的智能助手服務。

相比ChatGPT、Midjourney等人工智能應用依賴云端服務器提供服務，端側大模型主打在本地實現智能化。甚至有廠商提出，讓每個人在手機上都擁有“個人大模型”。

目前，在中國手機市場份額排名前五的企業中，除了蘋果公司，其余均已發布自有端側大模型產品。手機廠商提出的包括通話記錄自動生成、人工智能圖像處理等應用場景，日漸成為消費者的日常。

端側大模型同樣是個人電腦產品發布時的高頻詞。在相關宣傳中，端側大模型不僅能夠提升日常使用及辦公效率，還是保護隱私和數據安全的最優解。

艾媒咨詢CEO兼首席分析師張毅表示，人工智能可能成為今年度的手機新賣點，尤其是手機的社交價值功能呈現方面，將有更多故事可講。對于手機廠商而言，大模型是公認的未來發展賽道和方向。盡管現在人工智能在智能手機終端的應用仍較為初級，但未來的普及和推廣仍值得期待。

不過，現有技術條件下，要做好端側大模型并不容易。目前條件下，手機性能遠遠不足以支撐大模型運行。對于大模型來說，參數量是模型能力的直觀體現，如今云端大模型的參數量均在千億級別，而手機端最高參數規模則不過百億。

聯想集團董事長兼CEO楊元慶認為，未來十年是人工智能的十年，人工智能將改造所有業務。將來人人都會有自己的智能體，后者通過交互學習越來越懂用戶，最終成為每個人的“人工智能雙胞胎”。

但他也不諱言市場的不確定性。在他看來，內置個人智能體需要更高配置，如果這些對用戶不是剛需，可能就不需要這么高配置。

國際數據公司認為，未來人工智能終端將在創作與創意、游戲和虛擬世界、語音合成與轉換、視覺和圖像處理、聊天機器人等十大領域廣泛落地發展。（記者崔爽）

地方動態

第四次數據標注產業供需對接會暨央企走進國家數據標注基地（保定）舉行

算力與綠電協同：中金數據烏蘭察布打造中國源網荷儲一體化零碳算力標桿

2025數據服務業發展研討會在京召開

A股產業互聯網平臺公司高質量發展研討會在京成功舉辦

協會要聞
通知公告


關注中國信息協會官微	關注中國信息化網官微