国产精品毛片完整版,理性免费观看电视剧高清影院,红杏亚洲影院一区二区三区,中文字幕一区二区三区日韩

超越谷歌微軟，阿里達摩院AI預訓練模型M6參數規模破10萬億

2021-11-08 18:32

11月8日消息，阿里巴巴達摩院公布多模態大模型M6最新進展，其參數已從萬億躍遷至10萬億，規模遠超谷歌、微軟此前發布的萬億級模型，成為全球最大的AI預訓練模型。同時，M6做到了業內極致的低碳高效，使用512塊GPU在10天內即訓練出具有可用水平的10萬億模型。相比去年發布的大模型GPT－3，M6實現同等參數規模，能耗為其1％。

超越谷歌微軟，阿里達摩院AI預訓練模型M6參數規模破10萬億

【什么是超大規模預訓練模型】

目前，人工智能正迅速普及并應用到人們的日常生活，但仔細觀察會發現，這些技術主要集中在“感知層面”，比如聽覺、視覺等。但需要外部知識、邏輯推理的“認知層面”，人工智能尚處于初級階段。

“認知智能”被認為是下一代人工智能的關鍵性突破。而超大規模預訓練模型則被認為是認知智能的基礎設施。

當前，企業應用AI技術面臨前期投入大、開發時間長等痛點，AI技術高昂的使用門檻將絕大多數企業拒之門外。Gartner的研究報告顯示，37％的企業已經或即將部署AI模型，但仍有大量中小企業未享受到人工智能技術帶來的利好。大規模預訓練模型的出現或將徹底改變人工智能的應用現狀。

大規模預訓練模型基于復雜的預訓練目標和龐大的模型參數，將豐富的知識存儲到大量參數的隱式編碼中，使其能夠完成多種下游任務，即便是新任務，也能夠通過動態學習來完成。

借助大規模預訓練模型，企業應用AI技術的前期投入將大幅下降，其不再需要前期就投入大量資金和時間研發定制化模型。

2020年8月，GPT－3模型的面世可謂人類AI史的里程碑事件。GPT－3是美國非盈利機構OpenAI發布的GPT第三代模型，被譽為“最接近通用人工智能”的模型。GPT－3不僅支持多種不同類型的任務，包括改語法錯誤、寫文章（寫詩）、聊天、算數、答題、翻譯等，還能夠通過小樣本動態學習，解決從未遇到過的任務，從而具備成為通用解決方案的能力。

【阿里達摩院的超大規模多模態預訓練模型M6】

鑒于大規模預訓練模型的強大與高效，國內頭部科研機構如阿里、華為、智源研究院也都先后發布了自研的大規模預訓練模型。

其中，M6是由阿里達摩院聯合清華大學研發，中國首個萬億參數的超大規模多模態預訓練模型。

超越谷歌微軟，阿里達摩院AI預訓練模型M6參數規模破10萬億