隨著ChatGPT的快速進化吸引了全球網友的眼球,國內廠商也紛紛表示將推出相似的產品。
而在這段時間,隨著“文心一言”開啟測試,除百度外的多家廠商也開啟了AI模型產品的內測,希望可以提供更有競爭力的產品,搶占AI領域市場。
就在今日,鈦媒體從華為內部獨家獲悉,華為公司將發布一款直接對標ChatGPT的多模態千億級大模型產品,名為“盤古Chat”。
據介紹,盤古大模型于2020年11月在華為云內部立項成功。這款“盤古Chat ”預計將于今年7月7日舉行的華為云開發者大會 (HDC.Cloud 2023) 上對外發布以及內測,產品主要面向To B/G政企端客戶。
根據華為公布的一份論文數據顯示,華為盤古PanGu-Σ大模型參數最多為1.085萬億,基于華為自研的MindSpore框架開發。整體來看,PanGu-Σ大模型在對話方面可能已接近GPT-3.5的水平。
據之前的介紹可知,華為盤古大模型于2021年4月正式對外發布,后來又在2022年4月升級到2.0版本。目前,AI大模型中的NLP大模型、CV大模型以及科學計算大模型(氣象大模型)均已被標記為即將上線狀態。
據介紹,這是首個千億參數中文預訓練大模型,CV大模型則首次達到30億參數。盤古CV大模型業界最大CV大模型、首次實現兼顧判別與生成能力、在 ImageNet 上小樣本學習能力上的業界第一;盤古氣象大模型提供秒級天氣預報;紫東.太初是全球首個圖、文、音三模態大模型。
對于盤古大模型定位,華為內部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發揮出模型的性能;三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。
華為云官網顯示,盤古大模型由NLP大模型、CV大模型、多模態大模型、科學計算大模型等多個大模型構成,通過模型泛化,解決傳統AI作坊式開發模式下不能解決的AI規?;?、產業化難題,可以支持多種自然語言處理任務,包括文本生成、文本分類、問答系統等等。
具體的話,盤古NLP大模型首次使用Encoder-Decoder架構,兼顧NLP大模型的理解能力和生成能力,保證了模型在不同系統中的嵌入靈活性。
盤古CV大模型是首次實現模型按需抽取的業界最大CV大模型,首次實現兼顧判別與生成能力,基于模型大小和運行速度需求,自適應抽取不同規模模型,AI應用開發快速落地。
盤古氣象大模型提供秒級天氣預報,借助創新的3DEST網絡結構以及分層時間聚合算法,在氣象預報的關鍵要素和常用時間范圍上精度均超過當前最先進的預報方法,速度相比傳統方法提升1000倍以上。
簡單來說,此次即將發布的盤古Chat基于盤古大模型而來,但盤古模型并不局限于一個小分類,對盤古感興趣的小伙伴可以保持關注。
本文標題: 華為7月7日將發布“盤古Chat”多模態千億級大模型?
本文地址: http://3824dh.com/brand/news-98156d37ae.html
內容均來源于網絡,錯誤糾正或刪除請發郵件,收件郵箱kefu@huangye88.com
2009-2024 黃頁88版權所有 京ICP備2023012932號-1 │ 京公網安備 11010802023561號 京ICP證100626
內容均來源于網絡,錯誤糾正或刪除請發郵件,收件郵箱kefu@huangye88.com