本帖最後由 jckuan 於 2024-4-10 20:51 編輯
聯發科技推出生成式 AI 服務平台 MediaTek DaVinci,支援各類大語言模型,其中更有強大繁體中文大型語言模型MediaTek Research BreeXe,更符合在地使用需求。
隨著生成式 AI 快速進展,業界陸續推出許多相關的大語言模型,各有各的強處,也讓許多行業應用生成式 AI 來提升效率或是創新,也甚至自行建立 AI 平台在企業內部應用。然而現行各種大語言模型在某些地方仍有不足,特別是臺灣的用詞與用字習慣。
聯發科技 MediaTek DaVinci 生成式 AI 內建豐富功能有效提升工作效率
以開發半導體產品為主的聯發科技(MediaTek),其實甚早就投入 AI 領域,也開發出在企業內部應用的生成式 AI 服務框架,目前已成為各部門日常應用的服務。為了讓更多人可以使用此平台,聯發科技正式向外推出 MediaTek DaVinci AI 服務平台,更加入由聯發創新基地發表平台上最新的強大繁體中文大型語言模型 MediaTek Research BreeXe (以下簡稱MR BreeXe)。
(左起)聯發科技人工智慧暨數據工程處副處長楊建洲、聯發科技人工智慧暨數據工程處協理葉家順、聯發創新基地負責人許大山博士、聯發創新基地資深技術經理陳宜昌
MediaTek DaVinci 是基於聯發科技生成式 AI 服務框架(GAI Service Framework,GAISF)所開發,原本是為集團內部打造具資料安全性、提高生產力的生成式 AI 工具,在各部門廣泛使用後,已發展成可供外部企業導入的生成式 AI 服務平台與豐富的生態系。目前已有數十家高科技、金融、電信、法律、製造、銷售、服務、系統整合、雲端服務等行業的企業,還有教育機構與新創公司等加入MediaTek Davinci 生態系。
MediaTek Davinci 是一個具高整合度與擴展性的開放平台,讓開發者可為各行業客製化生成式 AI 擴充外掛、助理等應用。即企業能在資料安全的環境下,善用平台的豐富工具提高生產力與競爭力。
高科技產業加入 MediaTek Davinci 生態系
MediaTek Davinci 支援各類大語言模型,包括不斷更新的版本,更支援聯發創新基地最新釋出的繁體中文大語言模型「MR BreeXe」。MR BreeXe 是以 Mixtral 8x7B 模型為基礎,繼承 Mixtral 多專家模型特有的節省運算資源、較高效能的優勢,再加上聯發創新基地的預訓練(pre-training)之後,不僅在繁體中文測試項目(TMMLU+、MT Bench TW)超越 GPT-3.5,更針對臺灣常見的地端應用特別進行改進,提升產業界使用生成式 AI 與檢索增強生成(RAG)的體驗。MR BreeXe 於 NVIDIA 的 Taipei-1 GPU 超級電腦 DGX H100 進行訓練,透過 MediaTek Davinci,支援全地端與部分地端的環境,並可依需求進行多樣本學習(few-shot learning)甚至微調(fine-tuning)來客製化。
不同行業加入 MediaTek Davinci 生態系
聯發科技人工智慧暨數據工程處協理葉家順表示:「MediaTek DaVinci 解決許多企業在採用生成式 AI 的問題,讓各行各業在確保資訊安全的環境下,可善用已有強大基礎的平台開發專屬的生成式 AI 應用。隨著更多企業與開發者加入 MediaTek Davinci 生態系,相信 MediaTek DaVinci 將會持續爆發性成長,成為企業的得力助手。」
聯發創新基地負責人許大山博士表示:「MediaTek Research BreeXe 繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,是現今繁體中文能力最強的語言模型,加上與 MediaTek Davinci 搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。」
|