找回密碼註冊
作者: Kimi
查看: 2649
回復: 0

文章標籤:

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

GEX PRO 850W玩家開箱體驗分享活動

卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

打印 上一主題 下一主題

[業界新聞] IBM推出新一代企業AI模型Granite 3.0 開啟「小模型 ‧ 高性能」時代

[複製鏈接]| 回復
跳轉到指定樓層
1#
Kimi 發表於 2024-10-24 11:40:53 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式


新的Granite 3.0 8B與2B 語言模型 具備高性能、透明度與安全性
搭配企業數據 在特定任務場景 展現優異性價比


Granite_icon_960x720.jpg

圖說:IBM發表自家旗艦級AI模型系列第三代 Granite 3.0 (花崗岩3.0),開啟企業級AI「小模型 ‧ 高性能 ‧ 低成本」的新時代。IBM 表示,在特定企業任務啟用小型 Granite模型,搭配企業自有數據,加上使用 IBM 與 RedHat 在今(2024)年五月推出的革命性對齊技術InstructLab,企業可獲得的效能與使用其他大型模型相同,但成本大幅降低約3倍至23倍。


【2024年10月22日,台北訊】 IBM 在美國時間10月21日舉行的TechXchange 年度技術大會上,發表了自家旗艦級模型系列第三代 Granite 3.0;它經由寬鬆的Apache 2.0許可發布,在眾多學術與行業評比測試中,均超越或與類似規模的競者模型並駕齊驅,展現了優異的性能、建模彈性、透明度與安全性。

此次發布的IBM Granite 3.0系列模型包括:
  • 通用/語言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • 護欄與安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • 專家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base




IBM Granite 3.0系列模型的主要特點:


  • 適合性:許多大語言模型(LLM)是基於可用的公開數據訓練而成;絕大多數的企業內部數據未被使用。Granite 3.0 8B與2B被設計為企業級AI的主力模型,可為檢索增強生成(RAG)、分類、摘要、實體提取、工具使用等企業任務,提供強大的性能。這些小巧、多功能模型可以根據企業數據進行微調,與業務場景或工作流程無縫整合。


  • 性能:在Hugging Face的OpenLLM排行榜評比測試中,Granite 3.0 8B Instruct模型的整體性能,平均領先Meta與Mistral類似大小的開源模型的最佳性能。在 IBM 的AttaQ 安全評比測試中,上述模型在所有受測的安全維度裡,表現均優於Meta與Mistral的模型。

    在這次發布裡,還有專家混合架構(Mixture of Experts, MOE)Granite 3.0 1B-A400M與Granite 3.0 3B-A800M,這些較小型、輕量級的模型可建置在傳統CPU伺服器,用於低延遲應用程式,兼顧性能與推理成本的完美平衡。

    IBM還發布了預訓練 Granite 時間序列模型的更新版本。這些新模型基於多三倍的數據量訓練,具備更高的建模彈性、支持外部變量與滾動預測。在三個主要時間序列模型評比中,Granite 的性能超越了Google、阿里等規模大十倍的模型。


  • 成本:在特定任務上啟用小型 Granite模型,搭配企業自有數據,加上使用 IBM 與 RedHat 在今(2024)年五月推出的革命性對齊技術InstructLab,企業獲得的效能與使用其他大型模型相同,但成本大幅降低。(根據數個早期概念驗證案例進行的成本分析結果顯示,成本減少約3至23倍)


  • 透明度:Granite 3.0技術報告負責任使用指南,均詳細描述了訓練這些模型的數據集、所採用的數據過濾、清洗與處理步驟;並詳列它們在主要學術與行業評比測試裡的性能結果。


  • 法律保障:IBM 為watsonx.ai 平台上的所有Granite 模型提供智慧財產權賠償保證,強化企業客戶採用此模型的信心。


  • 安全性:IBM 推出新的 Granite Guardian 模型系列,應用開發人員可以透過檢查使用者提示與LLM回應來建置「安全護欄」,提前發現各種風險。Granite Guardian 3.0 8B與2B模型,提供了目前市面上最完整的風險與危險檢測功能;也可與任何其他開放或專用的AI模型共同使用,強化AI安全保護機制。


  • 負責任:除了偏見、仇恨、髒話、褻瀆、暴力、嘗試破解限制等AI危害指標,Granite Guardian模型還提供了獨有的RAG特定檢查,例如是否基於事實、與上下文的相關性、與答案的相關性等。在針對安全性與RAG標準的19項廣泛測評中,Granite Guardian 3.0 8B模型對於危害檢測的整體準確性,平均優於Meta既有三個版本的Llama Guard 模型;它接受幻覺檢測的整體表現,也與專門用於幻覺檢測的模型WeCheck和MiniCheck相當。


  • 包容性:Granite 3.0 模型使用超過12萬億個標記的數據量訓練而得;數據來自12種不同的自然語言,與116種不同的程式語言,採用了新式的兩階段訓練方法,引用了數千個優化數據品質、數據選擇、與訓練參數的實驗結果。預計到今(2024)年底前,Granite 3.0 8B與2B模型將支持擴展到128K上下文窗口和多模型文件理解能力。


  • 開放性:全Granite 3.0模型組與更新版的時間序列模型,均可在HuggingFace上根據寬鬆的Apache 2.0許可證下載。新的 Granite 3.0 8B 和 2B 語言模型的指令變項、以及 Granite Guardian 3.0 8B 和 2B 模型,已在 IBM watsonx 平台商用。部分 Granite 3.0 模型也將作為 NVIDIA NIM 微服務提供,並通過 Google Cloud 的 Vertex AI Model Garden與 HuggingFace 的整合提供。

    為了向開發人員提供多種選擇和易用性,並支持本地和邊緣應用,精選的 Granite 3.0 模型也可在 Ollama 和 Replicate 上取得。新一代 Granite 模型擴充了 IBM 強大的開源 LLM 目錄:IBM 與 AWS、Docker、Domo、Qualcomm Technologies Inc.(通過其 Qualcomm® AI Hub)、Salesforce、SAP合作夥伴合作,將多種 Granite 模型整合在它們的產品裡或平台上。



IBM 同時宣佈將 Granite 3.0 設定為 IBM Consulting Advantage AI賦能服務平台上的預設AI模型。全球16萬位 IBM 諮詢顧問可以在各種客戶應用場景裡,如客戶服務或IT現代化,輕鬆方便地應用Granite 模型,更敏捷、高效、經濟地為客戶提供商業價值。


瞭解關於 Granite 和 IBM 企業級AI策略,請造訪 https://www.ibm.com/granite


關於 IBM
IBM 是全球領先的混合雲、人工智慧及企業諮詢服務的提供者,為全球超過 175 個國家的客戶服務,協助其從擁有的資料裡獲取商業洞察、簡化業務流程、降低成本,並取得產業競爭優勢。 來自金融服務、電信和健康醫療等關鍵基礎設施領域、超過4千家政府和企業機構,採用 IBM 混合雲平台和 Red Hat OpenShift 解決方案,快速、高效、安全地實現企業數位轉型。IBM 在人工智慧、量子運算、產業專屬的雲端運算解決方案和企業諮詢服務領域的突破性創新,為客戶提供開放和靈活的選擇。IBM 對企業誠信、透明治理、企業社會責任、多元與包容文化和服務精神的承諾,歷久彌新,是 IBM 業務發展的基礎。



您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-12-4 03:31 , Processed in 0.115822 second(s), 68 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表