在5月舉行的開發者大會上Google首次透露其正在開發的AI大模型Gemini,時隔7個月,Gemini終於來了。
根據Google官方消息,Google日前正式發布Gemini 1.0,這是Google迄今為止構建的最強大、最通用、最靈活的模型。據介紹針對不同場景,Google發布了三種不同版本:
Gemini Ultra: Google規模最大且功能最強大的模型,適用於高度複雜的任務。
Gemini Pro:適用於各種任務的最佳模式。
Gemini Nano:手機等設備最高效的模型。
Google也將Gemini與OpenAI的GPT-4進行了比較,除了HellaSwag資料集外,Gemini其它測試全面領先GPT-4。官方表示從自然影像、音效和影片理解到數學推理,在被大型語言模型(LLM)研究和開發中廣泛使用的32項學術測試中,Gemini Ultra的性能有30項都超過了目前最先進的水平。
Gemini Ultra以90.0%得分成為第一個在MMLU(大規模多任務語言理解)測試中超過人類專家的模型, MMLU綜合使用了數學、物理、歷史、法律、醫學和倫理等57個科目,用於測試世界知識和解決問題的能力。
在新的MMMU測試中Gemini Ultra也取得了59.4%的成績,該測試由橫跨不同領域、需要仔細推理的多模態任務組成。據悉Gemini 1.0有複雜多模態推理能力,可協助理解複雜的書面和視覺訊息,在海量資料中發掘難以辨別的知識內容。
Google稱Gemini 1.0經過訓練,可以同時便是並理解文字、圖像、音訊等,因此它能更好地理解具有細微差別的訊息,回答與複雜主題相關的問題,尤其擅長解釋數學和物理等複雜科目中的推理。
在編碼能力上第一代Gemini可以理解、解釋和產生世界上最受歡迎的程式語言(如Python、Java、C++和Go)的高品質程式碼。根據Google介紹Bard將使用Gemini Pro的微調版本來進行更高級的推理、規劃和理解等,將在170多個國家和地區提供英語服務,併計劃在未來擴展不同的模態,並支持新的語言和地區。
另外 Google也將在GooglePixel上使用Gemin,Pixel 8 Pro是首款搭載Gemini Nano的智慧型手機,將支援錄音應用程式中的總結等新功能,並在Gboard中推出智慧型回覆功能。
未來幾個月Gemini將應用於Google搜尋、廣告、Chrome和Duet AI。從12月13日開始,開發者和企業客戶可透過Google AI Studio或Google Cloud Vertex AI中的Gemini API取得Gemini Pro。
對於Gemini,Google表示這是AI發展過程中的一個重要里程碑,也標誌著Google邁進新紀元的開始。
消息來源 |