Google發表超強大AI模型「Gemini」!工程師:全方位輾壓GPT-4
image source:YouTube/Google
文/林子洵
Google(谷歌)近日推出新的生成式AI模型「Gemini」,將其分為Ultra、Pro和Nano三種不同的版本來適應不同的用戶需求,將整合進旗下的聊天機器人「Bard」並支援 Pixel 8 Pro。
Google的AI工具
Google近幾年來都在開發自己的AI工具,今年OpenAI發布ChatGPT,Google同時也開發出聊天機器人「Bard」。不過,ChatGPT當時引起全球關注、成為最受歡迎的生成式AI,Google經過半年後推出「Gemini」,聲稱比起GPT-4更好,更強大。
Gemini是什麼?
Gemini和ChatGPT一樣是大型語言模型(LLM),能夠透過分析大量資料(包括維基百科、數位書籍和網路論壇文章等)來學習。而語言模型會透過識別文本中的模式,最終自己生成文本。也代表著Gemini可以寫論文,也能寫程式,還能夠進行對話。
三種不同強度的版本
Gemini有三種不同強度的版本,最強的「Ultra」專為資料中心和企業應用程式等較為複雜的任務所設計;中端的「Pro」則是和Bard整合,也能讓使用者一起應用到許多Google服務中;最後是「Nano」版本,包括18億參數的Nano-1和32.5億參數的Nano-2,該版本專為終端設備設計,將會使用在智慧型手機中使用,可以摘要錄音,也能在WhatsApp中提供建議文字回應。
對比GPT-4 工程師:全方位輾壓
Google的工程師達斯(Debarghya Das)在推特上表示,Gemini Ultra在性能和效率上都比其他生成式AI模型強大,包含驅動ChatGPT的GPT-4。
Google官方也公布評分,表示Gemini從自然圖像、音訊、視訊理解等 32 項 AI 基準測試中,有 30 項的評分超越了 OpenAI 的 GPT-4V(今年10月推出),尤其是在文本、常規推理、數學、程式碼等領域,Gemini的表現幾乎是全方位碾壓OpenAI的GPT-4。
Gemini優勢
Gemini打破了只能單一領域的限制。Google從一開始就對Gemini實施多項訓練,包括使用代碼、圖像(表情符號)、影像、音訊(語言)等,因此Gemini無論是文字分析、圖片辨識,都能夠提供精準的解析,並且,除了能夠生成文字之外,還能夠識別圖片和聽音訊。
跟不上最新話題、聽不懂網路流行語?
小孩子才慢慢爬文搜尋!
聰明人都在訂閱【網路溫度計Line Notify】
一鍵就訂閱,話題不漏接:https://dvi.pse.is/57yrmg
想要租屋買房嗎?快來【房產溫度計】
給你完整的房市知識:https://linktr.ee/housedailyview