2024神回顧/除了ChatGPT還有誰值得入手?年度十大AI工具揭曉
數據分析、圖像生成、語音識別,AI為各行各業開啟無限可能,究竟2024年受到網友高度關注的AI工具又有哪些呢?
擁有這些AI工具,就能掌握未來科技脈動!
在你的日常生活之中,曾接觸到哪些實用的AI工具呢?《網路溫度計DailyView》透過《KEYPO大數據關鍵引擎》輿情分析軟體,帶你盤點2024年十大AI工具究竟有哪些值得你入手。
AI(Artificial Intelligence)就是我們所熟知的人工智慧,為了因應各行各業的需求,AI技術不斷與時俱進,不僅在數據分析、圖像生成、語音識別上提升效率並創造更多可能性,同時也迅速改變陳舊的生活與工作模式,幫助人類簡化問題、解決問題,將寶貴的時間留在開發產品、激發創意上。例如美國科技公司OpenAI近期公佈AI影片生成模型Sora,只要使用簡單的文字、影像或影片就能讓想像力變成現實,還能使用Remix功能替換、刪除影片中的元素,不僅首波開放ChatGPT訂閱用戶使用,今年12月17日起在官網也能搶先體驗。想要掌握今年科技浪潮,開啟智慧高效的運作方式,那就趕快跟著小編繼續看下去吧!
No.10 DALL-E
2021年初由OpenAI開發的圖像生成工具DALL-E,結合動畫電影《瓦力》(《WALL-E》)、西班牙加泰隆尼亞畫家薩爾瓦多達利(Salvador Dali)命名,其特點在於能夠透過描述文字創建逼真且高品質圖像,除了現實存在的事物也可以生成不存在的事物,DALL-E均可按照輸入指令生成對應圖片,多種場景、風格與細節設定,非常適合創意設計、廣告策劃與內容製作時使用。
目前除了有創作者將DALL-E生成圖像功能應用於YouTube、TikTok影片示意圖,先前也有網友在Dcard熱烈分享,「微軟推出了自己的AI影像網站Image Creator,可使用DALL-E產生AI影像,輸出的品質非常好」、「Bing的影像建立工具Bing Image Creator大進化了,現在使用最新的DALL-E 3,在生成比以前效果好不少,甚至在部分主題生成上比Midjourney還好」、「如果你是剛接觸AI的朋友,那Bing Image Creator是真的蠻適合的,因為免費,所以對新手來說可以更好的去嘗試,也不怕一開始學習成本太高,對於學生來說也很適合」。
No.9 Suno
如果你是音樂創作者,不知道該從哪裡汲取靈感,不妨可以試試「Suno」這款AI工具!邁克爾舒爾曼(Michael Shulman)、格奧爾格庫奇科(Georg Kucsko)、馬丁卡馬喬(Martin Camacho)與基南弗雷伯格(Keenan Freyberg)曾在人工智慧新創公司Kensho上班,後來四人創立公司並發布生成式人工智慧音樂創作工具Suno,只要使用者提供文字,就能匹配人聲與樂器結合的歌曲,去(2023)年底推出網路應用程式、與微軟合作後受到廣泛關注。
許多網紅今年也特別發文分享,預言「Suno」將帶來歷史性變革,「第一次聽到的時候真的覺得頭皮發麻太扯,這對整個音樂產業無疑會產生巨大影響,AI變革持續發生中」,還有網友試玩後表示,「它是一款生成式的人工智慧音樂創作網站,在免費方案裡可以玩很多變化,一天還可以生成五首歌!我第一次真的玩到一個晚上就沒了」、「最近網路上瘋傳『AI也可以創作歌曲了!』一開始以為說只是簡單地用AI編寫歌詞,並套上基本的旋律,就如過去以往機器人口音唱歌的音樂罷了!於是我就將網路很紅的電子音樂『達拉崩巴』歌詞重新填寫到模組裡面,並設定音樂想要的曲風就產生出新的歌曲!想不到聽起來也蠻有趣的,AI現在的功能真的愈來愈新奇了」。
No.8 Ideogram
有時候透過AI工具生成圖片會發生無法辨識文字的情況,不過如果你擁有「Ideogram」就不必煩惱這個問題!Ideogram為2022年誕生的文本生成圖像模型,利用深度學習方法,將用戶輸入的提示詞描繪成數位圖檔,並且能夠在生成圖像中產生更清晰易讀的文字,今年8月推出的2.0版本,新增現實、設計、3D和動漫等多種風格,同時顯著提升生成文字的絕佳能力。
許多網友對於Ideogram躍躍欲試,紛紛在臉書相關社團分享自己創作的圖片,不僅有網友創作出「義大利麵拌42號混凝土」,還有人生成在書店邊看書邊上廁所的場景,「僅獻給一進書店就想拉屎的同好」,讓其他網友看完後表示,「書香滿溢」、「屎書記載」、「書中自有黃金屋的道理」、「有當年敦南誠品的味道」、「真的不懂為什麼...每次進去就很想上廁所...可是自己明明很喜歡看書呀」。
No.7 Stable Diffusion
Stable Diffusion(簡稱SD)使用最新版本Stable Diffusion XL,三倍大的UNet骨架,只要簡單輸入任何文本就可以生成高質量且逼真圖片,除了可以線上免費使用AI圖像生成器,還可以搜索超過900萬個提示數據。Stable Diffusion與其他AI圖像生成器不同之處在於,它可以使用風格、框架或預設描述輸入文本並輸出圖片,甚至可以透過修復、外繪(擴大圖像大小)來增加或替換圖像部分,培養自由創作能力。
半導體裝置製造商ASML(艾司摩爾)在臉書粉絲專頁歡慶40週年,運用Midjourney、Runway、Stable Diffusion等生成式人工智慧和電腦合成影像技術工具製作而成一支影片,運用1,963個自然語言提示詞、生成7,852幅圖像,最後使用900多台電腦編輯並渲染出雛型影像,展現該品牌不斷突破科技極限、解放人與社會的潛力之精神,在網路上成為關注焦點。
No.6 吐槽大師
今年網友瘋傳的AI工具當然也少不了Monica網站所推出的「吐槽大師-終極AI吐槽生成器」!操作方法非常簡單,只要將個人Instagram、x(Twitter)或Linkedin帳戶的網址貼近吐槽生成器,接著按下「吐槽」按鈕,就會出現個性分析、MBTI、2024年運勢、靈魂人物、人生座右銘等資訊,甚至還會被吐槽大師無情吐槽社群文案內容。此外,Monica AI本身主打整合ChatGPT功能,包含聊天、翻譯、摘要、寫作、製圖到搜索引擎助手、文件與影片閱讀,不論是在電腦還是手機的瀏覽器均可使用。
Monica網站「吐槽大師」曝光後也引來網友試用分享,「蠻好玩的想被嗆的可以玩一下」、「超級好笑,到底在兇幾點」、「我覺得他不是AI吐槽大師,他是說實話大師」、「吐槽大師AI真的很神,用IG貼文就可以分析出人的個性,超準全中」,不過也有部分網友擔憂該款AI工具隱私問題,「私人帳號也能分析也蠻毛」、「只有我覺得AI吐槽大師,很像就是一個誘導你主動餵它資訊的資料蒐集器嗎?甚至還不用像那些脆的機器人一樣提問,你就把所有習慣用語、生活分享、書寫習慣都直接給出去欸」。
No.5 Claude
由Anthropic開發的AI模型「Claude」,標榜遵循關鍵協議減少出錯可能性,並且能抵禦越獄攻擊,幫助企業大規模建立安全AI驅動應用程式,主要強項在於推理、數學、編碼及英語和非英語(如日文、西班牙文)語言流暢度,可以使用於聊天機器人、文案撰寫、自動翻譯、圖表和圖形分析、財務預測、創建生產級代碼並在複雜代碼庫操作,甚至還可以為視障者描述圖像,精確、條理清晰的回應,非常適合拿來使用於創作、問題解答、資料總結和語言學習等,提升學習與工作效率。
今年10月財政部「雲端種樹趣e起集點樹」三期抽獎出現4人連續中獎,對此百萬YouTuber Cheap使用Claude詢問,「有9萬人抽獎,一共三次中獎機會,前兩次有5個中獎名額,最後一次有9個中獎名額,請問同樣的4個人中獎兩次或以上的機率是多少?」,Claude對此回應機率為1/25,602,045,019,537,024,000,000,000,000,000,000,「即使每秒進行一次抽獎持續進行,幾百一年也很難看到這種情況發生一次」,Cheap因此也建議國稅局再調查一次,「機率低到不是統計學可以解釋的」。
No.4 Gemini
大家可能對於「Google助理」並不陌生,Google近年運用AI模型重新打造AI助理「Gemini」,以進階語言理解和推理為基礎,不但提供原有Google助理免持操作功能,還能進行自然交談、傳訊息、協助處理多元任務,例如得到答案、播放歌曲、通話、控制手機、詢問影片內容、查詢Google航班、機票、飯店、天氣和地圖、設定計時器和鬧鐘等,也可以連結Gmail和Google雲端硬碟。不過用戶需注意Gemini回答未必全部精確,可以在回覆內容附上的來源進行Google搜尋查證。
有網友在《mobile01》論壇以「Google搜尋邁入新時代,生成式AI、Gemini模型全面導入!」為題進行分享,當中提到整合Gemini的Google搜尋能夠為問題提供完整計畫,稱為「Planing in Search」,輸入「提供住宿大學生一個低預算、為期7天的微波食品飲食計畫」指令,AI Overview便會在搜尋結果前列出每日飲食計畫,還有對應圖片、烹飪時間,也可以更改推薦內容,讓不少人紛紛留言,「ChatGPT才剛發表完,緊連著Gemini,樂見其成,越來越多好的應用」、「科技真的很進步,讓人嘆為觀止」、「AI無所不在,期待帶來更多樂趣與便利」、「要怎麼保證AI給的搜尋結果正確,AI吃的內容來源AI要怎麼判斷適當,都是未來的問題啊」。
No.3 Midjourney
Midjourney是一款人工智慧圖像生成工具,由大衛霍爾茲(David Holz)帶領的美國加州舊金山同名研究實驗室開發,操作方式也非常簡單,用戶只需要透過Discord平台輸入文字描述,Midjourney就可以生成充滿想像力的插畫、概念藝術、數位設計等視覺作品,同時支援多次生成與細節調整,創意探索與個性化定制,推薦廣告設計、品牌創建及個人藝術表達運用。
喜歡在YouTube頻道評論社會時事的網紅志祺七七經常在影片下方備註「影片中部分影像素材來自Shutterstock、Envato與Midjourney」;先前還有網友在Dcard AI工具交誼廳分享,「今年AI繪圖已經撼動了藝術設計圈,前陣子體驗了一下,覺得Midjourney還是最容易上手的工具,而且圖片產出又高品質,非常適合AI繪圖的新手小白入門」、「說到主流AI繪圖工具當然不能不提到Midjourney,只需要進入Midjourney的線上平台,輸入指令關鍵字就能簡單生成AI影像,製圖速度還超快!過程可能不用佔用到你兩三分鐘。體驗完感想只能說同樣身為藝術工作者,真的好害怕被取代的一天」。
No.2 Copilot
去(2023)年9月微軟公布Microsoft 365 Copilot,集結以GPT-4為核心的大型語言模型(LLM,Large Language Model)和微軟圖形(Microsoft Graph)數據,輔助用戶處理Word、Excel、PowerPoint、Outlook等複雜任務,例如文檔編寫、數據分析、演示設計及電子郵件整理,用戶只需輸入自然語言指令,Copilot即可快速提供建議或生成內容,除了可以取得解答、建議和資訊,也能將心中構想化為驚艷圖片,甚至簡化複雜資訊、潤飾文筆,同時還能和Teams整合,應用於會議記錄、自動化工作等,大幅提升效率。
近期Copilot結合Windows電腦,希望能幫助使用者提高生產力和創造力,也讓「AI電腦」成為當前消費者購買趨勢。有訂閱Microsoft 365的用戶在PTT分享,微軟提供每位用戶一個月60點點數使用Copilot,原PO也曬出Microsoft Designer生成圖片結果,其他鄉民紛紛驚艷表示,「原來可以畫圖喔!我都叫他幫我拉表格」、「已知用火,我記得以前每天都會給免費點數,現在要耗用付費點數了」。
No.1 ChatGPT
2024年受到網路關注的AI工具非「ChatGPT(Chat Generative Pre-trained Transformer,聊天生成預訓練轉換器)」莫屬!2022年首度公開的ChatGPT是一款由OpenAI開發的AI聊天工具,基於GPT-3.5、GPT-4、GPT-4o架構的大型語言模型,同時強化學習訓練。ChatGPT具備多用途自然語言處理能力,適用於內容創作、問題解答、學習輔助和程式輔助等多種場景,甚至還有編寫和除錯電腦程式的能力,用戶只需輸入問題或需求,即可得到清晰且有條理的回應,操作上簡單直觀,針對娛樂、教育、商務和技術等領域有效提升效率、激發創意,幫助用戶快速解決問題並實現目標。
ChatGPT上線2個月就達到上億位使用者加入的里程碑,GPT-3.5目前無須註冊即可免費使用、GPT-4o註冊後可免費限量使用,不過使用上仍然要小心事實準確度,尤其是種族、性別、語言和文化群體不同觀點與態度。網友對於ChatGPT也表示,「取代人的不是AI,是懂得用AI的人,不論男女老少,你一定要玩過ChatGPT。上一世代用網路,下一世代就是用AI了」、「ChatGPT對Excel的整合開啟了一個新的可能性領域。這個強大的組合允許你在Excel表格中執行各種功能——從生成文本和總結訊息到翻譯語言,甚至分析圖像。無論你是在為你的業務起草一個標語、總結長報告,還是從文本中提取數據,ChatGPT for Excel都使這些任務變得輕鬆而高效」。
分析說明
本研究資料由《KEYPO大數據關鍵引擎》輿情分析軟體提供,分析時間範圍為2024年01月01日至2024年12月08日。
《KEYPO大數據關鍵引擎》輿情分析軟體係擁有巨量資料,以人工智慧作為語意分析之工具,每月處理1500億以上中文資料的網路社群大數據資料庫,其內容涵蓋Facebook、YouTube、Threads、TikTok、Instagram、新聞媒體、討論區、部落格等網站。本調查針對討論主題相關文本進行分析,並根據網友就該議題之討論,作為本次主題分析與排序依據。
本文所調查之結果,非參考投票、民調、網路問卷等資料,名次僅代表網路討論聲量大小,不代表網友正負評價。
〖網路溫度計DailyView調查結果之圖文,未經授權請勿轉載、改寫〗