Google I/O 2023:AI技術大爆發從Gemini到Google Beam全新功能亮相

科技新聞

廣告

Google I/O開發者大會已在網上舉行,由Google及Alphabet行政總裁Sundar Pichai主持,展示了一系列令人興奮的AI技術和產品升級,旨在將AI研究成果融入日常生活,提供更智能、更個人化的體驗。

Google Gemini功能大升級

Google推出了Gemini應用程式的新功能,包括Gemini Live和Gemini Deep Research。Gemini Live現在整合了Project Astra的鏡頭和螢幕分享功能,並已開放予Android及iOS用戶,未來還將引入Google搜尋。此外,Gemini App新增了個人化功能,允許用戶上載自己的檔案,並即將支持與Google Drive和Gmail的連接。

Gemini Live功能更進一步提供相機和螢幕分享功能,允許用戶與Google應用程式無縫互動。全新的「代理模式」(Agent Mode)也在Gemini應用程式中亮相,幫助用戶更高效地完成任務,例如直接在第三方網站進行搜尋和預約。

Google搜尋AI模式更智慧

Google搜尋透過AI技術進行升級,推出了AI摘要(AI Overviews)和全新的AI模式(AI Mode)。用戶可以提出更長、更複雜的問題,並通過Project Astra進行即時搜尋。新模式還帶來了線上購物與虛擬試穿體驗,並將率先在美國推出,採用Gemini 2.5版本模型。

Gemini 2.5模型進一步突破

Google的Gemini 2.5模型進行了重大升級,推出了Flash和Pro版本。Flash版本在推理能力、多模態處理和程式碼生成方面表現出色,而Pro版本則導入了「深度思考」(Deep Think)模式,強化了平行思考技術。

生成式媒體模型開創新可能

Google推出了新一代生成式媒體模型,包括影片模型Veo 3和圖像生成模型Imagen 4,並整合至Gemini應用程式。透過「Flow」工具,影片製作者可以創作具有電影質感的短片,甚至將短片延伸為更長的片段。

Gmail個人化智能回覆功能

Gmail新增了「個人化智能回覆」功能,利用Gemini模型的情境資訊生成回覆。這項功能可以幫助用戶搜尋郵件、雲端檔案和Google文件,生成符合用戶語氣和風格的回覆,讓溝通更加高效。

Google Beam與HP合作,3D視訊技術再升級

Google Beam是基於AI技術的新視訊通訊平台,採用6個鏡頭陣列和最新影片模型,能將2D影片串流轉化為逼真的3D體驗。首批Google Beam裝置預計今年稍後推出,並與HP合作開發。

此外,Google Meet也新增了即時翻譯功能,支持英語和西班牙語的Beta測試版,未來幾週將陸續支援更多語言。這項技術還能捕捉說話者的聲音、語氣和表情,提供更自然的跨語言對話。

「Gemini Live現已整合Project Astra的鏡頭和螢幕分享功能,應用層面既有趣亦廣泛。」
「Gemini App可與Canvas整合,只需一鍵即可建立各種檔案。」
「Google Beam採用最先進的影片模型,能將2D影片串流轉換為逼真的3D體驗。」