Google I/O 2023:AI技術大爆發從Gemini到Google Beam全新功能亮相
Google Gemini功能大升級
Google推出了Gemini應用程式的新功能,包括Gemini Live和Gemini Deep Research。Gemini Live現在整合了Project Astra的鏡頭和螢幕分享功能,並已開放予Android及iOS用戶,未來還將引入Google搜尋。此外,Gemini App新增了個人化功能,允許用戶上載自己的檔案,並即將支持與Google Drive和Gmail的連接。
Gemini Live功能更進一步提供相機和螢幕分享功能,允許用戶與Google應用程式無縫互動。全新的「代理模式」(Agent Mode)也在Gemini應用程式中亮相,幫助用戶更高效地完成任務,例如直接在第三方網站進行搜尋和預約。
Google搜尋AI模式更智慧
Google搜尋透過AI技術進行升級,推出了AI摘要(AI Overviews)和全新的AI模式(AI Mode)。用戶可以提出更長、更複雜的問題,並通過Project Astra進行即時搜尋。新模式還帶來了線上購物與虛擬試穿體驗,並將率先在美國推出,採用Gemini 2.5版本模型。
Gemini 2.5模型進一步突破
Google的Gemini 2.5模型進行了重大升級,推出了Flash和Pro版本。Flash版本在推理能力、多模態處理和程式碼生成方面表現出色,而Pro版本則導入了「深度思考」(Deep Think)模式,強化了平行思考技術。
生成式媒體模型開創新可能
Google推出了新一代生成式媒體模型,包括影片模型Veo 3和圖像生成模型Imagen 4,並整合至Gemini應用程式。透過「Flow」工具,影片製作者可以創作具有電影質感的短片,甚至將短片延伸為更長的片段。
Gmail個人化智能回覆功能
Gmail新增了「個人化智能回覆」功能,利用Gemini模型的情境資訊生成回覆。這項功能可以幫助用戶搜尋郵件、雲端檔案和Google文件,生成符合用戶語氣和風格的回覆,讓溝通更加高效。
Google Beam與HP合作,3D視訊技術再升級
Google Beam是基於AI技術的新視訊通訊平台,採用6個鏡頭陣列和最新影片模型,能將2D影片串流轉化為逼真的3D體驗。首批Google Beam裝置預計今年稍後推出,並與HP合作開發。
此外,Google Meet也新增了即時翻譯功能,支持英語和西班牙語的Beta測試版,未來幾週將陸續支援更多語言。這項技術還能捕捉說話者的聲音、語氣和表情,提供更自然的跨語言對話。
「Gemini Live現已整合Project Astra的鏡頭和螢幕分享功能,應用層面既有趣亦廣泛。」
「Gemini App可與Canvas整合,只需一鍵即可建立各種檔案。」
「Google Beam採用最先進的影片模型,能將2D影片串流轉換為逼真的3D體驗。」