Google I/O 2023：AI技術大爆發從Gemini到Google Beam全新功能亮相

Google I/O開發者大會已在網上舉行，由Google及Alphabet行政總裁Sundar Pichai主持，展示了一系列令人興奮的AI技術和產品升級，旨在將AI研究成果融入日常生活，提供更智能、更個人化的體驗。

Google Gemini功能大升級

Google推出了Gemini應用程式的新功能，包括Gemini Live和Gemini Deep Research。Gemini Live現在整合了Project Astra的鏡頭和螢幕分享功能，並已開放予Android及iOS用戶，未來還將引入Google搜尋。此外，Gemini App新增了個人化功能，允許用戶上載自己的檔案，並即將支持與Google Drive和Gmail的連接。

Gemini Live功能更進一步提供相機和螢幕分享功能，允許用戶與Google應用程式無縫互動。全新的「代理模式」（Agent Mode）也在Gemini應用程式中亮相，幫助用戶更高效地完成任務，例如直接在第三方網站進行搜尋和預約。

Google搜尋AI模式更智慧

Google搜尋透過AI技術進行升級，推出了AI摘要（AI Overviews）和全新的AI模式（AI Mode）。用戶可以提出更長、更複雜的問題，並通過Project Astra進行即時搜尋。新模式還帶來了線上購物與虛擬試穿體驗，並將率先在美國推出，採用Gemini 2.5版本模型。

Gemini 2.5模型進一步突破

Google的Gemini 2.5模型進行了重大升級，推出了Flash和Pro版本。Flash版本在推理能力、多模態處理和程式碼生成方面表現出色，而Pro版本則導入了「深度思考」（Deep Think）模式，強化了平行思考技術。

生成式媒體模型開創新可能

Google推出了新一代生成式媒體模型，包括影片模型Veo 3和圖像生成模型Imagen 4，並整合至Gemini應用程式。透過「Flow」工具，影片製作者可以創作具有電影質感的短片，甚至將短片延伸為更長的片段。

Gmail個人化智能回覆功能

Gmail新增了「個人化智能回覆」功能，利用Gemini模型的情境資訊生成回覆。這項功能可以幫助用戶搜尋郵件、雲端檔案和Google文件，生成符合用戶語氣和風格的回覆，讓溝通更加高效。

Google Beam與HP合作，3D視訊技術再升級

Google Beam是基於AI技術的新視訊通訊平台，採用6個鏡頭陣列和最新影片模型，能將2D影片串流轉化為逼真的3D體驗。首批Google Beam裝置預計今年稍後推出，並與HP合作開發。

此外，Google Meet也新增了即時翻譯功能，支持英語和西班牙語的Beta測試版，未來幾週將陸續支援更多語言。這項技術還能捕捉說話者的聲音、語氣和表情，提供更自然的跨語言對話。

「Gemini Live現已整合Project Astra的鏡頭和螢幕分享功能，應用層面既有趣亦廣泛。」
「Gemini App可與Canvas整合，只需一鍵即可建立各種檔案。」
「Google Beam採用最先進的影片模型，能將2D影片串流轉換為逼真的3D體驗。」