2025 年 Google I/O 開發(fā)者大會剛落下帷幕,毫無疑問,人工智能不僅僅是一項功能,更是 Google 雄心勃勃的未來架構的支柱。這場在山景城舉行的年度開發(fā)者大會,強有力地宣示了 Google 的決心:通過“更加個性化、主動性和強大的”人工智能,開啟一個“探索與奇跡的全新黃金時代”。這一愿景的核心在于將 Gemini 打造成“世界典范”,并打造一個真正的“通用 AI 助手”。
超越語言,邁向“世界模型”
谷歌在人工智能基礎研究方面擁有多年經(jīng)驗,從開創(chuàng) Transformer 架構到開發(fā) AlphaGo 等代理系統(tǒng),如今正專注于擴展其最佳多模態(tài)基礎模型 Gemini 2.5 Pro,使其成為一個“世界模型”。這項雄心勃勃的計劃旨在使 Gemini 具備“像大腦一樣,通過理解和模擬世界的各個方面來制定計劃并想象新體驗”的能力。
谷歌展示了該方向的顯著進步。從訓練智能體掌握圍棋和星際爭霸等復雜游戲,到打造 Genie 2(可根據(jù)單個圖像提示生成交互式 3D 模擬環(huán)境),該公司正在穩(wěn)步奠定基礎。Gemini 利用世界知識和推理模擬自然環(huán)境,Veo 對視頻生成中物理的直觀理解,以及 Gemini Robotics 教會機器人抓握、遵循指令和動態(tài)調(diào)整的能力,都凸顯了這些新興“世界模型”能力的閃光點。
雙子座進化成世界模型,被譽為邁向一種全新、更通用、更實用的人工智能——通用人工智能助手——的“關鍵一步”。未來的助手將具備智能、情境感知能力,并能夠在任何設備上進行規(guī)劃和采取行動。
阿斯特拉計劃與“通用人工智能助手”的曙光
谷歌人工智能努力的最終愿景是將 Gemini 應用程序轉變?yōu)椤巴ㄓ萌斯ぶ悄苤帧薄梢蕴幚砣粘H蝿?、日常管理并提供令人愉快的建議,從而“讓我們更有效率,豐富我們的生活”。
這一未來建立在 Project Astra 的基礎之上。Project Astra 是去年的一個研究原型,展示了視頻理解、屏幕共享和記憶方面的突破性能力。谷歌透露,在過去一年中,這些功能已集成到Gemini Live中,現(xiàn)已面向更多用戶體驗。持續(xù)的改進包括更自然的語音輸出和原生音頻、增強的記憶功能以及新增的計算機控制功能。
谷歌目前正在收集來自可靠測試人員的反饋,旨在將這些高級功能引入 Gemini Live、全新的搜索體驗、面向開發(fā)者的 Live API,甚至智能眼鏡等新形態(tài)的設備。在整個開發(fā)過程中,安全和責任始終是重中之重,谷歌重點介紹了一個大型研究項目,旨在探索高級人工智能助手的倫理影響。
Mariner 項目:精簡未來的多任務代理
谷歌進一步展示了其對代理能力的承諾,并發(fā)布了Mariner 項目的最新進展。該項目是一個探索人機交互未來發(fā)展的研究原型,首先從瀏覽器開始。Mariner 項目于去年 12 月啟動,并根據(jù)值得信賴的測試人員的反饋不斷完善,目前已擁有一個能夠同時完成多達十項不同任務的代理系統(tǒng)。這些代理可以同時執(zhí)行信息查找、預訂、促成購買、進行研究等多項任務。
更新后的 Project Mariner 現(xiàn)已可供美國的 Google AI Ultra 訂閱用戶使用,并計劃將其計算機使用功能集成到 Gemini API 中,并在全年將其更多功能引入其他 Google 產(chǎn)品。
人工智能概述和搜索的重新構想
此次面向消費者的公告中,最引人矚目的是谷歌搜索AI模式的正式發(fā)布,該模式現(xiàn)已面向所有美國用戶開放,并由Gemini 2.5提供支持。谷歌稱這是“過去十年搜索領域最成功的發(fā)布之一”,其前身AI概覽已覆蓋全球超過15億用戶。
AI 模式承諾提供“端到端 AI 搜索體驗”,讓用戶能夠處理更長、更復雜的查詢(通常是傳統(tǒng)搜索長度的兩到三倍),并通過后續(xù)問題進行更深入的探究。這種對話式轉變旨在將搜索從關鍵詞驅(qū)動的工具轉變?yōu)榫哂懈呒壨评砟芰Φ闹悄艽怼?/p>
搜索的主要增強功能和未來發(fā)展方向包括:
- 深度研究: AI 模式可以進行大量并行搜索,以編制全面且有上下文的響應。
- 個人背景:利用用戶歷史記錄和其他 Google 產(chǎn)品,AI 模式將提供個性化建議。
- 多種響應格式:動態(tài)生成交互式列表、圖表和視覺呈現(xiàn)。
- Agentic 功能(來自 Project Mariner):很快,AI 模式將協(xié)助完成預訂和購買等現(xiàn)實世界的任務。
- 人工智能購物:革命性的虛擬試穿功能讓用戶能夠想象衣服穿在自己身上的視覺效果,同時人工智能代理可以跟蹤價格并完成購買。
谷歌還表示,AI 模式的功能最終將無縫融入核心搜索體驗,這預示著未來智能對話式 AI 將成為默認設置。
超越搜索:人工智能的普及
AI 集成已擴展到整個 Google 生態(tài)系統(tǒng):
- Android XR:谷歌發(fā)布了備受期待的混合現(xiàn)實操作系統(tǒng) Android XR,該系統(tǒng)專為沉浸式頭顯和時尚智能眼鏡而設計,其合作對象包括三星的“Project Moohan”XR頭顯以及Gentle Monster和Warby Parker的智能眼鏡。Android XR將把Gemini的智能功能引入這些設備,實現(xiàn)實時翻譯、免提消息傳遞和導航。
- 生成媒體工具:谷歌宣布其生成式人工智能模型迎來重大升級。Veo 3現(xiàn)在除了視頻之外,還能生成音頻(對話和音效),而Imagen 4 則提升了照片級真實感和細致的文本渲染。
- Flow:一款新的 AI 電影制作應用程序 Flow 允許用戶使用高級控制來創(chuàng)建和編輯 AI 生成的視頻內(nèi)容。
- Gemini 應用更新:具有對話式交互功能的“Gemini Live”現(xiàn)已免費向所有 Android 和 iOS 用戶開放。Gemini 2.5 Pro引入了增強型推理模式“Deep Think”。
- Google Beam(以前稱為 Project Starline):這個 AI 優(yōu)先的 3D 視頻通信平臺承諾為遠程交互提供沉浸式 3D 呈現(xiàn)。
- Gmail AI 集成:個性化智能回復現(xiàn)在將模擬用戶寫作風格,并且“收件箱清理”將允許對話式批量刪除電子郵件。
- 新的訂閱等級: “Google AI Ultra”是針對高級 AI 模型和實驗功能的高級訂閱,與“Google AI Pro”一起推出。
目前,超過 700 萬名開發(fā)者使用 Gemini 進行開發(fā),每月處理的令牌數(shù)量高達 480 萬億,谷歌正以前所未有的速度加速人工智能的普及。2025 年 Google I/O 大會明確展現(xiàn)了谷歌致力于“人工智能優(yōu)先”未來的決心,智能代理和高級模型將無縫集成到日常工具中,為用戶提供前所未有的功能,真正開啟數(shù)字交互的新時代。
參與評論 (0)