撰文 | 小不董
編輯 | 李信馬
題圖 |?Google I/O 2023?開發者大會?
北京時間5月11日凌晨 1 點,Google I/O 2023 開發者大會采用線上+線下的形式舉辦,和往年一樣再次席卷了科技界的關注。但和以往不同的是,人工智能成為了本次大會的主角,重點發布層出不窮,可以說,千言萬語都匯成了一句話:我的AI也很強!
以下就是2023 Google I/O大會的重點內容,“AI濃度”極高:
- Gmail推出help me write“幫我寫”功能
- 谷歌maps推出沉浸式路線視圖
- Google photos讓用戶把照片改得更好
- 一鍵搜圖!谷歌推出人工智能圖像打擊虛假信息
- 官宣最新的大模型PaLM 2
- Gemini正在推進
- 人工智能Bard新增更多功能,將完全運行在PaLM 2之上
- 預覽的新方式:Labs
- Google Cloud:創建每個人自己的模型
- Google基礎設施家族的新成員:基于英偉達H100GPU的A3虛擬機
- Alpha Fold帶來醫學突破
- Google要確保生成的每一張圖像都必須要具有原數據
- 魔力撰寫打造個性化手機
- Fast Pair讓硬件設備無縫協作
- Pixel 7A、Pixel Tablet、Pixel Fold發售
01.官宣大模型PaLM 2
會上,最值得期待的PaLM 2如約而至,大會上宣布了超過25種基于PaLM 2的產品和功能。谷歌將PaLM 2模型基本分為Gecko、Otter、Bison和Unicorn。意思分別是壁虎、水獺、野牛和獨角獸,對應不同的尺寸。
Gecko可以在移動設備上進行工作,其速度快到足以在移動設備上運行出色的交互式應用程序,哪怕是在離線的狀態之下也可以做到這一點。
由于對科學和數學主題進行了廣泛的訓練,PaLM 2模型的邏輯和推理能力更強,而且還接受逾百種語言文本的訓練,因此能夠理解并且生成精確的結果,結合強大的編碼能力,PaLM 2還可以幫助世界各地的開發者進行合作。
Med-PaLM 2與基礎的PaLM 2相比使得不準確的推理減少了9倍,而且運用于醫學上,也接近于回答同一組問題的臨床醫生專家的表現,它也是第一個在醫學執照考上展現出專家水平的語言模型。谷歌還在努力使其能夠結合醫學影像信息,幫助醫生,尤其是放射科醫生解釋圖像,并且交流結果。
02.對話機器人Bard持續加強
被寄予厚望的Bard也得到加強,作為一個非常輕量型的大語言模型,有PaLM 2作為加持,使它的數學邏輯和推理的能力大步向前,現在可以在整個代碼生成、代碼調試、對于代碼的片段進行解釋方面,做到彼此之間相互協作,且已經學會了超過20個編程語言,能夠幫助開發者進行更好的編程。
甚至Bard還能做一個象棋里的“四步殺”腳本。
對于開發者來說,Bard可以解釋代碼,化繁為簡,并且將代碼加以改善。
從Google中可以向Bard嵌入一些服務,例如問在新奧爾良有沒有不得不去的景點,Bard就會及時運用Google Search和Knowledge Graph去找到最相關的圖片。
或者學生應該報考哪個大學?輸入感興趣的幾個詞,就能生成一份大學名單,并在圖表中詳細標明,再運用谷歌地圖,在視覺上展示這些學校在哪里。
接下來幾個月會有Adobe Firefly,加上Bard會生成一個全新的圖片。
03.Gmail接入AI,實現“幫我寫”
Gmail方面,之前Google推出了Smart Compose智能撰寫功能,可以在用戶打字的時候提供協作建議,Smart Compose也被不斷的完善,在過去一年當中被使用了超過1800億次。
現在通過更強大的生成式模型,谷歌在Gmail中實現了help me write“幫我寫”功能。
會上,谷歌演示了如何在航班取消的情況下寫一封要求全額退款的電子郵件。
04.谷歌地圖也升級了
自推出街景視圖以來,AI已經拼接了數10億張全景圖像,讓人們可以在自己的設備上探索世界。去年的I/O大會上,谷歌推出了沉浸式視圖,也就是利用AI創建一個地方的高保真地圖,讓用戶可以在到達之前就可以獲得親身的體驗。現在谷歌將同樣的技術拓展到maps最擅長的領域,也就是幫助用戶到達目的地。
谷歌地圖每天提供了200億公里的路線指引,沉浸式路線視圖作為一種全新的旅程視角,可以縮放地圖,能獲得鳥瞰視圖,能詳細到出行方式的車道,甚至還可以提前看到空氣質量、交通和天氣情況。沉浸式路線試圖將會在今年夏天推出,并且在今年年底前會在15個城市上線,包括倫敦、紐約、東京和舊金山。
05.“美圖愛好者”的福音
另一個通過AI得以提升的產品就是Google Photos,每個月有17億張圖片在Google Photos上被編輯,谷歌率先在Pixel上推出的魔法橡皮擦,可以消除不必要的干擾。今年晚些時候,谷歌還會推出結合語義理解和生成式AI的魔法編輯器,讓用戶能夠獲得更多新的體驗。
與此同時,一個代號為Gemini的項目正在推進,谷歌計劃開發一種新的大型機器學習模型,盡管它還處于早期階段,但是已經能看到其在以往模型當中沒有出現的多模態能力。
其中就包括讓客戶擁有可識別出合成生成式內容的工具,水印和原數據就是兩個重要的方式。當人們看到一張合成圖片,可能會覺得它很真實,這就需要水印的存在了,Gemini讓AI生成的圖片從一開始就將水印融入其中,人們看到就知道,這是張合成圖片。
原數據可以允許內容創作者將原數據與原始文件相關聯,每當用戶看到一張圖片的時候,原數據就會提供其背景信息,且每一張由AI生成的圖像都會綁定這種原數據。
06.Duet AI:專家級的協作程序員
有沒有一種方式幫助開發者更好的完成編程任務?谷歌的建議是在Google Cloud當中加入Duet AI。它作為一個AI專家級的協作程序員,可以靈活運用于云端控制臺、聊天對話框甚至提供上下文的代碼股權,實時生成函數,在你需要的任何地方提供幫助。
07.A系列最新款、折疊屏手機、平板電腦發售
據谷歌介紹,Pixel是唯一一個以AI為中心的手機,也是唯一一臺結合了Google Tensor、安卓和AI的手機,可以說就是一臺AI設備。例如Pixel Call Assist呼叫助手這樣的功能,可以避免長時間的等待電話,忽略不想接的電話,提高想接的電話的音質。
還有Pixel相機,它可以理解面部表情和膚色,谷歌還增加了實際色調和預覽框引導的功能。
全新的Pixel 7A對A系列產品進行完全的升級,像所有Pixel7系列的設備一樣,Pixel 7A采用的是Google Tensor G2芯片,配備8G內存,確保Pixel 7A具備最佳的性能和智能化的表現。而主相機傳感器尺寸增加72%。
Pixel Tablet是唯一由谷歌設計的平板,有11英寸高分辨率顯示屏,4個內置揚聲器,高級鋁制外殼采用了納米陶瓷圖層,而且在Google Tensor G2的芯片驅動下,具有持久電池壽命和頂尖的個人AI技能,Pixel Tablet語音輸入速度點擊輸入速度快三倍。
Google I/O大會上,經常出現的一句話是:讓AI惠及每一個人。這恰恰是當下大眾的共同愿望,希望Google在未來的道路上繼續帶著擔當和責任大步向前。
文中圖片來源:2023 Google I/O大會