[XF 新聞] Google 擴展 AI 無障礙功能 相機尋找特定文字‧即時字幕/轉錄

- 辛尼 - 2024-08-14 - visibility Views

在剛過去 Pixel 9 活動中,Google 不但展示了最新的硬件產品,還重申致力於提高科技無障礙性的承諾。Google 公布了四項針對 Pixel 和 Android 無障礙功能的 AI 強化更新,這些更新包括改進的相機支援和更多語言選項供 Live Caption 和 Live Transcribe 功能使用。

首先,Google 的 Guided Frame 是 Pixel 的 TalkBack 功能的一部分,它提供語音和手勢指導幫助用戶拍攝完美的照片。這項功能特別適用於視障用戶,不僅可以幫助他們自拍,還包括拍攝寵物、食物、文件、電子設備和車輛等。現在,這個工具可以直接在相機設置中啟用,並根據 Google 的說法,它現在能夠「即使在複雜場景中也能更好地對焦主體」,提供群體拍攝中的臉部篩選,並提供整體改進的物體識別體驗。

此外,Google 的放大鏡應用也變得更加智能,用家可以在相機取景器中,用戶可以找到特定的文字,對於想要查看食物菜單上的特定內容或者「尋找機場出發時間」時特別有幫助。新的畫中畫模式允許用戶在保留屏幕上細節的同時放大視圖,並提供選擇放大鏡頭的選項。

Google 的 Live Caption 和 Live Transcribe 工具,雖然功能相似,但用途不同。Live Caption 更多是為設備上的聲音提供即時字幕,而 Live Transcribe 則專注於把周圍的聲音轉為文字。對於 Live Transcribe,Google 正在推出一個專為摺疊屏設計的雙屏模式功能,可幫助對話中的所有人看到他們自己的轉錄。另一方面,Google 正在將 Live Caption 支援擴展到七種新語言,包括韓文、波蘭文、葡萄牙文、俄文、中文、土耳其文和越南文,也可用於離線 Live Transcribe。