Gemini AI是由谷歌推出的一款先进的人工智能模型,具备多模态交互能力,能够同时识别和处理文本、图像、音频、视频及代码等多种类型的信息。Gemini AI的核心功能包括实时视频解析和屏幕内容解读,使其能够在用户使用设备摄像头或屏幕时提供即时的回答和建议。
实时视频解析:Gemini AI能够实时解读智能手机摄像头的画面,并根据画面内容回答相关问题。例如,用户可以通过摄像头拍摄刚上釉的陶器,Gemini AI可以实时分析画面并给出釉色选择建议
屏幕内容解读:该功能使Gemini AI能够直接查看用户设备屏幕上的内容,并即时回应用户的查询。用户可以在屏幕上展示任何内容,Gemini AI都能提供相关的信息和解答
Gemini AI是基于谷歌的“Project Astra”项目开发的,该项目近一年前首次对外展示。Project Astra为Gemini AI提供了多模态虚拟助手的支持,使其能够在不同的输入模式下提供准确的回应
此外,Gemini AI还具备“画布”和“音频概览”功能,用户可以自由组合文本、图像与代码模块,并自动提炼长语音的摘要
谷歌计划在未来数月内推动更多用户升级至Gemini AI,逐步取代之前的Google Assistant。此外,Gemini AI的2.0版本已经推出,增加了“AI概览”和“AI模式”等功能,进一步提升了其深度推理和用户交互能力
这些更新标志着谷歌将生成式AI深度融入搜索引擎,提供更丰富的功能和更好的用户体验
HIX.AI 是市场上最强大的一体化人工智能工具