在日前举行的Cloud Next 2024上,谷歌方面发布了一系列AI相关大模型及产品更新,其中包括推出Gemini 1.5 Pro公共预览版、文生图大模型Imagen 2新增“文生动图”功能,以及发布代码生成新模型CodeGemma、首款自研Arm架构处理器Axion等。
据了解,目前Gemini 1.5 Pro公共预览版已接入谷歌Vertex AI平台。该大模型最高可支持10000K token超长上下文,大致是Anthropic旗舰模型Claude 3能作为输入处理的数据量的四倍,约为OpenAI GPT-4 Turbo最大上下文量的八倍。
而文生图大模型Imagen 2新增的“文生动图”功能,是指其可根据用户输入的文本提示词生成类似GIF的动态图片。具体而言,该功能可生成时长达4秒、帧率为每秒24帧、分辨率为360像素×640像素,且支持镜头视角调整的动态图片。对于输出图片分辨率较低这一问题,谷歌方面承诺未来将对此进行改进。
据悉,为减轻用户对制造深度伪造(deepfake)图像的担忧,Imagen 2将采用谷歌Deepmind开发的SynthID为生成的动图添加隐形加密水印。据谷歌方面透露,该水印可以抵御包括压缩、滤镜和调色在内的各种编辑操作。此外,Imagen 2还新增了一项类似Photoshop“内容填充”的新功能,可通过编辑图像来添加或抹去照片中的元素,同时还支持扩图功能。
Axion则基于Arm的Neoverse 2,专为数据中心设计。据谷歌方面表示,Axion实例的性能比其他竞争对手如AWS和微软的基于Arm的实例高出30%,与相应基于X86的实例相比,性能提高了最多50%、能效提高了60%。
CodeGemma则以Gemma模型为基础,号称具有强大编码功能。据了解,该模型可分为专门处理代码补全和代码生成任务的7B预训练变体、用于代码聊天和指令跟随的7B指令调优变体、以及在本地计算机上运行快速代码补全的2B预训练变体。
据了解,在此次活动中,谷歌方面还推出了谷歌视频(Google Vids),这是Google Workspace新添加的由AI驱动的视频创作工具。对此谷歌方面表示,借助Google Vids,用户可以与文档和表格等其他Workspace工具一起制作视频,并且可与同事实时协作。
此外,谷歌方面此次还发布了新AI智能体构建工具Vertex AI Agent Builder,旨在帮助企业构建AI代理。据谷歌云首席执行官Thomas Kurian表示,“Vertex AI Agent Builder 使人们能够非常轻松、快速地构建和部署可用于生产的、由人工智能驱动的生成式对话智能体,并且能够以指导人类的方式指导智能体,以提高模型生成结果的质量和正确性”。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读: