在今年的Google I/O发布会上,Google展示了其在AI技术、硬件创新和软件平台上的最新成果。这次发布会展示了未来科技的趋势,揭示了如何通过先进技术提升用户体验和开发者效率。小编将为大家讲述一些比较感兴趣的点。
1. Gmail中的Gemini功能
Gmail用户将迎来Gemini AI技术的升级,可以更加智能地搜索、总结和起草电子邮件。Gemini不仅能处理简单的邮件任务,还能执行更复杂的操作,例如搜索收件箱、查找收据并填写在线表格,帮助用户轻松处理电商退货。
2. Gemini 1.5 Pro & Flash
新的Gemini 1.5 Pro 版本可以处理比以前更长的文档、代码库、视频和音频记录。新版本支持最多200万个token,这是之前版本的两倍,适用于所有商业用途。此外,Google还推出了Gemini 1.5 Flash,这是一个为高频生成AI任务优化的轻量版模型,同样支持多模式分析,包括音频、视频、图像和文本。
Gemini Advanced用户将能够利用Gemini 1.5 Pro的强大功能,分析和总结长达1500页的PDF文档。这一功能在全球150多个国家和35种语言中可用,用户可以从Google Drive导入文档或直接从移动设备上传。
3. Gemini Live
Google还预览了GeminiLive,这是一种新的体验,允许用户在智能手机上与Gemini进行深入的语音聊天。用户可以打断Gemini的讲话,Gemini也会实时适应用户的语音模式。通过智能手机摄像头,Gemini能够分析用户周围的环境并做出反应。
Gemini Live利用最新的生成式AI技术,结合增强的语音引擎,提供高质量的图像分析和多轮对话能力。
4. Gemini Nano
Google将最小的AI模型Gemini Nano集成到Chrome桌面客户端中,使开发者能够利用设备上的模型来增强自己的AI功能。例如,Workspace Lab中的“帮助我写作”工具将受益于这一新功能。
5. Android上的Gemini
在Android平台上,Gemini将取代Google Assistant,充分利用其与Android操作系统和Google应用的深度集成。用户将能够将AI生成的图像直接拖放到Gmail、Google Messages等应用中。
此外,Gemini Advanced订阅者可以快速从长文档中获取答案。Android设备上的Gemini Nano将升级以支持多模式输入,包括文本、视觉、声音和语音。最新功能将在未来几个月内推广到数亿设备上。
6. LearnLM 模型
Google推出了LearnLM,这是一套全新生成式AI模型,专门为学习进行了优化。LearnLM由Google DeepMind和Google Research联合开发,旨在通过对话式辅导帮助学生学习各种科目。该模型已经在Google的多个平台上应用,并通过Google Classroom的试点项目进行测试,帮助教师发现和实施新的教学方法、内容和活动。7. TPU 性能提升
Google发布了第六代TPUAI芯片,名为Trillium。这些芯片将在今年晚些时候推出,计算性能相比第五代提高了4.7倍。Trillium配备第三代SparseCore,是专为处理高级排名和推荐工作负载而设计的加速器。Google表示,新型TPU的能效比第五代芯片高67%,这对AI计算需求持续增长的行业来说至关重要。
总结
通过今年的Google I/O发布会,我们看到了Google的最新突破。无论是更智能的邮件处理、更强大的文档分析、创新的语音交互,还是令人惊叹的视频生成技术,Google都展示了科技世界的强大。观看视频,了解更多关于Google I/O 2024的精彩内容,见证科技如何改变世界!