20240515 谷歌I/O 2024大会全面硬刚OpenAI
🦉 AI新闻
🚀 谷歌发布升级版Gemini机器人 竞争OpenAI ChatGPT-4
摘要:谷歌展示了升级版的 Gemini 聊天机器人,其支持实时处理视频和语音输入,并准确回答问题。此次发布时机与 OpenAI 公布 ChatGPT-4o 新模型几乎同步。Gemini 的多模态能力和自然对话让人们看到了未来 AI 交互的潜力。
🚀 谷歌 Chrome 126 引入本地文本生成功能
摘要:谷歌在 I / O 2024 开发者大会上宣布,Chrome 126 浏览器将引入本地文本生成功能 Gemini Nano,用户可直接生成产品评论、社交媒体帖子等内容。与微软 Edge 的 Copilot 不同,Gemini Nano 在设备本地运行。此外,Chrome DevTools 将提供 Gemini 功能,帮助开发者调试应用程序并提供编码建议。
🚀 谷歌推出Gemini个性化助手功能Gems
摘要:2024年5月15日,谷歌在I/O开发者大会上发布Gemini的个性化选择“Gems”,用户可通过Gems定制Gemini助理角色。该功能允许用户创建具备特定特征的聊天机器人,以帮助完成各种任务,如健身伴侣、副厨师、编码助手、创意写作指导等。Gems类似于OpenAI的GPT Store和Character.AI,提供丰富的定制交互体验。
🚀 谷歌升级安卓端Gemini,提升内容理解和分析能力
摘要:谷歌在I/O 2024开发者大会上宣布将升级安卓端Gemini工具,使其更好地理解屏幕内容并分析数据,为用户提供建议。新版本还可通过视频自动字幕答疑,支持PDF文件内容总结。该功能为Google One AI Premium计划的一部分,月费为20美元。
🚀 谷歌推出Project Astra多模态AI项目
摘要:在2024年I/O开发者大会上,谷歌发布了基于Gemini的多模态AI项目——Project Astra。该项目能够本地运行在Pixel手机上,用户通过摄像头可以直接解释画面中的物品。谷歌用视频演示了其识别物品、记忆位置及解释代码的功能,展示了该技术的强大能力。
🚀 谷歌推出高速高效的Gemini 1.5 Flash模型
摘要:2023年5月15日,谷歌宣布推出新的Gemini 1.5 Flash模型,重点优化速度和效率。该模型适用于摘要、聊天应用、图像和视频字幕等任务,并能处理大规模数据。通过“蒸馏”过程,Flash模型在保留Pro版本功能的同时,更轻便和经济,适合开发者构建AI产品。
🚀 谷歌升级Gemini 1.5 Pro模型,提升上下文窗口至200万tokens
摘要:在2024年I/O开发者大会上,谷歌宣布将Gemini 1.5 Pro模型的上下文窗口从100万tokens提升至200万,使其能够处理更大量的数据,如2小时视频、22小时音频等。谷歌CEO皮查伊表示,Gemini时代将为创造者和开发者带来更多机遇。目前,150多万开发者使用Gemini模型,服务覆盖20亿用户。
🚀 谷歌推出AI Overviews搜索体验
摘要:谷歌在2024年 I/O 开发者大会上推出“AI Overviews”搜索体验,将于本周开始在美国开放,并逐步推广至更多国家。该功能旨在通过提问和聊天方式进行 AI 搜索。谷歌首席执行官表示,此更新为搜索引擎25年来最大更新之一。AI Overviews 主要与 Reddit 社区合作,解答用户提问。
🚀 谷歌I/O大会展示AR眼镜Project Astra
摘要:在今天召开的谷歌I/O开发者大会上,谷歌展示了Project Astra项目并意外展示一款AR眼镜。视频演示中,AR眼镜通过摄像头、麦克风和扬声器与演示者互动。这款眼镜设计简约,功能完善,但具体细节未公开。
🚀 谷歌将在Gmail中集成Gemini AI功能
摘要:在2024年5月15日的谷歌I/O开发者大会上,谷歌宣布将邀请Workspace和Google One AI Premium用户下月体验新版Gmail,其中集成了Gemini AI。用户可在移动和网页版Gmail中使用Gemini总结邮件内容、提问或撰写回复。新版还将引入“Contextual Smart Reply”和新的Gemini按钮,提供邮件总结和回复建议功能。
🚀 谷歌 I / O 2024:Workspace 将整合 Gemini
摘要:谷歌公司宣布在 I / O 2024 开发者大会上进一步整合 Gemini 技术,将在 Workspace 的侧面板中推出 Gemini 1.5 Pro 的多个技能。此举旨在节省用户在多个应用间搜索数据的时间和精力。Gmail、Docs、Sheet、Slides 和 Drive 将首先使用该功能,以便在应用内直接组织和理解数据,实现如邮件总结和会议记录摘要等功能。
🚀 谷歌引入AI诈骗电话检测功能
摘要:谷歌在I/O 2024开发者大会上宣布为安卓系统引入AI诈骗电话检测功能,该功能基于Gemini Nano模型本地运行,识别和提醒可能的诈骗行为,确保通话私密性。功能需用户手动启用,谷歌将在今年晚些时候分享更多详细信息。
🚀 谷歌推出Gemini旅行规划功能
摘要:谷歌在2024 I/O开发者大会上宣布为Gemini引入旅行规划功能,结合个人信息和公共出行信息,帮助用户快速规划预订航班、酒店等行程。用户可根据后期提示动态调整。该功能将在未来几个月内登陆Gemini Advanced。
##### 🚀 腾讯混元文生图大模型开源发布
摘要:5月14日,腾讯宣布旗下混元文生图大模型升级并开源,现已在Hugging Face和Github上发布,包含模型权重、推理代码、模型算法等。混元DiT是首个中英双语DiT架构,支持中英文细粒度理解能力,最低显存需求11GB。首批通过国内官方“大模型标准符合性评测”的国产大模型还包括阿里通义千问、360智脑和百度文心一言。
🚀 Meta开发带摄像头AI耳机 力争市场先机
摘要:Meta正研发名为Camerabuds的AI耳机,具备识别物体和翻译外语功能,但仍面临设计挑战如摄像头被遮挡和续航不足等问题。扎克伯格已尝试多种设计,但均不满意。目前Meta领导层希望加快研发以应对竞争。其他科技公司如Humane和Rabbit也在开发类似设备,但因订阅费和“套壳”问题备受质疑。
🚀 OpenAI推出新AI模型GPT-4o,登顶机器人竞技场
摘要:OpenAI 员工 William Fedus 证实,新发布的 AI 模型 GPT-4o 在 LMSYS 聊天机器人竞技场表现优异,登顶排行榜。GPT-4o 以“gpt-chatbot”为名测试,取得最高分。多方消息称,该模型大幅领先此前冠军 Claude 3 Opus 和 GPT-4 Turbo。竞技场是用户与随机 AI 对话并选择最佳回复的平台。
更多AI工具,参考国内chatgpt4me,Github-chatgpt4me