AI 日报

20240715 Meta 将发布4050亿参数AI模型Llama 3-405B





🦉 AI新闻

🚀 Meta 将发布4050亿参数AI模型Llama 3-405B

摘要:Meta公司计划于7月23日发布拥有4050亿参数的开源AI模型Llama 3-405B,这是现有80亿和700亿参数版本之外的升级。该模型号称是最强大的开源大语言模型。此前,扎克伯格在采访中透露正训练4050亿像素的密集模型。模型支持多模态AI,能够理解图像和文本等多种媒体内容。

🚀 OpenAI CEO驾驶豪车引发争议

摘要:OpenAI CEO 萨姆・阿尔特曼驾驶全球最贵跑车科尼赛格雷吉拉的视频引起热议和特斯拉 CEO 埃隆・马斯克的批评。视频引发网民对阿尔特曼如何负担奢华跑车的质疑。马斯克和阿尔特曼多年前因OpenAI运营方针调整产生不和。此外,尽管阿尔特曼年薪较低,但他持有多家公司股票,市值至少28亿美元。

🚀 GPT-2 训练成本大幅降低至每小时 28 美元

摘要:OpenAI 的 GPT-2 训练成本从 2019 年每小时 256 美元大幅下降至 28 美元,降幅近 90%。这一变化主要归功于使用了单个 8XH100 节点和简化的 llm.c 程序。此外,高端 AI 训练成本和硬件费用仍在持续上涨,未来模型训练可能花费数十亿美元。

🚀 OpenAI研发“草莓”项目提升AI推理能力

摘要:据路透社报道,OpenAI正在研发“草莓”项目,旨在提高AI推理能力,使其更加接近人类智力。该项目会自主扫描互联网,进行深度研究,解决复杂现实问题。目前该项目仍在开发阶段,对外保密。一些业内人士认为这将是AI技术的突破。

🚀 DeepMind利用Gemini增强机器人任务执行能力

摘要:科技媒体The Verge报道,谷歌旗下的DeepMind团队使用Gemini 1.5 Pro训练机器人,以完成更复杂的任务并在复杂环境中自由穿梭。新研究通过上下文窗口和视频导览,让机器人能通过自然语言指令完成任务,在9000平方英尺操作区的指令成功率高达90%。研究显示Gemini可帮助机器人计划导航以外的任务,例如查找用户喜欢的饮料等。团队计划进一步研究这些结果。

更多AI工具 Github-chatgpt4me

联系我:[email protected]