AI 日报

20240318 马斯克大模型Grok-1已开源,目前为止最大的开源大语言模型





🦉 AI新闻

🚀 马斯克大模型Grok-1已开源,目前为止最大的开源大语言模型

摘要:马斯克上一周就在x上预告将开源自己的大模型,等了一周,就在刚刚,马斯克的大模型 Grok-1 开源了,Grok-1采用的是先进混合专家模型,参数达到了3140亿,也是目前参数量最大的开源大语言模型。

官方地址:https://x.ai/blog/grok-os HuggingFace地址:https://huggingface.co/xai-org/grok-1

🚀 马斯克诉讼OpenAI案件进展新动态

摘要:马斯克与OpenAI的法律纷争中,OpenAI向法庭提交了一份文件,请求将此案认定为“复杂案件”以保护公司的技术和商业机密。OpenAI辩称未与马斯克达成任何创始协议或其他形式的协议,驳斥了马斯克为维护人类利益而提起诉讼的说法,认为其出于个人商业利益。OpenAI揭示了马斯克过去提出的合并或控制公司提案未获双方同意,现在通过诉讼试图获得公司技术。OpenAI请求法庭谨慎控制证据披露过程,避免敏感信息泄露。

🚀 OpenAI合作Figure推出先进人形机器人

摘要:北京时间3月13日深夜,由OpenAI投资的机器人公司Figure发布了一段展示其人形机器人的视频,该机器人能够流畅对话、理解和执行人类的自然语言指令。此次进展由OpenAI提供大语言-视觉模型支持,实现了人形机器人的高级交互和物理操作能力,无需远程操控即可自主完成任务。视频展现了机器人的动作流畅性和对话的自然性,这是利用端到端大模型驱动的成果。从宣布合作到视频发布仅13天,OpenAI与Figure的合作标志着具身智能领域的一个重大进步。

🚀 首个AI程序员Devin亮相,技术交流引发关注

摘要:首个AI程序员Devin借用创造者账号,在Slack上与客户公司的CTO进行技术对话,讨论关于平台密钥生命周期的问题。此举不仅展现了Devin在解决实际技术问题上的能力,还引起了圈内外的广泛关注。同时,Devin的开发商Cognition以及其他团队正在进一步探索和开发AI编程能力,比如开源版Devin“Data Interpreter”的推出,以及其它团队研发的相关AI技术。此外,Devin的出现也引发了关于AI未来在编程领域中角色的讨论和猜想。

🚀 谷歌推出模型打分框架Cappy,提高模型智能

摘要:近日,谷歌宣布推出一种名为Cappy的新模型打分框架,基于RoBERTa语言模型,旨在检测并打分模型输出内容,以此作为训练参考,提升模型性能。Cappy也能作为大型语言模型的候选机制,通过评分选择最优输出,以增强输出的准确性。该框架特别之处在于低RAM用量,可兼容多种闭源大模型,包括仅通过Web API访问的模型。在11项语言理解分类任务的测试显示,Cappy的纠错性能优于一些更大规模的模型,显示出前瞻性意义。

🚀 微软推出AI程序员AutoDev引领革新

摘要:全球首个AI程序员Devin诞生后,引发程序员界的广泛关注。紧随其后,微软发布了AI程序员AutoDev,这是一款能够自主编写、执行代码的AI工具,展现了AI在编程领域发展的惊人速度。与现有的AI编程助手如GitHub Copilot不同,AutoDev能够完成更复杂的软件工程任务,如自动运行测试、执行Git操作等,并在HumanEval测试中取得91.5%的高通过率。AutoDev工作流程完全自主,展示了AI技术在软件开发领域的进步和潜力,标志着软件及AI技术新纪元的到来。

🚀 南加大破解ChatGPT参数规模仅7亿

摘要:南加州大学一项最新研究,通过低成本的攻击方法成功揭示出了gpt-3.5-turbo模型的参数规模约为7亿(7B),这一成果令OpenAI的保密措施受到挑战。研究团队通过分析模型的嵌入向量维度,推断出参数规模,此前有消息称该模型的参数为20亿(20B),但现在看来,OpenAI通过优化可能已经将其压缩。此研究展示了通过软件漏洞攻击可以获取大型模型的敏感信息,并引发了关于模型安全性以及开放性的讨论。

更多AI工具,参考国内chatgpt4meGithub-chatgpt4me

联系我:[email protected]