AI 日报

20240130 Meta更新了Code Llama 70B AI模型,准确率超过GPT-3.5





🦉 AI新闻

🚀 Meta更新了Code Llama 70B AI模型,准确率超过GPT-3.5

摘要:Meta最近宣布对其AI模型Code Llama 70B进行了更新,新版能够处理更多查询且准确率达到53%,超过了GPT-3.5的48.1%。然而,与GPT-4的67%准确率相比仍有差距。Code Llama 70B是基于1TB代码和相关数据训练而来,并可免费用于研究和商业用途。Meta表示,较大的型号34B和70B能够提供更好的编码帮助。该模型托管在代码存储库Hugging Face上。

🚀 意大利监管机构指控OpenAI隐私法违规,调查结果公布

摘要:意大利隐私监管机构宣布,OpenAI的ChatGPT和用户数据收集技术存在违反欧盟法规的行为。该调查由OpenAI有30天回应。OpenAI是微软支持的美国AI研究公司,利用人工智能技术来提升产品和服务。此指控可能对OpenAI和其合作伙伴产生重大影响。

🚀 国内超过40款AI大模型产品获得备案审批,一次性批准14个模型

摘要:根据报道,国内近日通过备案审批的13家企业,共计获批14款AI大模型。此次备案批准数量创历史新高,其中还首次出现一家公司同时获批两款大模型。根据相关规定,提供具有舆论属性或社会动员能力的生成式人工智能服务,需进行安全评估并备案手续。该消息对于影响力、公众兴趣度、新颖性和重要性四个元素都表现较好。

🚀 腾讯回应拿地计划推迟,马化腾详述公司发展规划

摘要:腾讯公司董事会主席、首席执行官马化腾在年会上回应了之前拿地计划推迟的问题,并详细介绍了腾讯过去一年的业务发展和未来规划。马化腾表示,考虑到公司发展的底深情况和投资合适性,他们决定推迟拿地计划。此外,马化腾提到了人工智能的重要性和微信视频号的发展。腾讯还表示,拿地交易将主要用于满足公司对办公用地的需求。腾讯的混元大模型已通过备案,目前已应用于各大应用平台。

🗼 AI知识

🔥 从零开始构建类似 ChatGPT 的大语言模型

关于从头开始构建大型语言模型的书籍。作者邀请读者与他一同学习构建大型语言模型的过程,从数据加载到在自定义数据集上进行微调。作者强调了书中的实践学习重点,使用PyTorch进行编码,不依赖现有库,旨在深入讲解大型语言模型的工作原理、局限性和定制方法。同时,书中还探讨了预训练和微调大型语言模型的常用工作流程和范式,提供了对它们发展和定制的见解。

🔥 那么,我是如何使用 ChatGPT 的?

以作者个人经历为背景,结合自己对ChatGPT的使用心得,分享了对大模型的认识和使用经验。作者以实习生的比喻形象地描述了ChatGPT的特点,强调了对于ChatGPT的使用需求要清晰明确、对表达能力要求高、需求要分解具体、并且要持续学习。



更多AI工具,参考国内chatgpt4meGithub-chatgpt4me

联系我:[email protected]