Meta 发布最强开源 AI 模型 Llama 3.1,英伟达代工,扎克伯格称其为业内顶尖水准。

当地时间周二,美国科技巨头 Meta 发布了其最强开源人工智能 (AI) 模型 Llama 3.1,拥有三个不同的版本。扎克伯格称其为“业内顶尖水准的” AI 模型,并表示能够与 OpenAI 和谷歌等竞争对手的类似产品相抗衡。

Meta 的公告显示,Llama 3.1 在 Llama 3 的基础上进行了重大更新。Llama 3.1 主要用于驱动聊天机器人,可以进行八种语言的对话,编写更高质量的计算机代码,并可以解决更复杂的数学问题。

Llama 3.1 405B 模型包含 4050 亿个参数,是近年来参数规模最大的模型之一。通常,参数大致对应于模型的解决问题的能力,参数越多的模型通常表现越好。该模型使用 16000 个英伟达 H100 GPU 进行训练,受益于新的训练和开发技术,Meta 声称,Llama 3.1 405B 在一定程度上可以与 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet 竞争。

Meta 发布了其最强开源人工智能 (AI) 模型 Llama 3.1!英伟达代工加持,扎克伯格:业内顶尖水准

Meta 高管表示,该模型主要用于为 Meta 内部和外部开发人员的聊天机器人提供支持,具备广泛的新功能,包括改进的推理能力,帮助解决复杂的数学问题或瞬间综合整本书的文本。它还具有生成式 AI 功能,可以通过文本提示生成图像。一项名为“想象自己”的功能允许用户上传他们的面部图像,然后生成他们在不同场景和情境中的描绘。

像其他开源和闭源生成式 AI 模型一样,Llama 3.1 405B 可以执行各种任务,可以编程、回答基本数学问题,也可以用八种语言(英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语)总结文件。该模型目前仅支持文本操作,这意味着它不能回答图像问题,但大多数基于文本的工作负载(如分析 PDF 和电子表格)都在其能力范围内。

Meta 表示,该公司正在尝试多模态模型。在周二发表的一篇论文中,公司研究人员表示,他们正在积极开发可以识别图像和视频并理解(和生成)语音的 Llama 模型。然而,这些模型尚未准备好公开发布。

与 Meta 之前的模型一样,Llama 3.1 405B 可以下载或在云平台(如 AWS、Azure 和 Google Cloud)上使用。它还在 WhatsApp 和 Meta.ai 上使用,为美国用户提供聊天机器人体验。

另外,Llama 3.1 的上下文窗口(context window)涵盖 128000 个标记,比以前的 Llama 模型更大,大约相当于一本 50 页书的长度。

模型的上下文或上下文窗口指的是模型在生成输出(如文本)之前考虑的输入数据(如文本)。具有较大上下文窗口的模型,可以总结更长的文本片段和文件。在为聊天机器人提供动力时,这种模型也不太可能忘记最近讨论的主题。

Meta 周二还推出了另外两个新的较小模型 Llama 3.1 8B 和 Llama 3.1 70B,这两款模型是 Meta 在 4 月发布的 Llama 3 8B 和 Llama 3 70B 模型的更新版本,它们也有 128,000 个标记的上下文窗口。相比之下,以前的模型上下文窗口最大为 8,000 个标记。

Meta 在论文中表示,Llama 3.1 405B 的性能与 OpenAI 的 GPT-4 相当,在与 GPT-4o 和 Claude 3.5 Sonnet 的比较中取得了“混合结果”。尽管 Llama 3.1 405B 在执行代码和生成图表方面优于 GPT-4o,但其多语言能力整体较弱,在编程和一般推理方面也落后于 Claude 3.5 Sonnet。

Meta 发布了其最强开源人工智能 (AI) 模型 Llama 3.1!英伟达代工加持,扎克伯格:业内顶尖水准

在周二早上发布的一封公开信中,Meta CEO 马克·扎克伯格 描绘了一个未来的愿景,即 AI 工具和模型能够到达世界各地更多的开发者手中,确保人们能够享受到 AI 的“好处和机会”。

扎克伯格 既捍卫自己的开源策略,又大规模投资 AI。 “我认为对于一个 ai 助手来说,最重要的产品特性将是它的智能程度,”扎克伯格 在接受媒体采访时说道。 “我们正在构建的 Llama 模型是世界上最先进的模型之一。”

扎克伯格 补充说,Meta 已经在研发 Llama 4。

扎克伯格 还表示,Meta 的聊天机器人拥有“数亿”用户,并预计到年底将成为世界上使用最广泛的聊天机器人。他希望 Meta 以外的公司也能使用 Llama 来训练他们自己的 AI 模型。

Meta 在 AI 上的投资非常大。扎克伯格 表示,训练 Meta 的 Llama 3 模型花费了“数亿美元”的计算资源,但他预计未来的模型成本将更高。“未来这将需要数十亿甚至更多的计算资源,”他说。2023 年,Meta 试图削减一些未来技术和管理层的支出,裁掉了数千个工作岗位,这是扎克伯格 称之为“效率之年”的一部分。但扎克伯格 仍然愿意在 AI 竞赛中投入资金。

“我认为现在很多公司都在过度建设,你回头看时可能会觉得‘哦,我们可能都花费了更多的数十亿美元’,”扎克伯格 说。 “另一方面,我实际上认为所有投资的公司都在做出理性的决定,因为如果落后了,未来 10 到 15 年你将在最重要的技术上处于劣势。”

“如果 AI 在未来像移动平台一样重要,那么我不想通过竞争对手访问 AI,”扎克伯格 说,他长期以来对 Meta 依赖于 Google 和苹果手机和操作系统来分发其社交媒体应用感到不满。“我们是一家技术公司,我们需要不仅在应用层面上构建东西,还要在整个技术栈上进行构建。为此进行这些巨大的投资是值得的。”

此外,Meta 还联合 AI 芯片领头羊英伟达周二宣布,英伟达 AI Foundry 将为全球企业定制 Llama 3.1 生成式 AI 模型,将他们的数据与 Llama 3.1 405B 和英伟达 Nemotron 模型结合,创建“超级模型”。

今年 4 月份,Meta 告诉投资者,它计划今年的支出比最初的预期多出数十亿美元,其中一个核心原因是对 AI 的投资。据该公司发文称,到今年年底,预计将拥有约 35 万颗英伟达 H100 GPU。

他还解释了 Meta 的开源政策的竞争力,公众可以免费使用 Llama 背后的技术,这将有助于使 Meta 的工作成为其他成功创业公司和产品的基础,从而使 Meta 在行业发展中拥有更大的影响力。

英特尔表示:“恭喜 MetaAI!我们很激动能用 Llama 3.1 的发布来优化我们的 AI 产品组合。”

Meta 发布了其最强开源人工智能 (AI) 模型 Llama 3.1!英伟达代工加持,扎克伯格:业内顶尖水准

大部分网友对 Meta 表示祝贺,认为 Llama 3.1 是伟大的杰作,是开源社区的胜利。

Meta 发布了其最强开源人工智能 (AI) 模型 Llama 3.1!英伟达代工加持,扎克伯格:业内顶尖水准

也有网友质疑,规模如此巨大的模型,运行的时候要耗费多少电能?会对环境造成多大影响?

Meta 发布了其最强开源人工智能 (AI) 模型 Llama 3.1!英伟达代工加持,扎克伯格:业内顶尖水准

    免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
    (0)
    AI快讯网编辑-青青AI快讯网编辑-青青
    上一篇 2024年 7月 24日 上午10:40
    下一篇 2024年 7月 24日 上午10:55

    相关推荐

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注

    欢迎来到AI快讯网,开启AI资讯新时代!