Claude3横空出世,GPT对手来了!
目录
一、新的大模型Claude3的发布
2024.03.04日,由谷歌和亚马逊支持的AI初创公司Anthropic发布了Claude 3模型家族,这是一个全新突破性大语言模型系列,这一系列模型在各种认知任务上树立了新的性能标准,其中Claude 3 系列包括三个子模型:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,每个模型都提供了不同程度的智能、速度和成本选择,旨在满足广泛的人工智能应用需求。该公司表示,在各种基准测试中,该家族中Claude 3 Opus在各种基准测试中表现优于OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra 。
Anthropic是一家位于美国加州旧金山的人工智能初创公司,成立于2021年。该公司由OpenAI(ChatGPT的开发机构)前研究副总裁达里奥·阿莫迪(Dario Amodei)、大语言模型GPT-3论文的第一作者汤姆·布朗(Tom Brown)等人共同创立, 官网网址为https://www.anthropic.com/claude 。
2024年3月6日,亚马逊宣布Anthropic的Claude 3 Sonnet模型现已在亚马逊云科技的Amazon Bedrock正式可用。
二、Claude 3 系列模型的介绍和特点
PS 想gpt3.5一键升级gpt4.0,可查看我上篇gpt3.5和gpt4.0的文章
1.Claude 3 的三种模型
Claude3系列是包含三个子模型的,分别是Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,每个模型都提供了不同程度的智能计算能力,所以三个子模型的应用定位也不同,定位如下所示:
从图中可看出Claude 3 系列的Opus模型是能力最强的,官方宣称Claude 3 Opus在各种基准测试中的表现已经超过了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra 。测试结果如下图所示
从上图中可以看出Claude 3 系列的所有模型均在分析、预测、细致内容创作、代码生成和多语言对话等方面展现出卓越能力。
2.Claude 3 的三种优势
Claude 3作为新推出的大语言模型,也在三个主要方面进行了优化和创新,智能处理能更强。这三个优化的方面分别是:1.长文本输入 ,2.增强了上下文理解,减少拒绝次数 ,3.视觉能力
2.1 长上下文和近乎完美的回复
Claude 3模型系列在发布时将首先提供一个200K的上下文窗口。然而,这三个模型都能够接受超过100万个token的输入,我们可能会向需要增强处理能力的选定客户提供此功能
2.2 增强上下文理解,减少拒绝次数
先前的Claude模型经常做出不必要的拒绝,这表明它们缺乏上下文理解。我们在这一领域取得了有意义的进展:与以前的模型相比,Opus、Sonnet和Haiku拒绝回答接近系统警戒线的提示的可能性要小得多。如下所示,Claude 3模型对请求的理解更为细致,能够识别真正的伤害,并且很少拒绝回答无害的提示
2.3 强大的视觉功能
克劳德3型模型与其他领先的模型一样,具有复杂的视觉功能。它们可以处理各种视觉格式,包括照片、图表、图形和技术图表。我们特别高兴为我们的企业客户提供这种新的模态,其中一些客户的知识库中有高达50%的信息以PDF、流程图或演示幻灯片等各种格式进行编码。
三、应用与获取
Opus 和 Sonnet 目前已集成到 Anthropic 的 Claude.ai 和 Claude API 中,覆盖了 159 个国家/地区。Haiku 将很快推出。此外,Sonnet 也可以通过亚马逊云科技的 Bedrock 服务以及谷歌云 Vertex AI Model Garden 的私人预览渠道获得,而 Opus 和 Haiku 也将在不久后登陆这两个平台。