Claude3横空出世，GPT对手来了!

一、新的大模型Claude3的发布

2024.03.04日，由谷歌和亚马逊支持的AI初创公司Anthropic发布了Claude 3模型家族，这是一个全新突破性大语言模型系列，这一系列模型在各种认知任务上树立了新的性能标准，其中Claude 3 系列包括三个子模型：Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus，每个模型都提供了不同程度的智能、速度和成本选择，旨在满足广泛的人工智能应用需求。该公司表示，在各种基准测试中，该家族中Claude 3 Opus在各种基准测试中表现优于OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra 。
Anthropic是一家位于美国加州旧金山的人工智能初创公司，成立于2021年。该公司由OpenAI（ChatGPT的开发机构）前研究副总裁达里奥·阿莫迪（Dario Amodei）、大语言模型GPT-3论文的第一作者汤姆·布朗（Tom Brown）等人共同创立，官网网址为https://www.anthropic.com/claude 。
2024年3月6日，亚马逊宣布Anthropic的Claude 3 Sonnet模型现已在亚马逊云科技的Amazon Bedrock正式可用。
在这里插入图片描述

二、Claude 3 系列模型的介绍和特点

PS 想gpt3.5一键升级gpt4.0,可查看我上篇gpt3.5和gpt4.0的文章

1.Claude 3 的三种模型

Claude3系列是包含三个子模型的，分别是Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus，每个模型都提供了不同程度的智能计算能力，所以三个子模型的应用定位也不同，定位如下所示:
在这里插入图片描述
从图中可看出Claude 3 系列的Opus模型是能力最强的，官方宣称Claude 3 Opus在各种基准测试中的表现已经超过了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra 。测试结果如下图所示

从上图中可以看出Claude 3 系列的所有模型均在分析、预测、细致内容创作、代码生成和多语言对话等方面展现出卓越能力。

2.Claude 3 的三种优势

Claude 3作为新推出的大语言模型，也在三个主要方面进行了优化和创新，智能处理能更强。这三个优化的方面分别是:1.长文本输入，2.增强了上下文理解，减少拒绝次数，3.视觉能力

2.1 长上下文和近乎完美的回复

Claude 3模型系列在发布时将首先提供一个200K的上下文窗口。然而，这三个模型都能够接受超过100万个token的输入，我们可能会向需要增强处理能力的选定客户提供此功能
在这里插入图片描述

2.2 增强上下文理解，减少拒绝次数

先前的Claude模型经常做出不必要的拒绝，这表明它们缺乏上下文理解。我们在这一领域取得了有意义的进展：与以前的模型相比，Opus、Sonnet和Haiku拒绝回答接近系统警戒线的提示的可能性要小得多。如下所示，Claude 3模型对请求的理解更为细致，能够识别真正的伤害，并且很少拒绝回答无害的提示
在这里插入图片描述

2.3 强大的视觉功能

克劳德3型模型与其他领先的模型一样，具有复杂的视觉功能。它们可以处理各种视觉格式，包括照片、图表、图形和技术图表。我们特别高兴为我们的企业客户提供这种新的模态，其中一些客户的知识库中有高达50%的信息以PDF、流程图或演示幻灯片等各种格式进行编码。
在这里插入图片描述

三、应用与获取

Opus 和 Sonnet 目前已集成到 Anthropic 的 Claude.ai 和 Claude API 中，覆盖了 159 个国家/地区。Haiku 将很快推出。此外，Sonnet 也可以通过亚马逊云科技的 Bedrock 服务以及谷歌云 Vertex AI Model Garden 的私人预览渠道获得，而 Opus 和 Haiku 也将在不久后登陆这两个平台。