AI日报:Anthropic推出商业友好型Claude 3人工智能模型

简介: AI日报:Anthropic推出商业友好型Claude 3人工智能模型

Claude3发布

OpenAI的竞争对手Anthropic今天公布了其Claude 3系列模型,这是该初创公司的第一个多模式版本,旨在解决公司最大的生成人工智能问题:成本、性能和幻觉。

这家初创公司拥有亚马逊和谷歌数十亿美元的投资,以对抗微软的OpenAI巨头,并在其Claude 3家族中推出了三款新机型:Haiku、Sonnet和Opus。这些可以接受并生成文本和图像。

这些模型显示了Haiku、Sonnet和Opus等不断提升的功能水平以及定价。值得注意的是,Anthropic关于Claude 3的技术论文显示,这三个模型在知识、推理、数学、问题解决、编码和多语言数学方面都击败了OpenAI的GPT-3.5和Gemini 1.0 Pro。

根据Anthropic的数据,Opus甚至击败了GPT-4和Gemini Ultra——分别是OpenAI和谷歌最先进的模型。人类研究人员在一篇博客文章中写道,Opus在复杂任务上表现出“接近人类水平的理解力和流利度,引领了一般智力的前沿”。

Anthropic表示,这三种型号最初都有20万(20万)的代币窗口,但能够摄入超过100万个代币,可供选择需要额外处理能力的客户使用。

但Opus也是三种代币中价格最高的——百万分之15的代币用于输入,百万分之75的代币用于输出。相比之下,OpenAI的GPT-4 Turbo更便宜,输入为10美元/MTok,输出为30美元/MTok,但上下文窗口较小,为128k。

Sonnet击败了GPT-3.5,在几个性能指标上与GPT-4不相上下,输入成本为3/MTok,输出成本为15/MTok。Haiku是最便宜的型号,每公吨投入25美分,每公吨产出1.25美元,轻松击败了GPT-3.5和Gemini Pro,但没有击败GPT-4或Gemini Ultra。

Claude 3模型在2023年8月之前一直接受数据训练,但可以访问搜索应用程序获取最新信息。

Opus和Sonnet现已在claude.ai和claude API的159个国家推出,Haiku即将推出。尝试Sonnet通过免费版本的Claude AI聊天机器人在这里。Opus有付费的Claude Pro版本。

对于企业客户,Sonnet通常仅在亚马逊Bedrock上作为托管服务提供

实时聊天的“近即时响应”

随着语言和多模式人工智能模型之间的竞争加剧,Anthropic正在通过开发Claude 3模型来吸引企业客户,从而加强其商业游戏。

Claude 3模型可以进行分析、预测、内容创建和编码,并且是多语言的。添加图像功能将使企业能够将图表、图形和其他视觉效果上传到模型中。(OpenAI对GPT-4也做了同样的事情,推出了提供视觉的GPT-4V)。

然而,Anthropic指出,Claude 3型号可以实时提供“近乎即时的响应”,适用于实时客户聊天、自动完成和数据提取,其中时间至关重要。

例如,它说Haiku可以在不到三秒的时间内阅读一篇密集的研究论文,其中有大约1万个代币的图表,速度会更快。Sonnet的速度是Claude 2和2.1的两倍,这使得它在知识检索和销售自动化等任务中更有用。

Opus的速度与Claude 2相同

更少的幻觉

企业对生成人工智能的主要担忧之一是幻觉或错误的输出。以加拿大航空公司最近的案例为例,该公司的人工智能聊天机器人向旅行者提供了不正确的退款信息。在旅客提起诉讼后,法院命令该航空公司赔偿旅客的损失。

Anthropic说,Opus在给出正确答案和尽量减少错误答案方面是Claude 2.1的两倍。研究人员测量了三类准确性:正确答案、错误答案和回答不知道答案而不是错误答案。

至关重要的是,Anthropic表示,Claude 3模型在长上下文提示中对数据有很好的回忆能力——它表示,其他人工智能模型难以记住长提示的中间部分。这家初创公司声称Opus具有99%准确率的“近乎完美的召回”。

这意味着Claude 3车型可以更好地遵循品牌的声音和面向客户的应用指南。

然而,Claude 3模型无法记住之前聊天的提示。它也无法打开链接,并将拒绝识别图片中的人。

负责任的人工智能基金会

自两年前由前OpenAI工程师创立以来,Anthropic一直优先考虑让人工智能负责任。研究人员表示,它的模型是根据所谓的“宪法人工智能”进行训练的,即模型规则中体现的人类价值观,以避免性别歧视、种族主义和其他有害输出,并遵守联合国《世界人权宣言》等原则。

今天,Anthropic宣布了另一条规则:尊重残疾人权利,以减少任何宣扬刻板印象和偏见的产出。

至于其模型被用于邪恶原因的风险,Claude 3模型处于人工智能安全级别2,Anthropic表示,该级别确实“显示出危险能力的早期迹象,例如提供如何制造生物武器的指令的能力,但由于可靠性不足或未提供搜索引擎无法提供的信息,这些信息尚未有用。”

Claude 3模型是根据第三方的公共在线数据和私人数据进行训练的

目录
相关文章
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
当大火的文图生成模型遇见知识图谱,AI画像趋近于真实世界
本文介绍了阿里云机器学习PAI团队开发的名为ARTIST的中文文图生成模型,该模型融合了知识图谱信息,能够生成更加符合常识的图像。ARTIST基于Transformer架构,将文图生成任务分为图像矢量量化和文本引导的图像序列生成两个阶段。在第一阶段,模型使用VQGAN对图像进行矢量量化;在第二阶段,通过GPT模型并结合知识图谱中的实体知识来生成图像序列。在MUGE中文文图生成评测基准上,ARTIST表现出色,其生成效果优于其他模型。此外,EasyNLP框架提供了简单易用的接口,用户可以基于公开的Checkpoint进行少量领域相关的微调,实现各种艺术创作。
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
什么是人工智能模型的泛化能力
什么是人工智能模型的泛化能力
10 2
|
1天前
|
人工智能 NoSQL atlas
Fireworks AI和MongoDB:依托您的数据,借助优质模型,助力您开发高速AI应用
我们欣然宣布MongoDB与 Fireworks AI 正携手合作让客户能够利用生成式人工智能 (AI)更快速、更高效、更安全地开展创新活动
|
1天前
|
存储 人工智能 算法
【论文阅读-问答】人工智能生成内容增强的甲状腺结节计算机辅助诊断模型:CHATGPT风格的助手
【论文阅读-问答】人工智能生成内容增强的甲状腺结节计算机辅助诊断模型:CHATGPT风格的助手
14 6
|
1天前
|
人工智能 vr&ar
[译][AI Research] AI 模型中的“it”是数据集
模型效果的好坏,最重要的是数据集,而不是架构,超参数,优化器。
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
大模型和传统ai的区别
在人工智能(AI)领域,大模型一直是一个热议的话题。从之前的谷歌 DeepMind、百度 Big. AI等,再到今天的百度GPT-3,人工智能技术经历了从“有”到“大”的转变。那么,大模型与传统 ai的区别在哪里?这对未来人工智能发展会产生什么影响?
|
1天前
|
人工智能 监控 安全
在园区引入AI大模型
5月更文挑战第5天
16 0
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
ElasticON AI 2023大会回顾:深入探索 Elasticsearch 与人工智能的融合之路
ElasticON AI 2023大会回顾:深入探索 Elasticsearch 与人工智能的融合之路
22 0
|
1天前
|
存储 机器学习/深度学习 人工智能
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
对大模型和AI的认识与思考
2023年,笔者也参与了各种学习和实践,从大语言模型、多模态算法,文生图(Stable Diffusion)技术,到prompt工程实践和搭建文生图(Stable Diffusion)webui实操环境。在此对谈谈对大模型和AI的认识与思考,是为总结。5月更文挑战第3天
31 1

热门文章

最新文章

http://www.vxiaotou.com