编译 | 杨蕊伃编辑 | 漠影

智东西9月14日,据VentureBeat昨日宣布,美国大模型独角兽OpenAI发布了增强推理能力的大措辞模型,包括o1-preview和更简化的o1-mini(OpenAI草莓模型深夜突袭!
理化生达博士生水平,比GPT-4o强多了,ChatGPT可用)。
据悉,这两个新模型将为开拓者供应强大的推理能力,特殊是在科学、技能、工程和数学(STEM)领域。

目前,这两个模型已向ChatGPT Plus用户以及利用OpenAI付费API的开拓者开放。
因此,开拓者现在可以在现有的第三方运用和做事中测试这些模型,或者利用它们构建新的运用和做事。

o1-Preview和o1-mini模型目前专注于文本处理,在编码和文书起草上表现出色,还能够进行操持天生、风险评估、创建运用程序和游戏、自动完成提案要求、策略化参与等,但在内容快速相应方面还有待提升。

开拓者若何用好OpenAI o1模型5大年夜有趣应用值得一试

不过,o1系列模型并不是多模态的,在某些运用处景下并不能完备替代GPT-4o,如图像输入、函数调用等。

据悉,o1系列模型目前仅向“Tier 5”级别的用户群体开放,且暂时不支持批量要求,每分钟最多处理20个要求,不太适用于须要快速连续相应的运用处景。

个中,o1-preview模型在供应广泛的“天下知识”方面表现出色,是OpenAI目前供应的最昂贵的AI模型。

开拓职员可以通过OpenAI的公共API以及微软Azure OpenAI Service、Azure AI Studio和GitHub Models来访问这些新的OpenAI o1模型。

一、多模态功能缺失落:o1系列模型仅支持文本处理,无法完备取代GPT-4o

新的o1模型采取了一种“推理”机制,OpenAI称,它们会“考试测验多种策略,识别缺点,并进行完全的思考过程”。
OpenAI的API技能卖力人Michelle Pokrass在接管VentureBeat的视频电话采访时,分享了模型开拓背后的一些理念。

Michelle Pokrass称:“在我们的测试中,这些模型在一些最具寻衅性的基准测试中表现的像博士生一样。
”OpenAI的产品卖力人Nikunj Handa也向VentureBeat表达了他对o1模型家族的意见。
他认为,o1模型在处理“推理干系问题”方面“比GPT系列表现得要好得多”。

o1-preview和o1-mini模型目前仅支持文本输入和输出,这意味着它们在功能上还无法完备取代GPT-4o。
GPT-4o是OpenAI当前最前辈模型,它不仅能够处理文本,还支持多模态输入和输出,包括剖析文件附件和天生图像。
因此,对付须要这些高等功能的第三方开拓职员来说,GPT-4o仍旧是更得当的选择。

根据Pokrass和Handa的说法,o1系列模型并不是多模态的。
此外,这些模型目前还不能浏览网页,因此无法获取2023年10月之后的新信息。
不过,用户可以通过文本输入来供应最新知识,供模型参考和剖析。

在天生输出时,它们的速率也较慢,有时须要超过一分钟,在某些情形下乃至可能须要几分钟。

▲用户反响o1-preview模型天生速率有时候有点慢(图源:X截图)

一些得到早期访问权限的开拓者反馈,这些模型在编码和起草法律文件等任务上的性能有所提高。
因此,对付乐意考试测验并为更高效能支付额外用度的开拓者而言,o1-preview和o1-mini模型仍旧是值得考虑的选择。

就像OpenAI在其o1-preview和o1-mini推理模型的API文档中所说:“对付须要图像输入、函数调用或快速相应的运用程序,GPT-4o及其mini是得当的选择。
然而,如果您的目标是开拓须要深度推理并能容忍较长相应韶光的运用程序,o1模型可能是更好的选择。

二、o1系列限定每分钟最多20个要求

o1-preview和o1-mini模型最初仅向“Tier 5”用户开放,这是指那些通过API消费达到1000美元,并且至少在30天前就已经向公司支付过用度的用户。

OpenAI称,新o1模型系列目前处于预览阶段,与其他模型比较,它们有特定的利用限定。
o1模型的限定是每分钟最多20个要求,这意味着它们不适宜须要快速连续相应的运用处景。
此外,o1模型目前不支持批量要求,这与OpenAI的其他模型不同,后者可以将要求集中处理,常日在24小时内返回结果,且本钱较低。

据OpenAI的API技能卖力人Michelle Pokrass先容,o1-preview模型供应了更多STEM之外学科的“天下知识”,是目前供应的最昂贵的OpenAI AI模型。
其价格为每输入100万个token 15美元,每输出100万个token 60美元。
比较之下,GPT-4o的价格为每输入100万个token 15美元,每输出100万个token 4美元。
这意味着,o1-preview模型的价格比GPT-4o赶过200%到300%。

比拟之下,o1-mini模型的价格较为经济,其用度为每输入100万个token 3美元,每输出100万个token 12美元,这比o1-preview模型便宜了80%。

Pokrass说:“当然,我们将在接下来的几周和几个月内调度定价,以将其调度到得当的水平。

▲OpenAI各种领先模型的定价明细

三、o1系列模型能做什么:天生操持、评估风险、创建游戏、要求提案、增长黑客……

在处理高下文方面,o1系列模型的限定与GPT-4o以及其他OpenAI的顶级模型相称,能够处理最多128000个token,这包括了输入和输出。

o1-preview模型在单次输出或相应中最多可以天生32768个token,而o1-mini可以天生双倍的数量,即65536个token。

此外,部分开拓职员在o1-previews和o1-mini发布后就开始考虑如何利用它,并对其进行测试,看看它能做什么,不能做什么。

基于这项事情,以下是o1-preview和o1-mini模型迄今为止最有趣的一些用场。

1、天生操持和白皮书:一些用户报告称,o1模型系列能够天生详尽的行动操持和完全的文档,比如仅凭大略提示就能天生引用充分的白皮书。

▲o1-preview能天生关于企业天生式AI用例的白皮书(图源:X截图)

2、方案、根本举动步伐和风险评估:AI影响者和企业顾问Allie K.Miller在X上分享了一系列的OpenAI o1-preview模型的输出示例,这些示例展示了该模型在多个领域的运用能力,包括优化员工的组织日程安排、评估合并风险、设计更高效的仓库,以及平衡城市电网等任务。

3、快速创建运用程序和游戏:OpenAI的o1-preview模型彷佛是对Anthropic的Claude系列,尤其是其Artifacts功能的直接竞争,由于它同样为用户供应了一种强大且快速的办法来天生自己的交互式运用程序和游戏。

▲o1和Cursor Composer能创建运用程序(图源:X截图)

4、自行完成提案要求(RFP):承包商,特殊是那些为政府机构供应做事的,对提案要求(RFP)非常熟习。
RFP是机构以标准化格式搜聚条约投标的一种办法,这个过程既繁琐又耗时。
宾夕法尼亚大学沃顿商学院的教授Ethan Mollick在X上发布称,o1-preview模型能够自主填写RFP,只管它仅限于文本输入,并且不接管文件上传。

5、策略化参与和增长黑客:EasyGen是一款用于自动天生LinkedIn帖子的Chrome运用程序,其创始人Ruben Hassid在X上发布了一段演示视频,展示了o1-preview模型如何能够天生一个全面且合理的操持,以利用Reddit来帮助他的公司发展。

然而,网络关照初创公司Engagespot的首席技能官Anand Sukumaran认为,GPT-4o在编写大略程序时速率更快。

结语:OpenAI将连续优化o1及GPT系列模型,给用户供应更多的运用构建选择

VentureBeat作者认为,只管o1系列可能并不适宜部分开拓职员,但它的推出对付那些有实验空间并希望开拓新运用程序和做事的开拓职员来说,无疑是一个激动民气的时候。

OpenAI还承诺将连续推进o1系列及其GPT系列的能力,这意味着那些希望在这家AI公司的平台上构建运用程序的开拓者将拥有丰富的选择。

随着这些模型的不断优化和升级,它们将在诸如文学、艺术等更多领域展现出运用潜力。

来源:VentureBeat