23年生成式AI全球投资超360亿开拓者猜测2024年LLM应用大年夜爆发

2023年11月30日，ChatGPT庆祝了它的生日，Similarweb发布了下面这张精美的信息图来纪念这一时候。

从ChatGPT出身，到2023年5月，它的访问量一贯在迅速增长，峰值达到了每月18亿次的访问量。

随后，客流量在6月有所低落，但自9月以来又开始反弹——可能是由于高中生和大学生暑假结束，回到学校了。

去年的这个时候，很多人都在预测ChatGPT是否会取代谷歌，很显然，这件事还没有发生。

23年生成式AI全球投资超360亿开拓者猜测2024年LLM应用大年夜爆发

而在两周前，谷歌发布了ChatGPT的竞争对手——Gemini。

2022年末ChatGPT发布的时候，人们对人工智能，尤其是2023年的天生式人工智能充满了期待。

你可以让ChatGPT用Johnny Cash的风格写一首关于自动驾驶汽车的歌：

Ridin’ solo, but I’m never alone,

Got my AI ridin’ shotgun, steady as a stone.

On the endless road, under the sky so vast,

A ghost driver at the wheel, footprints of the past.

独自骑行，但我从不孤单，

我的人工智能像石头⼀样固若金汤。

在无尽的道路上，在辽阔的天空下、

一个幽灵司机驾驶着方向盘，留下了过去的脚印。

如果让他换成Giuseppe Verdi的风格，ChatGPT会展示出男高音歌唱的场景：

Ecco la carrozza senza cavallo！
（看，没有马的马车！
）

Scivola nella notte, silenziosa come il fato.（它在黑夜中滑行，像命运⼀样无声无息）

L'ingegno dell'uomo, l'orgoglio del progresso.（人类的聪慧，进步的骄傲）

In questa danza d'acciaio, tessiamo il nostro destino.（在这支钢舞中，我们编织自己的命运）

上面这张图展示了自ChatGPT发布以来，谷歌趋势对AI和ChatGPT的关注情形。

我们可能听说过「人工智能寒冬」的那个年代，但今年，风险投资公司向天生式人工智能投资了超过360亿美元。

毫无疑问，2023年是人工智能的盛夏。

一月份，人们开始探索ChatGPT的功能。
很快，大家意识到不同的提问办法（「提示」）会导致不同的答案。

于是，「提示工程」悄然兴起。

连大佬也感慨道，最热门的新编程措辞是英语。

然而，当普通大众还在为ChatGPT的能力惊叹不已、探索不同的提示技能之时，研究职员并没有安歇。

2023年第一季度，许多⼈都觉得跟不上人工智能的发展速率：

2月尾，Meta发布了LLaMA，

紧接着，AI21 Labs发布了Jurassic-2，

OpenAI发布了GPT-4，

Anthropic发布了Claude，

技能创新研究所（Technology Innovation Institute）发布了Falcon-40B，

谷歌发布了Bard，

连彭博也发布了自己的BloombergGPT。

随着开拓⼈员熟习了ChatGPT的玩法，他们开始构想可以利用LLM做些什么，——于是，求职信天生器、YouTube择要、定制的谈天机器⼈等运用纷纭涌现。

与传统的机器学习模型比较，大措辞模型使开拓⼈员能够通过大略的 API 调用来访问其功能。
这改变了开拓职员构建人工智能运用程序的办法。

伴随着这种快速构建人工智能运用程序的新方法，新的开拓工具也陆续涌现：

LangChain和LlamaIndex等框架引起了人们的极⼤兴趣，这些框架使开拓⼈员能够快速、模块化地利用LLM构建运用程序。

其余，可以实现语义搜索的矢量数据库，又重新受到关注，由于开拓职员创造，它也可以用来为LLM运用程序供应外部数据。

早在今年4月，实践者们就开始将LLM运用程序投入生产过程中，并谈论本钱、延迟、幻觉以及前后兼容性等寻衅。

「用LLM做出很酷的东西很随意马虎，但做出可投入生产的东西却很难」。

在2023年，构建LLM系统的关键词或许该当是：微调（fine-tuning）、检索增强天生（retrieval-augmented generation，RAG）和评估（evaluation）。

从数据科学家的角度来看，微调是向神经网络传授新知识的首选技能，因此，微调是让通用LLM访问特定领域数据的第一种盛行方法。

特殊是随着开源LLMs（如LLaMa-2）和高效LLMs微调技能（如QLora）的发布，LLMs的微调变得更随意马虎为实践者所接管。

上图是谷歌趋势对「RAG LLM」的兴趣变革曲线，可以看出RAG在2023年7月旁边成为热门话题。

RAG将知识从LLM的推理能力等分离出来，存储在外部数据库中，这比利用微调功能时更随意马虎更新。

然而，回顾2023年，我们可能会惊异地创造，由LLM驱动的运用软件少之又少。

毕竟，在天生式AI展现出自身性能的同时，也面临着很多问题。

例如，谷歌的Bard「发明」了有关James Webb望远镜的信息。
微软的Bing坚称歌手Billie Eilish参加了2023年超级碗中场秀。

而一位状师表示，他的联邦法院辩解状充满了ChatGPT供应的虚假引文和捏造的法律见地。

虽然知道谈天机器人会犯错，但高中生和大学生仍是谈天机器人最狂热的利用者，他们利用谈天机器人来撰写论文、完成问题集和编写代码。

对此，学校管理者也同样抵牾，他们无法判断谈天机器人到底是欺骗工具还是学习工具。

今年1月，纽约市学校校长David Banks禁止了ChatGPT，由于谈天机器⼈「不能培养批驳性思维和解决问题的能力」，

而在四个月后，David Banks又推翻了这一禁令，并表示自己「忽略了天生式人工智能在支持学生和西席方面的潜力」。

3月，OpenAI的联合创始人Greg Brockman曾预测，未来的谈天机器⼈将帮助编写电影剧本，并改写不雅观众不喜好的场景。

而两个月后，美国作家协会举行了罢工，哀求签订条约，保护人们免受人工智能天生的烂片之害。

9月，编剧们结束了罢工，电影公司放弃人工智能剧本，

同时，作家协会联合一些著名小说家对OpenAI提起了集体诉讼。
他们表示，OpenAI在未经赞许的情形下，在演习数据中利用了他们的版权作品。

虽然已经有⼀些天生式人工智能运用，如亚马逊的产品择要功能，但许多公司仍在试验和评估其办理方案。

从这个意义上讲，2023年也可以说是考试测验和理解天生式人工智能的一年。

对2024的期待

11月的时候，OpenAI宣告了一套新的产品，个中包括一个自建谈天机器⼈套件。

在新工具的帮助下，我们可以利用ChatGPT轻松创建一个谈天机器⼈。

它能确定哪些药物不能一起服用，还能列出特定地点所有知足特定条件的餐厅。

制作这些谈天机器人的方法既直不雅观又大略，——但我们对驱动它们的算法、演习数据的来源、以及谈天机器人天生的信息是否准确都一无所知。

我们也不知道自己利用了多少打算能力，对环境造成了多大影响。

未来，天生式人工智能的商业发展可能会有增无减。
人工智能将影响越来越多的繁芜活动，如放射学、药物研发、生理治疗、招聘和大学录取等。
科技公司也将不才一代硬件中植入人工智能。

大概在2024年，天生式人工智能办理方案将真正投入生产。

——我们会在生活中碰着越来越多的由LLM驱动的功能。

许多框架、度量标准和范式将不断发展，如何评估和监控由LLM驱动的运用，会成为一个更热门的谈论话题。

人们将学会如何精确衡量RAG、问答系统和谈天机器人的性能，并有可能会找到改进性能的新技能。

随着这些天生式人工智能系统性能的成熟，将有越来越多的天生式人工智能运用，来帮助我们提高生产效率和改进用户体验。

其余，减少数据泄露和保护敏感数据这一话题也将变得比以往更加主要。

可以肯定的是，2024年将会发生很多变革。
而现在，正是积累履历的好机遇。

参考资料：

https://towardsdatascience.com/2023-in-review-recapping-the-post-chatgpt-era-and-what-to-expect-for-2024-bb4357a4e827

每期AI知识网

23年生成式AI全球投资超360亿开拓者猜测2024年LLM应用大年夜爆发

AI经验总结丨若何用好AI来赋能小我和企业

介绍合成海报设计网站,创意无限，打造视觉盛宴