作者:邓怀宇

【导读】

随着天生式人工智能的发展,AI Agent运用不断呈现,而端侧大模型的落地为AI Agent运用注入新的活力。
特殊是近期,苹果发布的基于端侧大模型的智能系统Apple Intelligence,向业界展示了AI Agent运用的更广阔前景。
那么,目前AI Agent发展还面临哪些寻衅?端侧大模型将如何提升AI Agent的可用性?我们将在本文磋商。

一、什么是AI Agent?

AI Agent成长面临哪些寻衅端侧大年夜模型将若何提升其可用性

AI Agent(人工智能代理/人工智能体)是领悟感知、剖析、决策和实行能力的智能体,其能够与环境交互,网络信息、数据,并利用信息、数据自主实行任务,以实现人类设定的目标。
AI Agent具备相称显著的主动性,堪称人类的空想智能助手。
例如,AI Agent可以根据用户的在线互动和事务处置数据,理解用户的兴趣、偏好、日常习气,识别用户的意图,主动提出建议,做出决策,并自主帮助用户折衷多个运用程序去完成决策。

目前,基于大措辞模型的AI Agent运用,在代码天生、数据剖析、通用问题解答、科学研究等多个领域内,展现出显著的潜力。
比如,在代码天生领域,硅心科技发布的aiXcoder已经能自主完成开拓编程、代码自动补全以及代码智能搜索等任务,极大地提升了编程效率。
再比如,在线下零售领域,空间运营智能体OmVision Bot,在对店铺进行实时动态检测的同时,能够自主发出非常行为警告,并自主供应专业的店铺运营数据和总结报告,为商家供应全面且高效的管理支持。
在个人助理领域,人工智能初创公司HyperWrite推出的Personal Assistant个人智能代理,能够自主完成浏览器中的指界说务,帮忙用户快速浏览并总结浏览器页面内容,为用户供应智能化的个人助理做事。

基于大措辞模型的AI Agent项目 来源:金融机器智能官方

二、AI Agent发展面临的寻衅

只管AI Agent运用层出不穷,但目前,AI Agent尚处于发展的低级阶段,其功能与运用范围相对有限,在实际支配与运行过程中仍面临着诸多寻衅。

1、提示工程仍需优化

提示工程(Prompt Engineering)是AI Agent发展的关键环节,它有效地连接了人类意图与机器理解,使AI Agent能够更好地理解任务哀求,从而更加合理地分解任务,做出更符合情境的决策。
有效的提示工程可以提高AI Agent的准确性、可控性温柔应性,使其在繁芜任务中表现更佳。

过拟合是当下提示工程面临的紧张寻衅。
在提示工程的设计中,平衡很主要,如果提示工程设计过于狭窄,AI Agent会过于依赖特定的输入模式或情境。
一旦碰着与演习数据差异较大的新情境,AI Agent将无法适应,导致性能明显低落或产生缺点的输出。
这种局限性不仅限定了AI Agent的运用范围,还影响其在繁芜、多变环境中的稳定性和可靠性。

2、算力根本不敷

算力根本举动步伐的利害直接决定AI Agent的事情表现。
首先,打算资源不敷是紧张问题。
随着大模型变得越来越繁芜和弘大,大模型演习和推理过程中对打算资源的需求显著增加,而现有的算力根本举动步伐难以知足这些需求。

其次,打算过程中存储系统的性能瓶颈也是一大制约成分。
AI Agent演习须要处理大量的多模态数据,如图像、视频和文本数据等,这哀求存储系统必须具备高容量和高性能,以确保数据的快速读写和高效管理。
然而,现有的存储系统办理方案难以知足这些需求,导致数据同步和数据处理效率低下,影响AI Agent的整体表现。

此外,网络性能和通信问题也一定程度上限定了AI Agent的发展。
对付AI Agent的运用来说,通信效率非常主要,网络延迟和带宽瓶颈会严重影响AI Agent的处理能力和运用效果。

3、高质量数据难获取、多模态数据难转换

在数据方面,AI Agent紧张面临高质量数据难获取以及多模态转换过程中的数据流失落问题。

首先,高质量数据对付AI Agent的模型演习至关主要,但由于数据安全与隐私等问题,AI Agent在获取此类数据时面临更大的寻衅。

在进行繁芜推理和任务方案时,AI Agent须要处理大量的企业或个人数据,而这些数据每每包含敏感信息,如商业秘密和个人隐私,这对数据安全提出了更高的哀求。
任何数据透露或造孽访问都可能对用户的隐私造成不可逆转的危害,很多用户因此不肯望面向开拓者开放这些数据。
此外,由于本地打算资源的限定,目前大多数AI Agent都是基于云端大模型运行,这进一步加剧了用户对数据安全性的担忧。

其次,为了更全面地理解、描述现实天下并做出决策,AI Agent须要处理包括文本、图像、视频和音频在内的多模态数据,并将这些多模态数据转换、领悟。
然而,各种模态的数据都有其独特的构造和语义特色。
例如,文本数据常日以线性序列的形式存在,而图像则是二维的像素阵列,视频则是图像序列,音频则是韶光序列的声波旗子暗记。
AI Agent在将这些多模态数据进行转换和领悟的过程中,可能会丢失原始数据的细微特色和高下文信息,导致数据不完全,例如,将音频数据转换为文本数据时,关于语音情绪色彩或其他非措辞互换元素的数据可能丢失,进而影响AI Agent的准确理解和决策。

4、协同多运用事情的能力不敷

协同多运用事情的能力代表着AI Agent对工具的利用能力,直接决定了AI Agent的能力边界。
目前大部分AI Agent协同多运用事情的能力不敷,大多只能调用特定的某个或某几个运用,完成特定场景的任务,而无法实现更为广泛、灵巧的多运用协作。

比如,利用当下热门的Agent-GPT来支配一个与个人出行做事干系的AI Agent,该AI Agent其只能调用用户预设的特定运用,实行航班查询和酒店搜索等操作,并为用户天生一份完善的出行操持或攻略。
该AI Agent无法搜素大众点评、小红书等非预设运用的内容,也无法在携程、飞猪等非预设运用中完成预定航班、酒店等操作。
因此,提升AI Agent协同多运用事情的能力,成为当前AI Agent运用发展面临的一大主要寻衅。

5、可阐明性和用户信赖问题

可阐明性是AI Agent发展另一大的寻衅。
可阐明性指的是理解和解释大模型内部事情机制和决策过程的能力。
当前,大模型常日被视为黑箱模型,内部机制和决策过程不透明、难以阐明。
用户无法直接不雅观察或阐明模型是如何从输入得到输出,进而造成用户的信赖问题,从而影响Agent的运用。

6、任务归属问题

AI Agent依据人类预设的目标进行操作,但在任务的方案、决策以及实行环节上,AI Agent拥有高度的自主性。
这种自主性意味着AI Agent在实行任务时可能采纳的办法和行为,并不完备等同于或直接反响人类的原始意图。
因此,若AI Agent在实行任务过程中涌现不当行为或造成他人利益受损,关于任务归属的剖断也是一个主要寻衅。

三、端侧大模型将如何提升AI Agent的可用性?

随着轻量化大模型的发展,各终端设备制造商纷纭发布搭载端侧大模型的终端产品,这一定程度年夜将办理AI Agent在算力、数据、跨运用事情等方面的问题,进一步提升AI Agent的可用性。

1、更快的相应效率

过去,基于云端大模型的AI Agent在处理用户任务的过程中,首先须要将数据传输到远程做事器进行处理,然后再将处理结果返回,这一过程不可避免会产生延迟。
而具备较强打算能力的端侧大模型则可将这一处理过程迁移至本地设备,以此肃清传输造成的韶光花费,从而实现AI Agent实时相应。
同时,本地处理也一定程度上减少了数据传输的频率和数量,从而降落了带宽花费,降落了数据传输本钱。

小米最新旗舰手机小米14内置的端侧大模型,显著减少了用户利用的等待韶光和操作延迟,实现在拍摄过程中,实时对景象进行判断和优化,有效提高了用户体验,使得用户与设备的交互更加顺畅和自然。

2、更强的运行稳定性

端侧大模型减少了AI Agent对网络连接的依赖。
纵然在网络连接不稳定或无网络连接的情形下,基于端侧大模型的AI Agent依然能够正常事情,确保事情的连续性和可靠性。
比如,在翱翔模式下,用户依然可以利用实时翻译、文档剖析和智能总结等功能;在Apple Intelligence的最新演示中,Siri可以在无网络连接的情形下事情,并且能够基于端侧大模型回答用户的通识性知识问题。

3、更有效的协同多运用事情能力

相较于目前的AI Agent运用,终端设备厂商基于端侧大模型开拓的AI Agent运用能够更灵巧、充分地调用更多的终端设备厂商预设运用,自主完成更多的多场景任务。
这将大大拓宽AI Agent的运用处景和能力边界。

比如,在苹果Apple Intelligence系统中,Siri能够自主调用苹果手机内设的照片、邮件、备忘录、信息、日程、舆图、景象、钱包等运用,实现根据用户的邮件、信息内容,自主剖析用户行程安排,将之添加进日程,并作出相应的路线方案。
华为最新的智能体小艺则能够实现自主剖析设备中所有类型的文件,并根据用户需求实现扩运用的图片编辑、文件分享、文档剖析等操作。

值得一提的是,只管终端大模型使得AI Agent在跨运用调用方面有了很大发展,但目前基于终端大模型的AI Agent协同多运用事情能力还紧张局限在终端设备的预设运用中,要实现在更多运用的协同事情能力,还须要打通更多第三方运用,未来随着强势终端设备厂商推动打通更多第三方APP,,AI Agent的可用性和通用性将会进一步增强。

4、更好地办理数据隐私和安全问题

在端侧支配大模型使得AI Agent能够在本地设备上处理数据,无需上传到云端,从而减少了数据在传输过程中的透露风险,这将显著增强数据隐私和安全。
比如苹果最新发布的基于端侧模型运行的个人智能系统—Apple Intelligence的一条底层逻辑便是在设备端处理任务,所有个人敏感数据都会由端侧模型来处理,在须要更高打算能力的情形下,该系统也会先将用户数据在本地进行脱敏处理,然后通过Private Cloud Compute进行加密,再上传到云端做事器进一步处理、打算。
这极大程度地担保了用户的隐私安全。

此外,在担保数据隐私和安全的根本上,AI Agent能够在本地得到更加深度、全面的个人数据,AI Agent在对这些个人数据进行深度学习后,将更加理解用户行为、喜好和习气,从而提高意图感知的准确性以及任务方案和决策的可靠性。

【小结】

随着人们对天生式人工智能技能的认识逐步加深,AI Agent在大众生活中的运用也会变得更加的普遍,我们完备有情由相信在不远的未来它们能够真正成为大众生活和事情中的得力助手。