编者按:AI是被炒作得最多的技能了。在媒体的渲染下,AI彷佛无所不能,将来必定无所不在。但是做AI的买卖却未必像你想象的那般随意马虎。从传统意义上讲,当本年夜部分的AI系统都完备属于软件。其结果是,人工智能业务看起来并不完备像软件业务。这学买卖牵扯到不断的人力支持以及显著的可变成本。其可扩性一样平常没有我们希望的那么大略可以实现。而强大的防御能力彷佛不是免费就能取得的。有名风投契构A16Z的Martin Casado和Matt Bornstein对AI的商业进行了深度阐发,并为AI创业公司供应了有用的建议。原文揭橥在a16z.com上,标题是:The New Business of AI (and How It’s Different From Traditional Software)
就技能层面而言,人工智能彷佛是软件的未来。人工智能在一系列棘手的打算机科学问题上都展现出惊人的进步,而且软件开拓职员的事情正在发生根本上的变革,他们对数据上的投入正在变得跟对源代码的投入一样多。
许多AI公司(和投资者)都在押注,他们赌的是这种关系将不仅局限在技能上——AI业务也会类似于传统软件公司。根据我们跟AI公司互助的履历来看,我们还不太确定。
我们坚信AI的力量能够推动业务转型:我们用资金投入来支撑这一不雅观点,而且我们会连续对运用型AI公司和AI根本举动步伐进行大量投资。但是,我们把稳到,在很多情形下,人工智能公司的经济构造与软件业务比较有着根本的不一样。有时,它们乃至看起来更像传统的做事型公司。尤其是,许多AI公司具有以下特色:
由于大量利用云根本架构和不间断的人工支持,导致公司毛利率低落;
由于棘手的边缘案例问题给扩展性带来寻衅;
由于AI模型的商品化以及数据网络效应带来的寻衅,护城河的可防御性变弱。
有趣的是,在AI公司的财务数据里面我们看到了一个出乎猜想的同等模式,即这类公司的毛利率常日在50-60%的范围之内——远低于同比SaaS型业务60-80%以上的基准。早期阶段的私人成本可以在短期内粉饰这些效率低下的情形,特殊是在一些投资者更重视推动增长而不是盈利的情形下。但是,尚不清楚任何数量的长期产品或投放市场(GTM)优化能不能彻底办理这个问题。
就像SaaS 跟本地软件比较是引入了一种新颖的经济模式一样,我们相信AI正在创造一种在性子上全新的业务。因此,本文将磋商AI公司与传统软件公司的不同之处,并就如何办理这些差异分享了一些建议。我们的目标不是给出规范,而是为了帮助运营商和其他人理解AI的经济和计策前景,从而可以建立更具持续性的公司。
但是,我们把稳到,在很多情形下,人工智能公司的经济构造与软件业务比较有着根本的不一样。有时,它们乃至看起来更像传统的做事型公司。
软件 + 做事 = AI?软件(包括SaaS)的魅力在于它制作一次就可以卖很多次。这种性子创造出大量引人瞩目的业务收益,包括常常性收入来源,极高的毛利率(60-80 %+),以及(相对罕见的情形下,如果涌现网络效应或规模效应的话)超线性的增长。软件公司还具有树立强大的防御性护城河的潜力,由于它们拥有自身所产生的知识产权(常日是代码)。
另一个极度则是做事业。每上一个新项目都须要专门的人,而且只能卖一次。其结果是,收入每每是非常常性的,毛利率较低(30%至50%),而且规模增长便是最好结果了。其防御性更具寻衅性——每每要靠品牌或者既有的司帐掌握——由于客户不拥有的任何IP都不太可能具有广泛的适用性。
人工智能公司彷佛正在把越来越多的软件和做事要素结合在一起。
大多数AI运用看起来觉得都跟普通软件很像。他们依赖常规代码去实行诸如跟用户交互、管理数据或与其他系统集成之类的任务。但是,这种运用的核心是一组经由演习的数据模型。这些模型阐明图像、转录语音、天生自然措辞并实行其他的繁芜任务。掩护这些运用有时候觉得更像是做事业务——须要大量的,针对特定客户的事情以及输入本钱,其程度已经超过了范例的支持和成功函数。
这种动态会以多种主要的办法影响AI业务。在以下各节里面,我们谈判量个中的几种——毛利率、可扩性以及可防御性。
人工智能公司彷佛逐渐把软件和做事的要素结合到一起,无论是从毛利率、可扩性以及可防御性来看,都可能代表着一种全新的商业类型。
毛利率,第1部分:云根本举动步伐对AI 公司来说是一笔巨大的本钱,这种本钱有时候乃至是隐蔽的
在本地预置型软件的旧时期,交付产品意味着刻录和运输物理介质——无论是在做事器端还是在桌面运行,软件的本钱均由买方承担。如今,在SaaS 占主导的情形下,这一本钱已被推回给供应商。大多数软件公司每个月都要支付大笔的AWS或Azure账单——软件的哀求越高,账单的数额就越大。
而事实证明,人工智能的哀求相称高:
演习一个AI模型可能要花费数十万美元(或更多)的打算资源。只管将其视为一次性本钱很诱人,但重新演习已被视为一项不断持续的本钱,由于供应给AI模型的数据会随着韶光而变革(这种征象称为“数据漂移”,data drift)。
与运行传统软件比较,模型推断(在建模过程中天生预测的过程)在打算上也更加繁芜。同时,跟从数据库中读取数据比较,实行持续串的矩阵乘法也须要更多的数学运算。
与传统软件比较,人工智能运用更有可能对图像、音频或视频等富媒体进行处理。这些类型的数据花费的资源比一样平常的数据更耗存储资源,处理本钱高,并且常常会碰着感兴趣区域的问题——可能须要运用来处理大文件才能找到干系的小片段。
有AI公司见告我们,跟传统方法比较,云打算操作可能更繁芜,本钱更高,尤其是由于没有好的工具可以在环球范围内扩充AI模型。其结果是,一些AI公司必须定期跨云去转移演习好的模型——这一出一入要花费大量本钱才能改进可靠性、延迟和知足合规性。
这些东西加到一起每每要占到AI公司在云资源上面的花销的25%或更多。在极度情形下,处理特殊繁芜任务的初创企业会创造人工处理数据反而要比跑演习过的模型便宜。
采取专用AI处理器可以供应部分帮助,这些AI处理器可以更有效地实行打算,而优化技能(例如模型压缩和交叉编译)可以减少所需的打算量。
但是我们还不清楚这条效率曲线的形状。在许多问题领域上,处理和数据须要指数性增长才能取得精度的渐进性改进。就像我们之前指出过那样,这意味着模型繁芜性的增长速率惊人,而处理器想要跟上已经不大可能。光有摩尔定律已经不足。(举个例子,自2012年以来,演习最前辈的AI模型所需的打算资源增长了300000倍,而NVIDIA GPU的晶体管数量仅增长了约4倍!
)分布式打算是办理此问题的一个比较吸引人的办法,但这紧张是办理处理速率的问题,办理不了本钱问题。
毛利率,第2部分:很多AI运用都要靠“人在回路”(humans in the loop)才能保持较高的精度
人在回路系统有两种形式,均会导致许多AI初创企业的毛利率低落。
首先:演习当本年夜多数最前辈的AI模型都涉及到人工清理和标记大型数据集。这个过程耗力又耗钱,术语AI得到更广泛采取的最大障碍之一。其余,如上所述,一旦支配了模型,演习就不会结束。为了保持准确性,须要不断去捕捉和标记新的演习数据,并将其反馈到系统里面。只管诸如漂移检测和主动学习之类的技能可以减轻包袱,但履历数据显示,许多公司在此过程中的支出(常日还没把核心工程资源计入)最高可占到收入的10-15%,同时持续的开拓事情并不仅仅只是范例的缺点修复和特色添加。
其次:对付许多任务而言,尤其是那些须要更多认知推理的任务而言,每每要把人实时嵌入到AI系统里面。比方说,社交媒体公司雇用了成千上万的人工审核员来增强其基于AI的审核系统。许多自动驾驶汽车系统都有远程操作员,大多数基于AI的医疗设备都要跟作为联合决策者的年夜夫进行交互。随着越来越多的当代AI系统的能力得到理解,越来越多的初创企业正在采纳这种做法。操持出售纯软件产品的许多AI公司正在逐步把做事能力引入内部,并预定干系本钱。
随着AI模型性能的提高,对人工干预的需求可能会低落。但是,把人从这个回路里面完备剔除不太可能。无人驾驶汽车等许多问题太过繁芜,繁芜到无法通过当前的AI技能实现完备的自动化。安全、公正以及信赖等问题也须要人的监督——美国、欧盟和其他地区当前正在制订的AI法规里面可能会表示这一事实。
随着AI模型性能的提高,对人工干预的需求可能会低落。但是,把人从这个回路里面完备剔除不太可能。
即便我们终极实现了某些任务的完备自动化,也还不清楚这样就可以提高多少的利润。AI运用的基本功能是处理输入数据流并天生干系的预测。因此,操作这样的系统的本钱是所处理的数据量的函数。一些数据点要由人工处理(相对昂贵),而其他的数据点则可由AI模型自动处理(希望能更便宜)。但是每以个输入都须要进行处理,只是处理的办法不同。
那么,到目前为止,我们已经谈论了两类本钱,也便是云打算和人工支持。减少一类本钱每每会导致另一类本钱的增加。公式的这两个要素都可以优化,但没有一个有可能达到SaaS 业务那种靠近零本钱的水平。
AI系统的扩充困难大概会高于预期,由于AI处在长尾那头
对付AI公司而言,知道什么时候找到了产品市场匹配要比传统软件困难得多。很随意马虎会认为你已经找到了——尤其是在拿下了5到10个大客户之后——但接着你会看到自己的ML团队开始膨胀,而客户支配操持开始恶心地一拖再拖,挤占了发展新客户的资源。
在许多情形下,罪魁罪魁都是边界情形(edge case)。许多AI运用都有着开放式的界面,并且可以处理有噪声的非构造化数据(比方说图像或自然措辞)。用户每每对产品缺少直觉,或更糟糕的是,假定产品具有人类或超人的能力。这意味着边界情形无处不在:我们研究过的AI产品预期功能多达40-50%都处在用户意图的长尾之中。
换句话说,用户可以,并且也会输入险些所有的给AI运用。
换句话说,用户可以,并且也会输入险些所有的给AI运用。
处理这个巨大的状态空间每每是一件繁琐的事情。由于可能的输入值范围太大了,以至于每次新的客户支配都可能天生从未见过的数据。哪怕是看似类似的客户(比方说,两家汽车制造商都要进行毛病检测),就由于大略如在装置线上安装视频摄像头这样的事情,也可能须要大不相同的演习数据。
一位创始人把这种征象称为AI产品的“韶光本钱”。她的公司每拿到一个新客户的时候都要专门用一段韶光来进行数据网络和模型微调。这让他们能够去看看客户数据的分布情形,同时在支配前打消掉一些极度情形。但这也会带来本钱:公司的团队和财务资源都被捆绑到一起,除非模型的准确率达到了可接管的水平才能脱手。演习期的持续韶光一样平常都是很难确定的,由于更快地产生演习数据的可选手段基本上没有……不管团队再怎么努力都弗成。
到头来人工智能初创企业一样平常都要花费比预期更多的韶光和资源来支配自家的产品。要想提前识别这些需求是很困难的,由于传统的原型设计工具(比方说模型、原型或Beta测试)每每只能照顾到最常见的路径,不能涵盖边缘情形。跟传统软件一样,支配到最早的客户群的时候,这个过程特殊耗韶光,但是跟传统软件不同的是,这一过程未必会随着韶光的流逝而消逝。
守卫AI业务的辅导手册仍在编写当中⚔️
伟大的软件公司都会挖掘一条又宽又深的护城河。最好的护城河力量非常强大,比方说网络效应、切换本钱高以及规模经济等。
AI公司也可能具备所有这些成分。不过防御的根本常日是靠技能优胜的产品造就的,尤其是企业型的。成为实现某种繁芜软件的第一人可以带来重大的品牌上风和一段险些算是独霸市场的期间。
在AI的天下里,技能的差异化是很难实现的。新的模型架构紧张是在开放的、学术性的环境下开拓出来的。任何人都可以从开源库里面找到参考实现(预演习的模型),并且模型参数还可以自动优化。数据是AI系统的核心,但这常日归客户所有,或者放在公共领域,或者随着韶光的流逝而成为商品。随着市场的成熟,其代价也会逐渐低落,并且网络效应也相对较弱。在某些情形下,我们乃至创造跟数据馈送AI业务干系的规模不经济的情形。随着模型变得越来越成熟(可拜会《数据护城河的空洞承诺》一文https://a16z.com/2019/05/09/data-network-effects-moats/),每一个新的边缘案例的办理本钱都会变得越来越高,同时能够得到其代价的客户数量也会越来越少。
这并不一定就意味着AI产品的防御性就要比纯软件产品低。但是,对付人工智能公司而言,这条护城河彷佛比许多人预期的都要浅。从防御性的角度来看,人工智能在很大程度上可能是通往底层产品和数据的通道。
这并不一定就意味着AI产品的防御性就要比纯软件产品低。但是,对付人工智能公司而言,这条护城河彷佛比许多人预期的都要浅。
建立,扩充和守卫伟大的AI公司——给创始人的实用建议我们认为,人工智能公司要取得长期成功,关键是要应对寻衅,并充分利用做事和软件的上风。秉承这种精神,创始人可以采纳以下一些步骤来促进新的或现有的AI运用的发达发展。
尽可能肃清模型的繁芜性。我们已经看到,不同客户要演习不同的模型的初创企业跟所有客户都能够共享同一个模型初创企业之间在COGS(销货本钱)方面存在着巨大的差异。“单一模型”策略更易于掩护,可更快地推向新客户,并支持更大略、更高效的工程组织。这每每还能减少数据管道的蔓延以及重复的演习,从而可以显著改进云根本举动步伐的本钱。虽然没有达到空想状态的灵丹灵药,但关键之一是要在达成协议前尽可能多地理解你的客户及其数据。有时候,很显然,新客户会给你的ML工程事情带来巨大包袱。在大多数情形下,变更会比较眇小,仅涉及少数几个独特的模型或只需进行一些微调。做出这些判断(权衡长期经济康健与短期的业务增长)是AI创始人面临的最主要的事情之一。
要仔细(常日是严格)地选择问题域,以降落数据的繁芜性。从根本上来说,想让人工劳动自动化是很困难的一件事。许多公司创造AI模型的最小可行任务的范围比他们预期的要狭窄。比方说,有些团队在为电子邮件或者职位发布供应短建议中已经取得了成功,但供应一样平常的笔墨建议就困难得多。仅仅是更新记录这一条,专攻CRM领域的公司已经为AI找到非常有代价的利基市场。类似这样的一大类问题都属于对人比较困难,而AI相对随意马虎的类型。这些问题每每牵扯到大规模、低繁芜度的任务,比方说审核、数据输入/编码、转录等。专注于这些领域可以最大程度地减少总会碰着边缘情形的寻衅,换句话说,这可以简化为AI开拓馈送数据的过程。
我们认为,人工智能公司要取得长期成功,关键是要应对寻衅,并充分利用做事和软件的上风。
为高度可变成本做好操持。作为创始人,你该当为自己的商业模型供应可靠、直不雅观的思维框架。本文所谈论的本钱是有可能改进的——可减少一定幅度——但假设这种本钱会完备消逝(或强制其消逝)是缺点的。相反,我们建议在考虑毛利率较低的情形下去建立商业模式和GTM(市场推广)计策。来自创始人的一些好的建议:要深刻理解供应给模型的数据的分布情形。要把模型掩护和人的失落效当作紧张问题。要跟踪和衡量自己的实际可变成本——不要把它们藏在研发用度里面。财务模型要做出守旧的单元经济假设,尤其是在融资期间。不要等到规模扩大或外部技能进步了才去办理问题。
拥抱做事。AI有巨大的机会来知足它所在的市场。这可能意味着要供应全栈翻译做事而不是翻译软件,或者供应出租车做事而不是卖自动驾驶汽车。建立稠浊型业务比开拓纯粹软件更难,但是这种做法可以供应对客户需求的深刻洞察,并且产生出发展迅速,引领市场的公司。做做事也可以成为企业启动进入市场引擎的绝佳工具,尤其是在发卖繁芜和/或全新的技能时。关键是要武断地追求一种策略,不要想同时支持软件客户和做事客户。
对技能栈的变更要未雨绸缪。当代的AI仍处在起步阶段。可帮助从业职员用高效和标准化的办法完成事情的工具还正在搭建中。在接下来的几年当中,我们希望看到可以让模型演习自动化、可以提高推理效率可以对开拓职员的事情流标准化以及监视和保护生产环境的AI模型的工具得到广泛利用。一样平常来说,云打算作为软件公司要办理的本钱问题也越来越受到关注。如果运用跟当前的事情办法是紧耦合的话,可能会在将来导致自己做体系构造方面处于劣势。
用老派的办法来强化防御力。虽然还不清楚AI模型本身或根本数据是否能供应长期的保护,但好的产品和专有数据险些总能做出好的买卖。人工智能为创始人供应理解决旧问题的新视角。比方说,就凭借着表现出更好的性能,人工智能技能在相对生僻的恶意软件检测市场里面已经产生出新的代价。在最初的独特产品功能之上构建出带粘性的产品和可持久业务的机会永久都存在。有趣的是,我们还创造有几家AI公司通过有效的云计策巩固了自己的市场地位,这有点类似于最新一代的开源公司。
总结一下:从传统意义上讲,当本年夜部分的AI系统都完备属于软件。其结果是,人工智能业务看起来并不完备像软件业务。这学买卖牵扯到不断的人力支持以及显著的可变成本。其可扩性一样平常没有我们希望的那么大略可以实现。而(对付“开拓一次卖多次”的软件模式至关主要的)强大的防御能力彷佛不是免费就能取得的。
这些特色令AI在某种程度上觉得像做事业。换句话说,做事公司你可以换,但不能(完备)取代做事。
信不信由你,但这可能也是个好。类似可变成本、扩充性以及防御性的护城河之类的东西终极都是要靠市场而不是单个公司决定的。我们在数据里面看到不熟习的模式这一事实表明,AI公司确实是新事物——这意味着进入新市场并创造大量机会。已经有许多伟大的AI公司成功地在迷宫般的想法里面穿行,并开拓出出性能始终如一的产品。
信不信由你,但这可能也是个好。类似可变成本、扩充性以及防御性的护城河之类的东西终极都是要靠市场而不是单个公司决定的。我们在数据里面看到不熟习的模式这一事实表明,AI公司确实是新事物
人工智能仍处在从研究主题莅临盆技能过渡的早期阶段。大家很随意马虎就会忘却,无疑是推动一波AI软件开拓浪潮的先驱的AlexNet,出身仅有8年。智能运用正在推动软件行业向前发展,它的下一步会如何发展呢?我们对此感到愉快。
译者:boxi。