这将会是三白的又一篇万字以上的深度剖析报告,作为一个AI深度爱好者以及从业职员,从去年8月份字节豆包上线至今,我一贯都在密切的关注这款产品的每一次更新和动向,并频繁和字节已经行业内的AI从业的朋友们互换和谈论这款产品,最近花了近3天旁边的韶光,把过去1年的积累的内容重新整理并输出形成一个完全的报告。
全篇内容共13000字,阅读韶光估量须要半小时,我将按照一个标准的产品剖析报告的视角,系统的先容和分享个人关于字节豆包这款产品的一些不雅观察、剖析、思考,我将从产品、行业、商业、用户、竞品等多个角度综合剖析这款目前字节炙手可热的AI产品,须要声明的是,以下全部内容仅代表个人不雅观点,内容仅供参考,若存在有失落偏颇的地方欢迎大家和我沟通谈论;
由于内容较多,为了提升大家的阅读效率,我整理了一个全文脑图如下,没有韶光细细阅读的朋友可以快速看脑图即可:
1.为什么想剖析字节豆包这款产品?
一样平常我挑选剖析工具,常日会选择该赛道比较范例、或者有代表性的产品,也最好希望通过一个产品能够把这个赛道基本理解清楚,一方面我先不选择ChatGPT,紧张是它是外洋的产品,可能很多用户都体验不到,而豆包为海内公开利用的产品,且目前在利用规模上据个人理解目前是用户规模前三的AI产品;其余一方面,豆包比拟chatgpt,在产品特性上,除了基本具备Chatgpt的大部分功能之外,还增加了关于智能体agent、Agent开拓平台、AI社交、开拓者和创作者生态等多个领域,以是能够覆盖的领域,因此剖析它的代价可能更高;
2.全文内容的信息获取来源?
本篇文章全部内容和信息紧张基于如下几个信息来源:
个人基于长期对产品的关注、体验、思考而形成的个人不雅观点;来自和腾讯、字节、百度、阿里等海内大厂的AI从业朋友的谈论与互换;参考市情上公开的深度资讯、专题剖析、公开宣布、数据平台等;3.适宜哪些人群?想要系统的理解AI运用端产品,建立行业认知的朋友;AI产品经理和运营职员;研究AI和字节产品的金融或者计策研究职员;一、产品概述1.1. 产品基本信息先容1.1.1. 豆包是一款什么产品?
豆包是字节跳动在2023年8月份推出的一款AI产品,产品直接对标的竞品是ChatGPT、文心一言这一类的产品,属于字节跳动在chatbot领域推出的重量级产品,此外,字节还在外洋上线了一款豆包外洋版的产品,产品名称是cici;
产品在字节跳动公司内的组织架构是在字节去年11月份刚成立的FLOW团队,根据flow业务卖力人朱骏公开信息,目前豆包在海内的月活已经有2600万,算是目前海内生动规模最高的AI产品,目前运用内已经累计创建了800万+智能体;
与ChatGPT和文心一言等ChatAI类的产品不同的是,豆包的产品定位更方向于成为一个综合性的AI 智能体(AI Agent)平台,产品整体的交互形式以智能体的形式呈现,通过一个个智能体(Agent)的办法知足用户在不同运用处景的利用需求;通用场景下,用户可以和“豆包”默认智能体谈天对话,也可以探求其他垂直运用的智能体对话办理垂直场景的问题;
1.1.2. 豆包的研发背景和发展进程
官方对付为什么产品叫豆包的说法是,一开始想着是抖音内的AI工具包,或者是抖音内的所有AI运用都包了,以是叫豆包,很多用户调侃这个名字取的太过于俗气,但是目前从行业的风气上看,大厂的AI产品们都方向于取一些比较实物化、普通而接地气的名字,而不是一些高大上的名字;
豆包的前身是字节去年内部孵化的产品项目,名称是Grace,当时Grace还没有上升到全体公司重视的程度,据理解当时公司内部高层对付AI的态度还处于想搞清楚这是个什么东西的阶段,创始人张一鸣也在一直地会话行业内的专家试图理解大模型到底是怎么回事的阶段;
23年8月份的时候豆包开始灰度上线,当时的用户体量还不是很大,月活可能10万都不到,并且在8~10月份一贯保持着自然增长,根据QM公开的数据统计,豆包的整体生动在11月份的时候开始了跳跃性的增长,月活已经开始超过1000万,个人预测产品从11月份开始对外投放广告,因此带来了比较明显的增长,后来又经由半年旁边的韶光,5月月活规模达到2600万规模(参考字节官方公布数据);
1.2. 产品定位
1.2.1. 豆包的产品定位:从产品、公司计策的角度看产品定位
1)从产品形态的角度看产品定位从产品形态上看,前面也提到,豆包的产品定位是一个综合性的AI智能体平台;目前豆包内的智能体包括3种类型:
豆包默认智能体:这个是用户默认利用的智能体,用户首次利用时进入的是豆包默认的智能体,新建对话的时候也是默认调起默认智能体;PGC智能体:第二部分是豆包官方创建的智能体,目前豆包官方创建了25个官方智能体,包括AI图片天生、爱谈天的小宁、全能写作助手等;UGC智能体:这部分是用户自己创建的智能体,根据官方公示,截止到24年5月份,豆包运用内目前已经有将近800万的智能体;2)从公司计策的角度看产品定位从公司计策的角度上看,产品的定位包括如下几点:
豆包更方向于打造成为公司的品牌和门面的AI产品,包括从目前的产品规模和增长趋势,以及公司的大模型名称从之前的云雀大模型改名为豆包大模型,各类迹象都表明,公司故意将这款产品打磨成为一款明显标杆产品,乃至成为公司的品牌和门面的AI产品;豆包也是字节大模型秀肌肉的产品,目前豆包整体一贯都免费开放给用户利用,起本钱和花费也不小,但是个人认为这是一种通过C端盘踞用户市场和心智,然后带动大模型售卖的一种办法,企业级的客户通过利用和体验豆包的能力可以感想熏染和比拟豆包大模型的能力,如此更加有利于大模型的售卖,以是豆包也是字节大模型体验和秀肌肉的产品;豆包是字节AI场景的试验田,在扶持一个体量较大的AI产品之后,豆包也承担起了AI运用处景和市场验证的任务,目前个人感想熏染到的思路是,flow团队会将一些想要验证的场景以智能体的办法放到豆包运用内验证并不雅观察的增长的数据情形并验证需求,一旦需求和市场得到了验证,便采取独立APP的办法单独运作;这样的案例,目前可以看到有猫箱、coze等产品;1.3. 产品核心产品能力目前chatbot类的产品功能基本都大同小异,因此这里也就不面面俱到的产品详细产品的功能,个人紧张分享几点个人认为豆包做的相对还比较不错的,或者可以算的上产品核心能力的产品功能;
1.3.1.手机端核心产品功能
沉浸态的语音对话的功能:目前从大部分利用用户的反馈看,豆包的语音对话谈天的功能在自然度、拟人化和流畅度等方面都是相对来说比较不错的,和文心一言等竞品可以形成相对的差异,个人也紧张是通过行业内的研究职员们关注到这点,可见目前字节在语音模型、语音合成等方面确实具备比较领先的技能上风;自定义智能体:用户可以通过创建智能体的办法自己捏一个角色或者智能体,并运用于个人利用,或者公开给他人利用,目前APP内创建智能体的办法比较大略,只供应了prompt、头像、声音配置的选项,没有供应太多个性化的配置能力,这部分个性化的能力目前在智能体开拓平台扣子/coze里面实现;创造智能体:该模块紧张知足须要想要探求垂直运用处景的智能体的需求,目前创造智能体模块供应了头像天生、学习、AI绘画、游戏动漫、角色扮演、影视小说、事情、创作、生活、情绪、意见意义等十几类智能体;文生图能力:豆包目前支持文生图的功能,个人体验了海内多款文生图的chatbot类产品,目前在天生质量、准确性等方面,豆包的表现还是相比拟较不错的,因此个人认为目前在视觉天生方面,可能字节的能力和表现会相对更好一些;AI天生文本+短视频推举组合形成query回答:目前当你涉及一些吃喝玩乐干系的话题的时候,豆包除了天生笔墨回答,还会推流一个抖音短视频给用户,这种办法紧张是为理解决模型无法很好的应对实时性和物理天下干系的信息这个问题,合营人工天生的短视频,可能能够更好的解答用户的问题,让回答质量更高;本地生活推举:豆包支持基于用户的LBS推举用户定位附近的商家,给用户供应本地生活推举的做事,这块的功能,个人预测是接入了抖音本地生活推举的数据,但是目前该功能还没有大力做,产品体验和利用代价相对一样平常,但是在浩瀚的AI产品里面,目前只看到了豆包做了这个考试测验,也算是一个值得一提的功能;1.3.2.电脑端核心产品功能
豆包电脑端目前除了网页端web版的功能,还推出了PC客户真个版本,整体产品以浏览器的形式存在,基本有点类似于对标360AI浏览器,其核心功能包括如下:
AI搜索:AI和搜索结合的场景,是AI的一个关键运用领域,目前豆包的AI搜索功能,个人认为在搜索结果的时效性、准确性等方面是相比拟较不错的,其AI搜索的能力,个人认为乃至目前做的比文心一言的AI搜索还更好一些;据个人理解,百度搜索目前在AI搜索领域的布局目前还处于不雅观望和滞后状态,可能由于AI搜索的本钱比较高,并且AI搜索会冲击传统搜索广告的业务,以是目前没有重点发力;文档对话和阅读总结:文档对话的产品目前也比较多,包括以kimi为主的产品,大家的体验表现上实在都差不多,但是个人体验到的豆包表现优胜的点在于模型的OCR能力更好,例如上传扫描件PDF文档的时候,豆包可以准确是识别文档的内容,但是kimi等产品并没有达到相应的水平;内容创作:支持细分场景的AI内容创作,从之前通用的AI创尴尬刁难象,到目前逐步支持场景化创作,总体上比之前更近一步了,但是说实话从目前的创作结果上,还没有达到专业级的水平,比较市情上垂直运用领域的AI写作产品还是差了一些;浏览器插件:浏览器插件的功能是今年5月份旁边刚刚推出的功能,能支持在浏览器里面实现基于页面浏览的AI功能,包括划词搜索和翻译、页面择要、视频转笔墨等实用功能,目前做的还比较不错并保持着很高频率的产品更新;关于插件安装体验,可访问如下文档 https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc电脑插件:整体功能和浏览器插件差不多,支持切换到电脑的运用处景;详细利用可搜索下载豆包电脑客户端,安装后进入首页即有干系勾引;1.4. 豆包的关键版本迭代记录过去一年,基本豆包的每一次产品更新,我都在重点的关注,个中个人认为值得关注的重点包括:
去年11月份的版本更新是豆包产品整体洗面革心的一个版本,实现了险些豆包大部分的核心能力;之后的版本里陆续通过各种动作探索和发展第三方智能体的代价;2月份和扣子打通,支持扣子创建并发布智能体到豆包;3月份强化搜索和文件对话能力,应对kimi的市场热度;以及Q2重点发展PC客户端和浏览器插件;详细的版本迭代明细见下:
23年11月迭代版本
推出22个豆包官方智能体:包括英语学习助手、谈天、AI天生漫画、音乐电台、智能体创建助手、ai天生图片、文学伴侣、恋爱大事、旅游方案师、电影评论家、星座运势、起名专家、本地推举、编程助手;强化AI联网搜索能力:和今日头条、抖音搜索数据打通,天生的搜索结果支持溯源并打开跳转头条和外部网站的内容,支持查看出处,目标是为了增加天生结果的可靠性问题;这个阶段,豆包开始和头条搜索和抖音搜索密切互助,联网搜索的能力也紧张是基于头条和抖音搜索,尚未拓展到全网搜索;增加了关联问题推举的功能:基于用户的问题供应问题推举的功能,节省用户输入问题的韶光,供应提问的灵感帮助用户得到更多的信息,增加用户提问的频率;支持LBS确当地生活搜索推举:个中美食推举还比较准确,但是其他的推举还不准确,包括酒店、生活做事等;支持文生图的产品能力;首页改版强化智能体模块:创造智能体的入口从右上角迁移到底部栏,增加了AI智能体的模块,进一步的强化了智能体平台的定位,同时也可以看出对发展智能体生态的重视;支持抖音短视频内容推举:天生文本的同时匹配与之干系的干系匹配度最高的短视频内容;该能力紧张填补ai天生内容泛化的问题,AIGC+UGC互补结合更好的办理用户对回答内容满意度的问题,同时抖音短视频的内容真实性的觉得更强,进一步办理用户对天生内容的信赖感问题;24年1月迭代版本
首页改版进一步强化智能体的露出:智能体置顶到首页顶部,支持滑动展示;开始对智能体做进一步的分类:分类整理出不同的分类的智能体,这个阶段可见智能体的规模已经初步发展起来;将搜索框固定到首页顶部,强化搜索功能,但是后来又将搜搜框下架,紧张缘故原由可能由于搜索体验不佳,或者也可能是针对AI搜索的一次测试;24年2月迭代版本
虚拟谈天智能体增加谈天背景封面优化谈天氛围,体验越来越像星野,且智能体创建支持AI天生头像以及支持AI天生提示词;海内版智能体开拓平台“扣子”上线,和豆包打通,支持发布豆包;豆包AI拓展字节内部其他产品:包括抖音运用内上线AI搜索功能,今日头条APP首页右上角上线豆包AI功能,内嵌头条;24年3月迭代版本
智能体开始灰度支持定制个人的音色功能;增加文档对话剖析能力:支持上传PDF、表格、PPT、word、txt等格式文件,不支持图片格式,文档大小限定50个以内,大小限定20M以内;接入bing搜索,联网搜索拓展全网搜索,支持抖音搜索和头条搜索之外的内容搜索;上线豆包PC客户端和浏览器插件;24年5月迭代版本
PC端推出“问答”能力:整体产品形态对标知乎产品,目前紧张通过搜索问答类的内容,通过搜索引擎入口引流;为利用AI问答的能力做的搜索投放获客的能力;官方将问答内容和天生结果沉淀为问答内容,形成一个问答社区;社区链接如下:https://www.doubao.com/traffic/ask浏览器插件更新:支持b站视频总结、ARXIV论文阅读;24年6月迭代版本
豆包浏览器插件更新:支持youtube视频总结和中英双字幕,详细功能参考如下文档:https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc二、产品所属赛道剖析2.1. 赛道定义与细分2.1.1. AI的赛道细分
对付目前的AI的赛道,个人总结赛道的整体布局如下,个中今年上半年比较火热的运用领域,基本聚焦在chatbot、智能体开拓平台、虚拟社交、AI搜索这几个领域:
2.1.2. 豆包所属细分赛道:Chatbot赛道
只管很多人对付豆包的产品定位比较有争议,称它长得像ChatGPT,又长得像character.ai,但个人认为,目前的整体产品形式,基本都是源于ChatGPT,以是我更方向于归类为chatbot赛道;
2.1.3. 赛道内的紧张竞争者和市场竞争情形
既然归属于chatbot赛道,因此其紧张的竞争对手紧张包括ChatGPT、文心一言、腾讯元宝等产品;其余由于豆包和核心功能还包括虚拟社交、AI搜索等场景,以是kimi、character.ai、星野等产品,也可以视为其紧张竞品;
目前从用户体量上看,外洋生动规模的体量整体相对更高,ChatGPT毫无争议为目前环球生动规模最高的AI运用产品;
对付海内,文心一言目前根据QM和similarweb供应的干系数据,截止今年3月份WEB+APP的整体月活将近3000万旁边,而豆包截止5月对外公开的月活规模是2600万,其后是kimi月活将近1800万;
三、核心产品技能剖析3.1.MOE架构模型
豆包的运用内承载力虚拟社交谈天、AI搜索、文档对话、文生图、内容创作等多种利用场景,如此之多的功能放在一个产品里面,很难只是通过一个通用的大模型就能支持所有的产品能力,一定须要用到多种模型能力,因此豆包的底层采取的该当是MOE(稠浊专家模型)架构的模型;
MOE模型大略讲便是在模型中组合了多种类型的模型,在处理实际的任务的时候,动态匹配办理任务须要的模型组合,高效的实行任务;以在豆包内构建一个实时资讯谈天机器人并语音对话为例,全体过程中可能涉及到如下几个模型:
角色扮演模型:在用户创建一个虚拟角色的时候,后台可能会利用角色扮演模型赞助用户创建一个详细角色的Agent;RAG模型(增强检索模型):用户在和角色谈天的时候,由于用户对话的query哀求的是实时的资讯谈天,以是模型在相应的时候,须要基于联网检索的结果做天生输入,以是这个环节可能须要调用RAG模型,完成相应输出;TTS模型(文本转语音模型):模型完成文本的输出之后,须要将文本合成为语音之后以语音的办法输出给用户,这个过程须要用到TTS模型;以上我们通过一个案例理解什么是MOE架构模型以及其事情事理,接下来个人预测一下豆包的MOE模型中可能稠浊的哪些专家模型:
根本大模型:也便是豆包大模型,在办理一些通用场景的内容天生,例如豆包默认智能体的天生输出的时候,大概率可能直策应用的是根本大模型;行业大模型:包括在办理虚拟谈天和角色扮演等运用处景的时候,可能利用的是角色扮演模型;文生图模型:涉及图像天生等场景的时候,一定利用的是图像天生模型;语音合成模型、音色定制模型:目前语音谈天的场景,包括供应不同的音色,以及语音谈天的输出,都是通过语音合成模型和音色定制模型技能实现;RAG模型(增强检索模型)、知识图谱:如前举例,涉及须要联网检索,或者调用外部知识库解答的问题,可能会用到RAG模型和知识图谱技能;向量化模型:例如在回答用户问题时,通过向量化模型,系统可以快速查找到和用户问题干系的知识并天生准确的回答,向量化模型紧张用于将知识库向量化,方便根据用户问题匹配到跟用户最干系的知识,然后天生回答;四、商业模式剖析4.1.关于豆包当前的商业路径的思考当前豆包基本完备免费,并且无限量的供应给用户利用,在C端基本没有商业付费的场景,个人认为目前豆包的商业模式更多的是C端免费利用,形成市场规模、品牌效应和用户教诲之后,通过模型端收费,但是鉴于最近这段韶光字节大模型大幅度贬价之后,可能短期售卖模型也不赢利,而是通过模型花费带来的根本云做事的售卖,其商业变现的链条如下:
豆包C端免费———>企业端购买大模型,带动云做事售卖———>通过售卖云做事赢利;
以是,当前的商业路径,表面上是在做AI产品,实际上可能兜兜转换末了可能变成了卖传统的云做事赢利。
4.2.豆包未来可能通过什么模式实现商业化
参考目前市情上竞品的做法以及个人的意见,未来豆包的商业化办法可能包括如下3种办法:
1)个人增值订阅的模式:个人增值订阅大略讲便是付费会员,与ChatGPT的plus订阅,文心一言的会员类似,增值订阅目前是广泛的用户普遍可以接管的一种办法,而增值订阅的办法,关键在于未来通过什么增值功能勾引用户付费,我以为可能的增值点可能包括:
更强的模型:例如免用度户利用根本模型,利用更强的模型须要付费;付费智能体:例如图像天生等对本钱花费比较高的智能体智能限量利用,超过一定利用量之后须要付费;增值功能付费:包括深度检索功能、音色定制功能、上传文件大小等;2)广告模式:作为互联网广告的收入大户,纵然在AI产品,未来也未尝不可考试测验广告变现的模式,个中包括检索天生的索引入口、商家和做事的推举等,都可能是比较得当的广告入口,当产品的体量逐步上来之后,广告的规模可能也会比较可不雅观;
3)运用分成模式:目前豆包运用内的第三方智能体为用户创建并掩护,未来也不用除可以做成付费智能体的可能性,特殊是通过coze/扣子创建并发布到豆包的智能体,当第三方智能体支持付费,并且豆包内打通支付路径之后,作为平台方也可以向第三方运用抽取分成;
以上三种办法,仅为个人预测,并且个人认为增值订阅和广告模式的概率比较高,运用分发的难度相对会比较大,目前豆包官方暂时也没有对外公开其商业化的操持和进展情形;
4.3.豆包未来的付用度户可能是谁?
个人认为,对付豆包类的chatbot的产品,未来潜在的紧张付费群体包括如下几种:
AI爱好者:也便是ChatGPT带起来的第一批AI的兴趣用户,这批用户具备非常高的质量,既理性又有消费力,乐意为代价买单,我的身边有非常多的这样的群体,他们乃至乐意想尽统统办法购买订阅用度比较贵的ChatGPT plus的会员,属于高代价、付费购买意愿比较强的群体,该部分群体的整体年事也相比拟较高,大部分聚焦在30~40岁的用户,并且男性用户居多;办公族群体:包括商务办公、学习教诲、营销创作、商业做事、金融法律等行业和场景的用户群体,办理的是不同领域的事情场景的需求,大部分用户更乐意为场景付费,该部分用户的年事聚焦在25岁~40岁区间的群体;中小学生群体:社交和游戏偏好的群体可能也会是紧张的付用度户,虚拟社交目前也是豆包的主要利用场景,个人该领域用户画像不雅观测剖析认为,该场景在年轻人群体中的偏好较高,未来年轻一代的用户可能更加乐意为虚拟社交和娱乐谈天付费;4.4.用户的核心付费动机和需求是什么?为效率提升付费:现在大部分用户更方向于希望AI产品是一个提升效率的工具,以是用户更方向于为效率付费,包括生产效率、信息获取效率、学习效率、办公效率、沟通效率、决策效率等,个中生产效率和信息获取效率的提升是用户需求更强的场景;为精神娱乐和感情代价付费:AI除了以实用代价为出发点的效率场景之外,还有以虚拟社交等为例的精神娱乐和感情代价的运用处景,该场景用户为社交猎奇、情绪陪伴、感情宣泄等付费;那么,对付效率和娱乐这两个方向,估量哪个有可能更快看到商业变现?
个人认为娱乐方向的变现代价可能会跑的更快,由于效率场景的变现极大的依赖大模型的能力,要想要做出一个能办理详细的效率场景的产品出来,现在说实话真的太难了,而对付效率群体而言,普通的产品能力如果不能切实的办理他们的问题,用户断然是不愿意付费的,以是效率场景短期变现难;而娱乐场景,目前模型的能力基本也足以知足,用户的付费也有更多的是冲动付费的场景,因此目前从市场上看,投资人们更多的偏好虚拟社交的产品;
4.5.豆包的本钱构造
对付豆包类的AI产品,其核心本钱紧张包括技能、人力、市场营销用度这几部分本钱,至于详细的本钱规模,尚不得而知;
技能本钱:包括模型本钱、做事器和带宽本钱;人力本钱:包括研发职员、产品和运营职员的人力本钱市场用度:拉新获客的市场投放、市场营销的本钱;五、字节的AI产品布局和豆包的位置5.1.字节激进的AI运用布局从去年的6月份开始,字节已经开始密集的布局AI领域的运用,去年8月的时候,字节还只是上线了豆包、小悟空等少数几个产品,半年多过去,目前字节在海内和国外已经上线了十几个AI运用,覆盖了不同的热门赛道,可谓全面着花,基本在大厂里面,在AI运用层如此激进的,基本也就字节了;
纵不雅观字节的全体AI布局,可以看到,基本上半年几个火热的AI运用领域,字节基本都入局了,包括以豆包为标杆的Chatbot领域、以猫箱为主的虚拟社交领域,以扣子为主的智能台开拓平台领域,加上集团内其他旧产品和AI的结合,布局版图非常大,个中对付豆包,从目前字节在产品的增长投入、以及乃至将原来的大模型名称从云雀大模型改成豆包大模型等一系列动作可以看出,豆包在全体字节的AI运用的地位非常主要;
5.2.如何看待字节的激进和腾讯的镇静?
一方面,个人认为字节在AI的激进是自上而下的,从字节的发展进展和动作上看,字节的高层非常重视并看到AI带来的运用真个机会,并且迅速的开启了当年互联网时期小步快跑、快速验证市场需求的节奏,个人认为字节目前的发展思路存在如下几个特点:
快速盘踞运用端市场:先在目前市场空缺阶段先通过运用端快速盘踞用户市场,并顺利抛出一个AI领域的超级运用,未来节制入局AI运用领域的第一张门票;运用端积累更多的用户数据,反哺大模型迭代优化:运用真个数据越多,对付模型的迭代和发展就越有利;其余一方面,反不雅观腾讯,过去半年腾讯在AI运用侧的进展切实其实镇静到让人不敢相信,过去的一年里面对外公开AI运用的产品并不多,并且原生AI运用的产品也很少,目前只有腾讯元宝、腾讯元器刚刚推出没多久;虽然腾讯混元的卖力人的不雅观点认为目前AI运用的渗透整体都很低,以是大家都在同一个起跑线上,但是不可否认的是,目前腾讯在AI运用真个反应相对滞后,个人的不雅观点认为如下:
大模型才是最核心的,运用端并不焦急:虽然腾讯在运用真个发声比较少,但是根据个人理解,腾讯内部在模型真个投入并不低,腾讯混元集中了公司很多模型研发职员,并且对外招聘的力度也比较大,可见腾讯当前的重点还是先创造大模型的根本能力;过早进入运用端,并不会拉开差距,本钱和模型能力反而会限定增长规模:对付节制着互联网大半流量的腾讯而言,孵化一个超级运用的难度并不大,但是更多的还是该当先看清楚市场之后再脱手,否则过早进入,可能形成不了市场霸占率上风,反而还受限本钱以及模型能力,导致规模难以快速增长;字节和腾讯对待AI运用的两种不同的态度,基本也代表了目前市情上大家对AI的态度和心智,只能说各有态度、没有利害,只不过是不同认知下的选择而已。
六、豆包如何实现用户增长?
以下内容,为个人不雅观测不雅观点,尚未得到实际数据验证,个人认为豆包的获客新增策略紧张基于如下4个策略:
PLG产品驱动:通过持续拓展和新增更多的产品能力,覆盖不同的AI赛道,知足不同场景的利用需求,目前豆包基本兼容了主流的chatbot、虚拟社交、智能体创建、AI搜索、AI创作等多个方向的运用处景;广告投放:大厂的产品的快速增长,自然离不开广告投放,豆包的快速增长也紧张依托字节内部的引流投放,包括抖音和头条官方广告、穿山甲广告同盟、抖音内容创作者投放等;智能体的裂变分享:用户在利用智能体的过程中,可以把智能体链接分享给其他用户,给豆包带来更多流量;插件化:从最近关注到的情形创造,豆包开始做浏览器插件、电脑操作系统赞助插件、以及和今日头条互助豆包ai助手、乃至传言目前豆包正在和手机厂商互助手机助手,这些动向表明了未来豆包的增长会通过插件化的办法,对外开释影响力和带动增长;七、用户画像剖析7.1.豆包目前的用户画像剖析根据某第三方数据平台不雅观察剖析豆包APP用户的画像特色如下:
男性用户为主:豆包生动用户中,将近70%的用户为男性用户,女性用户仅30%旁边,对付该数据征象,个人认为和目前海内整体AI兴趣偏年夜大好人群的分布有关系,或许对付AI科技类的产品,本身男性用户天然便是比女性用户更感兴趣;想通的数据平台,不雅观察文心一言等其他同类型的产品,也存在男性用户占比明显高于女性用户的特色;25岁~40岁职场用户群体为主:豆包生动用户中,年事在25~40岁之间的用户占比将近70%,为豆包的主流用户,参考全体互联网大盘的数据,该年事阶段的用户占大盘的占比近30%旁边;7.2.豆包未来的核心用户群体是哪些?豆包当前的用户画像更多的还是受目前市场用户的整体情形所影响,个人认为,对付一个综合性的AI智能体平台,豆包的核心用户群体,将逐步拓展如下用户:
年轻一代用户:包括大学生、中小学生群体,目前豆包的整体利用用户,更多的还是以职场白领群体为主,年轻用户相对较少,鉴于虚拟社交场景也是豆包的重点发展场景之一,个人认为未来对付社交、游戏等新奇事物比较感兴趣的年轻一代群体,将会是该场景的主要用户群体;拓展下沉用户群体:目前AI和大模型的最新资讯,紧张还是在一二线城市为主,未来下沉市场的用户在AI的利用渗透可能会越来越高;女性用户的占比逐步提升起来:AI目前对付大部分人来说,还是个技能感比较强的东西,比较更加吸引男性用户,随着未来Ai的利用门槛和工程化越来越遍及,女性用户的占比会逐步提升起来;八、核心竞品剖析8.1 核心产品能力比拟个人认为,衡量一个ChatBot类的产品,其核心产品能力的比拟该当包括如下几个维度:
文本天生:这是LLM最根本的能力,作为一个崇尚技能派的人,个人比较看重的是文本天生在逻辑推理、专业性、场景化等方面的表现,由于通用的天生能力对我而言是没啥用的,我们须要专才来办理我们的问题,而不是一个什么都会的通才;语音谈天:其次是语音谈天的能力,包括语音谈天的流畅度、真实感、交互办法,我们须要的是一个靠近真实的谈天AI,而不是一个像天猫精灵那样的傻瓜机器人;联网搜索:不言而喻,联网搜索的能力基本是一个chatbot产品非常关键的能力之一,也是一个核心竞争的产品能力点,常日对付联网能力的判断,个人紧张看搜索结果的完全度、全面性、时效性、准确性;多模态:多模态的能力紧张包括跨模态的输入和输出,包括输入办法上支持的格式类型(文本、语音、图片、文件、视频等),以及输出办法上的格式类型;垂直场景办理方案:也便是办理垂直场景的AI运用的办理能力,包括平台供应的智能体、插件的能力,以及支持用户定制智能体和插件的能力;以下为个人对豆包及其核心竞品核心能力的比拟情形,其比拟仅根据个人在过去将近1年的实际利用的感想熏染得到的结论,仅代表个人不雅观点,如有禁绝确的地方欢迎指出,总结起来核心不雅观点紧张如下:
ChatGPT在文本天生的专业度、逻辑性,语音谈天能力体验,多模态表现方面比较其竞品做的都相比拟较出色;但是在联网搜索、插件和GPTs发展方面相对弱一些;豆包在语音谈天,联网搜索方面表现出色,但是在文本天生、多模态方面表现比Chatgpt、文心一言比较逊色一些;文心一言在文本天生方面比较豆包更精良,但是语音谈天、联网搜索表现略比豆包逊色一些;三个产品在垂直场景的办理方案方面均没有非常出色的表现;8.2 终端布局比拟整体上,豆包在拓展终端,还有用户利用入口这个事情上,做的更加激进,包括浏览器插件、电脑系统插件的植入,乃至据闻未来还操持将产品能力拓展到抖音、头条等产品;
8.3 底层大模型比拟
对付模型的比拟,站在利用真个角度上看,个人紧张从模型根本参数、模型综合表现能力、价格这三个维度去做对,根据个人关注理解到的信息和评价,比拟GPT4.0、豆包大模型、文心大模型,个人评价如下:
在基本参数方面,从模型参数规模上看,目前GPT4.0的参数规模估量该当是最高的,其演习数据规模个人预测估量该当也是最高的,至于高下文长度,目前大家基本豆包128k水平,至于目前市情上一堆天生百万、千万级的高下文,个人并不太理解为何能做到如此大的差异,个中可能有营销的嫌疑,但是个人比较相信GPT4.0的高下文长度上限更加有代表性;对付模型综合表现方面,只管目前海内有不少模型都天生达到或者超过GPT4.0的水平,但是从个人实际在运用接入的表现上看,GPT4.0的综合表现基本远远超过海内所有模型;价格方面,目前价格最低的模型是豆包大模型,今年5月份的时候其主力模型把输出的价格低落了将近60倍,低至2元/百万token,这个对付行业运用的开拓者而言真的是一个福音,从个人的角度上看,GPT4o的价格虽然贵,但是能力和定价匹配,豆包大模型的能力和GPT4o能力有差异,但是性价比高,但是文心大模型的价格目前属实太高,其定价基本对标GPT4o,站在开拓者的角度上看,性价比不高;九、未来的产品发展方向思考对付未来这款产品将会如何发展,个人认为,未来其发展该当会包含如下5个模块:
核心运用处景能力升级和深化:除了底层大模型的同步发展之外,豆包在产品工程化方面个人认为后续会越来越深入,个中对付AI目前在虚拟社交、搜索、内容创作、办公、教诲、生活助手等这些核心的运用处景的发展,后续会供应更多的功能升级和做事;智能体生态的发展:豆包将会重点发展第三方智能体生态,个中关键的目标是孵化超级智能体,也便是利用量较高,并且能带来更高的裂变效应和产品有名度的智能体;其次是如何将未来发展起来的智能体对外拓展和赋能,让智能体的能力得到更多的利用;多模态AI场景实现:目前豆包的大部分能力基本都是单模态,未来随着多模态大模型的发展,相信产品也必将推出更多的多模态利用场景;插件化:豆包的插件化紧张是将豆包的产品能力拓展到更多的用户利用场景,把产品能力接入到更多的终端和生态,个中包括PC利用场景的插件化、运用插件化、硬件生态插件化,目前从产品的动作和布局上,可以看到有这样的方向;商业化:产品的商业化是一定会启动的,只管目前产品是一个免费产品,但是目前产品昂贵的模型本钱和研发本钱,一定会push产品开始探索商业化;当然,以上内容均为个人基于对行业和产品的理解和履历的一些想法,并非实锤信息,仅供参考。
OK,至此,关于字节豆包的产品剖析到此为止,写完以上内容之后,三白表示心情十分惬意,作为一个非常不喜好积累收藏零散、支离破碎的知识信息的强制症患者,每次系统输出某一个产品的知识体系的时候,就彷佛把自己乱七八糟的屋子重新整顿了一遍一样干净和舒畅,我挺享受这样的知识梳理的过程。
作者:三白有话说,"大众年夜众号:三白有话说
本文由 @三白有话说 原创发布于大家都是产品经理。未经作者容许,禁止转载。
题图来自字节豆包官网
该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。