OpenAI近日发布了首个AI视频天生模型Sora,其打破性的技能秒杀一众对手,令网友直呼“全体行业RIP”。
Sora能根据笔墨指令天生逼真且充满想象力的视频,且能天生长达1分钟的连贯视频。

溜达在东京街头的女子,多镜头同等性的1分钟视频

Sora的出色表现得益于其对措辞的深刻理解,它能准确地理解用户指令中所表达的需求,把握这些元素在现实天下中的表现形式。
Sora的最大特点在于其能供应多帧预测,实现了一镜到底的效果。
这意味着Sora能在同一视频中设计出多个镜头,同时保持角色和视觉风格的同等性。
这种级别的多镜头同等性,是目前市场上的其他AI视频工具无法企及的。
此外,Sora模型还能展示出对电影拍摄语法的自发理解,这种能力表示在它对讲故事的独特才能上。

类似皮克斯动画的视频

OpenAI视频模型Sora能生成1分钟连贯视频秒杀对手

逼真的猛犸象视频

一镜到底的狗狗视频

海盗船与战舰在咖啡杯里缠斗

VeryKen智评:Sora的发布是AI视频天生领域的重大打破,将对AI视频天生领域的竞争格局产生影响,有望引领一场新的技能改造潮流。
这一打破让人们看到了AI理解和仿照现实天下的可能,也让人们对实现人工通用智能(AGI)的未来充满了期待。

然而,只管Sora模型在技能上取得了显著打破,但其在实际运用中还面临一些寻衅。
例如,Sora在仿照繁芜场景的物理效果上可能会碰着难题,有时也难以准确理解特定情境下的因果关系。
这些问题的办理,将是OpenAI未来研发的主要方向。
(量子位,新智元)

【谷歌溘然上线Gemini 1.5:MoE架构,100万高下文】

谷歌近日发布了其最新的人工智能模型Gemini 1.5。
这一新版本的最大亮点在于,作为首个登场的多模态通用模型,Gemini 1.5 Pro把稳定处理高下文的上限扩大至100万tokens。
这意味着Gemini 1.5 Pro能一次性处理超过70万个单词的文本、3万行代码、11个小时的音频,或1个小时的视频。
相较之下,两个月前发布的Gemini 1.0 Pro高下文理解限定为3.2万tokens,而OpenAI的GPT-4 Turbo也只支持12.8万tokens。

Gemini 1.5 Pro的出色表现不仅表示在处理大量资料的能力上,还表现在其对多模态信息的理解上。
在测试过程中,研究职员用多段一个多小时的视频考验了Gemini 1.5 Pro的长序列理解能力。
结果显示,Gemini 1.5 Pro在理解是非视频上与在超长文本任务上的表现同样精良。
此外,Gemini 1.5 Pro还支持图像和视频的天生。
这些功能的实现,都得益于谷歌的模型采取了“稠浊专家模型”(MoE)的算法。

VeryKen智评:Gemini 1.5的发布是AI领域的一次重大打破。
它的涌现不仅推动了AI技能的发展,也为AI在各个领域的运用供应了更多的可能性。
首先,Gemini 1.5 Pro的涌现,使得AI模型能够处理更大量的数据,这对付大数据剖析、自然措辞处理等领域具有主要的意义。
其次,Gemini 1.5 Pro的多模态信息处理能力,使得AI模型能够更好地理解和处理图像、音频和视频等多种类型的数据,这对付图像识别、语音识别和视频剖析等领域具有主要的推动浸染。
(机器之心,量子位,财联社)

【Gemini大规模商业化,谷歌首次在AI竞赛中追平微软与OpenAI】

谷歌近期推出其大规模商业化的AI模型Gemini,这一举动标志着谷歌正式加入了人工智能竞赛。
这是第一次有另一家公司的大模型能与OpenAI最前辈的ChatGPT模型相媲美。

据谷歌CEO桑达尔·皮查伊称,驱动会员版Gemini Advanced全新体验的Ultra 1.0,是首个在MMLU(大规模多任务措辞理解)上超越人类专家的模型。
Gemini Advanced的表现与GPT-4大致相称,两大模型在不同领域互有胜负。
GPT-4在编写代码和撰写诗歌等任务上更加出色,而Gemini则更善于多模态和搜索任务。

Gemini的Android版App已上线,用户可以将Gemini设置为默认助手,取代此前的Google Assistant。
在移动真个产品发布是这次谷歌的产品亮点,也更能让普通人通过手机就可以直接感知到大模型的功能。
目前Gemini Advanced已在150多个国家和地区供应英语版本,定价为19.99 美元/月,与 GPT-4 价格相同,但用户可免费试用2个月。
(极客公园,36氪)

【奥特曼欲筹资7万亿美元寻衅英伟达,黄仁勋:不靠谱】

OpenAI创始人兼CEO山姆·奥特曼正从中东地区筹集总计高达7万亿美元的资金,以支持公司的一项半导体操持,并与英伟达展开竞争。
但英伟达创始人兼CEO黄仁勋对此表示疑惑,他认为各国须要培植独立的AI根本举动步伐,未来几年打算技能的进步将使人工智能的开拓本钱远低于7万亿美元。
他略带讽刺地称:“(七万亿美元)显然能买下所有的GPU……但是,打算机架构其实在不断地进步。

黄仁勋在迪拜天下政府峰会上表示,人类正迎来“通用打算的结束和加速打算的开始”,芯片部件的制造将“越来越快”,进而降落人工智能技能的本钱。
但他也承认AI支出的增长趋势确实不会很快结束,估计未来五年环球数据中央为AI供应动力的本钱将翻一番。
(澎湃新闻,财联社)

【超强算法砍掉95%数据量,大模型性能反而更强了】

陈丹琦团队最新研究成果“数据选择算法LESS”将大模型的演习数据量砍掉95%,仅利用与任务最干系的5%数据进行指令微调,却取得了比利用全体数据集更好的效果。
LESS算法的核心在于优先利用对目标任务有直接帮助的数据进行演习,而不是依赖表面形式特色。
这种方法具有高效性和可迁移性,可以在其他大模型以及各种类型的模型上同样适用。

这一打破性的创造不仅降落了大模型的演习本钱,而且提高了模型的性能,为AI领域的发展开辟了新的道路。
在大模型科研的下半场,"less is more"成为了新的主题,更小的参数,更好的效果,帮助大模型在更多领域更快落地。
(量子位)

【谷歌推出新型思维链,推理本钱降至1/40】

谷歌和南加州大学的最新研究“自我创造”(Self-Discover)为大模型推理范式带来改造。
这种新方法不仅让模型在处理繁芜任务时表现更佳,还将同等效果下的推理本钱压缩至1/40,比较已成行业标准的思维链(CoT)有显著上风。

自我创造的核心策略是“千人千面”,即让大模型针对不同问题提出特定的推理构造,而不是像CoT那样采取“千篇一律”的办法。
这种灵巧应变的办法更加贴近于人类的思考模式,也使大模型的思维办法更进一步。

自我创造步骤架构紧张分为两个阶段。
第一阶段是辅导大措辞模型从原子推理模块中进行挑选、调度、整合,搭建出一个可以办理特界说务的推理构造。
第二阶段则是输入实例,让大模型利用第一阶段创造的推理构造来天生答案。

在GPT-4和PaLM 2上进行的实验显示,利用自我创造步骤架构后,模型的性能在BBH、T4D、MATH等几个基准中都有明显提升。
在处理问题的推理调用方面,自我创造步骤须要的调用次数明显少于CoT+Self Consistency,而且准确性更高。
(量子位)

【ChatGPT测试“影象力”新功能,更具个性化】

OpenAI正在测试一项名为“影象”(memory)的新功能,使其谈天机器人ChatGPT能在每次互换时保留用户供应的特定信息。
这项新功能许可用户辅导ChatGPT记住或忘却特定的对话内容,其影象会随着用户的互动而演化,并且与特定对话无关。
删除谈天记录并不会肃清其影象,用户必须在设置里删除影象本身。
这将使ChatGPT对其1亿周生动用户变得更为有用和更具个性化。

VeryKen智评:这项新功能的推出,标志着OpenAI在提高其产品的个性化和实用性方面的最新考试测验。
只管为每个用户建立更详细的历史记录可能会产生新的隐私问题,但OpenAI已采纳方法来办理这些问题。
用户可以在设置菜单里随时关闭这项功能,如果他们希望ChatGPT忘却某些内容,只需见告ChatGPT即可。
(财联社,量子位)

【“木头姐”最新预测:通用人工智能最早2026年实现】

号称“女版巴菲特”、“木头姐”的方舟投资管理公司CEO凯茜·伍德(Cathie Wood)的ARK研究团队发布了一份长达163页的《Big Ideas 2024》预测报告,个中对人工智能技能的发展进行了深度剖析和预测。
报告显示,AI技能的发展速率超出市场预期,估量通用人工智能(AGI)最早将在2026年涌现,最晚则到2030年涌现,比2019年预测的2099年提前了69年到73年。

该报告指出,随着AI大模型广泛且迅速的运用,算力演习本钱正快速低落,AI推理本钱以每年约86%的速率低落,尤其与GPT-4 Turbo干系的推理本钱已低于一年前的GPT-3.5。
ARK团队预测,估量到2030年,AI 硬件和软件的领悟可以使模型演习和推理本钱以每年75%的速率低落。

报告进一步指出,到2030年,AI硬件的投资规模将达1.3万亿美元,并推动环球AI软件发卖规模高达13万亿美元,毛利率将坚持在75%的水平。
同时,AI根本举动步伐即做事供应商、软件公司和AI根本模型供应商这三类企业届时也将产生20%的现金流利润。

报告还预测,颠覆性技能的领悟将定义环球下一个十年的发展,AI、公共区块链、多组学测序(Multiomic Sequencing)、能源存储和机器人这五个紧张技能平台正在相互领悟,并改变环球经济活动,而经济增速可能从过去125年均匀3%加速至未来7年的7%。

此外报告还详细谈到了机器人技能、数字钱包、精准治疗和多组测序发展、多组学工具和技能、电动汽车、自动驾驶、可重复利用火箭、3D打印等家当的未来发展。
这些颠覆性创新技能不仅是经济增长的驱动力,而且对付成本市场具有巨大的长期增值浸染。

VeryKen智评:“木头姐”团队的这份报告为我们描述了一个由AI技能驱动的未来天下,这个天下充满了无限的可能性和机遇。
然而这也意味着我们须要重新评估潜在市场机会,并把稳企业面临颠覆式创新带来的风险成分。
正如ARK在报告中所强调的,“创新不仅是增长的关键,也是韧性的关键。
”(钛媒体)

半导体

【Arm强劲财报引股价暴涨,母公司软银股价也连续三日大涨】

英国科技公司Arm Holdings近日发布了强劲的第三财季财报,营收和调度后利润均超华尔街预期,股价盘后一度暴涨42%,而从2月8日起的三个交易日股价大涨93%,今年累计已上涨192%。
受此推动,母公司软银集团的股价连续三日大涨,创下自2021年5月以来的最高水平。

Arm的业务增长得益于其在半导体行业中的独特角色,它通过授权出售软件用来编写与芯片通信的基本指令集,并供应设计模块,让芯片公司如高通等利用这些模块来构建他们的产品。
只管2023年由于智好手机市场低迷,Arm的发卖额一度萎缩,但2024年随着智好手机和条记本电脑的升级需求重新兴旺,以及天生式人工智能做事非常火热,Arm的业务增长重获巨大动力。
由于汽车和人工智能等市场将在第四财季表现强劲,该公司上调了约1亿美元的财报营收预测。

Arm自2016年以来大幅实现业务多元化,智好手机目前占公司下贱业务的35%,而2016年这一比例在60%至70%之间。
如今Arm的客户名单险些涵盖全体科技行业,包括苹果、亚马逊、高通和联发科等。

然而只管实现了多元化,Arm在人工智能领域的参与度仍有较大提升空间。
Arm的客户正在转向利用Arm的第九代核心芯片架构,该技能的特许权利用费是其前身的两倍。
他们还在每台设备上利用更多的Arm打算核心,这也增加了特许权利用费。

VeryKen智评:Arm的强劲财报和股价表现反响了其在半导体和人工智能领域的强大竞争力,但其高估值也引发市场担忧。
未来Arm须要连续推动业务多元化和技能创新,以保持其在行业中的领先地位,投资者也要密切关注其盈利能力和市场估值,避免投资风险。
(财联社,界面新闻,澎湃新闻)

【英伟达股价飙升,市值超过亚马逊】

英伟达股价近日一起飙升,市值超过亚马逊,并一度超过谷歌母公司Alphabet,达1.82万亿美元。
这一强劲涨势的背后,是市场对人工智能的激情亲切,以及华尔街大行对英伟达的看涨感情。
高盛、美银、摩根士丹利等华尔街大行比来纷纭上调英伟达目标价,推动着市场的看涨感情。
此外,英伟达据传将进军定制芯片市场,进一步巩固其在AI芯片方面的领导地位,乃至有望内部“再造一个Arm”。

VeryKen智评:只管英伟达的股价和市值持续上涨,但也存在风险。
首先,其高市值可能会引发市场的担忧,其次,如果其财报不如预期,或美国通胀重燃,都有可能闭幕这一轮美股涨势。
(华尔街见闻)

【HBM内存需求与价格均暴涨,家当链公司因此受益】

随着AI GPU以及与AI干系的各种需求激增,HBM(High Bandwidth Memory)的价格2023年逆势暴涨,今年则延续了火热的状态,带动家当链公司股价水涨船高。

HBM是一种面向须要极高吞吐量的数据密集型运用程序的DRAM,其浸染类似于数据的中转站。
目前AI做事器GPU市场以NVIDIA H100、A100、A800以及AMD MI250、MI250X系列为主,这些GPU基本都配备了HBM。
据市场研究公司Omnia称,HBM估量今年将霸占DRAM市场的18%以上,高于去年的9%。
这表明,在AI打算系统领域,还没有其他存储芯片可以取代HBM。

在HBM内存制造领域,三星和SK海力士霸占主导地位,个中SK海力士约占HBM市场50%的份额,三星占比40%,美光占比不敷10%。
SK海力士近日宣告其新一代HBM产品HBM3的销量同比增长超过五倍。
三星电子表示,包括HBM3在内的前辈HBM产品的份额已达到半导体总发卖额的近50%,估量到年底将增至90%。

面对日益增长的HBM需求,三星电子和SK海力士正提高HBM产量并将成本支出分配给HBM干系设备,家当链干系公司也因此受益。
例如日本半导体设备公司TOWA(东和)表示,估量将从“韩国紧张制造商”得到用于制造HBM芯片机器的“最大订单”。

VeryKen智评:HBM的需求和价格的上涨反响了AI GPU需求的增长以及HBM在知足这种需求方面的关键浸染。
但也带来一些寻衅。
首先,HBM的生产扩展难度大,这可能限定其供应能力。
其次,HBM的高价格可能会对其在市场中的竞争力产生影响。
末了,只管HBM在AI打算系统领域的运用前景广阔,但在其他领域的运用还有待开拓。
(华尔街见闻)