译者 | 核子可乐
策划 | 李冬梅
本文是由天下有名数据库行业专家 Andy Pavlo 教授撰写的 2023 年数据库回顾文章。最近几年,每一个岁末或年初,Andy 教授都会撰写下关于过去一年他对数据库领域的不雅观察和感悟,他的系列文章不仅整理和收纳了数据库领域的大事宜和技能发展趋势,更为数据库领域从业者供应了宝贵的参考和启迪。
在本文中,Andy 教授首先回顾了 2023 年数据库领域的主要里程碑,包括技能进步和业界动态。他还详细阐述了在这一年中引起广泛关注的几个主题,如向量数据库、自然措辞查询和 SQL 之间的关系、人工智能崛起为数据库领域带来的机遇等。AI 前哨对本文进行了翻译,以便广大读者能够更好地理解干系内容,紧跟环球的数据库动态。
新年新气候,只管发生了很多糟苦处,但我还是要对过去一年间的各紧张数据库事宜和趋势进行回顾和盘点,毕竟 2023 确是数据库发展进程中的主要一年。
我的目标是连续保持锐利但公道的不雅观点,同时过滤掉那些言过实在的炒作辞吐。
向量数据库的兴起2023 年无疑是向量数据库全面兴起的一年。只管个中一些系统几年之前就已经出身,但出于人们对大措辞模型及干系做事运用(例如 ChatGPT)的广泛关注,向量数据库终于在这一年中迎来全面爆发。向量数据库能够根据数据的语义、而不仅仅是内容,来对数据(特殊是非构造化数据)进行深入搜索。换句话说,运用程序现在可以直接搜索关于特定主题的内容,而不是僵硬地查找详细关键字。
这种“神奇”搜索的背后离不开 transformers,这项技能能够将数据转换成固定长度的一维浮点数向量,被称为嵌入。人类无法直接理解这些嵌入中的值,但其内容却编码了参数和 transformers 演习语料库之间的某种关系。这些嵌入向量的大小范围从大略的数百维 transformers,一起延伸到高端模型中的数千维。
当我们利用 transformers 为数据库内的所有记录天生嵌入时,即可通过在高维空间中查找最靠近搜索嵌入的记录嵌入来找到特定输入的相似记录。但是,暴力比较所有向量来探求最靠近匹配项会带来极高的本钱。
这项操作的繁芜度为 O(N d k),个中 N 代表嵌入数量,d 是各个向量的大小,k 是我们须要的匹配数量——看不懂也没紧要,这本身便是项艰深的技能,大家随便听听就好。
这时候就轮到向量 DBMS 发挥浸染了。从实质上讲,向量 DBMS 便是一种拥有专门索引数据构造的文档数据库,用于加快对嵌入相似性的搜索过程。这些系统可以利用近似搜索来天生结果,而不是傻傻对每项查询的最相似向量实行精确匹配。如此一来,我们就能以“足够好”的效果换取更快的返回速率。
刚刚遭遇 2022 年区块链数据库的海量崩溃之后,沮丧的风险投资商们猛然嗅到了向量数据库中的商机,并再次愉快起来。他们开始为向量数据库领域的险些每家紧张厂商都注入了大笔种子资金。在 2023 年的种子轮融资当中,Marqo 拿到 530 万美元,Qdrant 斩获 750 万美元,Chroma 则得到 1800 万美元。Weaviate 在 2023 年 4 月的 B 轮融资成功筹得 5000 万美元,而这一年中领跑全场的还得说 Pinecone 的 1 亿美元 B 轮。这下可真是抄上了。
小结:向量数据库没什么技能壁垒在 2022 年底大措辞模型在 ChatGPT 的加持下进入“主流”视野后,多家 DBMS 厂商只用不到一年韶光就推出了自己的向量搜索扩展,个中包括 SingleStore、甲骨文、Rocket 和 Clickhouse。几大 PostgreSQL 衍生系统也宣告将支持微量搜索,个中一些利用到 pgvectorryna(Supabase、AlloyDB),也有几家利用其他开源 ANN 库(Timescale、Neon 等)。MongoDB 和 Cassandra 等领先 NoSQL DBMS 也引入了向量索引。
就在 DBMS 向量支持功能快速遍及的同时,JSON 数据类型也在迅猛崛起。采取原生存储 JSON 的 NoSQL 系统是从 2000 年代末起开始盛行的(包括 MongoDB 和 CouchDB),但又过了好几年,关系型 DBMS 才开始添加对 JSON 的支持(PostgreSQL、Oracle 和 MySQL 的支持韶光分别是在 2012 年、2014 年和 2015 年)。SQL 标准在 SQL:2016 中引入了对 JSON 灵气进行操作的函数,但直到 SQL:2023 才正式将 JSON 数据类型添加进来。鉴于许多关系 DBMS 早已支持具有相似观点的 XML 数据类型,这样的滞后的确令人感到意外。
向量搜索索引的快速增长有两大潜在缘故原由。首先,通过嵌入进行相似性搜索开始成为愈发主要的用例,迫使每家 DBMS 厂商都匆忙推出了自己的版本。其二是这种引入新型访问方法和索引数据构造的工程量并不算大,以是 DBMS 厂商每每可以快速发布自己的向量搜索功能。大多数厂商根本不须要从头开始编写向量索引,而只需集成市情上可用的几种高质量开源库(例如微软 DiskANN 和 Meta Faiss 等)。
而从这个角度来看,向量搜索功能的实现事情量不高,导致向量 DBMS 厂商根本没有足够深的护城河来抵御老牌 DBMS 厂商的竞争压力。
我最近曾给 Pinecone 和 Weaviate 公司的联合创始人提出忠言,建议他们的系统采纳两条发展路径:其一是由客户用这些向量 DBMS 作为“记录数据库”,而厂商则为操作事情负载供应更好的支持。这样他们的产品就会越来越像目前盛行的文档型 DBMS(例如 MongoDB),并在五年之内像之前的 NoSQL 系统那样添加对 SQL 的支持。另一条路则是将向量 DBMS 作为上游主流 DBMS 的赞助性方案,目前实在已经有不少人在以这样的办法利用 Elastic 和 Vespa 等搜索引擎 DBMS。如此一来,向量 DBMS 不能在不扩展自身查询措辞或者改变数据模型构造的条件下坚持生存。
旁注:我最近还专门录制了一期向量与关系数据库的问答节目,提到在未来五年内,每一种关系 DBMS 都将拥有自己的一套高性能向量索引实现。
SQL 正变得越来越好刚刚到来的 2024 年,也恰好是 Don Chamberlain 和 Ray Boyce 在 IBM 研究院发明 SQL 的五十周年。SQL 最初被命名为 SEQUEL(构造化英语查询措辞),自上世纪八十年代以来一贯是数据库交互领域的客不雅观标准编程措辞。只管 SQL 历史悠久,但其用场和功能一贯在不断更新,并在过去十年间迎来了颠覆性变革。
就在去年,ISO/UEC 9075 规范发布了最新版本,即 SQL:2023。这次更新引入了大量“锦上添花”的功能,用以办理不同 SQL 方言(例如 ANY_VALUE)中的不一致问题。值得一提的是,个中对 SQL 的两项增强进一步削弱了对替代性数据模型和查询措辞的需求。但请把稳,SQL 新规范包含这些内容,并不代表大家常用的关系 DBMS 会立即支持这些新功能。
截至 2024 年 1 月,据我理解唯一支持 SQL/PGQ 功能的 DBMS 就只有 Oracle。DuckDB 倒是供应一个支持 SQL/PGQ 的实验性分支,但仍无法正常运行以上示例,由于其支持的语法仍略有差异。
多维数组(SQL/MDA):
自从 SQL:1999 引入有限的一维、固定长度数组这种数据类型以来,SQL 就正式开启了自己的数组支持之旅。SQL:2023 扩展了这项功能,可以支持未对最大基数进行预定义的嵌套数组。SQL:2023 中的 SQL/MDA 更新能够支持利用基于整数的坐标的任意维度多维数组。Rasdaman 的 RQL 极大启示了 SQL/MDA 语法,以供应与 SQL 兼容且符合其凑集语义的构造及操作数组布局。这些增强功能使得运用程序可以完备在 SQL 之内对多维数组实行操作和交互,而无需单独导出(例如导出为 Python notebook)。下表所示,为在 CREATE TABLE 语句中利用 MDARRAY 数据类型的几种不同示例:
只管 SQL.MDA 规范自 2019 年就已经发布,但直到 SQL:2023 才被纳入官方标准。据我理解,除了 Rasdaman 之外,还没有哪种生产级 DBMS 能够支持 SQL/MDA 扩展。我能找到的唯一其他原型就只有 HSQLDB 的一个分支,名为 ASQLDB。
小结:自然措辞查询永久取代不了 SQLSQL:2023 修订版代表这种通用措辞迈进了持续发展和改造的下一阶段。当然,SQL 仍不算完美、也不具备真正的可移植性,由于每种 DBMS 都有自己的怪癖、专有功能和非标扩展。我个人最喜好 PostgreSQL 的::cast 运算符快捷办法。
SQL/PGQ 虽然意义重大,但我以为它在短韶光内还不敷以对图 DBMS 造成致命打击。毕竟已经有多种方法可以将面向图的查询转换为 SQL,不少 DBMS(包括 SQL Server 和 Oracle)也供应内置的 SQL 扩展,能够降落图数据存储和查询的门槛。Amazon Neptune 是亚马逊云科技旗下 Aurora MySQL 产品上的图数据库方案。Apache AGE 在 PostgreSQL 之上则供应 OpenCypher 接口。估量諅 要 OLAP 系统(例如 Snowflake、Redshift 和 BigQuery 等)也将在不久的将来支持 SQL/PGQ。
在 DBMS 中添加 SQL/PGQ,绝不像添加新语法支持那么大略。必须关注一系列工程要点,才能担保图查询操作拥有良好的性能。例如,图查询会实行多路连接来遍历全体图构造。但当这些连接的中间结果大于基表时,每每会引发问题。DBMS 必须利用最坏情形最优连接(WCOJ)算法来改进表间常用的哈希连接方法。另一项主要技能,则是利用 factorization 来避免连接期间实现的冗余中间结果。这类压缩方法能帮助 DBMS 避免一遍又一各处用相同连接花费内存。
我这里提出的优化方法,并没能在现有图 DBMS 中全部得到实现。由于据我所知,Neo4j、TigerGraph 等领先系统也还做不到。我听说过的唯一面向图系统便是滑铁卢大学的嵌入式 Kuzu DBMS。此外,大多数关系 DBMS 也还没有实现(至少那些开源数据库还弗成)。前文提到的 DuckDB 有个实验分支实现了 WCOJ 和 factorization 优化,并在 2023 年的论文中提到,其在行业标准图基准上的操作性能比 Neo4j 赶过 10 倍。
但正如前文提到,SQL 在大多数读者朋友出生前就已经存在,也将在我们故去后依旧坚挺。总之,我反对统统所谓自然措辞查询将彻底取代 SQL 的说法。
旁注:两年之前,我曾公开打赌说在 2030 年之前,图 DBMS 还不可能在数据库市场上取代关系 DBMS。至少就目前看,我的结论仍旧精确。
MariaDB 身陷困境去年,MariaDB 开始在新闻宣布中频频亮相,而且大多不是什么好事。我们创造独立于 MariaDB 基金会之外的 MariaDB 公司已经后院动怒。2022 年,该公司考试测验借壳上市,但股价在 IPO 后的三天内迅速下跌 40%。而为了加快上市速率而搞的借壳操作也被公之于众。截至 2023 年底,该公司股价较开盘以来已累计下跌超 90%。
面对一系列财务问题,该公司被迫宣告了两轮裁员。第一轮是在 2023 年 4 月,并随后在 2023 年 10 月进行了一轮更大规模的精简。该公司还宣告将淘汰两款产品:Xpand 和 SkySQL。MariaDB 公司于 2018 年收购了当时名为 Xlustrix 的 Xpand;2014 年时我曾参不雅观过 Clustrix 的办公室,创造那里就像一座令人不寒而栗的鬼城(巨大的楼层中,有半数房间都关着灯)。SkySQL 的来历则更为繁芜,他们最初是一家供应 MariaDB 做事的独立公司,后来在 2013 年与 Monty Program AB 合并。2014 年,合并后的两家公司共同成为我们如今熟知的 MariaDB 公司。但就在去年 12 月,该公司宣告 SkySQL 将会转为一家独立企业。
MariaDB 公司的情形如此糟糕,导致其基金会 CEO 专门撰文,抱怨自 IPO 以来基金会与公司间的关系如何快速恶化,并表达了“重启”的意愿。其他坏还包括:微软于 2023 年 9 月宣告,未来不会连续在 Azure 上供应 MariaDB 托管做事,转而专注支持 MySQL。有些朋友可能不太熟习,MariaDB 便是 MySQL 的一个分支,是 MySQL 缔造者 Monty Widenus 在甲骨文于 2009 年宣告收购 Sun Microsystems 后开拓而成。总而言之,当初被放弃的 MySQL 表现良好,而作为新兴替代力量的 MariaDB 却身陷困境。以是还看什么宫斗戏,多关注数据库市场什么都有了!
过去十年以来,数据库客户明显变得越来越精明了。企业没办法再通过华而不实的基准数据、承诺取代 SQL 的新查询措辞或者技能大佬的背书来“假装成功”。DBMS 的荣誉比以往任何时候都更加主要。也便是说,DBMS 软件本身及其背后的开拓企业须要同心协力,任何内斗都将直接削弱产品的市场生命力。
而且也别指望着开源能让项目长久存续,事实见告我们,任何 DBMS 项目都很难在相应的营利性公司倒闭后连续康健发展。少数反例就只有 PostgreSQL;再加上为 MySQL 构建 InfiniDB OLAP 引擎的公司在 2014 年破产之后,其 GPLv2 源代码被继续下来并成为 MariaDB 中的 ColumnStore。
相反,更多例子表明一旦没有营利企业来支撑项目开销,DBMS 将很快消逝。感兴趣的朋友可以去看看 Apache 基金会的库存清单,理解到底有多少 DBMS 项目被这样彻底废弃。
纯云 DBaaS(数据库即做事)方案的涌现令形势变得更加严厉。由于一旦公司失落败(或者财务状况不佳),用于托管数据库的做事器也将被快速关停。Xeround 曾在 2013 年关闭数据库时,给了客户两周韶光来迁移数据库。为了减少本钱,InfluxDB 虽在 2023 年 7 月下线全体做事区前给客户预留了六个月过渡期,但此举仍令人们感到震荡。
MariaDB 显然频年夜多数普通数据库初创企业的情形更好,毕竟 Monty 等成员还建立起了掌握这个开源项目的非营利基金会。但对付任何一个开源 DBMS 项目,只要卖力赢利的公司跟卖力推进项目发展的基金会发生了冲突,项目本身可就危险了!
而且就在此时此刻,MySQL 仍在不断改进,且甲骨文用实际行动证明自己确实是非常精良的企业业务管理者(至少在工程层面是这样)。相信 MariaDB 公司的乱象,将进一步推动用户群体转向 PostgreSQL。
但作为 Monty 用自己女儿名字命名的数据库,我也相信 MariaDB 仍会连续存不才去。
自研数据库崩溃导致美国航空业中断2023 年 1 月 11 日,受 NOTAM 系统中断影响,美国联邦航空管理局(FAA)被迫叫停了美国境内的所有航班。NOTAM 系统卖力向翱翔员供应纯文本编码,并就翱翔路径上可能碰着的意外变革或潜在危险发出警告。1 月 11 日上午,NOTAM 系统崩溃,导致全美约 1.1 万个航班停息起飞。但拥有独立航空通报系统的其他国家未受这次系统故障的影响。
根据 FAA 的阐明,这次中断是由数据库文件破坏所造成。第三方承包商的工程师考试测验用备份更换该文件,但创造操作过程导致备份文件也被破坏。类似的问题曾经在 2008 年导致 FAA 的原有根本举动步伐涌现同样的故障。
目前并不清楚 FAA 在 NOTAM 系统中到底利用的是哪款 DBMS。但有宣布表明,该系统至今仍运行在两台 1988 年的飞利浦 DS714/81 大型机上。这些设备利用的根本就不是我们熟知的当代操作系统,而上世纪六十年代的老古董。也便是说,FAA 明显没能在上世纪八十年代利用 Oracle、Ingres 和 Informix 等能够支持各种 Unix 平台的 DBMS 完成当代化改造。我个的合理推测是,NOTAM 系统利用的可能是普通文件(例如 CSV)自托管数据库。这些由非数据库专家编写的运用代码卖力从文件中读取/写入记录,将结果复制到备用做事器并在崩溃时保障数据完全性。
小结:在老掉牙的内部自研数据库上事情,是开拓者的噩梦在不可替代的遗留硬件上运行关键任务系统,并利用早已老掉牙的内部原研自定义数据库,可以说是每一位数据库从业者最胆怯的噩梦。我很惊异 NOTAM 居然拖到现在才崩溃(或者说 2008 年搞出问题的也是同一套系统?),以是面对这样一套能够支持运行 35 年的“出土文物”,我反倒有点肃然起敬了。
有人士称,NOTAM 系统每秒只能处理 20 条。以当代标准来看,这确实少得可怜。但还是那句话,这套系统的支配是在上世纪八十年代。数据库传奇大佬、1998 年图灵奖得到者 Jim Gray 曾在 1985 年专门撰文先容“普通”DBMS 如何每秒实行 50 项事务,而非常高真个 DBMS 每秒乃至能够处理 200 项事务。作为参考,五年之前曾有人用八十年代的基准(即基于 TPC-A 的 TPC-B)在 Raspberry Pi 3 上运行过 PostgreSQL,终极性能也大致便是每秒 200 项事务。但如果不考虑跨数据中央间的强同等系统(约束其性能的唯一瓶颈便是光速),当代单节点 OLTP DBMS 在某些事情负载上可以轻松实现每秒数百万项事务。以是必须承认,NOTAM 哪怕因此上世纪八十年代的标准看也没达到顶尖水准,放在本日更是掉队得吓人。
由于 NOTAM 没有将数据库跟运用程序逻辑区分开来,以是根本不可能对这些组件进行独立升级。考虑到当时人们已经很清楚关系模型的上风所在,这样的设计哪怕放在当年也该受到批驳。我们并不能说 SQL 就一定可以阻挡这次故障(毕竟这属于人为缺点),但至少组件间的独立性可以让系统更加灵巧、也更易于管理。
而且,美国政府当时已经开始利用商用关系型 DBMS。例如,Stonebraker 的 RTI(Ingres 的开拓商)就曾在 1988 年的上市文件中提到,其客户包括国防部、财政部、多个军事部门和研究实验室。我相信美国政府的其他部门当时肯定也在利用 IBM DB2 和 Oracle。以是,硬要选择 NOTAM 并延续至今,在我看来是个不可理喻的决定。
在听说这事时,我正从阿姆斯特丹坐飞机返回美国。幸运的是,故障并没有影响到入境航班,以是我们的飞机可以正常按时降落。但后来我还是被困在了纽瓦克机场,由于所有海内航班都被迫中止。
聊聊数据库融资除了前文提到向量 DBMS 的风险投资热潮之外,其他类型的数据库系统在过去一年中也吸纳了不少资金。但总体而言,这一年的数据库融资热度要比往年生僻得多。
自动调优初创公司 DBTune 在欧洲筹集到 260 万美元的种子轮资金;PostgresML 的种子轮则融得 450 万美元,这笔款项将用于构建自定义扩展 DBaaS 以通过 SQL 调用机器学习框架。TileDB 在秋季宣告了 3400 万美元的 B 轮融资,用于连续构建其阵列 DBMS。只管已经成立 13 年有余,SQReam 仍凭借其 GPU 加速型 DBMS 完成了 4500 万美元的 C 轮融资。Neon 于 2023 年 8 月拿下 4600 万美元 B 轮融资,用以扩展其无做事器 PostgreSQL 平台。这一年中最大的融资赢家当数 Databricks,他们于 2023 年 9 月的 I 轮融资中得到 5 亿美元巨资,但仍远不及 2021 年 H 轮的 16 亿美元。
2024 年 1 月 5 日更新:这里补充一下,MotherDuck(DuckDB 的商业版本)于 202 年 9 月筹得 5250 万美元 B 轮融资,而 DBeaver 则凭借其备受装腔的 DBMS 管理工具拿到 500 万美元种子轮融资。
2023 年数据库领域还涌现了不少收购。最大的一次发生在去年年初,Progress Software 以 3.55 亿美元现金直接买下了 MarkLogic——后者是历史最悠久的 XML DBMS 之一(出身于 2001 年前后)。Progress 旗下还拥有 OpenEdge,它的涌现乃至早于 MarkLogic(约 1984 年)。IBM 收购了 Meta 的衍生公司 Ahana,后者考试测验对 PrestoDB 进行商业化改造(与现已更名为 Trino 的硬分叉 PrestoSQL 不同)。多云数据库做事商 Aiven 收购了 AI 驱动型查询重写器初创公司 EverSQL,EnterpriseDB 则借用贝恩成本的资金收购了 Seafowl 团队——后者开拓出基于 DataFusion、能够兼容 PostgreSQL 的 OLAP 引擎。Snowflake 则分别收购了两家初创公司:其一是由前斯坦福大学教授 Peter Bailis 创立的 Sisu Data,其二是由伯克利大学教授 Aditya Parameswaran 创立的 Ponder(基于 Modin)。
小结:大模型干系家当,仍将受到成本青睐搞风投的朋友见告我,跟往年比较,2023 年市场上涌现了更多新兴企业,但资方却谨慎地捂紧了钱袋子。这种趋势其实在全体初创领域都有表示,只能说数据库也未能幸免。当然,唯一的例外便是 AI+大措辞模型,对付这类有望开拓打算领域新版图的项目,大成本们仍旧年夜方而激情亲切。
只管 2023 年内,美国的一系列宏不雅观经济指标开始转好,但科技行业仍旧心存疑虑并努力寻求降本增效。以 OtterTune 为例,客户们希望我们能更积极地优化数据库,帮助他们在 2023 年内降落数据库根本举动步伐本钱。与之对应,之前客户们的紧张诉求集中在提高 DBMS 的性能和稳定性上。我们操持在 2024 年发布新功能,切实达成本钱节约目标。而在我自己带的班里,大学生们纷纭请我帮他们推举数据库开拓岗位。要知道,卡耐基梅隆大学的打算机科学系享有盛誉,如今这里的学生居然都很难靠自己找到空想的演习机会和全职岗位了,看来大环境的确不好。
如果美国的科技市场连续保持这样的颓势,那么多数数据库初创企业在未来几年内恐怕都很难有本色性发展。规模较小的 DBMS 厂商可能被科技巨子或者私募股权公司吞并,乃至直接消亡。另一方面,那些凭借高估值筹得大量资金的公司也同样身陷困境。正如前文提到,个中很多可能根本无法成功上市,也没有多少科技大厂会用这些 DBMS,由于这是个人人都有自家 DBMS 的时期。对付这些体量很大、但还不足大的初创公司来说,摆在面前的路有三条:要么连续进行融资来坚持公司运转;要么通过 Cloudera 等私募股权机构寻求帮助;要么接管 IT 做事公司(例如 Rocket、Actian)的收购,在坚持原有系统稳定的同时,连续从被锁定的遗留客户身上压迫容许用度。但对付一家有追求的数据库公司来说,这三条路明显都不理想,而且明显不利于连续扩大客户受众。
末了我要提醒大家的是,Databricks 的问题已经不是要不要上市,而是什么时候上市。
有史以来最贵的一次密码修正OG 数据库专家 Larry Ellison 在 2023 年的奇迹可谓如日方升。对付他本就出色的职业生涯来说,这又是再创辉煌的一年。2023 年 6 月,他重登环球第四大富豪的宝座。甲骨文股价在 2023 年内上涨了 22%,险些追平标准普尔 500 指数的 24%回报率。2023 年 9 月,Larry 平生第一次前往微软总部,与软件巨子的 CEO 一道宣告 Oracle DBMS 将以托管做事的形式正式上岸 Azure 云。在 2023 年 11 月,股东们又以压倒性的多数票,决定让 79 岁的 Larry 连续担当甲骨文董事会主席。
但 2023 年真正的大新闻,还和蠊马斯克砸下 10 亿美元收购社交媒体 Twitter 之后,亲自帮助 Larry 重置了账户的密码。通过这次代价 10 亿美元的密码重置,Larry 终于在 2023 年 10 月发出了自己的第二条、也是近十多年来的唯一一条推文。Larry 表示自己即将动身前往牛津大学,随后宣告将在牛津创建 Ellison 理工学院(EIT)。
实在 Larry 详细发了什么并不主要,真正主要的是 Larry 重新回归 Twitter 了。我还通过个人道路打听到,Larry 会偶尔阅读 Twitter ,而且紧张关注创业宣扬、激情亲切的生日祝福还有他自己灵光一现时的各种想法。
通过 Larry 的推文,我们终于创造这位技能圈大佬原来也有日常生活,并不像人们想象中那么日理万机——毕竟这家伙可是拥有自己的米格-29 战斗机外加一座夏威夷海岛。而更让人倾慕妒忌恨的是,他还有位更有钱的好友,乃至乐意拿出 10 亿美元(捎带着)帮他重置账户密码。觉得 10 亿太多了?朋友们,当你身价 1030 亿时,这真的不算多。
新的一年,更加精彩我满心期待 2024 年,也会把更多韶光和精力投入到数据库领域。Dana、Bohan 和我创立的 OtterTune 公司也即将迎来四周年生日。这段经历教会了我很多,也让我们的数据库优化做事扩展到了最初的学术原型以外。
面对新的一年,我们打算分享更多关于利用 AI 技能改进现有 MySQL 和 PostgreSQL DBMS 的亮点和成果。我们也将开拓更多新的增强功能,帮助更多用户轻松掩护起稳定可靠的自有数据库。
备注:别忘了在数据库上多跑 ANALYZE,你的 DBMS 查询优化器会感谢你的。如果嫌麻烦,也可以选择用 OtterTune 自动办理。
原文链接:Andy教授2023年数据库回顾:向量数据库没有技能护城河!
没人能靠技能大佬背书“假装成功”_数据库_Andy Pavlo_InfoQ精选文章