2023年8月29日,数字化软件公司Rockset宣布成功融资4400万美元,这是继公司B轮融资之后的新一轮融资。这一消息表明,在现代生成式AI时代,Rockset的实时索引能力备受需求推动。
这轮融资由Icon Ventures领投,同时Glynn Capital、Four Rivers、K5 Global、Sequoia和Greylock也参与其中。Rockset总部位于加利福尼亚州圣马特奥。
2023年特别是Rockset的技术一直在不断发展,其技术基础是由Meta(前Facebook)创建的开源RocksDB持久键值存储。今年3月,Rockset推出了一个平台更新,旨在使其实时索引数据库速度大幅提升。紧随其后的是4月份推出的矢量嵌入支持,以帮助实现AI用例。
Rockset的联合创始人兼首席执行官Venkat Venkataramani表示:“我们越来越多地参与到正在构建的AI应用中,这是一个非常大的平台转变正在发生的事情。从根本上说,我们做的是实时索引,而事实证明,应用程序也需要在矢量嵌入上进行实时索引。”
矢量支持不仅仅是一种新的数据类型
矢量嵌入的使用在2023年随着生成式AI的兴起而增长。矢量是数据的数值表示,用于支持大型语言模型(LLMs)。目前有许多专用的矢量数据库,包括Pinecone和Milvus,它们加入了越来越多支持矢量嵌入的现有数据库技术,包括DataStax、MongoDB和Neo4j。
在Rockset内部,矢量嵌入被支持为现有数据库中的“浮点数组”数据类型。然而,从Venkataramani的角度来看,支持矢量作为数据类型并不是他特别感兴趣的事情。
更有趣的是Rockset如何为矢量嵌入构建了实时索引技术。该索引为给定数据集启用搜索提供了逻辑键。实时更新索引对于某些生产用例来说非常关键,因为它需要尽可能获取最新的信息。
正如Venkataramani所说,Rockset为矢量和常规数据构建实时索引的基本方法是相同的。拥有可以查询常规数据和矢量的实时索引对于现代AI应用非常有用。
Rockset如何构建矢量嵌入的实时索引
Rockset实时数据库的基础是RocksDB数据存储,公司已经使用RocksDB Cloud技术对其进行了扩展。
Venkataramani解释说,Rockset在RocksDB Cloud中开发了许多高级技术,帮助加速所有数据类型的索引。他指出,RocksDB Cloud现在具有近似最近邻(ANN)索引实现,这对于在矢量数据上进行实时搜索至关重要。
Venkataramani说:“现在,就像Rockset中的任何其他索引一样,一旦为矢量嵌入列构建了相似度ANN索引,它就会始终保持最新状态,它会在插入、更新和删除操作中自动保持最新。”
Rockset还整合了一个分布式SQL引擎,用于快速数据查询。Venkataramani指出,公司的SQL引擎现在能够在数据库上支持的所有数据类型上执行实时查询。
他说:“现在,您可以在单个SQL查询中执行大量过滤、连接和聚合操作,并使用矢量嵌入来进行排名相关性,以进行相似性搜索用例。单个SQL查询非常高效且非常快,因为SQL引擎是专为应用程序而建的,而不是等待报告的分析师。”
展望未来
Venkataramani预计,Rockset将会在AI能力方面有更多的发展。他期待的未来功能之一是支持GPU加速,以进一步加快LLMs和生成式AI用例的查询速度。
他说:“这个行业只是刚刚开始。这个平台转变不是一时兴起,这将成为每个应用程序的核心部分。”
结论
Rockset的新一轮融资反映了数字化软件领域的蓬勃发展,特别是在AI应用程序方面。公司正在不断提升其实时索引数据库技术,以适应生成式AI时代的需求。通过支持矢量嵌入和构建实时索引技术,Rockset已经在AI应用中扮演着关键角色,未来将继续推动数字化和AI领域的创新和发展。
文章来自ChatGPT3.5