由Spark Capital领投的融资A轮投资中,开源向量数据库公司Qdrant成功融资2800万美元。
Qdrant成立于2021年,总部位于柏林,致力于利用AI革命的机遇,面向开发者提供开源向量搜索引擎和数据库。这成为生成式AI的重要组成部分,需要在非结构化数据之间建立关系,即使这些数据在实时应用中是“动态”的,例如文本、图像或未标记或未组织的音频。根据Gartner的数据,非结构化数据占据了所有新企业数据的约90%,增长速度是其结构化对应物的三倍。
近几个月来,向量数据库领域备受瞩目。Weaviate通过其开源向量数据库成功融资5000万美元,而Zilliz则获得6000万美元用于推广Milvus开源向量数据库。此外,Chroma通过种子轮融资筹集了1800万美元,而Pinecone则因其专有替代方案而筹集了1亿美元。
Qdrant在去年4月曾融资750万美元,再次显示投资者对向量数据库的巨大兴趣,也预示着Qdrant计划扩张。Qdrant首席执行官兼创始人Andre Zayarni向TechCrunch解释说:“原计划是在今年第二季度进行下一轮融资,但我们几个月前就收到了一份报价,决定省略一些时间,现在开始扩展公司。”他补充道:“筹集资金和招聘合适的人员总是需要时间的。”
值得注意的是,Zayarni表示公司实际上拒绝了一家“主要数据库市场参与者”的潜在收购要约,与此同时接受了跟投资的邀约。“我们选择了融资,”他说,并补充说,他们将利用新的现金注入来建设业务团队,因为目前公司基本上是由工程师构成的。
二进制逻辑
自上次融资以来的九个月里,Qdrant推出了一项名为二进制量化(BQ)的新型高效压缩技术,专注于低延迟、高吞吐量的索引,据称可以将内存消耗降低多达32倍,并提高检索速度约40倍。
“二进制量化是将向量压缩为只有零和一的最简单表示方式,”Zayarni说。“比较向量变得是最简单的CPU指令,这使得查询速度显著提高,并在内存使用上实现了巨大的节省。理论概念并非新颖,但我们以一种几乎没有精度损失的方式实现了它。”
尽管BQ可能并不适用于所有AI模型,用户完全可以自行决定哪种压缩选项最适合他们的用例。但Zayarni表示,他们在OpenAI的模型中取得了最好的结果,Cohere和Google的Gemini也表现出色。该公司目前正在与Mistral和Stability AI等公司的模型进行基准测试。
正是这些努力吸引了一些知名的采用者,包括德勤、安永和——可能是最引人注目的——X(前身是Twitter)。或者更准确地说,是埃隆·马斯克的xAI,该公司正在开发ChatGPT竞争对手Grok,上个月首次亮相X平台。
虽然Zayarni因为保密协议未透露X或xAI是如何使用Qdrant的详细信息,但合理地可以假设它正在使用Qdrant处理实时数据。事实上,Grok使用了一种名为Grok-1的生成式AI模型,该模型经过来自网络的数据和人类反馈的培训,鉴于其与X的(现在)紧密关联,它可以将社交媒体帖子的实时数据整合到其响应中。这就是今天被称为检索增强生成(RAG)的用例,埃隆·马斯克在过去几个月里曾公开预告过这样的用途。
Qdrant并未透露其客户中是使用开源Qdrant版本的,还是使用其托管服务的详细信息,但它指出一些初创公司,如GitBook、VoiceFlow和Dust,“主要”使用其托管云服务,这有效地为资源受限的公司节省了管理和部署一切的麻烦,就像它们必须在使用核心开源版本时一样。
然而,Zayarni坚称公司的开源信誉是其主要的卖点之一,即使公司选择支付附加服务费用。
除了今天的融资之外,Qdrant还正式推出了其托管的“本地”版本,为企业提供了在内部托管一切但利用Qdrant提供的高级功能和支持的选项。这也是继上周Qdrant的云版着陆微软Azure平台后的消息,此前已经支持AWS和Google Cloud Platform。
除了主投资者Spark Capital外,Qdrant的A轮融资还包括Unusual Ventures和42cap的参与。