近年来,向量数据库在现代人工智能领域扮演着不可或缺的角色,储存着诸如图像、视频和文本等非结构化数据,使人们和系统能够搜索未分类内容。这些向量数据库在大型语言模型(LLMs)如GPT-4(驱动ChatGPT的核心)中尤为重要,部分原因在于数据库能够在数据创建或更新时提供实时索引和搜索功能,这对于个性化特性、推荐系统、情感分析等至关重要。
随着生成式人工智能的不断崛起,各种向量数据库初创公司备受关注,纷纷获得了大量资金支持。仅在今年4月,Pinecone和Weaviate分别筹集了1亿和5000万美元,以发展其向量数据库技术。同月,初创向量数据库公司Chroma和Qdrant分别获得了1800万和750万美元的种子融资。去年年底,Milvus开源向量数据库的核心开发者Zilliz获得了6000万美元的融资。
可以明显看出,致力于帮助基础设施跟上人工智能热潮的公司正受到巨大需求的推动,而澳大利亚初创公司Marqo正试图通过更综合的“端到端”向量搜索解决方案来实现资本化。
解决难题
成立于墨尔本的Marqo是Jesse Clark和Tom Hamer的创意结晶,前者曾是亚马逊位于西雅图的机器人部门的首席机器学习科学家,后者曾是亚马逊网络服务(AWS)在悉尼的数据库软件工程师。Marqo的使命核心是解决非结构化数据的难题,据一些估计,非结构化数据占据了所有被创造数据的高达90%。随着越来越多的人借助生成式人工智能来回答在线问题或创建新图像和艺术作品,这进一步加剧了需要新工具来理解这些数据的需求。
与现有的竞争者相比,Marqo的一个核心卖点在于,它承诺通过一个单一的API提供一整套向量搜索功能,包括向量生成、存储和检索。这意味着Marqo允许用户跳过OpenAI或Hugging Face等公司的第三方向量生成工具,提供一站式服务。
Marqo的联合创始人兼首席执行官Tom Hamer在接受TechCrunch的电子邮件采访中解释道:“向量搜索很难实现,向量数据库只是难题的一部分,开发人员发现将所有所需组件整合在一起,以构建具有最佳相关性、延迟和可靠性的基于向量的搜索体验非常具有挑战性。Marqo提供了一个端到端系统,将所有这些组件整合在一起,解决了开发人员的主要痛点。”
此外,搜索系统的好坏取决于其生成的结果,这意味着相关性、准确性和“实时性”对于任何信息存储和检索系统都是至关重要的。Hamer表示,这也是Marqo的优势之一。
他继续说道:“如果开发人员想要持续改进搜索结果的相关性,他们必须手动训练新的向量生成AI模型。Marqo的持续学习技术将允许搜索根据用户参与度自动改进,比如点击、‘加入购物车’等,这对于电子商务和其他终端用户搜索用例非常重要。”
Marqo在去年获得了66万英镑(840,000美元)的种子轮融资,如今它宣布获得440万美元的种子融资,以加倍推动商业努力。这包括一个新的云服务,该服务今天正式向公众推出,以补充现有的开源Marqo项目。
开源因素
与许多竞争对手一样,Marqo的开源理念是一个经过深思熟虑的举措,旨在亲近开发者社区,开发者可以对产品进行调整,以确定是否适合他们的需求。反过来,这意味着他们更有可能向公司高层推荐该产品,甚至参与产品的开发。
Hamer表示:“我坚信开源产品的开发会带来更高质量的结果。在开源基础上构建Marqo使我们能够与用户保持紧密的反馈循环,快速迭代,以构建开发人员实际所需的产品。开源还是一个很好的客户获取渠道。客户可以清楚地了解他们购买了什么,他们可以免费尝试并确保Marqo适合他们的用例。”
然而,开源通常需要大量的资源来执行生产级产品,无论是人力投入还是基础设施。这就是Marqo Cloud介入的地方。
Hamer继续解释道:“
自托管开源产品对于不需要实时搜索且具有少量终端用户的用户来说是一个很好的选择,或者用于构建概念验证。Marqo的云平台处理我们客户的云资源的基础设施、维护和运营,确保性能和成本效益的最佳平衡。”
尽管Marqo在实质上是一家澳大利亚初创公司,但它在英国注册了一个母公司,这是其首个投资者Creator Fund所在地。它还在伦敦设有一个小办事处,目前只有一名员工,但计划在欧洲建立销售、市场营销和客户支持团队,以支撑其在欧洲的雄心。
Marqo的种子轮融资由澳大利亚风投公司Blackbird Ventures领投,Creator Fund参与其中,这两家公司都曾参投过种子轮融资。对于最新一轮融资,Marqo还吸引了January Capital和Cohere联合创始人Ivan Zhang和Aidan Gomez的投资。
结论
在AI领域,向量搜索引擎的需求与日俱增,而Marqo以其全面的“端到端”解决方案,为开发人员提供了更加便捷高效的向量搜索功能。Marqo的独特之处在于,它不仅提供了向量生成、存储和检索的功能,还通过持续学习技术,使搜索结果始终保持相关性和准确性,满足了不断发展的搜索需求。同时,Marqo以开源的方式推出产品,吸引了开发者社区的参与和贡献,进一步提升了产品的质量和适用性。通过Marqo Cloud,用户可以轻松地将开源产品部署到云端,获得最佳性能和成本效益。
在竞争激烈的向量数据库市场中,Marqo凭借其创新性的解决方案、开源的开发模式以及强大的团队支持,为未来的AI应用领域注入了更多可能性。作为数字化软件公司的运营,我们认为Marqo有望成为数字化和AI软件领域的重要合作伙伴,为开发者和企业提供强大的向量搜索功能,助力AI技术的发展和应用。
https://techcrunch.com/2023/08/16/meet-marqo-an-open-source-vector-search-engine-for-ai-applications/
文章来自ChatGPT3.5