使用MongoDB 构建AI:轻松应对从预测式AI到生成式AI

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 无论企业目前处于AI发展的哪个阶段,MongoDB均可提供支持

毫无疑问,如今从生成式AI (GenAI )中获益最大的是那些早已运用预测式AI (Predictive AI )的组织。2023年6月,麦肯锡在2023年6月发布的《生成式人工智能的经济潜力》研究中得出了与此相同的结论 (报告链接:https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier )。

原因主要有以下几点:

  • 内部文化决定组织是否愿意尝试和探索人工智能
  • 组织是否具备相关技能,但必须强调的是相比预测式AI,生成式AI更依赖于开发者,而不是数据科学家
  • 组织是否拥有准确无误、精心挑选的数据,可随时输入到GenAI模型中

但这并不意味着只有具备预测式AI使用经验的团队才能从生成式AI中获益。如果分析研究MongoDB “构建AI案例研究系列” 中的实例,不难发现,许多处于不同AI成熟度阶段的组织都在利用MongoDB进行人工智能创新。

本文介绍两家企业,它们成功地构建了预测式AI应用程序,并朝着生成式AI的方向迈进:

  • MyGamePlan助力职业足球运动员和教练提升球队表现。
  • Ferret.ai利用公开数据进行背景调查,帮助企业和消费者之间建立信任。

在这两个案例中,预测式AI成为数据驱动型决策的核心。如今,这两家公司都正在探索生成式AI,希望通过推出新产品来扩展服务,以提高用户参与度。两者的共同之处是他们都选择了MongoDB Atlas,并将其灵活运用到各种AI用例中。

MyGamePlan:利用AI驱动的洞察力提升职业足球运动员的表现

利用数据和分析来提升职业运动员表现的做法并不新鲜。但是,解决方案往往极其复杂,需要集成来自多个数据提供者的数据,导致成本高昂且洞察时间长。MyGamePlan专注于协助职业足球俱乐部和球员改变这种状况。

很多欧洲优秀的球队工作人员和球员都正在使用MyGamePlan,其中包括勒沃库森足球俱乐部 (Bayer Leverkusen,目前位列德国足球甲级联赛第一名 )、桑德兰足球俱乐部 (AFC Sunderland,英冠联赛 )、卡斯特利翁足球俱乐部 (CD Castellón,目前位列西班牙第三级别联赛第一名 )及弗罗茨瓦夫西里西亚足球俱乐部 (Slask Wroclaw,目前位列波兰足球甲级联赛第一名 )。

据MyGamePlan首席技术官兼联合创始人Dries Deprest介绍,MyGamePlan借助前沿分析、AI技术及用户友好型平台实现了赛事数据、球员跟踪数据和视频资源数据的无缝集成,并重新定义了足球分析的方式。平台可以实现工作流程自动化,帮助教练和球员制定比赛战术、促进球员发展并推动卓越战略实施,从而助力球队取得胜利。

MyGamePlay平台的核心是基于Python的自定义预测式AI模型。这些模型托管在Amazon Sagemaker上,能够分析比赛的特定时刻,对球员的个人表现及其对球队的贡献进行评分。此外,这些模型还可以推測球员的表现和贡献,并与对手球队的球员进行比较,以帮助制定比赛日战术。

数据是确保模型和预测准确性的关键。该公司将MongoDB Atlas作为其数据库,用于存储:

  • 每场比赛的元数据,包括比赛、球队和球员的数据。
  • 每场比赛的事件数据,如传球、断球、犯规和射门等。
  • 跟踪遥测数据,可每隔100毫秒捕捉每位球员在场的位置。

这些数据可从MongoDB迁移到Python DataFrames,与第三方数据流结合使用,共同训练公司的ML模型。同时,可从特定比赛序列中生成推论并将其存储回MongoDB Atlas,供教练和球员进行下游分析。
image.png

图1:利用MyGamePlan网页和手机应用,教练和球员可以即时评估比赛并制定战术。

Deprest表示,MyGamePlan正在使用AI模型持续丰富数据,并将这些数据用于洞察和分析,因此MongoDB非常适合这一用例。

两年前,MyGamePlan启动了开发项目,从那时起便开始采用MongoDB。数据涉及复杂的多向关系,需要将比赛与球员、事件和跟踪相互关联。为了更好地表示这种数据关系,MyGamePlan选择在丰富的文档结构中使用嵌套元素。这种方法不仅能够提高开发者的工作效率,还能够提升程序运行效率。如果使用外键创建关系模型,再连接关系数据库中的规范化表格,这样极为缓慢且低效。

在开发方面,Deprest表示,使用PyMongo driver将MongoDB与托管在Sagemaker的Python ML数据管道和MongoDB Node.js driver集成在一起,随后将其用于基于React、面向客户端的网页和移动应用程序。

Deprest认为,造成MongoDB与NoSQL数据之间差异的两个关键因素在于:首先,MongoDB更受开发者的青睐,采用率更高。这就意味着团队能够快速熟悉它,并利用它来提高效率。其次,用户可以直接在实时数据的基础上构建应用内部分析,无需花费时间和金钱将其移动到数据仓库或数据湖中。借助MongoDB的聚合管道,用户可以使用强大的滚动、变换和窗口函数来处理和分析数据,以根据需求对数据进行切片和切块。

除了预测式AI,MyGamePlan团队正在评估如何利用GenAI来进一步改善用户体验。

据Deprest介绍,MyGamePlan平台拥有丰富的数据和分析,希望让球员和教练能够更加轻松地从中获得洞见。为此,他们正在探索在数据之上进行自然语言处理,并通过聊天和问答界面来实现这一目标。借助GenAI,用户可以轻松地可视化并总结数据。目前,团队正在评估将OpenAI旗下大型语言模型 (LLM )ChatGPT与复杂的提示工程方法相结合,同时利用LangChain进行编排,配合使用LlamaIndex和MongoDB Atlas Vector Search来实现检索增强生成 (RAG )的能力。

基于MongoDB Atlas来构建应用,使MyGamePlan团队能够利用开发者数据平台的丰富功能,为未来的几乎所有应用和AI需求提供支持。用Deprest的话来说,就是:“由于MyGamePlan的源数据保存在MongoDB Atlas数据库中,将其与向量存储及就地向量搜索结合使用为我们的开发者提供了一种非常高效且完美的解决方案。”

Ferret.ai:通过AI和MongoDB Atlas生成智能,解析关系以创建信任,同时降低成本达30%

无论在现实世界还是在数学世界,我们都在不断地与他人建立关系。不论是线上交易、厂商或专业人士与潜在客户,还是投资者与企业创始人或者其他方面,建立新的人际关系不可避免。在所有这些关系中,信任必不可少,然而建立信任却是一件非常具有挑战性的事情。Ferret.ai正是这样一款旨在帮助消除猜疑、建立信任的工具。

Ferret是一个AI平台,专注于为公司和个人提供实时、公正的情报,以识别风险并把握机遇。借助先进的预测式和生成式AI,结合成千上万的全球数据源及数十亿公开文件,Ferret.ai可提供精心策划的关系情报和监测服务 (这些服务以往仅限于金融行业使用 ),帮助树立透明度新标准。

Ferret首席技术官Al Basseri在谈及Ferret的工作原理时表示,Ferret.ai从公共来源中获取个人信息。这些来源包括社交网络、交易记录、法庭文件、新闻档案、公司所有权和注册商业利益等。相关数据通过Kafka管道传输到公司的Anyscale/Ray MLops平台,在这个平台上,再使用spaCy提取和机器学习模型来进行自然语言处理。Ferret.ai从数据源中获得的所有元数据 (接近30亿个文档 )及模型推断均存储在MongoDB Atlas中。用户可通过页面和移动客户应用程序,企业用户可通过即将推出API来使用Atlas中的数据。
image.png

图2:人工智能+实时数据=来自Ferret.ai的关系智能

除了预测式AI之外,公司开发者目前正在尝试在Ferret平台上使用GenAI。Basseri表示,Ferret与英伟达的数据科学团队建立了紧密的合作关系,从而能够对所提供的数据来源和分析进行综合,以帮助客户更好地了解联系人,并建立良好的关系。实验表明,相比那些规模更大、更通用的大型语言模型,Mistral模型及其混合专家集成系统所需的资源开销更少。

除了托管来自Ferret的预测式和生成式AI模型数据外,客户数据和联系人列表也存储在MongoDB Atlas中。Ferret可对公共记录源进行持续监测和评分,及时检测个人身份信息的变化。

正如Basseri所介绍的,通过使用MongoDB Atlas Triggers,Ferret.ai可以监测评分的更新,并立即向消费应用程序发送警报,从而使客户能够实时了解关系网络动态。这是一种具有反应式的、完全基于事件驱动的程序,开发者只需进行设置即可轻松实现。

Basseri还介绍了MongoDB为其开发者带来的其它一些优势,其中包括

  • 借助Atlas,该服务以完全托管的形式提供,并融入了最佳实践。这使开发者和数据科学家可以从数据库运行工作中解脱出来,将精力投入到应用程序和AI创新上
  • MongoDB Atlas是一种成熟的解决方案,已被广泛应用于许多高增长的企业
  • 随着团队的迅速扩展,拥有了解MongoDB的工程师变得至关重要

除了数据库之外,Ferret正将其对MongoDB Atlas平台的应用扩展到文本搜索领域。随着公司进入谷歌云,其正在从现有的Amazon OpenSearch 服务迁移到Atlas Search。

在谈及迁移的驱动因素时,Basseri表示:“将数据库和搜索统一在同一个API有助于减少开发者的认知负荷,从而提高他们的工作效率,加快新功能的构建。这样可以消除了数据库和搜索之间同步数据带来的不便,从而缩短了工程周期。此外,这也意味着用户可以获得更好的体验,因为之前的延迟瓶颈已经消失,用户在Ferret平台上搜索联系人和内容时,可以得到最新的结果,而不是过时的数据。从OpenSearch迁移到Atlas Search还可以节省资金成本,并获得更多的灵活性。通过消除数据库和搜索引擎之间不必要的数据冗余,可将每月的总云成本减少30%。由于Atlas是支持多云的开发者数据平台,因此可以根据需要在多个云提供商之间迁移。”

迁移完成后,Basseri及其团队将能够使用Atlas Vector Search进行开发,并继续构建Ferret平台的GenAI功能。

从以上两个案例可以看出,无论企业目前处于AI发展的哪个阶段,MongoDB均可提供支持。如需了解更多信息,欢迎关注MongoDB微信公众号“MongoDB数据库”。

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
1天前
|
NoSQL atlas MongoDB
MongoDB白皮书推荐:零售企业构建员工赋能应用程序的痛点与解决方案
良好的数据基础是打造企业机构所需的最佳员工赋能产品的前提,而 MongoDB Realm 所具备功能性和灵活性足以全面提升员工效率,避免增加基础设施的负担
|
1天前
|
人工智能 NoSQL atlas
生成式AI入门必读:基本概念、数据挑战与解决方案
许多企业正在选择MongoDB Atlas。其原生向量搜索功能,加上统一的 API 和灵活的文档模型,对于寻求通过 RAG 方法提取专有数据来增强 LLM 的企业来说,是一个有吸引力的选择。
|
1天前
|
人工智能 NoSQL 安全
MongoDB观点:让生成式AI成为业务增长的新动能,游戏公司可以这样做
游戏公司采用检索增强生成(RAG)技术,如MongoDB Atlas Vector Search,以提高AI输出的准确性和定制化服务。通过灵活的文档数据库如MongoDB Atlas,企业能更好地集成AI,确保数据安全并抓住创新机遇。ChatGPT标志着AI时代的转折点,游戏公司凭借大量数据优势,有望在这一变革中引领行业发展。
|
1天前
|
人工智能 NoSQL atlas
Atlas Vector Search:借助语义搜索和 AI 针对任何类型的数据构建智能应用
一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用
|
1天前
|
人工智能 NoSQL atlas
Fireworks AI和MongoDB:依托您的数据,借助优质模型,助力您开发高速AI应用
我们欣然宣布MongoDB与 Fireworks AI 正携手合作让客户能够利用生成式人工智能 (AI)更快速、更高效、更安全地开展创新活动
|
1天前
|
机器学习/深度学习 人工智能 算法
构建高效AI系统:深度学习优化技术解析
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动创新的核心动力。本文将深入探讨在构建高效AI系统中,如何通过优化算法、调整网络结构及使用新型硬件资源等手段显著提升模型性能。我们将剖析先进的优化策略,如自适应学习率调整、梯度累积技巧以及正则化方法,并讨论其对模型训练稳定性和效率的影响。文中不仅提供理论分析,还结合实例说明如何在实际项目中应用这些优化技术。
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
构建未来:AI在持续学习系统中的创新应用
【5月更文挑战第11天】 随着人工智能(AI)技术的飞速发展,其在教育领域的应用日益增多。特别是在持续学习系统(Lifelong Learning Systems, LLS)中,AI技术正开启着个性化和适应性教学的新篇章。本文聚焦于AI在LLS中的创新应用,探讨了机器学习、自然语言处理和认知建模等关键技术如何共同作用于构建智能化的学习环境。文章旨在分析当前AI技术在持续学习领域的最新进展,并展望其对未来教育模式的影响。
|
1天前
|
机器学习/深度学习 人工智能 算法
构建未来:AI驱动的自适应网络安全防御系统
【5月更文挑战第11天】在数字时代的风口浪尖,网络安全问题日益凸显。传统的安全防御手段在应对不断进化的网络威胁时显得力不从心。本文提出了一个基于人工智能技术的自适应网络安全防御系统框架,旨在通过实时分析、学习和预测网络行为,自动调整防御策略以抵御未知攻击。系统采用先进的机器学习算法和大数据分析技术,能够在保持高效性能的同时,最小化误报率。文章详细阐述了系统的设计理念、关键技术组件以及预期效果,为网络安全的未来发展方向提供新思路。
|
1天前
|
机器学习/深度学习 人工智能 自动驾驶
构建未来:AI在持续学习系统中的创新应用
【5月更文挑战第11天】 在人工智能的迅猛发展浪潮中,一个不断进化的分支便是AI在持续学习系统中的应用。本文旨在探讨AI技术如何革新持续学习系统,并分析其在不同领域的创新实践。文章首先界定了持续学习系统的概念,随后深入解析了深度学习、强化学习以及转移学习等关键技术在其中的作用。通过案例分析,展示了这些技术如何在医疗诊断、自动驾驶及个性化教育中发挥至关重要的角色。最终,讨论了面临的挑战与未来的发展趋势,为读者提供了一个关于AI在持续学习领域未来可能展开的蓝图。
10 1
|
1天前
|
机器学习/深度学习 存储 人工智能
构建未来:AI在持续学习系统中的进化之路
【5月更文挑战第8天】 随着人工智能(AI)技术的飞速发展,AI系统正逐步从单一任务处理转向多任务、持续学习的智能体。本文将深入探讨AI技术在持续学习系统中的最新进展,包括深度学习、强化学习以及转移学习等关键技术。文章还将讨论如何通过这些技术实现AI系统的适应性、泛化能力和自我进化,从而推动AI在多变环境中的长期应用和自主决策能力。
http://www.vxiaotou.com