戴尔科技已与 Elasticsearch 和 Nvidia 合作构建服务器和存储阵列,能够在海量信息中进行数据搜索和处理,而这已成为人工智能应用的瓶颈。
此次合作于周一在温哥华举行的 SIGGRAPH 2025 上宣布,通过自动化数据准备来增强戴尔的人工智能数据平台,从而在包含结构化和非结构化文件的数据湖中提供自然语言搜索功能。
戴尔基础设施解决方案集团总裁 Arthur Lewis 在一份声明中表示:“释放人工智能全部潜力的关键在于打破数据孤岛,简化企业数据访问。与 Nvidia 和 Elastic 等行业领导者合作,推进戴尔人工智能数据平台的发展,将有助于企业加速创新,并自信地扩展人工智能。”
这些新功能基于 Nvidia AI 数据平台参考设计和 Elastic 产品 Elasticsearch 构建。当新数据被导入系统时,这些引擎会立即索引每项资产,确保可以通过自然语言搜索访问,并与最终用户的仪表板集成,并实现快速处理。
戴尔表示,这项技术是通过与开源搜索 AI 领导者 Elastic 的新合作实现的。它为客户提供高级矢量搜索、语义数据检索(搜索引擎能够理解查询信息背后的意图)以及混合关键字搜索功能,并利用 GPU 加速来提升性能。
Elastic 首席产品官 Ken Exner 在戴尔提供的一份声明中表示:“快速、准确且情境感知地访问非结构化数据是扩展企业 AI 的关键。Elasticsearch 矢量数据库是戴尔 AI 数据平台非结构化数据引擎的核心,Elastic 将把矢量搜索和混合检索功能带入一个交钥匙架构,从而实现跨海量数据集的自然语言搜索、实时推理和智能资产发现。”
戴尔表示,该技术建立在三个软件引擎之上。
第一个是联合 SQL 引擎,用于跨多个数据源(例如数据湖、数据库和对象存储)进行即时查询,使用标准 SQL 并提供统一分析而无需移动数据。
第二个是由 Elasticsearch 提供支持的非结构化数据引擎。它为用户提供快速的全文、语义和矢量搜索,以便他们能够即时访问海量档案中的文档或视频片段。
第三个是数据处理引擎,它使用 Apache Spark 围绕 ETL 进行准确、实时的分析——用于准备分析数据的提取、转换、加载过程——以及围绕该数据构建模型的机器学习过程。
为了给这些引擎提供动力,戴尔发布了经过验证的设计,适用于其风冷 2U PowerEdge R7725 和 R770 服务器,配备 Nvidia RTX Pro 6000 Blackwell GPU 以及 PowerScale 和 ObjectScale 存储阵列。
PowerEdge R7725 是首款集成 Nvidia AI 数据平台参考设计的 2U 服务器。戴尔表示,一旦它与戴尔 AI 数据平台及其新的非结构化数据引擎配对,它就成为企业的交钥匙解决方案。
Nvidia 企业 AI 副总裁 Justin Boitano 在一份声明中表示:“全球企业都需要能够处理日益增长的 AI 工作负载规模和复杂性的基础设施。借助搭载 Nvidia RTX PRO 6000 GPU 的全新 2U Dell PowerEdge 服务器,企业现在拥有一个高效、加速的计算平台,可以为 NVIDIA Blackwell 上的 AI 应用程序和存储提供支持。”