【蓝因子教育】基于 RAG(检索生成技术)构建知识驱动型 AI 智能体_核心_用户_场景

知识驱动型 AI 应用场景

在企业级 AI 智能体应用中,知识驱动型场景是一种常见的实施路径。该模式能充分利用大语言模型(LLM)的自然语言处理能力,结合特定领域的知识库,以相对独立的方式构建交互功能,从而为用户提供全新的服务体验。相较于需要深度集成企业核心业务系统或进行大规模流程再造的 AI 应用,知识驱动型智能体的部署流程通常更为简化,周期相对较短。落地该场景,能够在有限的资源投入下,有效提升企业用户对 AI 技术实际应用效果的认知与接受度。

核心原理

与知识驱动型场景相对应的是知识驱动型 AI 智能体。其中,知识库是知识驱动型 AI 智能体的核心组成部分。需要明确区分,这里的知识库与传统基于全文检索的知识库有着本质区别。我们可以将其类比为数据库管理软件,但存储和查询的对象发生了根本变化:存储的是相对静态的知识,而非像库存水平、银行账户余额、网站用户活动等动态数据。其次,查询方式也从基于精确匹配(如等于、不等于、大于、小于、包含等)转变为基于语义近似性的模糊查询。

举个例子,在传统数据库中,你无法通过关键词 "喵喵" 检索到包含 "猫猫" 的记录,因为它们在字面上不匹配。但在知识库中,这种查询成为可能。由于 "喵喵" 和 "猫猫" 在语义上存在关联,因此知识库能够识别到这种相似性并返回相关结果。

展开剩余66%

这种基于语义的查询之所以能够实现,其核心技术在于将文本(未来可能扩展到图片、视频、语音等多模态数据,目前以文本效果最佳且应用最广)转化为高维向量(或称矢量)。通过计算这些向量之间的距离或相似度,知识库就能找到语义上最接近的匹配项。整个转换与匹配的过程如图 1 所示。 (图 1 Emdedding 与知识库的语义检索能力 )

正是这种基于语义相似性的分析能力,让知识库的检索能力发生了质的飞跃。它不再局限于字面上的精确匹配,而是能够理解词语背后的含义,从而找到语义上相关的信息。这种更智能的匹配方式,极大地扩展了信息获取的可能性,为用户带来了全新的交互体验,也成为了催生各种知识驱动型 AI 新场景的关键技术基础。

典型的知识驱动型场景包括:

知识问答:用户通过输入文字(或语音转文字)提出问题,系统查询知识库以提供相关的知识性答案。

文本合规性检查:将大段文本输入系统,与预设的知识规则或标准进行对比,评估其合规程度。

通常不被归类为知识驱动型 AI 的场景有:

图片识别:典型的图片识别任务,特别是像生产缺陷检查这类,更侧重于从图像中提取特征并进行模式匹配或分类。这属于计算机视觉(CV)的范畴,常用深度学习模型(如 CNN)实现,这些模型可以看作是特定领域的判别式模型,其核心在于模式识别而非知识推理。

智能问数:智能问数(Query by Example, Q&A over databases)的核心挑战是将自然语言问题准确地转换为数据库查询语句(SQL)。对于需要实时、精确数据的情况,Text2SQL 等直接转换方法效率最高。知识驱动型 AI 可以辅助处理自然语言理解的部分,比如识别实体、理解同义词等,但它通常不是整个 "智能问数" 流程的核心,特别是当涉及到精确、动态的数据库查询时。

** 实用技巧:** 当任务规则模糊,需要理解语义时,知识驱动型 AI 效果更佳;反之,若规则清晰到可用 IFTTT(如果这样就那样)来进行描述,则直接编写程序通常更高效。

发布于:湖南省