本发明公开了一种基于规则引导的自适应路径生成方法,包括:首先将问题中的主题实体进行过滤筛选,然后输入到强化学习的环境中,利用三个符号操作生成三个查询图形成初始空间,再利用规则归纳算法基于主题实体对大规模数据库进行规则归纳并补全稀疏知识库中缺失的中间实体,形成规则查询图构成新的动作决策空间,决策空间是由知识库中的实体及其对应的关系组成,通过策略网络来指导智能体进行动作选择并给予奖励,最终得到需要的关系路径并到达目标实体。本发明提出了规则引导和组合奖励的强化学习方法,在规则引导的基础上,自适应生成动作决策空间,利用关系路径和规则之间的内在关系重构组合奖励缓解稀...