介绍和知识库

This commit is contained in:
zengmq 2025-07-16 23:39:12 +08:00
parent b7a4736472
commit 7ee6f3d052
3 changed files with 58 additions and 6 deletions

View File

@ -5,8 +5,6 @@
灵图LinkTool是一个基于大模型上下文协议的自然语言驱动地理信息应用通用智能体该智能体深度融合模型上下文协议MCP、自然语言交互接口与ArcGIS Pro地理处理工具库。面对用户地理处理任务需求时LinkTool能够分析用户需求实现ArcGIS Pro与多源服务之间的无缝连接实现“任务理解—工具选择—参数配置—动态修正”决策流程。用户可随时查看分析进度、修改参数、重复执行或终止任务操作过程具备完整可回溯性与100%工程复现率。 灵图LinkTool是一个基于大模型上下文协议的自然语言驱动地理信息应用通用智能体该智能体深度融合模型上下文协议MCP、自然语言交互接口与ArcGIS Pro地理处理工具库。面对用户地理处理任务需求时LinkTool能够分析用户需求实现ArcGIS Pro与多源服务之间的无缝连接实现“任务理解—工具选择—参数配置—动态修正”决策流程。用户可随时查看分析进度、修改参数、重复执行或终止任务操作过程具备完整可回溯性与100%工程复现率。
## 创新特色 ## 创新特色
> 列举并介绍智能体部分投稿比赛、吸引评委和观众的创新点,突出亮眼的地方(包括功能上、设计思路上等)
### 功能层面 ### 功能层面
- 全面兼容多类MCP服务协议\ - 全面兼容多类MCP服务协议\
@ -14,8 +12,47 @@ LinkTool已成功对接MCP服务包括Python脚本执行器、Bing搜索、
- 自主规划空间分析任务流程\ - 自主规划空间分析任务流程\
传统的GIS操作依赖用户手动规划工具调用顺序面对多步骤的综合分析任务时往往需要反复试错与参数调整费时费力。本项目通过将提示词工程与知识检索增强生成RAG技术深度集成于GIS任务链中实现了类人类的“任务理解—工具选择—参数配置—动态修正”决策流程赋予插件“理解意图、自主拆解任务、组合工具、自动执行”的能力。\ 传统的GIS操作依赖用户手动规划工具调用顺序面对多步骤的综合分析任务时往往需要反复试错与参数调整费时费力。本项目通过将提示词工程与知识检索增强生成RAG技术深度集成于GIS任务链中实现了类人类的“任务理解—工具选择—参数配置—动态修正”决策流程赋予插件“理解意图、自主拆解任务、组合工具、自动执行”的能力。\
用户只需用自然语言描述分析目标如“分析某区域的道路密度与交通公平性”插件便能自动生成任务规划调用相关工具链执行包括空间叠加、属性筛选、字段计算、图层导出等操作形成完整的地理信息分析闭环。经过实测LinkTool在处理复杂GIS分析任务时整体效率相比人工操作提升约1.5~2倍且分析效果在匿名评审中接近人类专家水平显示出智能体执行流程的高可靠性与专业性。 用户只需用自然语言描述分析目标如“分析某区域的道路密度与交通公平性”插件便能自动生成任务规划调用相关工具链执行包括空间叠加、属性筛选、字段计算、图层导出等操作形成完整的地理信息分析闭环。经过实测LinkTool在处理复杂GIS分析任务时整体效率相比人工操作提升约1.5~2倍且分析效果在匿名评审中接近人类专家水平显示出智能体执行流程的高可靠性与专业性。
- 基于矢量、栅格及网络数据结构的各类空间分析操作\
可以调用地理处理软件的上千个工具
- 地理处理工具执行过程可视与可控\ - 地理处理工具执行过程可视与可控\
地理人工智能GeoAI应用中常存在“黑箱化”问题用户难以理解模型中间推理逻辑与数据处理路径。本项目通过“任务可视化+结果可追踪”的架构设计构建了智能体操作全过程可视化机制每一次工具调用都以卡片形式展示执行细节包括工具名称、输入参数、操作对象与处理结果并将中间分析成果实时叠加显示于ArcGIS Pro地图视图中。\ 地理人工智能GeoAI应用中常存在“黑箱化”问题用户难以理解模型中间推理逻辑与数据处理路径。本项目通过“任务可视化+结果可追踪”的架构设计构建了智能体操作全过程可视化机制每一次工具调用都以卡片形式展示执行细节包括工具名称、输入参数、操作对象与处理结果并将中间分析成果实时叠加显示于ArcGIS Pro地图视图中。\
用户可随时查看分析进度、修改参数、重复执行或终止任务操作过程具备完整可回溯性与100%工程复现率有效解决传统GeoAI系统中“看不懂、调不了、复现难”的问题。例如在坡度分析任务中用户可以直观查看坡度图分布与工具配置参数实现从数据输入到结果分析的全过程掌控。 用户可随时查看分析进度、修改参数、重复执行或终止任务操作过程具备完整可回溯性与100%工程复现率有效解决传统GeoAI系统中“看不懂、调不了、复现难”的问题。例如在坡度分析任务中用户可以直观查看坡度图分布与工具配置参数实现从数据输入到结果分析的全过程掌控。
- 知识库调用\
能够访问内置的四大地理信息处理知识库,知识库已经进行了切片和向量化嵌入,模型可根据实际需要自拟关键词句进行知识库检索
### 应用层面 ### 应用层面
- 教学 - 地理信息科学教学能力\
可以实现对空间数据的统计、分析、可视化及基于数据内容的智能问答。通过深度融合自然语言交互与GIS工具链能力本项目为GIS教学科研应用提供了高效、便捷的创新解决方案。其应用场景广泛覆盖自然资源管理、城市规划等多个领域具备极强的实用性与推广潜力。通过展示地理思维过程与推演逻辑项目将充分体现大语言模型技术在地理信息科学教学科研实践中解决实际问题的核心价值。
- 智能化自动化数据分析与处理\
面对重复繁琐、多工具调用的复杂地理处理任务,传统的模型构建器和 Python 脚本虽能实现自动化但其编写和调试本身耗时耗力且缺乏灵活性。LinkTool 突破了这一局限,通过其自然语言驱动的智能体核心,实现了"零代码"的智能自动化。用户只需用日常语言描述任务LinkTool 即可自主理解、规划并执行多达十几个甚至更多的工具链,将原本数小时的"搭积木"或"写代码"过程,缩短至数分钟的自然对话,效率提升数倍。
#### 案例展示
##### 市政道路数据快速提取
>用户需求:在海珠区内从广州塔到中山大学怎么走,根据路名把广州道路数据中相应的要素导出来。
实现过程:
1. 坐标定位调用高德MCP获取广州塔与中山大学的精确坐标。
2. 路线规划通过高德MCP获取驾车路线途经滨江东路等7条道路
3. 数据筛选自动调用ArcGIS Pro的MCP工具完成【按属性选择】等操作。
4. 成果输出导出选中道路要素至指定Geodatabase数据库生成操作报告。
优势体现:
我们对案例按照传统方法进行分析并与LinkTool作了对比。按照传统的GIS应用分析理论操作员需要对道路数据进行复杂的清洗、拓扑检查、属性完善随后通过构建GIS网络数据结构进行网络分析使用迪杰斯特拉算法求解最短路径实际用时23小时即使操作员代码能力较强通过代码请求高德API的方式实现需求也需要大约1小时而使用LinkTool仅凭一句话即可联动多源时空数据将完成时间压缩至10分钟左右。基于MCP协议LinkTool可以大批量调用相关工具进而可快速完成生成OD成本矩阵等进一步的空间分析操作大大提升了科研效率使科研工作者节约数据收集、爬取与数据库建立、录入、结构化的时间从而更专注于GIS算法的核心技术和理论的研究。
##### 社区交通设施公平性科研分析
>用户需求:以村(社区)为单位分别分析海珠区建筑和道路集聚情况,通过建筑密度和道路密度分析海珠区各村(社区)的交通设施公平性。
实现过程:
1. 密度计算自动调用SummarizeWithin工具计算各社区建筑密度综合PairwiseIntersect和CalculateGeometry工具统计道路密度。
2. 空间分析生成莫兰指数计算代码调用arcpy.stats.SpatialAutocorrelation工具自动分析建筑/道路密度的空间集聚性。
3. 匹配度评估通过CaculateField自动生成交通匹配度即道路密度/建筑密度,读取要素类属性表识别失衡区域并进行总结,提出政策建议。
优势体现:
1. 提升科研效率将以往需要科研人员花费数日进行的复杂空间统计包括数据清洗、累计超过30个工具调用、结果解读与报告撰写简化为30分钟左右的指令操作。
2. 教学赋能操作零门槛非专业人员无需掌握arcpy语法即可完成专业的空间统计更好理解空间自相关等地理信息科学理论。
##### 外业调查点位筛选
>用户需求请按照以下步骤要求提取出土壤类型可能发生改变的区域将国土三调土地利用类型图2020和二普土壤图进行空间叠加分析筛选出水改旱和旱改水地块。水改旱是土壤二普土壤图上土壤类型为水稻土国土三调土地利用类型图上土地利用方式为旱地、园地、林地、草地的地块旱改水是土壤二普土壤图上土壤类型为非水稻土国土三调土地利用类型图上土地利用方式为水田的地块。当国土三调十地利用图斑与土壤二普土壤图重叠比例超过50%将整块地类图斑提取出来重叠比例不足50%的舍弃。将集中连片的相邻图斑做融合归并处理。对于边界之间距离小于10m的图斑使用GIS聚合面功能进行归并。筛选出面积大于50亩的地类为早地、果园、茶园、林地草地等的图斑提取出来总结自《第三次全国土壤普查技术规程规范修订版

View File

@ -1,13 +1,28 @@
# 知识库 # 知识库
## 简介 ## 简介
构建了ArcGIS Pro应用案例、任务规划案例、ArcGIS Pro工具调用大全、ArcGIS Pro帮助文档四个知识库。\
ArcGIS Pro应用案例来源于[arcgis课程库网址](https://learn.arcgis.com/zh-cn/gallery/)、任务规划案例和ArcGIS Pro帮助文档来源于[Arcgis pro帮助文档](https://pro.arcgis.com/zh-cn/pro-app/latest/help/main/welcome-to-the-arcgis-pro-app-help.htm)、工具调用大全来源于。
- ArcGIS Pro应用案例\
截至当前版本该知识库收集整理了近200个基于ArcGIS Pro平台的应用案例范围覆盖广从投影到要素编辑再到制图等内容都有覆盖也正是因为有这一拥有大量案例的知识库使得LinkTool在调用ArcGIS Pro地理处理工具进行操作过程中具有较高的精确度和专业性。
- 任务规划案例库\
收集使用ArcGIS Pro完成常见空间分析需求的步骤案例帮助用户结合自身需求形成更合理的解决方案。在本知识库中收集整理了近千条常见应用问题的解题步骤通过学习、调用该知识库LinkTool可在解决用户输入问题时生成任务规划这一任务规划可帮助LinkTool在解决问题时中有较为清晰的思路与方向能够提高解决问题的效率以及减少走弯路情况的发生。
- ArcGIS Pro工具调用大全\
包括调用ArcGIS Pro工具所需的工具名和所需参数列表等信息方便用户快速查找和使用工具。LinkTool在使用ArcGIS Pro中的工具时需要按照工具所需输入正确的参数与数据而本知识库中记录了ArcGIS Pro中的近1500个工具的名称以及所需参数与数据。LinkTool在调用ArcGIS Pro中的工具时可以通过查看本知识库从而获取该工具所需参数与数据并从数据库中寻找到对应的数据以及合适的参数输入进一步完成用户输入的问题。
- ArcGIS Pro帮助文档\
包含ArcGIS Pro各项工具的详细使用说明、参数要求和原理说明为用户提供全面的技术支持。
简要介绍有哪些知识库、大致是些什么内容
## 知识库构建 ## 知识库构建
Link Tool旨在构建一个专业的GIS工具知识库通过自动化手段爬取Esri官方文档进行清洗、转换、翻译和结构化处理最终生成可用于智能体训练的结构化数据。整个系统分为网页爬虫模块和本地Markdown处理模块。
- 网页爬虫模块负责从网络上抓取Esri相关的GIS工具文档包括链接提取、页面爬取、内容清洗、HTML转Markdown以及翻译等步骤。它通过WebCrawlerManager协调各个组件的工作能够自动提取网页中的链接并根据URL判断是否为工具文档然后使用通义千问API进行英文内容翻译和任务规划生成最终将处理后的数据保存为Markdown文件或CSV格式。模块支持多线程爬取具有异常处理机制能够在爬取失败时进行重试并记录详细的日志信息。
- 本地Markdown处理模块则专注于对已有的Markdown文件进行进一步处理主要功能包括读取本地Markdown文件、翻译英文内容、生成任务规划和问题、解析工具信息、将文档中的工具调用示例名称统一替换为程序可识别的标准调用名并将处理结果保存为新的Markdown文件或CSV格式。该模块通过MarkdownProcessor协调各组件工作支持批量处理指定目录下的所有Markdown文件能够提取文件中的元数据并利用通义千问API生成结构化数据。模块同样具备详细的日志记录功能并支持多线程处理以提高效率。结合ArcGIS工具文档的映射表和AIPlanner模块的智能识别能力确保文档中的工具调用名称与程序处理的标准一致。
详细记录知识爬取、整理、翻译等等我们前期构建知识库时所做的工作
## 实现方法 ## 实现方法
将整理好的四个知识库文档上传到阿里云百炼平台采用检索增强生成RAG技术根据用户输入从外部信息源检索相关信息然后将检索到的内容整合到用户输入中从而帮助大模型生成更准确的回答。知识库功能作为阿里云百炼的RAG能力能有效补充私有知识并提供最新信息。
具体操作为导入Markdown非结构化数据和工具列表结构化数据对知识库进行配置开启多轮会话改写——将基于会话上下文自动调整原始输入Prompt用户问题以提升检索效果。使用官方向量v3DashScope text-embedding-v3模型用于将原始输入Prompt和知识文本转化为数值化向量官方向量v3模型在语种支持、输入长度和向量维度自定义化等方面相比官方向量v2模型进行了全面升级适用于大部分场景。选择官方排序的Rank模型通过语义排序和文本匹配特征以确保相关性。设置20%的相似度阈值该阈值表示允许召回的文本切片的最低相似度分数用于筛选Rank模型返回的文本切片即只有分数超过此数值的文本切片才会被召回。调低此阈值预期会召回更多文本切片但可能导致召回一些相关度较低的文本切片相反提高此阈值会减少召回的文本切片。若设置得过高则可能导致知识库丢弃相关的文本切片。
![图1](../assets/ksetting.png)
介绍通过阿里云百炼平台实现知识库管理、检索、命中测试等的方法

BIN
assets/ksetting.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 40 KiB