介绍和知识库
This commit is contained in:
parent
b7a4736472
commit
7ee6f3d052
@ -5,8 +5,6 @@
|
||||
灵图LinkTool是一个基于大模型上下文协议的自然语言驱动地理信息应用通用智能体,该智能体深度融合模型上下文协议(MCP)、自然语言交互接口与ArcGIS Pro地理处理工具库。面对用户地理处理任务需求时,LinkTool能够分析用户需求实现ArcGIS Pro与多源服务之间的无缝连接,实现“任务理解—工具选择—参数配置—动态修正”决策流程。用户可随时查看分析进度、修改参数、重复执行或终止任务,操作过程具备完整可回溯性与100%工程复现率。
|
||||
|
||||
## 创新特色
|
||||
|
||||
> 列举并介绍智能体部分投稿比赛、吸引评委和观众的创新点,突出亮眼的地方(包括功能上、设计思路上等)
|
||||
### 功能层面
|
||||
|
||||
- 全面兼容多类MCP服务协议\
|
||||
@ -14,8 +12,47 @@ LinkTool已成功对接MCP服务,包括Python脚本执行器、Bing搜索、
|
||||
- 自主规划空间分析任务流程\
|
||||
传统的GIS操作依赖用户手动规划工具调用顺序,面对多步骤的综合分析任务时,往往需要反复试错与参数调整,费时费力。本项目通过将提示词工程与知识检索增强生成(RAG)技术深度集成于GIS任务链中,实现了类人类的“任务理解—工具选择—参数配置—动态修正”决策流程,赋予插件“理解意图、自主拆解任务、组合工具、自动执行”的能力。\
|
||||
用户只需用自然语言描述分析目标(如“分析某区域的道路密度与交通公平性”),插件便能自动生成任务规划,调用相关工具链,执行包括空间叠加、属性筛选、字段计算、图层导出等操作,形成完整的地理信息分析闭环。经过实测,LinkTool在处理复杂GIS分析任务时,整体效率相比人工操作提升约1.5~2倍,且分析效果在匿名评审中接近人类专家水平,显示出智能体执行流程的高可靠性与专业性。
|
||||
- 基于矢量、栅格及网络数据结构的各类空间分析操作\
|
||||
可以调用地理处理软件的上千个工具
|
||||
- 地理处理工具执行过程可视与可控\
|
||||
地理人工智能(GeoAI)应用中常存在“黑箱化”问题,用户难以理解模型中间推理逻辑与数据处理路径。本项目通过“任务可视化+结果可追踪”的架构设计,构建了智能体操作全过程可视化机制:每一次工具调用都以卡片形式展示执行细节,包括工具名称、输入参数、操作对象与处理结果,并将中间分析成果实时叠加显示于ArcGIS Pro地图视图中。\
|
||||
用户可随时查看分析进度、修改参数、重复执行或终止任务,操作过程具备完整可回溯性与100%工程复现率,有效解决传统GeoAI系统中“看不懂、调不了、复现难”的问题。例如在坡度分析任务中,用户可以直观查看坡度图分布与工具配置参数,实现从数据输入到结果分析的全过程掌控。
|
||||
- 知识库调用\
|
||||
能够访问内置的四大地理信息处理知识库,知识库已经进行了切片和向量化嵌入,模型可根据实际需要自拟关键词句进行知识库检索
|
||||
### 应用层面
|
||||
- 教学
|
||||
- 地理信息科学教学能力\
|
||||
可以实现对空间数据的统计、分析、可视化及基于数据内容的智能问答。通过深度融合自然语言交互与GIS工具链能力,本项目为GIS教学科研应用提供了高效、便捷的创新解决方案。其应用场景广泛覆盖自然资源管理、城市规划等多个领域,具备极强的实用性与推广潜力。通过展示地理思维过程与推演逻辑,项目将充分体现大语言模型技术在地理信息科学教学科研实践中解决实际问题的核心价值。
|
||||
|
||||
- 智能化自动化数据分析与处理\
|
||||
面对重复繁琐、多工具调用的复杂地理处理任务,传统的模型构建器和 Python 脚本虽能实现自动化,但其编写和调试本身耗时耗力,且缺乏灵活性。LinkTool 突破了这一局限,通过其自然语言驱动的智能体核心,实现了"零代码"的智能自动化。用户只需用日常语言描述任务,LinkTool 即可自主理解、规划并执行多达十几个甚至更多的工具链,将原本数小时的"搭积木"或"写代码"过程,缩短至数分钟的自然对话,效率提升数倍。
|
||||
#### 案例展示
|
||||
##### 市政道路数据快速提取
|
||||
>用户需求:在海珠区内从广州塔到中山大学怎么走,根据路名把广州道路数据中相应的要素导出来。
|
||||
|
||||
实现过程:
|
||||
1. 坐标定位:调用高德MCP获取广州塔与中山大学的精确坐标。
|
||||
2. 路线规划:通过高德MCP获取驾车路线(途经滨江东路等7条道路)。
|
||||
3. 数据筛选:自动调用ArcGIS Pro的MCP工具完成【按属性选择】等操作。
|
||||
4. 成果输出:导出选中道路要素至指定Geodatabase数据库,生成操作报告。
|
||||
|
||||
优势体现:
|
||||
我们对案例按照传统方法进行分析并与LinkTool作了对比。按照传统的GIS应用分析理论,操作员需要对道路数据进行复杂的清洗、拓扑检查、属性完善,随后通过构建GIS网络数据结构进行网络分析,使用迪杰斯特拉算法求解最短路径,实际用时2~3小时;即使操作员代码能力较强,通过代码请求高德API的方式实现需求也需要大约1小时,而使用LinkTool仅凭一句话即可联动多源时空数据,将完成时间压缩至10分钟左右。基于MCP协议LinkTool可以大批量调用相关工具,进而可快速完成生成OD成本矩阵等进一步的空间分析操作,大大提升了科研效率,使科研工作者节约数据收集、爬取与数据库建立、录入、结构化的时间,从而更专注于GIS算法的核心技术和理论的研究。
|
||||
##### 社区交通设施公平性科研分析
|
||||
>用户需求:以村(社区)为单位分别分析海珠区建筑和道路集聚情况,通过建筑密度和道路密度分析海珠区各村(社区)的交通设施公平性。
|
||||
|
||||
实现过程:
|
||||
1. 密度计算:自动调用SummarizeWithin工具计算各社区建筑密度,综合PairwiseIntersect和CalculateGeometry工具统计道路密度。
|
||||
2. 空间分析:生成莫兰指数计算代码,调用arcpy.stats.SpatialAutocorrelation工具,自动分析建筑/道路密度的空间集聚性。
|
||||
3. 匹配度评估:通过CaculateField自动生成交通匹配度,即道路密度/建筑密度,读取要素类属性表识别失衡区域并进行总结,提出政策建议。
|
||||
|
||||
优势体现:
|
||||
1. 提升科研效率:将以往需要科研人员花费数日进行的复杂空间统计(包括数据清洗、累计超过30个工具调用、结果解读与报告撰写)简化为30分钟左右的指令操作。
|
||||
2. 教学赋能:操作零门槛,非专业人员无需掌握arcpy语法即可完成专业的空间统计,更好理解空间自相关等地理信息科学理论。
|
||||
|
||||
##### 外业调查点位筛选
|
||||
>用户需求:请按照以下步骤要求提取出土壤类型可能发生改变的区域:将国土三调土地利用类型图(2020)和二普土壤图进行空间叠加分析,筛选出水改旱和旱改水地块。水改旱是土壤二普土壤图上土壤类型为水稻土,国土三调土地利用类型图上土地利用方式为旱地、园地、林地、草地的地块;旱改水是土壤二普土壤图上土壤类型为非水稻土,国土三调土地利用类型图上土地利用方式为水田的地块。当国土三调十地利用图斑与土壤二普土壤图重叠比例超过50%,将整块地类图斑提取出来,重叠比例不足50%的舍弃。将集中连片的相邻图斑做融合归并处理。对于边界之间距离小于10m的图斑,使用GIS聚合面功能进行归并。筛选出面积大于50亩的地类为早地、果园、茶园、林地草地等的图斑提取出来(总结自《第三次全国土壤普查技术规程规范(修订版)》)。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
@ -1,13 +1,28 @@
|
||||
# 知识库
|
||||
|
||||
## 简介
|
||||
构建了ArcGIS Pro应用案例、任务规划案例、ArcGIS Pro工具调用大全、ArcGIS Pro帮助文档四个知识库。\
|
||||
ArcGIS Pro应用案例来源于[arcgis课程库网址](https://learn.arcgis.com/zh-cn/gallery/)、任务规划案例和ArcGIS Pro帮助文档来源于[Arcgis pro帮助文档](https://pro.arcgis.com/zh-cn/pro-app/latest/help/main/welcome-to-the-arcgis-pro-app-help.htm)、工具调用大全来源于。
|
||||
|
||||
- ArcGIS Pro应用案例\
|
||||
截至当前版本,该知识库收集整理了近200个基于ArcGIS Pro平台的应用案例,范围覆盖广,从投影到要素编辑再到制图等内容都有覆盖,也正是因为有这一拥有大量案例的知识库,使得LinkTool在调用ArcGIS Pro地理处理工具进行操作过程中具有较高的精确度和专业性。
|
||||
- 任务规划案例库\
|
||||
收集使用ArcGIS Pro完成常见空间分析需求的步骤案例,帮助用户结合自身需求形成更合理的解决方案。在本知识库中收集整理了近千条常见应用问题的解题步骤,通过学习、调用该知识库,LinkTool可在解决用户输入问题时生成任务规划,这一任务规划可帮助LinkTool在解决问题时中有较为清晰的思路与方向,能够提高解决问题的效率以及减少走弯路情况的发生。
|
||||
- ArcGIS Pro工具调用大全\
|
||||
包括调用ArcGIS Pro工具所需的工具名和所需参数列表等信息,方便用户快速查找和使用工具。LinkTool在使用ArcGIS Pro中的工具时需要按照工具所需输入正确的参数与数据,而本知识库中记录了ArcGIS Pro中的近1500个工具的名称以及所需参数与数据。LinkTool在调用ArcGIS Pro中的工具时可以通过查看本知识库,从而获取该工具所需参数与数据,并从数据库中寻找到对应的数据以及合适的参数输入,进一步完成用户输入的问题。
|
||||
- ArcGIS Pro帮助文档\
|
||||
包含ArcGIS Pro各项工具的详细使用说明、参数要求和原理说明,为用户提供全面的技术支持。
|
||||
|
||||
简要介绍有哪些知识库、大致是些什么内容
|
||||
|
||||
## 知识库构建
|
||||
Link Tool旨在构建一个专业的GIS工具知识库,通过自动化手段爬取Esri官方文档,进行清洗、转换、翻译和结构化处理,最终生成可用于智能体训练的结构化数据。整个系统分为网页爬虫模块和本地Markdown处理模块。
|
||||
- 网页爬虫模块负责从网络上抓取Esri相关的GIS工具文档,包括链接提取、页面爬取、内容清洗、HTML转Markdown以及翻译等步骤。它通过WebCrawlerManager协调各个组件的工作,能够自动提取网页中的链接,并根据URL判断是否为工具文档,然后使用通义千问API进行英文内容翻译和任务规划生成,最终将处理后的数据保存为Markdown文件或CSV格式。模块支持多线程爬取,具有异常处理机制,能够在爬取失败时进行重试,并记录详细的日志信息。
|
||||
- 本地Markdown处理模块则专注于对已有的Markdown文件进行进一步处理,主要功能包括读取本地Markdown文件、翻译英文内容、生成任务规划和问题、解析工具信息、将文档中的工具调用示例名称统一替换为程序可识别的标准调用名,并将处理结果保存为新的Markdown文件或CSV格式。该模块通过MarkdownProcessor协调各组件工作,支持批量处理指定目录下的所有Markdown文件,能够提取文件中的元数据,并利用通义千问API生成结构化数据。模块同样具备详细的日志记录功能,并支持多线程处理以提高效率。结合ArcGIS工具文档的映射表和AIPlanner模块的智能识别能力,确保文档中的工具调用名称与程序处理的标准一致。
|
||||
|
||||
详细记录知识爬取、整理、翻译等等我们前期构建知识库时所做的工作
|
||||
|
||||
## 实现方法
|
||||
将整理好的四个知识库文档上传到阿里云百炼平台,采用检索增强生成(RAG)技术,根据用户输入从外部信息源检索相关信息,然后将检索到的内容整合到用户输入中,从而帮助大模型生成更准确的回答。知识库功能作为阿里云百炼的RAG能力,能有效补充私有知识并提供最新信息。
|
||||
具体操作为导入Markdown非结构化数据和工具列表结构化数据,对知识库进行配置,开启多轮会话改写——将基于会话上下文自动调整原始输入Prompt(用户问题)以提升检索效果。使用官方向量v3(DashScope text-embedding-v3)模型,用于将原始输入Prompt和知识文本转化为数值化向量,官方向量v3模型在语种支持、输入长度和向量维度自定义化等方面,相比官方向量v2模型进行了全面升级,适用于大部分场景。选择官方排序的Rank模型,通过语义排序和文本匹配特征以确保相关性。设置20%的相似度阈值,该阈值表示允许召回的文本切片的最低相似度分数,用于筛选Rank模型返回的文本切片,即只有分数超过此数值的文本切片才会被召回。调低此阈值预期会召回更多文本切片,但可能导致召回一些相关度较低的文本切片;相反,提高此阈值会减少召回的文本切片。若设置得过高,则可能导致知识库丢弃相关的文本切片。
|
||||

|
||||
|
||||
|
||||
介绍通过阿里云百炼平台实现知识库管理、检索、命中测试等的方法
|
||||
BIN
assets/ksetting.png
Normal file
BIN
assets/ksetting.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 40 KiB |
Loading…
Reference in New Issue
Block a user