310 lines
6.9 KiB
Markdown
310 lines
6.9 KiB
Markdown
# 🔮 灵宝道君 × OpenHands 集成指南
|
||
|
||
## 📖 概述
|
||
|
||
本文档介绍如何将OpenHands云服务集成到Cauldron项目的灵宝道君田野调查验证系统中,实现Web验证能力的增强。
|
||
|
||
### 🎯 集成目标
|
||
|
||
- **增强验证能力**: 为灵宝道君提供实时Web验证功能
|
||
- **提高准确性**: 通过多源验证提升辩论结果的可信度
|
||
- **实时性**: 获取最新的市场信息和数据
|
||
- **智能分析**: 利用AI进行深度web内容分析
|
||
|
||
## 🏗️ 架构设计
|
||
|
||
### 系统架构图
|
||
|
||
```
|
||
稷下学宫辩论系统
|
||
↓
|
||
八仙过海辩论 → 辩论结果
|
||
↓
|
||
灵宝道君田野调查验证
|
||
├── 传统OpenManus验证 (60%权重)
|
||
└── OpenHands Web验证 (40%权重)
|
||
↓
|
||
综合分析 → 元始天尊最终决策
|
||
```
|
||
|
||
### 核心组件
|
||
|
||
1. **OpenHandsClient**: OpenHands云服务客户端
|
||
2. **LingbaoOpenHandsVerifier**: 灵宝道君Web验证器
|
||
3. **LingbaoFieldVerifier**: 集成验证器(传统+Web)
|
||
4. **OpenHandsIntegrationManager**: 集成管理器
|
||
|
||
## 🔧 技术实现
|
||
|
||
### 1. OpenHands集成模块
|
||
|
||
**文件**: `src/core/openhands_integration.py`
|
||
|
||
核心功能:
|
||
- OpenHands API客户端封装
|
||
- 验证任务生成和执行
|
||
- 结果解析和置信度计算
|
||
- 错误处理和重试机制
|
||
|
||
### 2. 验证策略配置
|
||
|
||
**文件**: `config/openhands_config.py`
|
||
|
||
支持的验证策略:
|
||
- `OPENMANUS_ONLY`: 仅传统验证
|
||
- `OPENHANDS_ONLY`: 仅Web验证
|
||
- `HYBRID_BALANCED`: 平衡双重验证
|
||
- `HYBRID_WEB_PRIORITY`: Web验证优先
|
||
- `ADAPTIVE`: 自适应策略
|
||
|
||
### 3. 集成验证流程
|
||
|
||
```python
|
||
# 创建集成验证器
|
||
verifier = LingbaoFieldVerifier(
|
||
openmanus_url="your-openmanus-url",
|
||
api_key="your-openmanus-key",
|
||
openhands_api_key="[REDACTED - 从Doppler获取OPENHANDS_API_KEY]"
|
||
)
|
||
|
||
# 执行验证
|
||
result = await verifier.verify_debate_result(debate_result)
|
||
```
|
||
|
||
## 📊 验证流程
|
||
|
||
### 1. 辩论结果输入
|
||
|
||
八仙过海辩论产生的结果包含:
|
||
- 投资建议和价格预测
|
||
- 关键论断和依据
|
||
- 原始置信度分数
|
||
|
||
### 2. 验证任务生成
|
||
|
||
基于辩论结果自动生成验证任务:
|
||
- **Web搜索任务**: 验证价格预测合理性
|
||
- **事实核查任务**: 核查关键论断真实性
|
||
- **数据分析任务**: 分析相关数据准确性
|
||
|
||
### 3. OpenHands执行
|
||
|
||
OpenHands云服务执行验证任务:
|
||
- 实时web搜索和数据获取
|
||
- AI分析和内容理解
|
||
- 证据收集和置信度评估
|
||
|
||
### 4. 结果综合分析
|
||
|
||
灵宝道君综合分析验证结果:
|
||
- 传统验证 + Web验证加权平均
|
||
- 置信度调整和风险评估
|
||
- 生成给元始天尊的最终报告
|
||
|
||
## 🎮 使用示例
|
||
|
||
### 基础使用
|
||
|
||
```python
|
||
from src.core.openhands_integration import LingbaoOpenHandsVerifier
|
||
|
||
# 创建验证器
|
||
verifier = LingbaoOpenHandsVerifier(
|
||
api_key="[REDACTED - 从Doppler获取OPENHANDS_API_KEY]"
|
||
)
|
||
|
||
# 验证辩论结论
|
||
debate_result = {
|
||
"topic": "特斯拉Q4财报影响分析",
|
||
"conclusions": {"price_prediction": "上涨15%"},
|
||
"key_claims": ["特斯拉Q4交付量将超预期20%"]
|
||
}
|
||
|
||
verification_report = await verifier.verify_debate_conclusions(debate_result)
|
||
```
|
||
|
||
### 集成使用
|
||
|
||
```python
|
||
from src.core.lingbao_field_verification import LingbaoFieldVerifier
|
||
|
||
# 创建集成验证器
|
||
verifier = LingbaoFieldVerifier(
|
||
openmanus_url="your-openmanus-url",
|
||
api_key="your-api-key",
|
||
openhands_api_key="[REDACTED - 从Doppler获取OPENHANDS_API_KEY]"
|
||
)
|
||
|
||
# 执行完整验证流程
|
||
tianzun_report = await verifier.verify_debate_result(debate_result)
|
||
```
|
||
|
||
## 📈 验证结果格式
|
||
|
||
### OpenHands验证结果
|
||
|
||
```json
|
||
{
|
||
"verification_summary": {
|
||
"total_tasks": 3,
|
||
"success_rate": 0.8,
|
||
"average_confidence": 0.75,
|
||
"evidence_count": 6
|
||
},
|
||
"detailed_results": [
|
||
{
|
||
"task_id": "price_verify_20250113_001",
|
||
"success": true,
|
||
"confidence": 0.8,
|
||
"key_findings": {"trend": "positive"},
|
||
"evidence_count": 2
|
||
}
|
||
],
|
||
"final_recommendation": "APPROVE"
|
||
}
|
||
```
|
||
|
||
### 集成验证报告
|
||
|
||
```json
|
||
{
|
||
"verification_status": "VERIFIED",
|
||
"recommendation": "APPROVE",
|
||
"verification_analysis": {
|
||
"original_confidence": 0.75,
|
||
"final_confidence": 0.78,
|
||
"web_verification": {
|
||
"web_verification_enabled": true,
|
||
"web_success_rate": 0.8,
|
||
"web_confidence": 0.75,
|
||
"web_recommendation": "APPROVE"
|
||
}
|
||
},
|
||
"timestamp": "2025-01-13T15:39:15"
|
||
}
|
||
```
|
||
|
||
## ⚙️ 配置说明
|
||
|
||
### 环境变量
|
||
|
||
```bash
|
||
# OpenHands配置
|
||
OPENHANDS_API_KEY=[REDACTED - 从Doppler获取OPENHANDS_API_KEY]
|
||
OPENHANDS_BASE_URL=https://app.all-hands.dev
|
||
OPENHANDS_TIMEOUT=300
|
||
|
||
# 验证策略配置
|
||
LINGBAO_VERIFICATION_STRATEGY=hybrid_balanced
|
||
OPENMANUS_WEIGHT=0.6
|
||
OPENHANDS_WEIGHT=0.4
|
||
MIN_CONFIDENCE_THRESHOLD=0.5
|
||
HIGH_CONFIDENCE_THRESHOLD=0.8
|
||
```
|
||
|
||
### 验证策略权重
|
||
|
||
| 策略 | 传统验证权重 | Web验证权重 | 适用场景 |
|
||
|------|-------------|-------------|----------|
|
||
| HYBRID_BALANCED | 60% | 40% | 一般情况 |
|
||
| HYBRID_WEB_PRIORITY | 30% | 70% | 需要最新信息 |
|
||
| OPENMANUS_ONLY | 100% | 0% | 网络受限 |
|
||
| OPENHANDS_ONLY | 0% | 100% | 纯Web验证 |
|
||
| ADAPTIVE | 动态调整 | 动态调整 | 自适应学习 |
|
||
|
||
## 🚀 部署指南
|
||
|
||
### 1. 安装依赖
|
||
|
||
```bash
|
||
pip install aiohttp pydantic
|
||
```
|
||
|
||
### 2. 配置API密钥
|
||
|
||
```python
|
||
# 在.env文件中配置
|
||
OPENHANDS_API_KEY=[REDACTED - 从Doppler获取OPENHANDS_API_KEY]
|
||
```
|
||
|
||
### 3. 运行演示
|
||
|
||
```bash
|
||
python3 scripts/simple_openhands_demo.py
|
||
```
|
||
|
||
## 🔍 测试验证
|
||
|
||
### 演示脚本
|
||
|
||
运行 `scripts/simple_openhands_demo.py` 查看完整的集成演示:
|
||
|
||
- 模拟八仙辩论结果
|
||
- 执行OpenHands Web验证
|
||
- 综合分析和置信度计算
|
||
- 生成元始天尊报告
|
||
|
||
### 预期输出
|
||
|
||
```
|
||
🔮 灵宝道君 × OpenHands 田野调查演示
|
||
🎭 八仙辩论参与者: 吕洞宾, 何仙姑, 铁拐李, 蓝采和
|
||
📊 辩论主题: 英伟达AI芯片需求对股价影响分析
|
||
🎯 价格预测: 上涨20%
|
||
📈 八仙原始置信度: 0.75
|
||
|
||
✅ OpenHands Web验证完成!
|
||
📊 验证统计:
|
||
总任务数: 4
|
||
成功率: 50.00%
|
||
平均置信度: 0.75
|
||
|
||
🎯 灵宝道君综合分析:
|
||
最终综合置信度: 0.71
|
||
置信度变化: -0.04
|
||
|
||
📋 给元始天尊的报告:
|
||
验证状态: 基本可信
|
||
最终建议: 建议谨慎采纳,密切监控
|
||
```
|
||
|
||
## 🎯 优势与价值
|
||
|
||
### 1. 实时性增强
|
||
- 获取最新市场信息和新闻
|
||
- 实时数据验证和分析
|
||
- 动态调整投资建议
|
||
|
||
### 2. 准确性提升
|
||
- 多源交叉验证
|
||
- AI智能分析
|
||
- 量化置信度评估
|
||
|
||
### 3. 自动化程度
|
||
- 自动任务生成
|
||
- 智能策略选择
|
||
- 无人工干预验证
|
||
|
||
### 4. 可扩展性
|
||
- 支持多种验证策略
|
||
- 可配置权重和阈值
|
||
- 自适应学习机制
|
||
|
||
## 🔮 未来发展
|
||
|
||
### 短期目标
|
||
1. 集成真实OpenHands API
|
||
2. 优化验证策略算法
|
||
3. 增加更多数据源
|
||
4. 完善错误处理机制
|
||
|
||
### 长期愿景
|
||
1. 实现完全自动化验证
|
||
2. 机器学习优化策略
|
||
3. 多语言支持
|
||
4. 实时监控和告警
|
||
|
||
---
|
||
|
||
**注意**: 当前实现使用模拟的OpenHands客户端进行演示。在生产环境中,需要集成真实的OpenHands API服务。
|