4.4 KiB
4.4 KiB
MongoDB到Milvus修复代码
问题说明
你的N8N工作流中,从MongoDB到Milvus的数据转换出现问题。主要原因是数据格式不符合Langchain Document标准。
修复方案
请将以下代码完全替换你N8N工作流中"Code test"节点的JavaScript代码:
const processedItems = [];
const items = $input.all();
function cleanText(text) {
if (!text || typeof text !== 'string') {
return "空内容";
}
return text
.trim()
.replace(/[\r\n\t]/g, ' ')
.replace(/\s+/g, ' ')
.substring(0, 500);
}
console.log(`开始处理 ${items.length} 个items`);
for (const item of items) {
try {
if (!item || !item.json) {
console.log("跳过无效item");
continue;
}
const data = item.json;
const rawTitle = data.title || data.content || "";
const cleanTitle = cleanText(rawTitle);
if (!cleanTitle || cleanTitle === "空内容" || cleanTitle.length < 5) {
console.log(`跳过无效标题: ${rawTitle}`);
continue;
}
let publishedDate;
try {
const timeStr = data.published_time || data.pubDate || data.date;
publishedDate = timeStr ? new Date(timeStr).toISOString() : new Date().toISOString();
} catch (error) {
console.log(`时间解析错误: ${error.message}`);
publishedDate = new Date().toISOString();
}
const articleId = data.article_id || `article_${Date.now()}_${Math.floor(Math.random() * 10000)}`;
// 🔧 修复:确保所有metadata字段都是字符串类型
const document = {
pageContent: String(cleanTitle),
metadata: {
title: String(cleanTitle),
published_date: String(publishedDate),
article_id: String(articleId),
source: String(data.source || "rss_feed"),
processed: String(false)
}
};
// 🔧 关键修复:验证metadata中确实有title字段
if (!document.metadata.title || document.metadata.title === "undefined") {
document.metadata.title = "未知标题_" + Date.now();
}
processedItems.push(document);
console.log(`成功处理: ${document.metadata.title.substring(0, 30)}...`);
console.log(`metadata检查: title=${document.metadata.title}, article_id=${document.metadata.article_id}`);
} catch (error) {
console.log(`处理item时出错: ${error.message}`);
continue;
}
}
if (processedItems.length === 0) {
console.log("没有有效数据,返回默认文档");
const defaultDoc = {
pageContent: "默认测试内容 - 市场分析",
metadata: {
title: "默认测试文档",
published_date: new Date().toISOString(),
article_id: "default_article_" + Date.now(),
source: "default",
processed: "false"
}
};
return [defaultDoc];
}
console.log(`✅ 成功处理 ${processedItems.length} 个文档,准备向量化`);
// 🔧 最终验证:确保每个文档都有title字段
for (let i = 0; i < processedItems.length; i++) {
if (!processedItems[i].metadata || !processedItems[i].metadata.title) {
console.log(`❌ 文档 ${i} 缺少title字段,修复中...`);
processedItems[i].metadata = processedItems[i].metadata || {};
processedItems[i].metadata.title = `修复标题_${i}_${Date.now()}`;
}
console.log(`✅ 文档 ${i} title: ${processedItems[i].metadata.title}`);
}
return processedItems;
操作步骤
- 打开你的N8N工作流
- 找到"Code test"节点
- 双击打开编辑
- 删除现有的JavaScript代码
- 复制上面的代码粘贴进去
- 保存节点
- 保存工作流
- 手动触发测试
关键修复点
- ✅ 修复了数据格式,符合Langchain Document标准
- ✅ 改进了文本清理,避免向量化失败
- ✅ 增强了错误处理和日志输出
- ✅ 确保返回正确的数据结构
验证方法
执行工作流后,检查:
- N8N执行日志中是否有"成功处理 X 个文档"的消息
- Milvus集合"ifuleyou"中是否有新数据
- 是否没有错误信息
如果还有问题,请查看N8N的执行日志获取具体错误信息。